Basic Statistics

:
Pengantar, Konsep Dasar, Aplikasi (Mahasiswa Pasca Sarjana UKRIDA 2010/11)

Jonathan Sarwono Web: http://www.jonathansarwono.info

2/24/2011

Jonathan Sarwono - ULTC - UKRIDA

1

Konsep Dasar
‡ Definisi: Statistik merupakan ilmu untuk mengumpulkan, mengorganisasi dan menginterpretasi data numerik. ‡ Fungsi:
± Mendiskripsikan variabel ± Menghubung-hubungkan antar variabel (hubungan asosiasi) ± Melihat pengaruh satu variabel terhadap variabel lain (recursive dan reciprocal). Pengaruh dapat secara langsung maupun tidak langsung ± Membandingkan beberapa sampel (rata-rata) ± Memprediksi satu variabel dengan menggunakan variabel lainnya.

‡ Variabel: Variabel didefinisikan sebagai something that may vary or differ (Brown, 1998:7). Definisi lain yang lebih detil mengatakan bahwa variabel is simply symbol or a concept that can assume any one of a set of values (Davis, 1998:23)

2/24/2011

Jonathan Sarwono - ULTC - UKRIDA

2

ULTC .Var Bebas Var Moderat Var Perantara Var Tergantung Var Kontrol Sumber: Tuckman (1978) 2/24/2011 Jonathan Sarwono .UKRIDA 3 .

UKRIDA 4 . tetapi didasarkan pada konsep dan definisi operasional suatu variabel. untuk membawa informasi dari variabel-variabel yang sedang diukur.‡ Skala Pengukuran: Skala pengukuran merupakan aturan atau tata cara memberikan angka atau nilai kepada aspek-aspek obyek. pernyataan dan kejadian. Tujuan menggunakan skala pengukuran ialah pertama.ULTC . Pemberian angka tersebut tidak boleh dilakukan sembarangan. menterjemahkan karakteristik dan sifat-sifat kejadian-kejadian empiris kedalam suatu bentuk yang dapat dianalisis oleh peneliti. Jenis skala pengukuran yang ada: ± ± ± ± Nominal Ordinal Interval Rasio 2/24/2011 Jonathan Sarwono . kedua. manusia.

01 0.ULTC . 95% dan 90% ‡ Signifikansi / Probabilitas (Significance Level/ P Value / ): Signifikansi atau disebut juga probabilitas merupakan tingkat ketepatan (presisi) dalam kaitannya dengan kesalahan pengambilan sampel (sampling error).05) Range: 0. merupakan jangkauan dimana nilai populasi yang tepat diperkirakan ± Contoh: Sig = 0. ` Contoh: jika tingkat kepercayaan sebesar 95% dipilih. maka 95 dari 100 sampel akan mempunyai nilai populasi yang sebenarnya dalam jangkauan ketepatan sebagaimana sudah dispesifikasi sebelumnya.UKRIDA 5 .1.` Tingkat Kepercayaan (Confidence Interval): didasarkan pada gagasan yang berasal dari Teorema Batas Sentral (Central Limit Theorem).05 (SPSS menggunakan deafult sebesar 0. Gagasan pokok yang berasal dari teorema tersebut ialah apabila suatu populasi secara berulang-ulang ditarik sampel. Semakin kecil sig-nya semakin besar jumlah sampel 2/24/2011 Jonathan Sarwono . ` Dalam SPSS CI menggunakan default sebesar 95% ` Dalam teori umumnya: 99%. maka nilai rata-rata atribut yang diperoleh dari sampel-sampel tersebut sejajar dengan nilai populasi yang sebenarnya.

05 adalah 1. ‡ Nilai Kritis (Critical Value): nilai yang menyebabkan penolakan hipotesis 0 jika dalam pengujian hipotesis diberikan nilai statistik tertentu yg lebih besar dari nilai kritis dan penerimaan hipotesis 0 apabila nilai statistik yang diberikan lebih kecil dari nilai kritisnya. ‡ Derajat Kebebasan (Degree of Freedom / DF ): Variabel variabel independen random yang menyusun suatu nilai statistik tertentu / estimasi jumlah kategori independen dalam suatu pengujian atau experimen statistik tertentu. Nilai kritis diambil dari table nilai kritis t sedang nilai absolut (hitung / hasil riset) berasal dari data 2/24/2011 Jonathan Sarwono .ULTC .UKRIDA 6 . Nilai absolut t harus lebih besar dari 1.98 agar H0 ditolak (misalnya 2) .‡ Jumlah Data: Jumlah individu yang dijadikan sebagai sampel yang ditarik dari populasi ± Jumlah sampel: n ± Jumlah populasi: N ± Dalam statistik menentukan jumlah n dari N disebut dengan teknik sampling yang meliputi menentukan desain dan ukuran sampel (n).98. ± Misalnya nilai kritis t dengan derajat kebebasan (DF) sebesar 12 dan tingkat signifikansi (Sig) sebesar 0.

Artinya peneliti merumuskan hipotesis tidak semata-mata berdasarkan anggapan dasarnya. Untuk itu peneliti memerlukan hipotesis pembanding yang bersifat obyektif dan netral atau secara teknis disebut hipotesis nol (H0). Dalam hipotesis ini peneliti mengaggap benar hipotesisnya yang kemudian akan dibuktikan secara empiris melalui pengujian hipotesis dengan mempergunakan data yang diperolehnya selama melakukan penelitian ± Hipotesis operasional merupakan hipotesis yang bersifat obyektif.ULTC . ± Hipotesis penelitian/kerja: hipotesis penelitian merupakan anggapan dasar peneliti terhadap suatu masalah yang sedang dikaji. a probable answer to a research question .UKRIDA 7 . H0 digunakan untuk memberikan keseimbangan pada hipotesis penelitian karena peneliti meyakini dalam pengujian nanti benar atau salahnya hipotesis penelitian tergantung dari bukti-bukti yang diperolehnya selama melakukan penelitian 2/24/2011 Jonathan Sarwono . tetapi juga berdasarkan obyektifitasnya. (Nasution:2000) Zikmund (1997:112) mendefinisikan hipotesis sebagai: Unproven proposition or supposition that tentatively explains certain facts or phenomena.` Hipotesis (hypothesis): pernyataan tentative yang merupakan dugaan mengenai apa saja yang sedang kita amati dalam usaha untuk memahaminya . bahwa hipotesis penelitian yang dibuat belum tentu benar setelah diuji dengan menggunakan data yang ada.

‡ Distribusi normal: Data yang mempunyai distribusi normal artinya data yang distribusinya simetris sempurna.UKRIDA 8 . dimana seseorang sedang melakukan pengukuran atau membuat estimasi. ‡ Statistik Inferensi: nilai statistik yang digunakan dalam proses penarikan kesimpulan mengenai suatu parameter tertentu. Kegunaan utama statistik deskriptif ialah untuk menggambarkan jawaban-jawaban observasi. misal koefesien korelasi.ULTC . 2/24/2011 Jonathan Sarwono . Yang termasuk didalamnya diantaranya ialah distribusi frekuensi. distribusi persen dan rata-rata (mean). Hipotesis ini dirumuskan berdasarkan pengamatan peneliti terhadap populasi dalam bentuk angkaangka (kuantitatif).± Hipotesis statistik: Hipotesis statistik merupakan jenis hipotesis yang dirumuskan dalam bentuk notasi statistik. Jika digunakan bahasa umum disebut berbentuk kurva bel ‡ Statistik Deskriptif: transformasi data mentah ke dalam suatu bentuk yang akan membuat pembaca lebih mudah memahami dan menafsirkan maksud dari data atau angka yang ditampilkan.

bagan. tabel. yang diukur dengan menggunakan kurtosis index. nilai tengah (median) dan mode. ± Skew (simetris) data: bagaimana data terkonsentrasi di bagian ujung bawah atau atas skala yang diukur dengan skew index. 2/24/2011 Jonathan Sarwono . dan grafik yang digunakan untuk menggambarkan.Statistik Deskriptif ‡ Pengertian: statistik deskriptif mencakup angka-angka.ULTC . mengorganisasi.UKRIDA 9 . ± Dispersi (keanekaragaman) data: bagaimana data menyebar yang biasanya dengan varian dan akar kuadratnya dan standard deviasi. ± Kurtosis (ketinggian puncak) data: bagaimana data terkonsentrasi di sekitar nilai tunggal. meringkas dan mempresentasikan data mentah. Statistik deskriptif sering digunakan untuk menganalisis: ± Tendensi sentral (lokasi) data: dimana posisi data berada yang biasanya diukur dengan rata-rata (mean).

Jawaban Pernah Tidak pernah Jumlah Frekuensi 110 90 200 2/24/2011 Jonathan Sarwono . Distribusi frekeunsi merupakan dasar bagi statistik deskriptif dan menjadi prasyarat untuk membuat grafik serta untuk menggambarkan seperangkat data. Dalam menyajikan digunakan table.ULTC .UKRIDA 10 .‡ Tabel distribusi frekuensi: untuk meringkas dan memadatkan data dengan cara mengelompokkan kedalam kelas-kelas dan mencatat berapa banyak poin-poin data yang jatuh di masing-masing kelas tersebut.

‡ Frekuensi Relatif: frekuensi yang dihitung dalam bentuk persen.ULTC .UKRIDA 11 . Umur <25 26-30 31-40 >40 Jumlah Frekuensi 121 59 83 66 329 Persentase 37% 18% 25% 20% 100% 2/24/2011 Jonathan Sarwono .

UKRIDA 12 .000. 500.000 ² 1.000 ² 2.000 ² 1.‡ Frekuensi Kumulatif: frekuensi yang dihitung secara meningkat keatas dari frekuensi yang paling rendah sampai dengan yang paling tinggi Penghasilan per bulan Rp. 1. 2.500.500.500.000.000. 1.000 >Rp.ULTC .000 Jumlah Frekuensi 10 15 20 5 50 Frekuensi kumulatif 50 40 25 5 2/24/2011 Jonathan Sarwono .000 >Rp.000 >Rp.000 ² 2.000.

) A 100 B 125 C 140 D 150 E 175 N=5 7 X = 690 Mean= 690/5 = 138 2/24/2011 Jonathan Sarwono . median dan mode. Rata-rata populasi diberi lambang µ dan untuk sampel simbolnya x Indivi Penghasilan du dalam ribuan (Rp.ULTC . Tendensi sentral berguna untuk menggambarkan bilangan yang dapat mewakili sekelompok bilangan tertentu ± Mean: rata-rata yang sering digunakan dalam pengukuran tendensi sentral .UKRIDA 13 . Contoh bilangan tendensi sentral ialah mean (rata-rata).‡ Pengukuran Tendensi Sentral:Cara lain untuk menggambarkan statistik deskriptif ialah dengan menggunakan tendensi sentral.

ULTC .UKRIDA 14 . Untuk mencari nilai mode dapat dilihat pada jumlah frekuensi yang paling besar.‡ Mode: nilai yang jumlah frekuensinya paling besar. Nilai 60 65 66 70 72 75 80 85 Frekuensi 5 6 7 15 2 6 8 10 Mode= 70 (jumlah frekuensi terbesar. yaitu 15) 2/24/2011 Jonathan Sarwono .

Nomor 1 2 3 4 5 6 7 8 9 Nilai 60 65 70 75 85 80 81 79 77 85 adalah median yang membagi empat nilai di atasnya dan empat nilai di bawahnya 2/24/2011 Jonathan Sarwono .‡ Median: nilai tengah yang membatasi setengah frekuensi bagian bawah dan setengah frekuensi bagian atas bila data disusun secara berurutan.UKRIDA 15 .ULTC .

‡ Pengukuran Dispersi / Variasi: Untuk mengetahui bagaimana sebaran data disekitar rata-rata atau untuk mengetahui keseragaman suatu data atau gejala. mean deviasi dan standar deviasi ± Range: jarak antara nilai yang paling tinggi dengan nilai yang paling rendah. Range digunakan untuk menggambarkan bagaimana suatu data menyebar. Jika nilai tertinggi 85 dan terendah 60.ULTC . Semakin besar variasinya. maka semakin tidak seragam data atau gejala tersebut. maka keseragaman data semakin tinggi.UKRIDA 16 . Pengukuran variasi diantaranya ialah: range. Sebaliknya semakin kecil variasinya. maka nilai range ialah 25. Nilai range dapat digunakan untuk menemukan nilai standard deviasi dengan cara membagi nilai range dengan 4. Yang dimaksud dengan deviasi ialah penyimpangan suatu nilai dari mean pada kelompoknya 2/24/2011 Jonathan Sarwono . ± Mean Deviasi: disebut juga penyimpangan merupakan harga mutlak semua deviasi nilai-nilai individual.

Varian digunakan kalau kita ingin membandingkan variabilitas dua variabel atau lebih yang berskala interval Semakin besar nilai varian maka semakin menyebar data tersebut. Nilai ini lebih sering digunakan untuk menggambarkan sebaran data dibandingkan dengan varian. Untuk populasi diberi simbol V dan sampel v 2/24/2011 Jonathan Sarwono . Atau secara teknik dikatakan sebagai perbedaan rata-rata antara nilai observasi dan rata-rata.UKRIDA 17 .ULTC . Standard deviasi digunakan untuk menggambarkan dispersi dalam unit-unit yang sama sebagaimana pengukuran aslinya.± Variance: digunakan sebagai salah satu instrumen descriptor untuk distribusi data dan menggambarkan seberapa jauh suatu nilai terletak dari posisi ratarata. Untuk populasi simbolnya sedang untuk sampel s ± Koefesien variasi: digunakan untuk mengukur dispersi relatif dengan cara membagi standard deviasi dengan nilai rata-rata dan kemudian mengkalikan 100 untuk dijadikan persen. maka standard deviasinya besar. Jika observasi individual mempunyai variasi besar dalam nilai rata-rata kelompoknya. Varian populasi diberi simbol sigma ( 2) dan untuk sampel diberi simbol s2 ± Standard Deviasi: Nilai statistik yang digunakan untuk menunjukkan seberapa besar individu-individu bervariasi.

± Quartile: data yang membagi sampel menjadi empat bagian sama besar. Dua kuartil disisi media disebut sebagai jarak interquartile. Misalnya 25% nilai tertinggi disebut sebagai kuartil atas. Simbol untuk populasi Sk dan sampel sk. Maksudnya 90% mahasiswa yang ikut ujian tersebut nilainya dibawah nila A (<95). Sebagai contoh A mempunyai nilai Matematik 95 dalam daftar A dikatakan dia berada di percentile ke 90 dari semua mahasisa yang mengikuti ujian matematika. 25% nilai terendah disebut kuartil bawah.UKRIDA 18 . Skew menunjukkan tingkatan simetri dalam suatu data set. maka semakin tinggi variabilitas. Dengan demikian data semakin tidak dapat dipercaya (tidak valid) 2/24/2011 Jonathan Sarwono .ULTC . Kegunaan: untuk menggambarkan jika suatu data jatuh di kuartil tertentu ‡ Pengukuran Kemiringan (Skewness): menggambarkan bagaimana poin poin data pada posisi puncak atau bawah pada skala pengukuran. Semakin miring suatu distribusi.± Percentile: untuk mengukur persentasi poin-poin data yang terletak dibawah satu nilai tertentu saat nilai nilai diurutkan.

‡ Gambar Skewness Source: http://people.eku.ULTC .edu 2/24/2011 Jonathan Sarwono .UKRIDA 19 .

Semakin runcing atau datar.‡ Pengukuran Kurtosis: menggambarkan bagaimana data yang terkonsentrasi disekitar nilai tunggal biasanya nilai rata-rata. maka semakin tidak normal suatu distribusi data. 2/24/2011 Jonathan Sarwono . Simbol kurtosis untuk populasi K sedang untuk sampel k. Dengan demikian semakin kurang berdistribusi normal. Kesimpulannya kurtosis mengukur ketinggian (peak) atau ke rata-an (flat) suatu distribusi data. Ada tiga jenis kurtosis ± Distribusi mesokurtic: distribusi seperti kurva bel normal. maka data semakin tidak valid.UKRIDA 20 .ULTC . tidak runcing dan tidak datar. ± Distribusi platykurtic: distribusi lebih datar dibandingkan dengan kurva normal ± Distribusi leptokurtic: distribusi lebih runcing dibandingkan dengan kurva normal Nilai ideal kurtosis sebesar 3 atau kurtosis kurva bel normal.

com 2/24/2011 Jonathan Sarwono .Source: http://www.UKRIDA 21 .philender.ULTC .

Source: http://mvpprograms.com 2/24/2011 Jonathan Sarwono .UKRIDA 22 .ULTC .

Benang Merah Rumus Menuju Ke Tesis No 1 2 3 4 5 Waktu Muka Basic Statistics 1 kali Melihat hubungan asosiasi antar variabel 1 kali dengan analisis korelasi Melihat pengaruh variabel satu terhadap 1 kali variabel lainnya dengan analisis regresi Mengindentifikasi faktor / variabel laten 1 kali dengan analisis faktor Melihat pengaruh langsung dan tidak 2 kali langsung serta gabungan dan parsial variabel satu terhadap variabel lainnya dengan analisis jalur (path analysis) Melihat pengaruh variabel laten satu terhadap 3 kali variabel laten lainnya dengan structural equation model (SEM) Materi Jonathan Sarwono .UKRIDA Tatap Ruangan Lab Lab Lab Lab Lab 6 Lab 2/24/2011 23 .ULTC .

Latihan ‡ ‡ ‡ ‡ ‡ ‡ Frekuensi: hal 35 37 Explore: hal 39 40 Descriptive: hal 41 42 Tabulasi silang: hal 43 46 Distribusi normal Histogram 2/24/2011 Jonathan Sarwono .ULTC .UKRIDA 24 .

rev.(2006).(2009). 5/95 2/24/2011 Jonathan Sarwono . Jonathan.ULTC . Yogyakarta: Penerbit Graha Ilmu Sarwono. Metode Penelitian Kuantitatif dan Kualitatif.UKRIDA 25 . Data Analysis: Describing Data Descriptive Statistic. Jonathan. Texas State Auditor's Office. Methodology Manual.Referensi Sarwono. Statistik itu Mudah: Panduan Lengkap untuk Belajar Komputasi Statistik Menggunakan SPSS 16 -------------.