Basic Statistics

:
Pengantar, Konsep Dasar, Aplikasi (Mahasiswa Pasca Sarjana UKRIDA 2010/11)

Jonathan Sarwono Web: http://www.jonathansarwono.info

2/24/2011

Jonathan Sarwono - ULTC - UKRIDA

1

Konsep Dasar
‡ Definisi: Statistik merupakan ilmu untuk mengumpulkan, mengorganisasi dan menginterpretasi data numerik. ‡ Fungsi:
± Mendiskripsikan variabel ± Menghubung-hubungkan antar variabel (hubungan asosiasi) ± Melihat pengaruh satu variabel terhadap variabel lain (recursive dan reciprocal). Pengaruh dapat secara langsung maupun tidak langsung ± Membandingkan beberapa sampel (rata-rata) ± Memprediksi satu variabel dengan menggunakan variabel lainnya.

‡ Variabel: Variabel didefinisikan sebagai something that may vary or differ (Brown, 1998:7). Definisi lain yang lebih detil mengatakan bahwa variabel is simply symbol or a concept that can assume any one of a set of values (Davis, 1998:23)

2/24/2011

Jonathan Sarwono - ULTC - UKRIDA

2

UKRIDA 3 .Var Bebas Var Moderat Var Perantara Var Tergantung Var Kontrol Sumber: Tuckman (1978) 2/24/2011 Jonathan Sarwono .ULTC .

ULTC .UKRIDA 4 . menterjemahkan karakteristik dan sifat-sifat kejadian-kejadian empiris kedalam suatu bentuk yang dapat dianalisis oleh peneliti. tetapi didasarkan pada konsep dan definisi operasional suatu variabel. Tujuan menggunakan skala pengukuran ialah pertama. manusia. pernyataan dan kejadian. kedua. untuk membawa informasi dari variabel-variabel yang sedang diukur. Jenis skala pengukuran yang ada: ± ± ± ± Nominal Ordinal Interval Rasio 2/24/2011 Jonathan Sarwono . Pemberian angka tersebut tidak boleh dilakukan sembarangan.‡ Skala Pengukuran: Skala pengukuran merupakan aturan atau tata cara memberikan angka atau nilai kepada aspek-aspek obyek.

merupakan jangkauan dimana nilai populasi yang tepat diperkirakan ± Contoh: Sig = 0. maka nilai rata-rata atribut yang diperoleh dari sampel-sampel tersebut sejajar dengan nilai populasi yang sebenarnya.01 0.ULTC . 95% dan 90% ‡ Signifikansi / Probabilitas (Significance Level/ P Value / ): Signifikansi atau disebut juga probabilitas merupakan tingkat ketepatan (presisi) dalam kaitannya dengan kesalahan pengambilan sampel (sampling error). Gagasan pokok yang berasal dari teorema tersebut ialah apabila suatu populasi secara berulang-ulang ditarik sampel. Semakin kecil sig-nya semakin besar jumlah sampel 2/24/2011 Jonathan Sarwono .` Tingkat Kepercayaan (Confidence Interval): didasarkan pada gagasan yang berasal dari Teorema Batas Sentral (Central Limit Theorem). ` Dalam SPSS CI menggunakan default sebesar 95% ` Dalam teori umumnya: 99%.1.05 (SPSS menggunakan deafult sebesar 0. ` Contoh: jika tingkat kepercayaan sebesar 95% dipilih.UKRIDA 5 . maka 95 dari 100 sampel akan mempunyai nilai populasi yang sebenarnya dalam jangkauan ketepatan sebagaimana sudah dispesifikasi sebelumnya.05) Range: 0.

‡ Derajat Kebebasan (Degree of Freedom / DF ): Variabel variabel independen random yang menyusun suatu nilai statistik tertentu / estimasi jumlah kategori independen dalam suatu pengujian atau experimen statistik tertentu. ‡ Nilai Kritis (Critical Value): nilai yang menyebabkan penolakan hipotesis 0 jika dalam pengujian hipotesis diberikan nilai statistik tertentu yg lebih besar dari nilai kritis dan penerimaan hipotesis 0 apabila nilai statistik yang diberikan lebih kecil dari nilai kritisnya.98 agar H0 ditolak (misalnya 2) .UKRIDA 6 .98. Nilai kritis diambil dari table nilai kritis t sedang nilai absolut (hitung / hasil riset) berasal dari data 2/24/2011 Jonathan Sarwono . Nilai absolut t harus lebih besar dari 1.ULTC . ± Misalnya nilai kritis t dengan derajat kebebasan (DF) sebesar 12 dan tingkat signifikansi (Sig) sebesar 0.‡ Jumlah Data: Jumlah individu yang dijadikan sebagai sampel yang ditarik dari populasi ± Jumlah sampel: n ± Jumlah populasi: N ± Dalam statistik menentukan jumlah n dari N disebut dengan teknik sampling yang meliputi menentukan desain dan ukuran sampel (n).05 adalah 1.

` Hipotesis (hypothesis): pernyataan tentative yang merupakan dugaan mengenai apa saja yang sedang kita amati dalam usaha untuk memahaminya . ± Hipotesis penelitian/kerja: hipotesis penelitian merupakan anggapan dasar peneliti terhadap suatu masalah yang sedang dikaji. Artinya peneliti merumuskan hipotesis tidak semata-mata berdasarkan anggapan dasarnya. a probable answer to a research question . H0 digunakan untuk memberikan keseimbangan pada hipotesis penelitian karena peneliti meyakini dalam pengujian nanti benar atau salahnya hipotesis penelitian tergantung dari bukti-bukti yang diperolehnya selama melakukan penelitian 2/24/2011 Jonathan Sarwono . (Nasution:2000) Zikmund (1997:112) mendefinisikan hipotesis sebagai: Unproven proposition or supposition that tentatively explains certain facts or phenomena. bahwa hipotesis penelitian yang dibuat belum tentu benar setelah diuji dengan menggunakan data yang ada. Untuk itu peneliti memerlukan hipotesis pembanding yang bersifat obyektif dan netral atau secara teknis disebut hipotesis nol (H0).ULTC . tetapi juga berdasarkan obyektifitasnya.UKRIDA 7 . Dalam hipotesis ini peneliti mengaggap benar hipotesisnya yang kemudian akan dibuktikan secara empiris melalui pengujian hipotesis dengan mempergunakan data yang diperolehnya selama melakukan penelitian ± Hipotesis operasional merupakan hipotesis yang bersifat obyektif.

Yang termasuk didalamnya diantaranya ialah distribusi frekuensi. Hipotesis ini dirumuskan berdasarkan pengamatan peneliti terhadap populasi dalam bentuk angkaangka (kuantitatif). 2/24/2011 Jonathan Sarwono .UKRIDA 8 . Jika digunakan bahasa umum disebut berbentuk kurva bel ‡ Statistik Deskriptif: transformasi data mentah ke dalam suatu bentuk yang akan membuat pembaca lebih mudah memahami dan menafsirkan maksud dari data atau angka yang ditampilkan.± Hipotesis statistik: Hipotesis statistik merupakan jenis hipotesis yang dirumuskan dalam bentuk notasi statistik. ‡ Statistik Inferensi: nilai statistik yang digunakan dalam proses penarikan kesimpulan mengenai suatu parameter tertentu. distribusi persen dan rata-rata (mean). ‡ Distribusi normal: Data yang mempunyai distribusi normal artinya data yang distribusinya simetris sempurna. Kegunaan utama statistik deskriptif ialah untuk menggambarkan jawaban-jawaban observasi. misal koefesien korelasi.ULTC . dimana seseorang sedang melakukan pengukuran atau membuat estimasi.

dan grafik yang digunakan untuk menggambarkan. nilai tengah (median) dan mode. bagan. tabel. ± Kurtosis (ketinggian puncak) data: bagaimana data terkonsentrasi di sekitar nilai tunggal. mengorganisasi.ULTC . meringkas dan mempresentasikan data mentah.UKRIDA 9 . Statistik deskriptif sering digunakan untuk menganalisis: ± Tendensi sentral (lokasi) data: dimana posisi data berada yang biasanya diukur dengan rata-rata (mean). 2/24/2011 Jonathan Sarwono .Statistik Deskriptif ‡ Pengertian: statistik deskriptif mencakup angka-angka. ± Dispersi (keanekaragaman) data: bagaimana data menyebar yang biasanya dengan varian dan akar kuadratnya dan standard deviasi. ± Skew (simetris) data: bagaimana data terkonsentrasi di bagian ujung bawah atau atas skala yang diukur dengan skew index. yang diukur dengan menggunakan kurtosis index.

Dalam menyajikan digunakan table. Jawaban Pernah Tidak pernah Jumlah Frekuensi 110 90 200 2/24/2011 Jonathan Sarwono .ULTC .‡ Tabel distribusi frekuensi: untuk meringkas dan memadatkan data dengan cara mengelompokkan kedalam kelas-kelas dan mencatat berapa banyak poin-poin data yang jatuh di masing-masing kelas tersebut. Distribusi frekeunsi merupakan dasar bagi statistik deskriptif dan menjadi prasyarat untuk membuat grafik serta untuk menggambarkan seperangkat data.UKRIDA 10 .

UKRIDA 11 .ULTC .‡ Frekuensi Relatif: frekuensi yang dihitung dalam bentuk persen. Umur <25 26-30 31-40 >40 Jumlah Frekuensi 121 59 83 66 329 Persentase 37% 18% 25% 20% 100% 2/24/2011 Jonathan Sarwono .

000 ² 1.000.ULTC .000 ² 2.UKRIDA 12 .000 >Rp. 1.000.‡ Frekuensi Kumulatif: frekuensi yang dihitung secara meningkat keatas dari frekuensi yang paling rendah sampai dengan yang paling tinggi Penghasilan per bulan Rp.000 >Rp.500. 2. 1.000.500.500.000 >Rp.000.000 Jumlah Frekuensi 10 15 20 5 50 Frekuensi kumulatif 50 40 25 5 2/24/2011 Jonathan Sarwono .000 ² 1.000 ² 2. 500.

Contoh bilangan tendensi sentral ialah mean (rata-rata). median dan mode.UKRIDA 13 .) A 100 B 125 C 140 D 150 E 175 N=5 7 X = 690 Mean= 690/5 = 138 2/24/2011 Jonathan Sarwono .‡ Pengukuran Tendensi Sentral:Cara lain untuk menggambarkan statistik deskriptif ialah dengan menggunakan tendensi sentral. Rata-rata populasi diberi lambang µ dan untuk sampel simbolnya x Indivi Penghasilan du dalam ribuan (Rp. Tendensi sentral berguna untuk menggambarkan bilangan yang dapat mewakili sekelompok bilangan tertentu ± Mean: rata-rata yang sering digunakan dalam pengukuran tendensi sentral .ULTC .

Untuk mencari nilai mode dapat dilihat pada jumlah frekuensi yang paling besar. yaitu 15) 2/24/2011 Jonathan Sarwono .ULTC . Nilai 60 65 66 70 72 75 80 85 Frekuensi 5 6 7 15 2 6 8 10 Mode= 70 (jumlah frekuensi terbesar.‡ Mode: nilai yang jumlah frekuensinya paling besar.UKRIDA 14 .

Nomor 1 2 3 4 5 6 7 8 9 Nilai 60 65 70 75 85 80 81 79 77 85 adalah median yang membagi empat nilai di atasnya dan empat nilai di bawahnya 2/24/2011 Jonathan Sarwono .‡ Median: nilai tengah yang membatasi setengah frekuensi bagian bawah dan setengah frekuensi bagian atas bila data disusun secara berurutan.UKRIDA 15 .ULTC .

Jika nilai tertinggi 85 dan terendah 60. Range digunakan untuk menggambarkan bagaimana suatu data menyebar. ± Mean Deviasi: disebut juga penyimpangan merupakan harga mutlak semua deviasi nilai-nilai individual. Pengukuran variasi diantaranya ialah: range. Sebaliknya semakin kecil variasinya.‡ Pengukuran Dispersi / Variasi: Untuk mengetahui bagaimana sebaran data disekitar rata-rata atau untuk mengetahui keseragaman suatu data atau gejala. mean deviasi dan standar deviasi ± Range: jarak antara nilai yang paling tinggi dengan nilai yang paling rendah.ULTC . maka keseragaman data semakin tinggi. Nilai range dapat digunakan untuk menemukan nilai standard deviasi dengan cara membagi nilai range dengan 4. maka nilai range ialah 25. Yang dimaksud dengan deviasi ialah penyimpangan suatu nilai dari mean pada kelompoknya 2/24/2011 Jonathan Sarwono . maka semakin tidak seragam data atau gejala tersebut. Semakin besar variasinya.UKRIDA 16 .

maka standard deviasinya besar.ULTC .± Variance: digunakan sebagai salah satu instrumen descriptor untuk distribusi data dan menggambarkan seberapa jauh suatu nilai terletak dari posisi ratarata. Varian populasi diberi simbol sigma ( 2) dan untuk sampel diberi simbol s2 ± Standard Deviasi: Nilai statistik yang digunakan untuk menunjukkan seberapa besar individu-individu bervariasi. Varian digunakan kalau kita ingin membandingkan variabilitas dua variabel atau lebih yang berskala interval Semakin besar nilai varian maka semakin menyebar data tersebut. Untuk populasi simbolnya sedang untuk sampel s ± Koefesien variasi: digunakan untuk mengukur dispersi relatif dengan cara membagi standard deviasi dengan nilai rata-rata dan kemudian mengkalikan 100 untuk dijadikan persen. Untuk populasi diberi simbol V dan sampel v 2/24/2011 Jonathan Sarwono . Atau secara teknik dikatakan sebagai perbedaan rata-rata antara nilai observasi dan rata-rata.UKRIDA 17 . Nilai ini lebih sering digunakan untuk menggambarkan sebaran data dibandingkan dengan varian. Jika observasi individual mempunyai variasi besar dalam nilai rata-rata kelompoknya. Standard deviasi digunakan untuk menggambarkan dispersi dalam unit-unit yang sama sebagaimana pengukuran aslinya.

± Quartile: data yang membagi sampel menjadi empat bagian sama besar. Simbol untuk populasi Sk dan sampel sk.UKRIDA 18 . maka semakin tinggi variabilitas. Skew menunjukkan tingkatan simetri dalam suatu data set. Dengan demikian data semakin tidak dapat dipercaya (tidak valid) 2/24/2011 Jonathan Sarwono .ULTC .± Percentile: untuk mengukur persentasi poin-poin data yang terletak dibawah satu nilai tertentu saat nilai nilai diurutkan. Maksudnya 90% mahasiswa yang ikut ujian tersebut nilainya dibawah nila A (<95). Semakin miring suatu distribusi. Kegunaan: untuk menggambarkan jika suatu data jatuh di kuartil tertentu ‡ Pengukuran Kemiringan (Skewness): menggambarkan bagaimana poin poin data pada posisi puncak atau bawah pada skala pengukuran. Misalnya 25% nilai tertinggi disebut sebagai kuartil atas. Dua kuartil disisi media disebut sebagai jarak interquartile. Sebagai contoh A mempunyai nilai Matematik 95 dalam daftar A dikatakan dia berada di percentile ke 90 dari semua mahasisa yang mengikuti ujian matematika. 25% nilai terendah disebut kuartil bawah.

ULTC .edu 2/24/2011 Jonathan Sarwono .UKRIDA 19 .eku.‡ Gambar Skewness Source: http://people.

Dengan demikian semakin kurang berdistribusi normal. maka data semakin tidak valid. Semakin runcing atau datar. maka semakin tidak normal suatu distribusi data. 2/24/2011 Jonathan Sarwono .ULTC . tidak runcing dan tidak datar. ± Distribusi platykurtic: distribusi lebih datar dibandingkan dengan kurva normal ± Distribusi leptokurtic: distribusi lebih runcing dibandingkan dengan kurva normal Nilai ideal kurtosis sebesar 3 atau kurtosis kurva bel normal.‡ Pengukuran Kurtosis: menggambarkan bagaimana data yang terkonsentrasi disekitar nilai tunggal biasanya nilai rata-rata.UKRIDA 20 . Ada tiga jenis kurtosis ± Distribusi mesokurtic: distribusi seperti kurva bel normal. Kesimpulannya kurtosis mengukur ketinggian (peak) atau ke rata-an (flat) suatu distribusi data. Simbol kurtosis untuk populasi K sedang untuk sampel k.

Source: http://www.philender.ULTC .com 2/24/2011 Jonathan Sarwono .UKRIDA 21 .

ULTC .com 2/24/2011 Jonathan Sarwono .Source: http://mvpprograms.UKRIDA 22 .

UKRIDA Tatap Ruangan Lab Lab Lab Lab Lab 6 Lab 2/24/2011 23 .ULTC .Benang Merah Rumus Menuju Ke Tesis No 1 2 3 4 5 Waktu Muka Basic Statistics 1 kali Melihat hubungan asosiasi antar variabel 1 kali dengan analisis korelasi Melihat pengaruh variabel satu terhadap 1 kali variabel lainnya dengan analisis regresi Mengindentifikasi faktor / variabel laten 1 kali dengan analisis faktor Melihat pengaruh langsung dan tidak 2 kali langsung serta gabungan dan parsial variabel satu terhadap variabel lainnya dengan analisis jalur (path analysis) Melihat pengaruh variabel laten satu terhadap 3 kali variabel laten lainnya dengan structural equation model (SEM) Materi Jonathan Sarwono .

UKRIDA 24 .ULTC .Latihan ‡ ‡ ‡ ‡ ‡ ‡ Frekuensi: hal 35 37 Explore: hal 39 40 Descriptive: hal 41 42 Tabulasi silang: hal 43 46 Distribusi normal Histogram 2/24/2011 Jonathan Sarwono .

(2009). Jonathan. 5/95 2/24/2011 Jonathan Sarwono .ULTC . Yogyakarta: Penerbit Graha Ilmu Sarwono. Jonathan.Referensi Sarwono.(2006). Metode Penelitian Kuantitatif dan Kualitatif. Data Analysis: Describing Data Descriptive Statistic.UKRIDA 25 . Methodology Manual. Statistik itu Mudah: Panduan Lengkap untuk Belajar Komputasi Statistik Menggunakan SPSS 16 -------------. Texas State Auditor's Office. rev.

Sign up to vote on this title
UsefulNot useful