Basic Statistics

:
Pengantar, Konsep Dasar, Aplikasi (Mahasiswa Pasca Sarjana UKRIDA 2010/11)

Jonathan Sarwono Web: http://www.jonathansarwono.info

2/24/2011

Jonathan Sarwono - ULTC - UKRIDA

1

Konsep Dasar
‡ Definisi: Statistik merupakan ilmu untuk mengumpulkan, mengorganisasi dan menginterpretasi data numerik. ‡ Fungsi:
± Mendiskripsikan variabel ± Menghubung-hubungkan antar variabel (hubungan asosiasi) ± Melihat pengaruh satu variabel terhadap variabel lain (recursive dan reciprocal). Pengaruh dapat secara langsung maupun tidak langsung ± Membandingkan beberapa sampel (rata-rata) ± Memprediksi satu variabel dengan menggunakan variabel lainnya.

‡ Variabel: Variabel didefinisikan sebagai something that may vary or differ (Brown, 1998:7). Definisi lain yang lebih detil mengatakan bahwa variabel is simply symbol or a concept that can assume any one of a set of values (Davis, 1998:23)

2/24/2011

Jonathan Sarwono - ULTC - UKRIDA

2

ULTC .UKRIDA 3 .Var Bebas Var Moderat Var Perantara Var Tergantung Var Kontrol Sumber: Tuckman (1978) 2/24/2011 Jonathan Sarwono .

ULTC . manusia.UKRIDA 4 . tetapi didasarkan pada konsep dan definisi operasional suatu variabel.‡ Skala Pengukuran: Skala pengukuran merupakan aturan atau tata cara memberikan angka atau nilai kepada aspek-aspek obyek. pernyataan dan kejadian. kedua. Pemberian angka tersebut tidak boleh dilakukan sembarangan. menterjemahkan karakteristik dan sifat-sifat kejadian-kejadian empiris kedalam suatu bentuk yang dapat dianalisis oleh peneliti. Tujuan menggunakan skala pengukuran ialah pertama. Jenis skala pengukuran yang ada: ± ± ± ± Nominal Ordinal Interval Rasio 2/24/2011 Jonathan Sarwono . untuk membawa informasi dari variabel-variabel yang sedang diukur.

Gagasan pokok yang berasal dari teorema tersebut ialah apabila suatu populasi secara berulang-ulang ditarik sampel. Semakin kecil sig-nya semakin besar jumlah sampel 2/24/2011 Jonathan Sarwono .ULTC . ` Dalam SPSS CI menggunakan default sebesar 95% ` Dalam teori umumnya: 99%.` Tingkat Kepercayaan (Confidence Interval): didasarkan pada gagasan yang berasal dari Teorema Batas Sentral (Central Limit Theorem). 95% dan 90% ‡ Signifikansi / Probabilitas (Significance Level/ P Value / ): Signifikansi atau disebut juga probabilitas merupakan tingkat ketepatan (presisi) dalam kaitannya dengan kesalahan pengambilan sampel (sampling error).05) Range: 0.05 (SPSS menggunakan deafult sebesar 0.1.UKRIDA 5 . merupakan jangkauan dimana nilai populasi yang tepat diperkirakan ± Contoh: Sig = 0.01 0. maka nilai rata-rata atribut yang diperoleh dari sampel-sampel tersebut sejajar dengan nilai populasi yang sebenarnya. ` Contoh: jika tingkat kepercayaan sebesar 95% dipilih. maka 95 dari 100 sampel akan mempunyai nilai populasi yang sebenarnya dalam jangkauan ketepatan sebagaimana sudah dispesifikasi sebelumnya.

‡ Nilai Kritis (Critical Value): nilai yang menyebabkan penolakan hipotesis 0 jika dalam pengujian hipotesis diberikan nilai statistik tertentu yg lebih besar dari nilai kritis dan penerimaan hipotesis 0 apabila nilai statistik yang diberikan lebih kecil dari nilai kritisnya.‡ Jumlah Data: Jumlah individu yang dijadikan sebagai sampel yang ditarik dari populasi ± Jumlah sampel: n ± Jumlah populasi: N ± Dalam statistik menentukan jumlah n dari N disebut dengan teknik sampling yang meliputi menentukan desain dan ukuran sampel (n).98 agar H0 ditolak (misalnya 2) . ± Misalnya nilai kritis t dengan derajat kebebasan (DF) sebesar 12 dan tingkat signifikansi (Sig) sebesar 0. Nilai kritis diambil dari table nilai kritis t sedang nilai absolut (hitung / hasil riset) berasal dari data 2/24/2011 Jonathan Sarwono .UKRIDA 6 . ‡ Derajat Kebebasan (Degree of Freedom / DF ): Variabel variabel independen random yang menyusun suatu nilai statistik tertentu / estimasi jumlah kategori independen dalam suatu pengujian atau experimen statistik tertentu.98. Nilai absolut t harus lebih besar dari 1.05 adalah 1.ULTC .

a probable answer to a research question . bahwa hipotesis penelitian yang dibuat belum tentu benar setelah diuji dengan menggunakan data yang ada. Dalam hipotesis ini peneliti mengaggap benar hipotesisnya yang kemudian akan dibuktikan secara empiris melalui pengujian hipotesis dengan mempergunakan data yang diperolehnya selama melakukan penelitian ± Hipotesis operasional merupakan hipotesis yang bersifat obyektif. ± Hipotesis penelitian/kerja: hipotesis penelitian merupakan anggapan dasar peneliti terhadap suatu masalah yang sedang dikaji.UKRIDA 7 . H0 digunakan untuk memberikan keseimbangan pada hipotesis penelitian karena peneliti meyakini dalam pengujian nanti benar atau salahnya hipotesis penelitian tergantung dari bukti-bukti yang diperolehnya selama melakukan penelitian 2/24/2011 Jonathan Sarwono . tetapi juga berdasarkan obyektifitasnya. Artinya peneliti merumuskan hipotesis tidak semata-mata berdasarkan anggapan dasarnya. Untuk itu peneliti memerlukan hipotesis pembanding yang bersifat obyektif dan netral atau secara teknis disebut hipotesis nol (H0). (Nasution:2000) Zikmund (1997:112) mendefinisikan hipotesis sebagai: Unproven proposition or supposition that tentatively explains certain facts or phenomena.` Hipotesis (hypothesis): pernyataan tentative yang merupakan dugaan mengenai apa saja yang sedang kita amati dalam usaha untuk memahaminya .ULTC .

Yang termasuk didalamnya diantaranya ialah distribusi frekuensi. 2/24/2011 Jonathan Sarwono . distribusi persen dan rata-rata (mean).ULTC . Jika digunakan bahasa umum disebut berbentuk kurva bel ‡ Statistik Deskriptif: transformasi data mentah ke dalam suatu bentuk yang akan membuat pembaca lebih mudah memahami dan menafsirkan maksud dari data atau angka yang ditampilkan. ‡ Statistik Inferensi: nilai statistik yang digunakan dalam proses penarikan kesimpulan mengenai suatu parameter tertentu. Hipotesis ini dirumuskan berdasarkan pengamatan peneliti terhadap populasi dalam bentuk angkaangka (kuantitatif). dimana seseorang sedang melakukan pengukuran atau membuat estimasi.UKRIDA 8 . misal koefesien korelasi. ‡ Distribusi normal: Data yang mempunyai distribusi normal artinya data yang distribusinya simetris sempurna. Kegunaan utama statistik deskriptif ialah untuk menggambarkan jawaban-jawaban observasi.± Hipotesis statistik: Hipotesis statistik merupakan jenis hipotesis yang dirumuskan dalam bentuk notasi statistik.

tabel. ± Kurtosis (ketinggian puncak) data: bagaimana data terkonsentrasi di sekitar nilai tunggal. ± Skew (simetris) data: bagaimana data terkonsentrasi di bagian ujung bawah atau atas skala yang diukur dengan skew index.UKRIDA 9 . Statistik deskriptif sering digunakan untuk menganalisis: ± Tendensi sentral (lokasi) data: dimana posisi data berada yang biasanya diukur dengan rata-rata (mean). meringkas dan mempresentasikan data mentah.ULTC . ± Dispersi (keanekaragaman) data: bagaimana data menyebar yang biasanya dengan varian dan akar kuadratnya dan standard deviasi. dan grafik yang digunakan untuk menggambarkan. nilai tengah (median) dan mode. 2/24/2011 Jonathan Sarwono . mengorganisasi. bagan. yang diukur dengan menggunakan kurtosis index.Statistik Deskriptif ‡ Pengertian: statistik deskriptif mencakup angka-angka.

Dalam menyajikan digunakan table.ULTC .‡ Tabel distribusi frekuensi: untuk meringkas dan memadatkan data dengan cara mengelompokkan kedalam kelas-kelas dan mencatat berapa banyak poin-poin data yang jatuh di masing-masing kelas tersebut. Distribusi frekeunsi merupakan dasar bagi statistik deskriptif dan menjadi prasyarat untuk membuat grafik serta untuk menggambarkan seperangkat data. Jawaban Pernah Tidak pernah Jumlah Frekuensi 110 90 200 2/24/2011 Jonathan Sarwono .UKRIDA 10 .

‡ Frekuensi Relatif: frekuensi yang dihitung dalam bentuk persen.UKRIDA 11 . Umur <25 26-30 31-40 >40 Jumlah Frekuensi 121 59 83 66 329 Persentase 37% 18% 25% 20% 100% 2/24/2011 Jonathan Sarwono .ULTC .

000 >Rp.000 Jumlah Frekuensi 10 15 20 5 50 Frekuensi kumulatif 50 40 25 5 2/24/2011 Jonathan Sarwono . 500.ULTC .500.000 ² 2.500.000 ² 1.UKRIDA 12 .000 >Rp.000.000. 1. 2.000 ² 2.000.500.000 ² 1.000 >Rp. 1.000.‡ Frekuensi Kumulatif: frekuensi yang dihitung secara meningkat keatas dari frekuensi yang paling rendah sampai dengan yang paling tinggi Penghasilan per bulan Rp.

‡ Pengukuran Tendensi Sentral:Cara lain untuk menggambarkan statistik deskriptif ialah dengan menggunakan tendensi sentral.) A 100 B 125 C 140 D 150 E 175 N=5 7 X = 690 Mean= 690/5 = 138 2/24/2011 Jonathan Sarwono . Rata-rata populasi diberi lambang µ dan untuk sampel simbolnya x Indivi Penghasilan du dalam ribuan (Rp. median dan mode.ULTC . Contoh bilangan tendensi sentral ialah mean (rata-rata).UKRIDA 13 . Tendensi sentral berguna untuk menggambarkan bilangan yang dapat mewakili sekelompok bilangan tertentu ± Mean: rata-rata yang sering digunakan dalam pengukuran tendensi sentral .

yaitu 15) 2/24/2011 Jonathan Sarwono .ULTC .UKRIDA 14 .‡ Mode: nilai yang jumlah frekuensinya paling besar. Nilai 60 65 66 70 72 75 80 85 Frekuensi 5 6 7 15 2 6 8 10 Mode= 70 (jumlah frekuensi terbesar. Untuk mencari nilai mode dapat dilihat pada jumlah frekuensi yang paling besar.

Nomor 1 2 3 4 5 6 7 8 9 Nilai 60 65 70 75 85 80 81 79 77 85 adalah median yang membagi empat nilai di atasnya dan empat nilai di bawahnya 2/24/2011 Jonathan Sarwono .‡ Median: nilai tengah yang membatasi setengah frekuensi bagian bawah dan setengah frekuensi bagian atas bila data disusun secara berurutan.ULTC .UKRIDA 15 .

Yang dimaksud dengan deviasi ialah penyimpangan suatu nilai dari mean pada kelompoknya 2/24/2011 Jonathan Sarwono .ULTC . Nilai range dapat digunakan untuk menemukan nilai standard deviasi dengan cara membagi nilai range dengan 4. Pengukuran variasi diantaranya ialah: range. Range digunakan untuk menggambarkan bagaimana suatu data menyebar. maka semakin tidak seragam data atau gejala tersebut. Sebaliknya semakin kecil variasinya. maka keseragaman data semakin tinggi. mean deviasi dan standar deviasi ± Range: jarak antara nilai yang paling tinggi dengan nilai yang paling rendah. Jika nilai tertinggi 85 dan terendah 60.‡ Pengukuran Dispersi / Variasi: Untuk mengetahui bagaimana sebaran data disekitar rata-rata atau untuk mengetahui keseragaman suatu data atau gejala. Semakin besar variasinya. ± Mean Deviasi: disebut juga penyimpangan merupakan harga mutlak semua deviasi nilai-nilai individual.UKRIDA 16 . maka nilai range ialah 25.

Untuk populasi simbolnya sedang untuk sampel s ± Koefesien variasi: digunakan untuk mengukur dispersi relatif dengan cara membagi standard deviasi dengan nilai rata-rata dan kemudian mengkalikan 100 untuk dijadikan persen. Untuk populasi diberi simbol V dan sampel v 2/24/2011 Jonathan Sarwono . maka standard deviasinya besar.ULTC . Nilai ini lebih sering digunakan untuk menggambarkan sebaran data dibandingkan dengan varian. Atau secara teknik dikatakan sebagai perbedaan rata-rata antara nilai observasi dan rata-rata.UKRIDA 17 . Varian digunakan kalau kita ingin membandingkan variabilitas dua variabel atau lebih yang berskala interval Semakin besar nilai varian maka semakin menyebar data tersebut. Jika observasi individual mempunyai variasi besar dalam nilai rata-rata kelompoknya. Standard deviasi digunakan untuk menggambarkan dispersi dalam unit-unit yang sama sebagaimana pengukuran aslinya.± Variance: digunakan sebagai salah satu instrumen descriptor untuk distribusi data dan menggambarkan seberapa jauh suatu nilai terletak dari posisi ratarata. Varian populasi diberi simbol sigma ( 2) dan untuk sampel diberi simbol s2 ± Standard Deviasi: Nilai statistik yang digunakan untuk menunjukkan seberapa besar individu-individu bervariasi.

Sebagai contoh A mempunyai nilai Matematik 95 dalam daftar A dikatakan dia berada di percentile ke 90 dari semua mahasisa yang mengikuti ujian matematika. Skew menunjukkan tingkatan simetri dalam suatu data set. 25% nilai terendah disebut kuartil bawah. Kegunaan: untuk menggambarkan jika suatu data jatuh di kuartil tertentu ‡ Pengukuran Kemiringan (Skewness): menggambarkan bagaimana poin poin data pada posisi puncak atau bawah pada skala pengukuran. Semakin miring suatu distribusi. Dengan demikian data semakin tidak dapat dipercaya (tidak valid) 2/24/2011 Jonathan Sarwono . Misalnya 25% nilai tertinggi disebut sebagai kuartil atas. Maksudnya 90% mahasiswa yang ikut ujian tersebut nilainya dibawah nila A (<95). ± Quartile: data yang membagi sampel menjadi empat bagian sama besar. Simbol untuk populasi Sk dan sampel sk.UKRIDA 18 .± Percentile: untuk mengukur persentasi poin-poin data yang terletak dibawah satu nilai tertentu saat nilai nilai diurutkan. Dua kuartil disisi media disebut sebagai jarak interquartile.ULTC . maka semakin tinggi variabilitas.

UKRIDA 19 .eku.‡ Gambar Skewness Source: http://people.ULTC .edu 2/24/2011 Jonathan Sarwono .

tidak runcing dan tidak datar. maka semakin tidak normal suatu distribusi data. 2/24/2011 Jonathan Sarwono .ULTC . ± Distribusi platykurtic: distribusi lebih datar dibandingkan dengan kurva normal ± Distribusi leptokurtic: distribusi lebih runcing dibandingkan dengan kurva normal Nilai ideal kurtosis sebesar 3 atau kurtosis kurva bel normal.UKRIDA 20 . Dengan demikian semakin kurang berdistribusi normal. Ada tiga jenis kurtosis ± Distribusi mesokurtic: distribusi seperti kurva bel normal.‡ Pengukuran Kurtosis: menggambarkan bagaimana data yang terkonsentrasi disekitar nilai tunggal biasanya nilai rata-rata. Kesimpulannya kurtosis mengukur ketinggian (peak) atau ke rata-an (flat) suatu distribusi data. Simbol kurtosis untuk populasi K sedang untuk sampel k. maka data semakin tidak valid. Semakin runcing atau datar.

UKRIDA 21 .com 2/24/2011 Jonathan Sarwono .ULTC .Source: http://www.philender.

com 2/24/2011 Jonathan Sarwono .UKRIDA 22 .Source: http://mvpprograms.ULTC .

ULTC .UKRIDA Tatap Ruangan Lab Lab Lab Lab Lab 6 Lab 2/24/2011 23 .Benang Merah Rumus Menuju Ke Tesis No 1 2 3 4 5 Waktu Muka Basic Statistics 1 kali Melihat hubungan asosiasi antar variabel 1 kali dengan analisis korelasi Melihat pengaruh variabel satu terhadap 1 kali variabel lainnya dengan analisis regresi Mengindentifikasi faktor / variabel laten 1 kali dengan analisis faktor Melihat pengaruh langsung dan tidak 2 kali langsung serta gabungan dan parsial variabel satu terhadap variabel lainnya dengan analisis jalur (path analysis) Melihat pengaruh variabel laten satu terhadap 3 kali variabel laten lainnya dengan structural equation model (SEM) Materi Jonathan Sarwono .

UKRIDA 24 .ULTC .Latihan ‡ ‡ ‡ ‡ ‡ ‡ Frekuensi: hal 35 37 Explore: hal 39 40 Descriptive: hal 41 42 Tabulasi silang: hal 43 46 Distribusi normal Histogram 2/24/2011 Jonathan Sarwono .

(2009). Texas State Auditor's Office. Metode Penelitian Kuantitatif dan Kualitatif.ULTC . Yogyakarta: Penerbit Graha Ilmu Sarwono. Methodology Manual. Statistik itu Mudah: Panduan Lengkap untuk Belajar Komputasi Statistik Menggunakan SPSS 16 -------------. Jonathan. Jonathan. 5/95 2/24/2011 Jonathan Sarwono . rev.Referensi Sarwono.(2006). Data Analysis: Describing Data Descriptive Statistic.UKRIDA 25 .

Sign up to vote on this title
UsefulNot useful