Konsep Dasar Statistik

Basic Statistics:
Pengantar, Konsep Dasar, Aplikasi

(Mahasiswa Pasca Sarjana UKRIDA 2010/11)
Jonathan Sarwono
Web: http://www.jonathansarwono.info
12/08/21 Jonathan Sarwono - ULTC - UKRIDA 1

Konsep Dasar
• Definisi: Statistik merupakan ilmu untuk mengumpulkan, mengorganisasi

dan menginterpretasi data numerik.
• Fungsi:
– Mendiskripsikan variabel
– Menghubung-hubungkan antar variabel (hubungan asosiasi)
– Melihat pengaruh satu variabel terhadap variabel lain (recursive dan reciprocal).
Pengaruh dapat secara langsung maupun tidak langsung
– Membandingkan beberapa sampel (rata-rata)
– Memprediksi satu variabel dengan menggunakan variabel lainnya.
• Variabel: Variabel didefinisikan sebagai “something that may vary or
differ” (Brown, 1998:7). Definisi lain yang lebih detil mengatakan bahwa
variabel “ is simply symbol or a concept that can assume any one of a set
of values” (Davis, 1998:23)

Var Bebas
Var Var
Var Moderat Perantara Tergantung
Var Kontrol
Sumber: Tuckman (1978)

• Skala Pengukuran: Skala pengukuran merupakan aturan atau tata cara
memberikan angka atau nilai kepada aspek-aspek obyek, manusia,
pernyataan dan kejadian. Pemberian angka tersebut tidak boleh dilakukan
sembarangan, tetapi didasarkan pada konsep dan definisi operasional
suatu variabel. Tujuan menggunakan skala pengukuran ialah pertama,
menterjemahkan karakteristik dan sifat-sifat kejadian-kejadian empiris
kedalam suatu bentuk yang dapat dianalisis oleh peneliti; kedua, untuk
membawa informasi dari variabel-variabel yang sedang diukur. Jenis skala
pengukuran yang ada:
– Nominal
– Ordinal
– Interval
– Rasio

 Tingkat Kepercayaan (Confidence Interval): didasarkan pada gagasan
yang berasal dari Teorema Batas Sentral (Central Limit Theorem). Gagasan
pokok yang berasal dari teorema tersebut ialah apabila suatu populasi
secara berulang-ulang ditarik sampel, maka nilai rata-rata atribut yang
diperoleh dari sampel-sampel tersebut sejajar dengan nilai populasi yang
sebenarnya.
 Contoh: jika tingkat kepercayaan sebesar 95% dipilih, maka 95 dari 100
sampel akan mempunyai nilai populasi yang sebenarnya dalam jangkauan
ketepatan sebagaimana sudah dispesifikasi sebelumnya.
 Dalam SPSS CI menggunakan default sebesar 95%
 Dalam teori umumnya: 99%, 95% dan 90%
• Signifikansi / Probabilitas (Significance Level/ P Value / α): Signifikansi
atau disebut juga probabilitas merupakan tingkat ketepatan (presisi)
dalam kaitannya dengan kesalahan pengambilan sampel (sampling error),
merupakan jangkauan dimana nilai populasi yang tepat diperkirakan
– Contoh: Sig = 0,05 (SPSS menggunakan deafult sebesar 0,05)
Range: 0,01 – 0,1. Semakin kecil sig-nya semakin besar jumlah sampel

• Jumlah Data: Jumlah individu yang dijadikan sebagai sampel yang ditarik
dari populasi
– Jumlah sampel: n
– Jumlah populasi: N
– Dalam statistik menentukan jumlah n dari N disebut dengan teknik sampling
yang meliputi menentukan desain dan ukuran sampel (n).
• Derajat Kebebasan (Degree of Freedom / DF ): Variabel – variabel
independen random yang menyusun suatu nilai statistik tertentu /
estimasi jumlah kategori independen dalam suatu pengujian atau
experimen statistik tertentu.
• Nilai Kritis (Critical Value): nilai yang menyebabkan penolakan hipotesis 0
jika dalam pengujian hipotesis diberikan nilai statistik tertentu yg lebih
besar dari nilai kritis dan penerimaan hipotesis 0 apabila nilai statistik
yang diberikan lebih kecil dari nilai kritisnya.
– Misalnya nilai kritis t dengan derajat kebebasan (DF) sebesar 12 dan tingkat
signifikansi (Sig) sebesar 0,05 adalah 1,98. Nilai absolut t harus lebih besar
dari 1,98 agar H0 ditolak (misalnya 2) . Nilai kritis diambil dari table nilai kritis t
sedang nilai absolut (hitung / hasil riset) berasal dari data

 Hipotesis (hypothesis): “pernyataan tentative yang merupakan dugaan
mengenai apa saja yang sedang kita amati dalam usaha untuk
memahaminya”. (Nasution:2000)
Zikmund (1997:112) mendefinisikan hipotesis sebagai: “Unproven
proposition or supposition that tentatively explains certain facts or
phenomena; a probable answer to a research question”.
– Hipotesis penelitian/kerja: hipotesis penelitian merupakan anggapan dasar
peneliti terhadap suatu masalah yang sedang dikaji. Dalam hipotesis ini
peneliti mengaggap benar hipotesisnya yang kemudian akan dibuktikan
secara empiris melalui pengujian hipotesis dengan mempergunakan data yang
diperolehnya selama melakukan penelitian
– Hipotesis operasional merupakan hipotesis yang bersifat obyektif. Artinya
peneliti merumuskan hipotesis tidak semata-mata berdasarkan anggapan
dasarnya, tetapi juga berdasarkan obyektifitasnya, bahwa hipotesis penelitian
yang dibuat belum tentu benar setelah diuji dengan menggunakan data yang
ada. Untuk itu peneliti memerlukan hipotesis pembanding yang bersifat
obyektif dan netral atau secara teknis disebut hipotesis nol (H0). H0
digunakan untuk memberikan keseimbangan pada hipotesis penelitian karena
peneliti meyakini dalam pengujian nanti benar atau salahnya hipotesis
penelitian tergantung dari bukti-bukti yang diperolehnya selama melakukan
penelitian

– Hipotesis statistik: Hipotesis statistik merupakan jenis hipotesis yang
dirumuskan dalam bentuk notasi statistik. Hipotesis ini dirumuskan
berdasarkan pengamatan peneliti terhadap populasi dalam bentuk angka-
angka (kuantitatif).
• Distribusi normal: Data yang mempunyai distribusi normal artinya data
yang distribusinya simetris sempurna. Jika digunakan bahasa umum
disebut berbentuk kurva bel
• Statistik Deskriptif: transformasi data mentah ke dalam suatu bentuk
yang akan membuat pembaca lebih mudah memahami dan menafsirkan
maksud dari data atau angka yang ditampilkan. Kegunaan utama statistik
deskriptif ialah untuk menggambarkan jawaban-jawaban observasi. Yang
termasuk didalamnya diantaranya ialah distribusi frekuensi, distribusi
persen dan rata-rata (mean).
• Statistik Inferensi: nilai statistik yang digunakan dalam proses penarikan
kesimpulan mengenai suatu parameter tertentu, misal koefesien korelasi,
dimana seseorang sedang melakukan pengukuran atau membuat
estimasi.

Statistik Deskriptif
• Pengertian: statistik deskriptif mencakup angka-angka, tabel, bagan, dan
grafik yang digunakan untuk menggambarkan, mengorganisasi, meringkas
dan mempresentasikan data mentah. Statistik deskriptif sering digunakan
untuk menganalisis:
– Tendensi sentral (lokasi) data: dimana posisi data berada yang biasanya diukur
dengan rata-rata (mean), nilai tengah (median) dan mode.
– Dispersi (keanekaragaman) data: bagaimana data menyebar yang biasanya
dengan varian dan akar kuadratnya dan standard deviasi.
– Skew (simetris) data: bagaimana data terkonsentrasi di bagian ujung bawah
atau atas skala yang diukur dengan skew index.
– Kurtosis (ketinggian puncak) data: bagaimana data terkonsentrasi di sekitar
nilai tunggal, yang diukur dengan menggunakan kurtosis index.

• Tabel distribusi frekuensi: untuk meringkas dan memadatkan data
dengan cara mengelompokkan kedalam kelas-kelas dan mencatat berapa
banyak poin-poin data yang jatuh di masing-masing kelas tersebut. Dalam
menyajikan digunakan table. Distribusi frekeunsi merupakan dasar bagi
statistik deskriptif dan menjadi prasyarat untuk membuat grafik serta
untuk menggambarkan seperangkat data.
Jawaban Frekuensi
Pernah 110
Tidak pernah 90
Jumlah 200

• Frekuensi Relatif: frekuensi yang dihitung dalam bentuk persen.
Umur Frekuensi Persentase

<25 121 37%
26-30 59 18%
31-40 83 25%
>40 66 20%
Jumlah 329 100%

• Frekuensi Kumulatif: frekuensi yang dihitung secara meningkat keatas
dari frekuensi yang paling rendah sampai dengan yang paling tinggi
Penghasilan per bulan Frekuensi Frekuensi

kumulatif
Rp. 500.000 – 1.000.000 10 50
>Rp. 1.000.000 – 1.500.000 15 40
>Rp. 1.500.000 – 2.000.000 20 25
>Rp. 2.000.000 – 2.500.000 5 5
Jumlah 50

• Pengukuran Tendensi Sentral:Cara lain untuk menggambarkan statistik
deskriptif ialah dengan menggunakan tendensi sentral. Contoh bilangan
tendensi sentral ialah mean (rata-rata), median dan mode. Tendensi
sentral berguna untuk menggambarkan bilangan yang dapat mewakili
sekelompok bilangan tertentu
– Mean: rata-rata yang sering digunakan dalam pengukuran tendensi sentral .
Rata-rata populasi diberi lambang µ dan untuk sampel simbolnya x
Indivi Penghasilan
du dalam ribuan
(Rp.)
A 100
B 125
C 140
D 150
E 175
N=5  X = 690
Mean= 690/5
= 138
• Mode: nilai yang jumlah frekuensinya paling besar. Untuk mencari nilai
mode dapat dilihat pada jumlah frekuensi yang paling besar.
Nilai Frekuensi
60 5
65 6
66 7
70 15
72 2
75 6
80 8
85 10
Mode= 70 (jumlah frekuensi terbesar, yaitu 15)

• Median: nilai tengah yang membatasi setengah frekuensi bagian bawah
dan setengah frekuensi bagian atas bila data disusun secara berurutan.
Nomor Nilai
1 60
2 65
3 70
4 75
5 85
6 80
7 81
8 79
9 77
85 adalah median yang membagi empat nilai di atasnya

dan empat nilai di bawahnya

• Pengukuran Dispersi / Variasi: Untuk mengetahui bagaimana sebaran
data disekitar rata-rata atau untuk mengetahui keseragaman suatu data
atau gejala. Semakin besar variasinya, maka semakin tidak seragam data
atau gejala tersebut. Sebaliknya semakin kecil variasinya, maka
keseragaman data semakin tinggi. Pengukuran variasi diantaranya ialah:
range, mean deviasi dan standar deviasi
– Range: jarak antara nilai yang paling tinggi dengan nilai yang paling rendah.
Jika nilai tertinggi 85 dan terendah 60, maka nilai range ialah 25. Range
digunakan untuk menggambarkan bagaimana suatu data menyebar. Nilai
range dapat digunakan untuk menemukan nilai standard deviasi dengan cara
membagi nilai range dengan 4.
– Mean Deviasi: disebut juga penyimpangan merupakan harga mutlak semua
deviasi nilai-nilai individual. Yang dimaksud dengan deviasi ialah
penyimpangan suatu nilai dari mean pada kelompoknya

– Variance: digunakan sebagai salah satu instrumen descriptor untuk distribusi
data dan menggambarkan seberapa jauh suatu nilai terletak dari posisi rata-
rata. Varian digunakan kalau kita ingin membandingkan variabilitas dua
variabel atau lebih yang berskala interval Semakin besar nilai varian maka
semakin menyebar data tersebut. Varian populasi diberi simbol sigma (σ2) dan
untuk sampel diberi simbol s2
– Standard Deviasi: Nilai statistik yang digunakan untuk menunjukkan seberapa
besar individu-individu bervariasi. Jika observasi individual mempunyai variasi
besar dalam nilai rata-rata kelompoknya, maka standard deviasinya besar.
Atau secara teknik dikatakan sebagai perbedaan rata-rata antara nilai
observasi dan rata-rata. Standard deviasi digunakan untuk menggambarkan
dispersi dalam unit-unit yang sama sebagaimana pengukuran aslinya. Nilai ini
lebih sering digunakan untuk menggambarkan sebaran data dibandingkan
dengan varian. Untuk populasi simbolnya σ sedang untuk sampel s
– Koefesien variasi: digunakan untuk mengukur dispersi relatif dengan cara
membagi standard deviasi dengan nilai rata-rata dan kemudian mengkalikan
100 untuk dijadikan persen. Untuk populasi diberi simbol V dan sampel v

– Percentile: untuk mengukur persentasi poin-poin data yang terletak dibawah
satu nilai tertentu saat nilai – nilai diurutkan. Sebagai contoh A mempunyai
nilai Matematik 95 dalam daftar A dikatakan dia berada di percentile ke 90
dari semua mahasisa yang mengikuti ujian matematika. Maksudnya 90%
mahasiswa yang ikut ujian tersebut nilainya dibawah nila A (<95).
– Quartile: data yang membagi sampel menjadi empat bagian sama besar.
Misalnya 25% nilai tertinggi disebut sebagai kuartil atas, 25% nilai terendah
disebut kuartil bawah. Dua kuartil disisi media disebut sebagai jarak
interquartile. Kegunaan: untuk menggambarkan jika suatu data jatuh di kuartil
tertentu
• Pengukuran Kemiringan (Skewness): menggambarkan bagaimana poin –
poin data pada posisi puncak atau bawah pada skala pengukuran. Simbol
untuk populasi Sk dan sampel sk. Skew menunjukkan tingkatan simetri
dalam suatu data set. Semakin miring suatu distribusi, maka semakin
tinggi variabilitas. Dengan demikian data semakin tidak dapat dipercaya
(tidak valid)

• Gambar Skewness
Source: http://people.eku.edu
• Pengukuran Kurtosis: menggambarkan bagaimana data yang
terkonsentrasi disekitar nilai tunggal biasanya nilai rata-rata.
Kesimpulannya kurtosis mengukur ketinggian (peak) atau ke rata-an (flat)
suatu distribusi data. Semakin runcing atau datar, maka semakin tidak
normal suatu distribusi data. Dengan demikian semakin kurang
berdistribusi normal, maka data semakin tidak valid. Simbol kurtosis untuk
populasi K sedang untuk sampel k. Ada tiga jenis kurtosis
– Distribusi mesokurtic: distribusi seperti kurva bel normal, tidak runcing dan
tidak datar.
– Distribusi platykurtic: distribusi lebih datar dibandingkan dengan kurva normal
– Distribusi leptokurtic: distribusi lebih runcing dibandingkan dengan kurva
normal
Nilai ideal kurtosis sebesar 3 atau kurtosis kurva bel normal.

Source: http://www.philender.com

Source: http://mvpprograms.com

Benang Merah Rumus Menuju Ke Tesis
No Materi Waktu Tatap Ruangan

Muka
1 Basic Statistics 1 kali Lab
2 Melihat hubungan asosiasi antar variabel 1 kali Lab
dengan analisis korelasi
3 Melihat pengaruh variabel satu terhadap 1 kali Lab
variabel lainnya dengan analisis regresi
4 Mengindentifikasi faktor / variabel laten 1 kali Lab
dengan analisis faktor
5 Melihat pengaruh langsung dan tidak 2 kali Lab
langsung serta gabungan dan parsial variabel
satu terhadap variabel lainnya dengan analisis
jalur (path analysis)
6 Melihat pengaruh variabel laten satu terhadap 3 kali Lab
variabel laten lainnya dengan structural
equation model (SEM)

Latihan
• Frekuensi: hal 35 – 37
• Explore: hal 39 – 40
• Descriptive: hal 41 – 42
• Tabulasi silang: hal 43 – 46
• Distribusi normal
• Histogram

Referensi
Sarwono, Jonathan.(2006). Metode Penelitian Kuantitatif dan Kualitatif.
Yogyakarta: Penerbit Graha Ilmu
Sarwono, Jonathan.(2009). Statistik itu Mudah: Panduan Lengkap untuk
Belajar Komputasi Statistik Menggunakan SPSS 16
-------------. Data Analysis: Describing Data – Descriptive Statistic. Texas State
Auditor's Office, Methodology Manual, rev. 5/95

Konsep Dasar Statistik

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Konsep Dasar Statistik

Diunggah oleh

Hak Cipta:

Format Tersedia

Basic Statistics:

Pengantar, Konsep Dasar, Aplikasi

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 1

• Definisi: Statistik merupakan ilmu untuk mengumpulkan, mengorganisasi

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 2

Sumber: Tuckman (1978)

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 3

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 4

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 5

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 6

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 7

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 8

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 9

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 10

Umur Frekuensi Persentase

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 11

Penghasilan per bulan Frekuensi Frekuensi

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 12

Mode= 70 (jumlah frekuensi terbesar, yaitu 15)

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 14

85 adalah median yang membagi empat nilai di atasnya

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 15

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 16

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 17

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 18

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 20

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 21

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 22

No Materi Waktu Tatap Ruangan

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 23

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 24

12/08/21 Jonathan Sarwono - ULTC - UKRIDA 25

Anda mungkin juga menyukai