METODE STATISTIKA II
Klasifikasi dalam Statistika
Buku Acuan
multivariate
Apakah Statistika Itu??!!
• Kita sekarang hidup di era yang didominasi oleh
informasi.
• Kita terus-menerus “dibombardir” dengan statistik
dan informasi statistik. Sebagai contoh:
Survei Pelanggan Berita Medis
Polling Politik Prediksi Ekonomi
Informasi Pemasaran Data Scanner
• Pikirkan seberapa sering Anda menggunakan data
dalam kehidupan sehari-hari.
• Tidak ada cara untuk menghindari penggunaan data.
“Statistika adalah cara untuk
mendapatkan informasi dari data”
-Gerald Keller-
Statistika
Data Informasi
Fakta, khususnya fakta Pengetahuan yang
numerik, dikumpulkan dikomunikasikan
bersama-sama untuk berkaitan dengan
referensi atau beberapa fakta
informasi. tertentu.
Statistika adalah ilmu yang mempelajari
cara pengumpulan, pengolahan,
penyajian, dan analisis data serta cara
pengambilan keputusan secara umum
berdasarkan hasil penelitian.
DATA
NOMINAL INTERVAL
ORDINAL RASIO
• Data yang diperoleh dengan cara kategorisasi atau klasifikasi.
• CIRI : posisi data setara
DATA
NOMINAL • tidak bisa dilakukan operasi matematika (+, ‐, x, :)
• CONTOH : jenis kelamin, jenis pekerjaan
• Data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah
diketahui dan tidak mempunyai titik nol absolut.
DATA • CIRI : Tidak ada kategorisasi
INTERVAL • bisa dilakukan operasi matematika
• CONTOH : temperatur yang diukur berdasarkan 0C dan 0F, sistem kalender
• data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah
diketahui dan mempunyai titik 0 absolut.
DATA • CIRI : tidak ada kategorisasi
RASIO
• bisa dilakukan operasi matematika
• CONTOH : gaji, skor ujian, jumlah buku
Metode Statistika
adalah prosedur-prosedur yang digunakan dalam
pegumpulan, penyajian, analisis, dan penafsiran
data.
Terbagi menjadi 2 :
Statistik •Metstat I
Deskriptif
Statistik •Metstat II
Inferensia
Statistik deskriptif menggambarkan kumpulan data
yang sedang dianalisis, tetapi tidak memungkinkan
kita untuk menarik kesimpulan atau campur tangan
terhadap data.
Populasi
Sampel
Inferens
Statistik
Parameter
Oleh karena itu, kita dapat membuat estimasi,
prediksi, atau keputusan tentang populasi
berdasarkan data sampel.
Dengan demikian, kita dapat menerapkan apa yang
kita ketahui tentang sampel ke populasi yang lebih
besar di mana sampel tersebut diambil!
Secara rasional:
• populasi besar membuat penyelidikan setiap
anggota tidak praktis dan mahal.
• Lebih mudah dan lebih murah untuk mengambil
sampel dan melakukan estimasi tentang populasi
dari sampel.
Bagaimanapun:
Kesimpulan dan Estimasi tidak selalu akan menjadi
benar.
Untuk alasan ini, kita masuk ke dalam inferensi
statistik "ukuran reliabilitas (keandalan)", yaitu
tingkat kepercayaan dan tingkat signifikansi.
Tingkat kepercayaan adalah proporsi suatu
prosedur estimasi akan benar.
Misalnya tingkat kepercayaan 95% berarti bahwa,
perkiraan berdasarkan bentuk inferensi statistik akan
benar 95%.
Contoh:
- Semua orang yang tidak mampu memenuhi
kebutuhan hidup dasar adalah miskin
- Simar adalah orang yang tidak mampu memenuhi
kebutuhan dasar
- Jadi Simar adalah miskin
Kesimpulan Induksi inferensia dalam
statistika
Kesimpulan yang diperoleh dengan menggunakan
pendekatan induksi yaitu menggunakan berbagai
informasi yang berlaku secara khusus untuk
mengambil suatu kesimpulan yang berlaku secara
umum; Kerangka berpikir khusus-umum
Contoh:
- Dari penelitian terhadap 10 orang penduduk Desa
Kahuripan, 5 orang diantaranya adalah laki-laki
- Setiap laki-laki yang diteliti bekerja sebagai petani
- Simar adalah laki-laki yang tinggal di Desa Kahuripan
- Jadi Simar adalah petani
Khusus
DEDUKSI Umum
Umum
INDUKSI Khusus
• Statistik inferensia digunakan untuk menarik
kesimpulan.
• Kesimpulan bisa induksi dan deduksi.
• Kesimpulan statistika adalah induksi.
• Manakah yang induksi?
Parametrik dan Nonparametrik
Salah satu sumber kebingungan dalam
menentukan statistik apa yang digunakan dalam
menganalisis data adalah apakah data Anda
memungkinkan untuk dianalisis dengan statistik
parametrik atau nonparametrik.
Pertimbangan lain:
Jika skala pengukuran N-O Nonparametrik
Jika skala pengukuran I-R Parametrik
• Statistik PARAMETRIK : berhubungan dengan
inferensi statistik yang membahas parameter-
parameter populasi; jenis data interval atau
rasio; distribusi data normal atau mendekati
normal, ukuran sampel cukup besar
Karakterisasi
menggunakan
Populasi statistik
Karakterisasi
menggunakan parameter
27
Ada dua macam jenis populasi, yaitu populasi
terbatas dan populasi tidak terbatas (tak
terhingga).
a. Populasi homogen
Populasi homogen adalah sumber data yang unsurnya
memiliki sifat atau keadaan yang sama sehingga tidak
perlu mempermasalahkan jumlahnya secara kuantitatif.
b. Populasi heterogen
Populasi heterogen adalah sumber data yang unsurnya
memiliki sifat atau keadaan yang berbeda (bervariasi)
sehingga perlu ditetapkan batas-batasnya baik secara
kuantitatif maupun secara kualitatif.
Teknik Sampling
Sampling Techniques
Nonprobability Probability
Sampling Techniques Sampling Techniques
5. Mengambil kesimpulan
INSTRUMEN
SAMPEL
SIFAT DATA
PERAN STATISTIKA
VARIABEL
METODE ANALISIS
Contoh Soal
Tiga puluh enam persen dari penduduk DKI
dewasa memiliki alergi. Sampel dari 1.200 orang
dewasa yang dipilih secara acak menghasilkan
33,2% memiliki alergi.
• Variable – Alergi
Syarat :
1. Pemilihan sumbu (sumbu tegak dan sumbu datar), kecuali grafik lingkaran
2. Penetapan skala (skala biasa, skala logaritma, skala lain)
3. Ukuran grafik (tidak terlalu besar, tinggi, pendek)
Jenis Grafik :
4
• Grafik Batang (Bar)
Sumbu tegak
3
• Grafik Garis (line)
2
• Grafik Lingkaran (Pie)
1
• Grafik Interaksi (Interactive)
0
1 2 3 4
Titik
pangkal Sumbu datar
Grafik Batang (Bar) Grafik Garis (line)
30 30
20 20
10 10
Jumlah
Count
0 0
administrasi personalia produksi marketing keuangan administrasi personalia produksi marketing keuangan
keuangan
administrasi
700000
600000
personalia
500000
Mean gaji perbulan
Jenis kelamin
400000
marketing laki-laki
prestasi kerja
Frekuensi
KELOMPOK FREKUENSI
Kelompok ke-1 f1 Pendidikan Frekuensi
Kelompok ke-2 f2
S1 62
Kelompok ke-3 f3
S2 19
Kelompok ke-i fi
S3 9
Kelompok ke-k fk
90
k
n = Σ fi
i=1
k
n = Σ fi = f1 + f2 + f3 +….. + fi + …… + fk
i=1
Distribusi Frekuensi
X + X2 + X3 + … + Xn n
X= 1 Σ Xi
n i =1
n
Bila terdapat sekumpulan bilangan di mana masing-masing bilangannya memiliki frekuensi,
maka rata-rata hitung menjadi :
k
X f + X2 f2 + X3 f3 + … + Xkfk Σ Xifi
X= 1 1
f 1 + f 2 + f 3 + … + fk i =1
k
Σ fi
Cara menghitung : i =1
MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.
Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55.
Pertanyaannya adalah apakah siswa yang memperoleh nilai 7
termasuk istimewa, baik, atau biasa-biasa saja ?
MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.
Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55.
Pertanyaannya adalah apakah siswa yang memperoleh nilai 7
termasuk istimewa, baik, atau biasa-biasa saja ?
Jika sekumpulan data banyak bilangannya genap (tidak mempunyai bilangan tengah)
Maka mediannya adalah rata-rata dari dua bilangan yang ditengahnya.
Contoh : 1 2 3 4 5 6 7 8 8 9 maka median (5+6) : 2 = 5.5
Ukuran Pemusatan
Contoh : A : 100 90 80 70 60 50 40 30 20 10
B : 100 100 100 100 100 10 10 10 10 10
C : 100 100 100 90 80 30 20 10 10 10
X = 55
r = 100 – 10 = 90
Rata-rata
Ukuran Penyebaran
Deviasi Rata-rata : penyebaran
Berdasarkan harga mutlak simpangan Kelompok A Kelompok B
bilangan-bilangan terhadap rata- Nilai X X - X |X – X| Nilai X X - X |X – X|
ratanya. 100 45 45 100 45 45
90 35 35 100 45 45
80 25 25 100 45 45
70 15 15 90 35 35
60 5 5 80 25 25
Rata-rata 50 -5 5 30 -25 25
40 -15 15 20 -35 35
30 -25 25 10 -45 45
20 -35 35 10 -45 45
10 -45 45 10 -45 45
Jumlah 0 250 Jumlah 0 390
DR = 250 = 25 DR = 390 = 39
10 10
n
|Xi – X|
Rata-rata DR = Σ
n
i=1
8250 15850
n s= √ 9 = 30.28 s= √ 9 = 41.97
√ Σ (Xi – X)
2
s=
i=1 n-1
Kesimpulan :
Kelompok A : rata-rata = 55 ; DR = 25 ; s = 30.28
Kelompok B : rata-rata = 55 ; DR = 39 ; s = 41.97
Maka data kelompok B lebih tersebar daripada kelompok A