Anda di halaman 1dari 47

Pertemuan ke-1

METODE STATISTIKA II
Klasifikasi dalam Statistika
Buku Acuan

 Anderson, T W and Sclove, S L. The Statistical Analysis


of Data, second ed. The Scientific Press. USA. 1986.
 Bhattacharya, G K and Johnson, RA. Statistical
Concepts and Methods. New York. John Wiley & Sons.
1977.
 Supranto, J. Statistik, Teori dan Aplikasi II. Jakarta.
Erlangga.1986.
 Walpole, R E. Pengantar Statistika, edisi 3
(terjemahan). Jakarta: Gramedia. 1982.
Pokok Bahasan
 Statistika Deskriptif dan Inferensia

 Kesimpulan induksi dan deduksi

 Statistika Parametrik dan Statistika Non Parametrik

 Jenis Populasi dan Sampel

 Peubah / Variabel Analisis : univariate, bivariate,

multivariate
Apakah Statistika Itu??!!
• Kita sekarang hidup di era yang didominasi oleh
informasi.
• Kita terus-menerus “dibombardir” dengan statistik
dan informasi statistik. Sebagai contoh:
Survei Pelanggan Berita Medis
Polling Politik Prediksi Ekonomi
Informasi Pemasaran Data Scanner
• Pikirkan seberapa sering Anda menggunakan data
dalam kehidupan sehari-hari.
• Tidak ada cara untuk menghindari penggunaan data.
“Statistika adalah cara untuk
mendapatkan informasi dari data”
-Gerald Keller-

Statistika

Data Informasi
Fakta, khususnya fakta Pengetahuan yang
numerik, dikumpulkan dikomunikasikan
bersama-sama untuk berkaitan dengan
referensi atau beberapa fakta
informasi. tertentu.
Statistika adalah ilmu yang mempelajari
cara pengumpulan, pengolahan, 
penyajian, dan analisis data serta cara
pengambilan keputusan secara umum
berdasarkan hasil penelitian.

Di dalam statistika ada Ketidakpastian dan Variasi


JENIS DATA
DATA KUALITATIF : DATA KUANTITATIF :
Data yang dinyatakan dalam Data yang dinyatakan dalam
bentuk bukan angka. bentuk angka
Contoh : jenis pekerjaan, Contoh : lama bekerja,
status marital, tingkat jumlah gaji, usia, hasil
kepuasan kerja ulangan

DATA

KUALITATIF JENIS KUANTITATIF


DATA

NOMINAL INTERVAL
ORDINAL RASIO
• Data yang diperoleh dengan cara kategorisasi atau klasifikasi.
• CIRI : posisi data setara
DATA 
NOMINAL • tidak bisa dilakukan operasi matematika (+, ‐, x, :)
• CONTOH : jenis kelamin, jenis pekerjaan

• Data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data 


tersebut terdapat hubungan
DATA  • CIRI : posisi data tidak setara/ada urutan
ORDINAL • tidak bisa dilakukan operasi matematika (+, ‐, x, :)
• CONTOH : kepuasan kerja, motivasi

• Data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah
diketahui dan tidak mempunyai titik nol absolut.
DATA  • CIRI :  Tidak ada kategorisasi
INTERVAL • bisa dilakukan operasi matematika
• CONTOH : temperatur yang diukur berdasarkan 0C dan 0F, sistem kalender

• data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah
diketahui dan mempunyai titik 0 absolut.
DATA  • CIRI : tidak ada kategorisasi
RASIO
• bisa dilakukan operasi matematika
• CONTOH : gaji, skor ujian, jumlah buku
Metode Statistika
adalah prosedur-prosedur yang digunakan dalam
pegumpulan, penyajian, analisis, dan penafsiran
data.

Terbagi menjadi 2 :

Statistik •Metstat I
Deskriptif

Statistik •Metstat II
Inferensia
Statistik deskriptif menggambarkan kumpulan data 
yang sedang dianalisis, tetapi tidak memungkinkan 
kita untuk menarik kesimpulan atau campur tangan
terhadap data. 

Statistik inferensia juga merupakan seperangkat 


metode, tetapi digunakan untuk menarik kesimpulan
atau inferensi tentang karakteristik populasi
berdasarkan data dari sampel.
Inferensi Statistik merupakan proses pembuatan
suatu estimasi, prediksi, atau keputusan mengenai
suatu populasi berdasarkan suatu sampel.

Populasi

Sampel

Inferens

Statistik
Parameter

Apa yang bisa kita simpulkan tentang Parameter Populasi


berdasarkan Statistik Sampel?
Kita menggunakan statistik untuk membuat 
kesimpulan/ inferensi tentang parameter.

Oleh karena itu, kita dapat membuat estimasi, 
prediksi, atau keputusan tentang populasi
berdasarkan data sampel.

Dengan demikian, kita dapat menerapkan apa yang 
kita ketahui tentang sampel ke populasi yang lebih 
besar di mana sampel tersebut diambil!
Secara rasional:
• populasi besar membuat penyelidikan setiap
anggota tidak praktis dan mahal.
• Lebih mudah dan lebih murah untuk mengambil
sampel dan melakukan estimasi tentang populasi
dari sampel.

Bagaimanapun:
Kesimpulan dan Estimasi tidak selalu akan menjadi
benar.
Untuk alasan ini, kita masuk ke dalam inferensi
statistik "ukuran reliabilitas (keandalan)", yaitu
tingkat kepercayaan dan tingkat signifikansi.
Tingkat kepercayaan adalah proporsi suatu
prosedur estimasi akan benar.
Misalnya tingkat kepercayaan 95% berarti bahwa,
perkiraan berdasarkan bentuk inferensi statistik akan
benar 95%.

Ketika tujuan dari inferensi statistik adalah untuk


menarik kesimpulan tentang populasi, tingkat
signifikansi mengukur seberapa sering suatu
kesimpulan akan salah dalam jangka panjang.
Misalnya tingkat signifikansi 5% berarti bahwa,
dalam jangka panjang, jenis kesimpulan akan salah
5%.
Kesimpulan Deduksi dan Induksi
 Kesimpulan Deduksi
Kesimpulan yang diperoleh dengan menggunakan
pendekatan deduksi yaitu menggunakan satu atau
lebih informasi yang berlaku umum untuk menarik
kesimpulan yang berlaku khusus; Kerangka berpikir
umum-khusus

Contoh:
- Semua orang yang tidak mampu memenuhi
kebutuhan hidup dasar adalah miskin
- Simar adalah orang yang tidak mampu memenuhi
kebutuhan dasar
- Jadi Simar adalah miskin
 Kesimpulan Induksi inferensia dalam
statistika
Kesimpulan yang diperoleh dengan menggunakan
pendekatan induksi yaitu menggunakan berbagai
informasi yang berlaku secara khusus untuk
mengambil suatu kesimpulan yang berlaku secara
umum; Kerangka berpikir khusus-umum

Contoh:
- Dari penelitian terhadap 10 orang penduduk Desa
Kahuripan, 5 orang diantaranya adalah laki-laki
- Setiap laki-laki yang diteliti bekerja sebagai petani
- Simar adalah laki-laki yang tinggal di Desa Kahuripan
- Jadi Simar adalah petani
Khusus
DEDUKSI Umum

Umum
INDUKSI Khusus
• Statistik inferensia digunakan untuk menarik
kesimpulan.
• Kesimpulan bisa induksi dan deduksi.
• Kesimpulan statistika adalah induksi.
• Manakah yang induksi?
Parametrik dan Nonparametrik
Salah satu sumber kebingungan dalam
menentukan statistik apa yang digunakan dalam
menganalisis data adalah apakah data Anda
memungkinkan untuk dianalisis dengan statistik
parametrik atau nonparametrik.

Pentingnya masalah ini tidak dapat diremehkan!

Jika salah maka Anda menggunakan prosedur


statistik yang salah atau Anda menggunakan
prosedur yang kurang tepat.
Definisi Nonparametrik menurut Walsh, J.E. (1962)
dalam buku “Handbook of Nonparametric Statistics”:

“A precise and universally acceptable definition of the


term ‘nonparametric’ is not presently available. The
viewpoint adopted in this handbook is that a statistical
procedure is of a nonparametric type if it has
properties which are satisfied to a reasonable
approximation when some assumptions that are
at least of a moderately general nature hold.”

Definisi tersebut menggarisbawahi fakta bahwa sulit


untuk mendefinisikan secara khusus istilah
nonparametrik.
Untuk tujuan praktis, definisi prosedur statistik
nonparametrik adalah prosedur statistik yang
tidak bergantung pada asumsi tentang shape atau
bentuk distribusi peluang dari mana data diambil.

Pertimbangan lain:
Jika skala pengukuran N-O  Nonparametrik
Jika skala pengukuran I-R  Parametrik
• Statistik PARAMETRIK : berhubungan dengan
inferensi statistik yang membahas parameter-
parameter populasi; jenis data interval atau
rasio; distribusi data normal atau mendekati
normal, ukuran sampel cukup besar

• Statistik NONPARAMETRIK : inferensi


statistik membahas parameter-parameter
populasi; jenis data nominal atau ordinal;
distribusi data tidak diketahui atau tidak
normal, ukuran sampel cukup kecil
Uji Statistik pada Statistika Parametrik:
1. Uji asumsi normalitas
2. Uji homogenitas
3. Uji asumsi multikolinieritas
-Analisis korelasi (misalkan korelasi Pearson)
-Analisis regresi linier
-Analisis komparasi
 Uji perbedaan rata-rata/mean dari 2
kelompok (Uji Z dan Uji t)
 Uji analisis varians (uji Anova) satu arah
Uji Statistik pada Statistika Non Parametrik:
-Analisis korelasi (misalnya korelasi peringkat
Spearman)
-Analisis komparasi
 Sign test atau uji tanda dua sampel
berpasangan
 Uji Mann-Whitney U untuk menguji apakah 2
mean populasi sama atau tidak
-Uji Chi-Square
-Regresi non parametrik
Populasi & Sampel
 Populasi adalah suatu kumpulan orang, benda
atau objek-objek lainnya yang merupakan fokus
perhatian dari penelitian
 Contoh populasi:
 Seluruh penduduk Indonesia pada tahun 2014
 Seluruh mahasiwa STIS pada semester ganjil
tahun akademik 2014/2015
 Banyaknya unit pengamatan dalam sebuah populasi
disebut ukuran populasi dan dinotasikan dengan N
 Sampel adalah suatu bagian (sebagian) dari
populasi yang diambil sebagai contoh dari
populasi bersangkutan
 Contoh sampel:
 Sebagian penduduk Indonesia pada tahun
2014
 Sebagian mahasiwa STIS pada semester ganjil
tahun akademik 2014/2015
 Banyaknya unit pengamatan dalam sebuah sampel
disebut ukuran sampel dan dinotasikan dengan n
dimana n<N
Sampel

Karakterisasi
menggunakan
Populasi statistik

Karakterisasi
menggunakan parameter

Untuk menarik inferensi, memprediksi dan


menarik kesimpulan dari sebuah populasi

27
Ada dua macam jenis populasi, yaitu populasi
terbatas dan populasi tidak terbatas (tak
terhingga).

1) Populasi Terbatas (Finite Population)


Populasi terbatas mempunyai sumber data yang
jelas batasnya secara kuantitatif sehingga dapat
dihitung jumlahnya.

2) Populasi Tak Terbatas (Infinite Population)


Populasi tak terbatas yaitu sumber datanya tak
dapat ditentukan batas-batasnya sehingga relatif
tidak dapat dinyatakan dalam bentuk jumlah (unit
pengamatan tak terhingga banyaknya)
Berdasarkan sifatnya populasi dapat digolongkan
menjadi populasi homogen dan populasi heterogen.

a. Populasi homogen
Populasi homogen adalah sumber data yang unsurnya
memiliki sifat atau keadaan yang sama sehingga tidak
perlu mempermasalahkan jumlahnya secara kuantitatif.

b. Populasi heterogen
Populasi heterogen adalah sumber data yang unsurnya
memiliki sifat atau keadaan yang berbeda (bervariasi)
sehingga perlu ditetapkan batas-batasnya baik secara
kuantitatif maupun secara kualitatif.
Teknik Sampling
Sampling Techniques

Nonprobability Probability
Sampling Techniques Sampling Techniques

Convenience Judgmental Quota Snowball


Sampling Sampling Sampling Sampling

Simple Random Systematic Stratified Cluster Other Sampling


Sampling Sampling Sampling Sampling Techniques
METODE ILMIAH :
Adalah salah satu cara mencari kebenaran yang bila ditinjau dari segi
penerapannya, resiko untuk keliru paling kecil.

LANGKAH-LANGKAH DALAM METODE ILMIAH :


1. Merumuskan masalah
2. Melakukan studi literatur
3. Membuat dugaan-dugaan, pertanyaan-pertanyaan atau hipotesis

4. Mengumpulkan dan mengolah data, menguji hipotesis,


atau menjawab pertanyaan

5. Mengambil kesimpulan

INSTRUMEN

SAMPEL

SIFAT DATA
PERAN STATISTIKA
VARIABEL

METODE ANALISIS
Contoh Soal
Tiga puluh enam persen dari penduduk DKI
dewasa memiliki alergi. Sampel dari 1.200 orang
dewasa yang dipilih secara acak menghasilkan
33,2% memiliki alergi.

Apa yang menjadi populasi, sampel, variabel,


data, eksperimen, statistik, parameter?
• Populasi – orang dewasa di DKI

• Sample – 1200 orang dewasa yang dipilih secara acak

• Variable – Alergi

• Data – ya atau tidak

• Experiment – Tanya jawab/wawancara

• Statistic – 33.2% (dari sampel)

• Parameter – persen populasi dengan alergi


Peubah/Variabel Analisis

• Analisis UNIVARIAT : hanya ada 1 pengukuran


(variabel) untuk n sampel atau beberapa variabel
tetapi masing-masing variabel dianalisis sendiri-
sendiri. Contoh : korelasi motivasi dengan
pencapaian akademik.

• Analisis MULTIVARIAT : dua atau lebih


pengukuran (variabel) untuk n sampel dimana
analisis antar variabel dilakukan bersamaan.
Contoh : pengaruh motivasi terhadap pencapaian
akademik yang dipengaruhi oleh faktor latar
belakang pendidikan orang tua, faktor sosial
ekonomi, faktor sekolah.
Contoh Penyajian Data
TABEL : memberikan informasi secara rinci. Terdiri atas kolom dan baris

Kolom pertama : LABEL


KOLOM
Kolom kedua …. n : Frekuensi atau label
TABEL
BARIS Berisikan data berdasarkan kolom

Tabel Tabulasi Silang

Pendapat tentang sertifikasi


Asal Wilayah Sangat Perlu Tidak Tidak Sangat Jumlah
perlu tahu perlu tdk
perlu
Jawa Barat
Jawa Tengah
Jawa Timur
NTT
Papua
Jumlah
GRAFIK : memberikan informasi dengan benar dan cepat, tetapi tidak rinci.

Syarat :
1. Pemilihan sumbu (sumbu tegak dan sumbu datar), kecuali grafik lingkaran
2. Penetapan skala (skala biasa, skala logaritma, skala lain)
3. Ukuran grafik (tidak terlalu besar, tinggi, pendek)

Jenis Grafik :
4
• Grafik Batang (Bar)
Sumbu tegak

3
• Grafik Garis (line)
2
• Grafik Lingkaran (Pie)
1
• Grafik Interaksi (Interactive)
0
1 2 3 4
Titik
pangkal Sumbu datar
Grafik Batang (Bar) Grafik Garis (line)
30 30

20 20

10 10

Jumlah
Count

0 0
administrasi personalia produksi marketing keuangan administrasi personalia produksi marketing keuangan

bidang pekerjaan bidang pekerjaan

Grafik lingkaran (pie) Grafik Interaksi (interactive)


800000

keuangan
administrasi

700000

600000

personalia
500000
Mean gaji perbulan

Jenis kelamin
400000

marketing laki-laki

produksi 300000 w anita


sangat jelek jelek cukup baik baik sangat baik

prestasi kerja
Frekuensi

FREKUENSI : banyaknya data untuk satu kelompok/klasifikasi

KELOMPOK FREKUENSI
Kelompok ke-1 f1 Pendidikan Frekuensi
Kelompok ke-2 f2
S1 62
Kelompok ke-3 f3
S2 19
Kelompok ke-i fi
S3 9
Kelompok ke-k fk
90
k
n = Σ fi
i=1

k
n = Σ fi = f1 + f2 + f3 +….. + fi + …… + fk
i=1
Distribusi Frekuensi

DISTRIBUSI FREKUENSI : mengelompokkan data interval/rasio dan menghitung


banyaknya data dalam satu kelompok/klasifikasi

USIA FREKUENSI Membuat distribusi frekuensi :


1. Mencari sebaran (range) yakni selisih antara data paling besar
20 5
dengan data paling kecil)  35 – 20 = 15
21 6 2. Menentukan banyak kelas dengan rumus k = 1 + 3,3 log n
22 13 7
3. Menentukan panjang kelas dengan rumus
23 4 p = sebaran / banyak kelas  15/7 = 2
24 7
25 7 KELOMPOK USIA FREKUENSI
26 7 20 – 21 11
27 5 22 – 23 17
28 3 24 – 25 14
29 4 26 – 27 12
30 15 28 – 29 7
31 3 30 – 31 18
33 5 32 - 33 5
35 1 34 - 35 1
Ukuran Pemusatan

RATA-RATA : suatu bilangan yang bertindak mewakili sekumpulan bilangan


atau jumlah bilangan dibagi banyaknya bilangan

X + X2 + X3 + … + Xn n
X= 1 Σ Xi
n i =1

n
Bila terdapat sekumpulan bilangan di mana masing-masing bilangannya memiliki frekuensi,
maka rata-rata hitung menjadi :
k
X f + X2 f2 + X3 f3 + … + Xkfk Σ Xifi
X= 1 1
f 1 + f 2 + f 3 + … + fk i =1

k
Σ fi
Cara menghitung : i =1

Bilangan (Xi) Frekuensi (fi) Xi fi


70 3 210
63 5 315
Maka : X = 695 = 69.5
10
85 2 170
Jumlah 10 695
Ukuran Pemusatan

MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.

Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55.
Pertanyaannya adalah apakah siswa yang memperoleh nilai 7
termasuk istimewa, baik, atau biasa-biasa saja ?

Jika nilai ulangan tersebut adalah : 10 10 8 7 7 6 5 5 5 5 4,

Jika nilai ulangan tersebut adalah : 8 8 8 8 8 8 7 5 5 4 3,


Ukuran Pemusatan

MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.

Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55.
Pertanyaannya adalah apakah siswa yang memperoleh nilai 7
termasuk istimewa, baik, atau biasa-biasa saja ?

Jika nilai ulangan tersebut adalah : 10 10 8 7 7 6 5 5 5 5 4,


maka rata-rata hitung = 6.55, median = 6
Kesimpulan : nilai 7 termasuk kategori baik sebab berada di atas rata-rata hitung
dan median (kelompok 50% atas)

Jika nilai ulangan tersebut adalah : 8 8 8 8 8 8 7 5 5 4 3,


maka rata-rata hitung = 6.55, median = 8
Kesimpulan : nilai 7 termasuk kategori kurang sebab berada di bawah median
(kelompok 50% bawah)

Jika sekumpulan data banyak bilangannya genap (tidak mempunyai bilangan tengah)
Maka mediannya adalah rata-rata dari dua bilangan yang ditengahnya.
Contoh : 1 2 3 4 5 6 7 8 8 9 maka median (5+6) : 2 = 5.5
Ukuran Pemusatan

MODUS : bilangan yang paling banyak muncul dari sekumpulan bilangan,


yang fungsinya untuk melihat kecenderungan dari sekumpulan bilangan tersebut.

Contoh : nilai ulangan 10 10 8 7 7 6 5 5 5 5 4


Maka : s = 6 ; k = 3 ; p =2
rata-rata hitung = 6.55 ; median = 6
modus = 5 ; kelas modus = 5 - 7

Nilai Frekuensi Nilai Frekuensi


10 2 8 – 10 3
8 1 5–7 7
7 2 2–4 1
6 1 Jumlah 11
5 4
4 1
Jumlah 11 - +
Mo X Me
Kurva positif apabila rata-rata hitung > modus / median
Kurva negatif apabila rata-rata hitung < modus / median
Ukuran Penyebaran

UKURAN YANG MENYATAKAN HOMOGENITAS / HETEROGENITAS :


1. RENTANG (Range)
2. DEVIASI RATA-RATA (Average Deviation)
3. VARIANS (Variance)
4. DEVIASI STANDAR (Standard Deviation)

Rentang (range) : selisih bilangan terbesar dengan bilangan terkecil.


Sebaran merupakan ukuran penyebaran yang sangat kasar, sebab hanya bersangkutan
dengan bilangan terbesar dan terkecil.

Contoh : A : 100 90 80 70 60 50 40 30 20 10
B : 100 100 100 100 100 10 10 10 10 10
C : 100 100 100 90 80 30 20 10 10 10

X = 55
r = 100 – 10 = 90
Rata-rata
Ukuran Penyebaran
Deviasi Rata-rata : penyebaran
Berdasarkan harga mutlak simpangan Kelompok A Kelompok B
bilangan-bilangan terhadap rata- Nilai X X - X |X – X| Nilai X X - X |X – X|
ratanya. 100 45 45 100 45 45
90 35 35 100 45 45
80 25 25 100 45 45
70 15 15 90 35 35
60 5 5 80 25 25

Rata-rata 50 -5 5 30 -25 25
40 -15 15 20 -35 35
30 -25 25 10 -45 45
20 -35 35 10 -45 45
10 -45 45 10 -45 45
Jumlah 0 250 Jumlah 0 390

DR = 250 = 25 DR = 390 = 39
10 10

n
|Xi – X|
Rata-rata DR = Σ
n
i=1

Makin besar simpangan,


makin besar nilai deviasi rata-rata
Ukuran Penyebaran
Varians : penyebaran berdasarkan Kelompok A Kelompok B
jumlah kuadrat simpangan bilangan- Nilai X X -X (X–X)2 Nilai X X -X (X –X)2
bilangan terhadap rata-ratanya ; 100 45 2025 100 45 2025
melihat ketidaksamaan sekelompok data
90 35 1225 100 45 2025
80 25 625 100 45 2025
n
s = Σ (Xi – X)
2 70 15 225 90 35 1225
2

i=1 n-1 60 5 25 80 25 625


50 -5 25 30 -25 625
40 -15 225 20 -35 1225

Deviasi Standar : penyebaran 30 -25 625 10 -45 2025

berdasarkan akar dari varians ; 20 -35 1225 10 -45 2025


menunjukkan keragaman kelompok data 10 -45 2025 10 -45 2025
Jumlah 8250 Jumlah 15850

8250 15850
n s= √ 9 = 30.28 s= √ 9 = 41.97
√ Σ (Xi – X)
2
s=
i=1 n-1
Kesimpulan :
Kelompok A : rata-rata = 55 ; DR = 25 ; s = 30.28
Kelompok B : rata-rata = 55 ; DR = 39 ; s = 41.97
Maka data kelompok B lebih tersebar daripada kelompok A

Anda mungkin juga menyukai