EK4226 Materi Statistika
EK4226 Materi Statistika
Pertemuan 1 2 3 4 5 6 7 Bahan Statistika Deskriptif; Ukuran Pemusatan dan Penyebaran Statistika; Frekuensi data Dasar-dasar teori peluang; Peluang bersyarat dan teorema bayes Konsep sampling dan Populasi; Nilai Ekspektasi ratarata, varian, dan kovarian Distribusi Teoritis Diskrit; Binom, hipergeometri, poisson Distribusi Teoritis Kontinu; Normal, Nilai Z, Normal Baku, membaca tabel distribusi teoritis kontinu Pendugaan Selang Kepercayaan Satu Sampel; z, t, dan proporsi UTS
STATISTIKA-Pengantar
Pertemuan 8 9 10 11 12 13 14
Bahan Pendugaan Selang Kepercayaan Dua Sampel; z, t, proporsi, chi-square Konsep Hipotesis; Pengujian Hipotesis Satu Sampel; z, t, dan proporsi Pengujian Hipotesis Lebih dari Satu Sampel; z, t, dan proporsi Konsep korelasi dan Skala Ukur Data Korelasi Kendall, Spearman, Pearson, dan Asosiasi KhiKuadrat Regresi Linier Sederhana untuk peramalan Aplikasi Korelasi dan Regresi Linier Sederhada di bid. Ekonomi UAS
STATISTIKA-Definisi Statistika
Apakah Statistika itu? Seni mengumpulkan, mengolah, dan mengintepretasikan data menjadi informasi yang berguna untuk pengambilan keputusan Berdasarkan kedalaman pengolahan data/analisis, Statistika dibedakan menjadi 2; yaitu:
Statistika Deskriptif: metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. Statistika Inferensi: mencakup semua metode yang berhubungan dengan analisis data untuk kemudian sampai pada peramalan atau penarikan kesimpulan keseluruhan gugus data induknya.
STATISTIKA-Istilah-istilah umum
Populasi Keseluruhan pengamatan yang menjadi perhatian si peneliti. Sampel atau Contoh Suatu himpunan bagian dari populasi. Sampel acak sederhana Suatu sampel acak sederhana n pengamatan adalah suatu contoh acak sederhana yang dipilih dengan suatu cara tertentu, sehingga tiap himpunan bagian yang berukuran n dari populasi tersebut memiliki peluang terpilih yang sama.
Parameter Sembarang nilai yang menjelaskan ciri-ciri populasi. Statistik Sembarang nilai yang menjelaskan ciri-ciri sampel.
STATISTIKA-Ukuran Pemusatan
Apakah Ukuran Pemusatan itu? (center of measurement) Sembarang ukuran yang menunjukkan pusat dari suatu gugus data yang umumnya telah diurutkan. Misalnya: mean atau nilai rata-rata, median, dan modus
STATISTIKA-Mean
Apakah mean atau nilai rata-rata? Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk mendapatkan gambaran umum tentang pusat dari suatu gugus data.
= i =1
x
N
Contoh:
n
x = i =1 n
Xi = { 1,3,4,7,5}
x = i =1
x
n
x + x + x + x4 + + xn 1+ 3 + 4 + 7 + 5 = 1 2 3 = =4 n 5
STATISTIKA-Median
Apakah median itu? Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk mendapatkan gambaran umum tentang pusat dari suatu gugus data; secara khusus untuk data berskala ukur nominal dan ordinal. Langkah-langkah Menghitung median... 1. Urutkan data 2. Kalau n ganjil, maka nilai mediannya adalah nilai pengamatan yang tepat membagi gugus data menjadi dua bagian yang sama besar. Kalau n genap, maka nilai mediannya adalah rata-rata dua nilai pengamatan yang paling tengah.
STATISTIKA-Median
Contoh: Berapakah median dari suatu gugus data X i ={ 1, -2, 8, 2, 2, 5}? Langkah 1: Urutkan data -2, 1, 2, 2, 5, 8 Langkah 2: n genap
X3 X4 x Me 2
2 2 2
STATISTIKA-Modus
Apakah Modus itu? Adalah nilai yang paling sering muncul dari suatu gugus data. Jadi nilai modus adalah nilai yang memiliki frekuensi yang paling besar dari suatu gugus data. Contoh:
X i = {2,1,2,2,5,5,5,8}
Nilai -2 1 2 5 Frekuensi 1 1 2 3
Mo 5
STATISTIKA-Ukuran Penyebaran
Apakah ukuran penyebaran/dispersion of measurement itu? Adalah suatu nilai yang menunjukkan keberagaman nilai dari suatu gugus data. Misalnya: range/wilayah, standar deviasi/simpangan baku, varian/ragam
STATISTIKA-Range/Wilayah Apakah Range/Wilayah itu? Adalah suatu nilai yang menunjukkan beda antara nilai terbesar dengan nilai terkecil dari suatu gugus data. Rumus:
Range = NilaiTerbesar NilaiTerkecil
Contoh:
X i = {2,1,2,2,5,5,5,8}
Range = 8 (2) = 10
STATISTIKA-Standar Deviasi/Simpangan Baku Apakah Standar Deviasi itu? Adalah suatu nilai yang menunjukkan rata-rata, beda nilai-nilai dari suatu gugus data terhadap mean-nya.
=N 2 ( ) ii= X i 1
s=
i= n i=1
x n 1
i
(X
Carilah standar deviasi dari data di atas! Ingat untuk mendapatkan St.Dev, maka diperlukan mean-nya!
x = 3.25
s=
= 3.105
STATISTIKA-Varian/Ragam Apakah varian/ragam itu? Adalah kuadrat dari nilai standar deviasi.
2 =
=N 2 ( ) ii= X i 1
n 1
STATISTIKA-Menggunakan Kalkulator Menghitung mean dengan kalkulator 1. Masuk ke mode SD: Tekan Shift Mode SD 2. Masukkan keseluruhan gugus data: Tekan -2 1 DT DT 3. Tekan x Menghitung St.Dev dengan kalkulator 1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean. 2. Tekan x n 1
DT
Nilai Z atau nilai baku... Adalah nilai pembakuan yang menyatakan jarak suatu pengamatan x dari mean dalam satuan standar deviasi.
Nilai Z untuk jika nilai-nilai parameter populasi diketahui x z= Nilai Z untuk jika nilai-nilai parameter populasi tidak diketahui
xx z= s
STATISTIKA-Contoh Nilai Z
x xx z= = s
{2,1,2,2,5,5,5,8}!
Tanda negatif menyatakan, nilai -2 ada di sebelah kiri mean dari gugus data, angka 1,69 menunjukkan jarak nilai -2 dari mean dalam satuan standar deviasi.
Dalil Chebyshev: 1 Sekurang-kurangnya 1 bagian data, 2 k terletak dalam k standar deviasi dari nilai tengahnya.
STATISTIKA-Ukuran Fraksional
Apakah Ukuran Fraksional itu? (fractional measurement) Sembarang ukuran yang membagi data menjadi fraksi-fraksi yang sama range-nya. Misalnya: kuartil, desil, persentil
Ada lebih dari 1 cara untuk mencari kuartil, desil, dan persentil. Namun semuanya memiliki satu filosofi: membagi data menjadi fraksi-fraksi yang memiliki anggota gugus data yang kira-kira hampir sama banyaknya
Q2
Q3
i pQi = x(n + 1) 4
STATISTIKA-Contoh
3 pQ3 = x8 = 6.00 4
2. cari nilainya berdasarkan rumus:
STATISTIKA-Ingatkah Saudara?
Apakah yang dimaksud center of measurement, dispersion measurement, dan fractional measurement? Ukuran apa yang paling sering digunakan? Mean dan Standar Deviasi. Bagaimana dengan fractional measurement? The Pareto principle (also known as the 80-20 rule, the law of the vital few and the principle of factor sparsity) states that, for many events, 80% of the effects comes from 20% of the causes.
STATISTIKA-Ingatkah Saudara?
PARETO PRINCIPLE: Business management thinker Joseph M. Juran suggested the principle and named it after Italian economist Vilfredo Pareto, who observed that 80% of income in Italy went to 20% of the population. It is a common rule of thumb in business; e.g., "80% of your sales comes from 20% of your clients." (Hukum 80/20)
Thomas Stanley, Ph.D. dan William D. Dunks, Ph.D. sering menggunakan ukuran fraksional untuk menggambarkan perilaku masyarakat Amerika.
STATISTIKA-Ingatkah Saudara?
BAGAIMANA HUKUM 80/20 DILAHIRKAN? (Sebuah Ilustrasi) Vilfredo Pareto, mengumpulkan data pendapatan orang-orang di Italia. Data-data yang didapatkannya diurutkan. Setelah berulang kali mengulang pengumpulan data, dia mendapati bahwa orang-orang yang menempati posisi data lebih besar atau sama dengan 80 (persentil ke-80 dan seterusnya) ternyata memiliki total pendapatan 80% dari seluruh orang-orang dalam pengamatannya.
STATISTIKA-Ingatkah Saudara?
Cobalah menghitung mean dan standar deviasi-nya! X={2, 3, 1} Y={3, 1, 4, 10, 2} Z={1, 45, 28, 2, -10, 35, 29, 50, 98, 100, -35, 18, 1, 1, 5, -9, 10, 7, 4, 19, 3, 12, 5, 10, 19, 20, 32, 67, 8, 9, 12, -1, 0, 2}
STATISTIKA-Menggunakan Kalkulator Menghitung mean dengan kalkulator 1. Masuk ke mode SD: Tekan Shift Mode SD 2. Masukkan keseluruhan gugus data: Tekan -2 1 DT DT 3. Tekan x Menghitung St.Dev dengan kalkulator 1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean. 2. Tekan x n 1
DT
X = { 2,1,2,2,5, 8}
i
x
i=n i =1
2 1 2 2 5 8 x= + + + + + 6 6 6 6 6 6
1 i =k x = i =1 n
f x
i
Frekuensi fi 1 1 2 1 1
X = { 2,1,2,2,5, 8}
i
s=
f xi x
i =k i =1 i
n 1
Cobalah menghitung nilai St. Dev dengan rumus di atas, bandingkan dengan rumus St. Dev pada pertemuan ke-1!
Dengan mengeluarkan selang kelas +70 dapatkah anda menghitung mean dan standar deviasi usia penduduk kota Surabaya tahun 1980? (petunjuknya: gunakan rumus untuk tabel frekuensi sederhana tetapi ganti Xi dengan titik tengah kelas)
Ruang Contoh adalah himpunan semua kemungkinan hasil dari suatu percobaan. Dilambangkan dengan huruf S. Kejadian adalah himpunan bagian dari ruang contoh. Terbagi atas dua jenis yaitu Kejadian Sederhana (anggota himpunannya tunggal) dan Kejadian Majemuk (gabungan beberapa kejadian sederhana). Ruang Nol/Himpunan Kosong adalah himpunan bagian dari ruang contoh yang tidak memiliki satu anggota pun. Dilambangkan dengan
Ilustrasi Matematis:
Contoh: Kasus nilai yang muncul dari pelemparan sebuah mata dadu.
S = {1,2,3,4,5,6}
A = {1,3,5} B = {2,4,6} C = {2,3,5} D = {2} E = {}
Notasi Pembangun Himpunan S={x|x adalah semua nilai mata dadu yang mungkin} A={x|x adalah mata dadu dengan nilai ganjil} B={x|x adalah mata dadu dengan nilai genap} C={x|x adalah mata dadu dengan nilai prima} D={x|x adalah mata dadu dengan nilai genap sekaligus prima} E={x|x adalah mata dadu dengan nilai } Buatlah Diagram Venn nya!
STATISTIKA-Pengolahan Kejadian
A B ; adalah
Komplemen: komplemen A dilambangkan dengan A; adalah himpunan semua anggota S yang bukan anggota A.
STATISTIKA-Kaidah Penggandaan
Contoh: Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 1 jenis saham dan 1 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan 8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan investasinya?
Jawabannya: n1= banyaknya jenis saham di bursa= 45 n2= banyaknya jenis mata uang= 8 Banyaknya pilihan investasi= n1x n2= 45x 8 = 360 pilihan
STATISTIKA-Permutasi
Dalil-Dalil Permutasi:
1. Banyaknya permutasi n benda yang berbeda adalah n! 2. Banyaknya permutasi r benda dari n benda yang berbeda adalah
n! nP r = (n r )!
n! n1!n2 !...nk !
RUMUS:
n! n Cr = r!(n r )!
Contoh: Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 3 jenis saham dan 2 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan 8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan paket investasinya? Perpaduan antara Kombinasi dan Kaidah Penggandaan
0 P ( A) 1 P ( ) = 0
P( S ) = 1
RUMUS:
n P ( A) = N
n = banyaknya titik contoh dalam kejadian A N = banyaknya titik contoh dalam ruang contoh
STATISTIKA-Kaidah Penjumlahan
Hal yang perlu diperhatikan: 1. Bila A dan B adalah dua kejadian sembarang, maka:
P( A B) = P( A) + P( B) P( A B)
2. Bila A dan B adalah dua kejadian yang saling asing, maka:
P( A B) = P( A) + P( B)
STATISTIKA-Peluang Bersyarat
Dalam suatu kasus, mungkin saja kita mendapati bahwa kita mengetahui sejumlah informasi awal. Dengan menggunakan informasi awal tersebut, kita dapat memperkirakan peluang suatu kejadian dengan lebih akurat. Peluang suatu kejadian terjadi, jika peluang kejadian yang lain diketahui disebut sebagai PELUANG BERSYARAT.
P( A B) P( B | A) = P( A)
Catatan: P(A)>0
Naik A B Total 10 15 25
Turun
Total 45 55 100
P ( B | A) = P ( B) P ( A | B ) = P ( A)
Kaidah Penggandaan: 1. Bila dalam suatu percobaan kejadian A dan B dapat terjadi sekaligus, maka:
P ( A B) = P( A) P( B | A)
2. Bila Kejadian A dan B bebas; maka:
P ( A B) = P( A) P ( B)
A A A A A A A A SAMPEL A A A A A
POPULASI
POPULASI adalah keseluruhan pengamatan yang menjadi perhatian si peneliti. SAMPEL adalah suatu himpunan bagian dari populasi.
Less Accuracy
High Accuracy
Low Resources
High Resources
Secara acak pilihlah sampel berukuran 3, 5, 7, dan 9 dari gugus data populasi di atas dan hitunglah nilai mean-nya. Bandingkan!
Less Accuracy
High Accuracy
Low Resources
High Resources
Probability Sampling
Non-Probability Sampling
1. Simple Random Sampling 2. Stratified Random Sampling 3. Cluster Random Sampling 4. Systematic Random Sampling
DEFINISI MATEMATIS:
E ( x) = X .dP
untuk diskrit:
untuk kontinu:
i
E ( x ) = i x i
E ( x) = x. f ( x).dx
a
Catatan: Definisi diskrit dan kontinu akan dijelaskan pada pertemuan selanjutnya.
STATISTIKA-Mean Variabel
MISAL: Ruang Contoh untuk pelemparan 2 uang logam, sbb: S={AA, AG, GA, GG} Jika dilakukan 16 kali pelemparan ternyata banyaknya muncul sisi gambar (Xi) sbb:
xi fi
0 4
1 7
2 5
Maka:
STATISTIKA-Mean Variabel
Mean Variabel x yang memiliki nilai yang sama dengan expected value E(x). Adalah suatu perhitungan mean populasi menggunakan frekuensi relatif Variabel Diskrit X:
xi P(X=x)
x1 f(x1)
n
x2 f(x2)
xn f(xn)
= E( X ) = xi . f ( xi)
i =1 n X: Variabel Kontinu
= E( X ) = xi . f ( xi)
i =1
= E( X ) = x. f ( x).dx
STATISTIKA-Mean Variabel
Bagaimana untuk variabel g(X)? Variabel Diskrit g(X): Variabel Kontinu g(X):
= E( X ) = g( xi). f ( xi)
i =1
STATISTIKA-Varian Variabel
Varian Variabel X Varian dari 16 kali pelemparan mata uang tersebut adalah:
2 2 2 ( 0 1 , 06 ) .( 4 ) ( 1 1 , 06 ) .( 7 ) ( 2 1 , 06 ) .(5) + + 2 = 16 = 0,5639
= E ( X ) = ( X ) . f ( x)
2 2 i =1
2 = E( X 2 ) 2
Bagaimana dengan varian dari g(X)?
Kontinu:
2 = E ( X )2 =
( X ) . f ( x).dx
STATISTIKA-Kovarian Variabel
xy = E (( x x )( y y ) )
n
Diskrit:
xy = ( xi x )( yi y ). f ( x). f ( y )
i =1
Kontinu
xy =
(x
i
)( yi y ). f ( x). f ( y ).dx.dy
Catatan: Semakin kecil nilai kovarian antara variabel x dan y, maka semakin besar independensi antara kedua variabel tersebut.
Bila a dan b adalah konstanta: ax +b = a + b Nilai tengah jumlah atau selisih dua atau lebih peubah acak
x y = x y
Nilai tengah hasil kali dua variabel xy = x . y Ragam jika b konstan x2+b = x2 = 2
2 2 2 x = + x y +y
Dikrit:
Kontinu: 150cm
180cm
DISTRIBUSI PELUANG:
Untuk menghitung nilai peluang tertentu selain menggunakan cara mendaftarkan atau membuat diagram. Ada bentuk-bentuk peluang khusus, yang nilainya dapat dicari dengan rumus tertentu. Distribusi peluang adalah fungsi yang digunakan untuk menghitung nilai peluang dari suatu bentuk peluang-peluang tertentu.
Contoh:
Banyaknya gambar yang muncul dari 3 kali pelemparan 1 mata uang.
(banyaknya gambar yang muncul dari 1 kali pelemparan 3 mata uang) BENTUK PELUANG
Distribusi Peluang
1 3/8 2 3/8 3 1/8
x P(X=x)
0 1/8
3 x f ( x) = 8
; x = 0, 1, 2, 3
DISTRIBUSI BINOMINAL
Ciri-ciri: 1. 2. 3. 4. Percobaan terdiri atas n ulangan Digolongkan menjadi sukses dan gagal Nilai peluang untuk setiap ulangan tidak berubah Pengulangan bersifat bebas
RUMUS:
n x n x b( x; n, p ) = x p q
p =35%
x =0
n =10
b(0;10,0.35) =0.013
RUMUS:
k N k x nx h( x; N , n, k ) = N n
n = banyaknya percobaan
k =5
N =45
n =3
x=0
h(0;45,3,5) =0,696
RUMUS:
e x p ( x; ) = x!
Arti Notasi e =bilangan natural =2.718 x =banyaknya sukses =mean populasi (sbg pendekatan binominal jika p sangat kecil; =np)
Jawaban:
=10
x =8
p(8;10) =0.113
P( X = a) = 0
Perhatikan bahwa jika x kontinu, maka:
n( x; , ) =
1 2
2
1 x 2
1=2
Semakin kecil semakin tinggi puncak dari kurva normal Semakin besar semakin ke kanan posisi dari kurva normal
P( ~ < x < + ~) = 1
Rumus Pembakuan:
z=
Ilustrasi Grafik:
z1
z2
Z =
x np npq
B. Distribusi Penarikan Sampel Distribusi penarikan sampel adalah distribusi peluang suatu statistik mengikuti dalil limit pusat.
Z =
x / n
x t= s/ n
Dimana, t merupakan variabel yang terdistribusi sesuai distribusi t dengan derajat bebas (v=n-1).
v= ~ v= 5 v= 2
t1-
s12 / 12 f = 2 2 s2 / 2
f1 ( v1 , v 2 ) =
1 f ( v1 , v 2 )
ILUSTRASI DISTRIBUSI F
Pendugaan parameter atau parameter estimation adalah metode statistika yang digunakan untuk menduga parameter menggunakan statistik. Beberapa alasan untuk melakukan estimasi: 1. Keterbatasan waktu 2. Keterbatasan tenaga; dan 3. Keterbatasan biaya Statistika menggunakan data yang berasal dari sampel untuk menduga parameter dari populasi.
Apa yang dimaksud dengan estimator? Menurut Yitnosumarto (1990), estimator adalah suatu nilai variabel dari statistik yang mungkin untuk sebuah parameter. Apa yang dimaksud dengan nilai duga/estimation value? Menurut Yitnosumarto (1990), estimation value adalah nilai dari estimator yang didapat dengan menganalisis data dari suatu sampel.
Contoh: Mean dari Ujian Akhir Nasional adalah 5,11 dan Varian sebesar 1,89.
Point Estimator/Penduga Titik: Pada point estimator, estimation value yang dihasilkan hanya berupa titik pada suatu garis bilangan. Misal: X=x1, x2, x3, , xn Jika peluang x1 hingga xn untuk terpilih adalah sama, maka:
x=
x
i=n i =1
Sifat-sifat Parameter Estimator: 1. Unbias Estimator (tidak berbias) Estimator haruslah mampu mendekati nilai sebenarnya dari parameter yang diduga. 2. Efisien Memiliki varian yang efisien.
/2
/2
P( x z / 2
< < x + z / 2
) = 1
/2
V=?
/2
P( x t / 2,v
/2
/2
) P( p z / 2
)) pq ) < p < p + z / 2 n
)) pq ) = 1 n
Jika CI untuk satu populasi digunakan untuk menguji: apakah BESARnya ukuran-ukuran pada sampel sama dengan nilai tertentu pada populasi, Maka CI untuk dua populasi digunakan untuk menguji: apakah BEDA ukuran-ukuran pada sampel sama dengan nilai tertentu pada populasi.
/2
/2
/2
V=?
/2
v = n1 + n2 2
/2
V=?
/2
Ingat!!! Distribusi F:
Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random. Statistik F:
/2
V=?
/2
CI=1-
/2
/2
) ) P(( p1 p2 ) z / 2
)) ) ) p1q1 p2 q2 + ) = 1 n1 n2
Sering kali untuk menarik suatu kesimpulan kita tidak mungkin meneliti keseluruhan populasi karena kendala waktu, tenaga, dan biaya. Statistika memberikan solusi untuk penarikan kesimpulan menggunakan data-data yang kita dapatkan dari sampel. Penarikan kesimpulan secara demikian dinamakan pengujian hipotesis
Hipotesis Statistik: Pernyataan atau dugaan mengenai ciri-ciri atau sifat dari satu atau lebih populasi Catatan: benar atau salahnya suatu hipotesis tidak penah diketahui kecuali kita memeriksa seluruh populasi. Ada 2 Macam Hipotesis: Hipotesis Nol: Hipotesis yang dirumuskan dengan harapan akan ditolak. Hipotesi Alternatif: Hipotesis yang dirumuskan dengan harapan akan diterima
Mengapa harus dilakukan PENGUJIAN HIPOTESIS? Untuk mendapatkan cukup fakta yang dapat membantu kita menilai derajat kebenaran suatu hipotesis.
ok
ok
dan :
1 =
2 =
Catatan: Peluang tidak mungkin dihitung kecuali kita memiliki hipotesis alternatif yang spesifik. (ditandai dengan = )
dan :
Seorang meneliti vaksin influensa jenis baru. Jika 25% penerima vaksin masih memiliki ketahanan terhadap influensa lebih dari 2 tahun, maka vaksin tersebut dinyatakan lebih baik dari vaksin yang lama.
Data yang didapatkan (9 dari 20 penerima vaksin masih memiliki ketahanan terhadap influensa lebih dari 2 tahun)
Hipotesis:
b( x;20;0.25)
x =9 8 x =0
: jika p=50%
= P(error jenis 2) = P(X<9 jika p=50%) Catatan: Untuk memperkecil dan maka n harus diperbesar = b( x;20;0.25)
x =0 8
= 0,2517
/2
/2
Sifat 1 arah dan 2 arah, ditentukan dari kejelasan ARAH PERNYATAAN. Sifat 1 arah; TIDAK LEBIH, KURANG DARI, LEBIH DARI Sifat 2 arah; ADALAH, SAMA DENGAN
Uji Hipotesis: 6 Langkah Menguji Statistik: 1. Nyatakan hipotesis nol-nya H0 bahwa = 0 2. Pilihlah hipotesis alternatif H1 yang sesuai diantara > 0, < 0, atau 0 3. Tentukan taraf nyata (significance) 4. Pilih statistik uji (statistical test) yang sesuai dan tentukan wilayah kritiknya 5. Hitung nilai statistik uji berdasarkan data pada contoh 6. KEPUTUSAN: Tolak H0 bila nilai uji statistik tersebut jatuh pada wilayah kritik.
Saya akan membantu anda!!! Setiap kali anda diminta untuk menduga suatu hipotesis; tanyakanlah Hal-hal berikut!!!
Pendugaan Hipotesis
Mean
Varian
Proporsi
1 Populasi
2 Populasi
1 Populasi
2 Populasi
1 Populasi
2 Populasi
Mean
1 Populasi
2 Populasi
Tidak Berpasangan
Berpasangan; Rumus 6
Saya akan membantu anda!!! Jika bertanya tentang Mean 2 Populasi Tidak Berpasangan???
Tidak Berpasangan
n<30; n>=30; atau 1 dan 2 diketahui nilainya; Rumus 3 n<30; atau 1 dan 2 tidak diketahui nilainya; 1=2; Rumus 4 atau 1 dan 2 tidak diketahui nilainya; 12; Rumus 5
1 Populasi; Rumus 7
2 Populasi; Rumus 8
1 Populasi; Rumus 9
2 Populasi; Rumus 10
RUMUS
uji z : x 0 z= / n uji t : x 0 t= s/ n
= 0
RUMUS 2
RUMUS
uji z : z= ( x1 x 2 ) d 0
2 ( 12 / n1 ) + ( 2 / n2 )
1-2=d0
RUMUS 4
uji t : t=
2 p
( x1 x 2 ) d 0 s p (1 / n1 ) + (1 / n2 )
v = n1 + n2 2
RUMUS
uji t : t= ( x1 x 2 ) d 0
2 ( s12 / n1 ) + ( s2 / n2 )
2 ( s12 / n1 + s2 / n2 ) 2 v= 2 2 ( s1 / n1 ) 2 ( s2 / n2 ) 2 + n1 1 n2 1
d=d0
RUMUS 6
pengamatan berpasangan
uji t : t= d d0 sd / n
H0 02 RUMUS 7 2=
RUMUS
uji 2 :
=
2
(n 1) s 2
02
; v = n 1
RUMUS 8
12= 22
H0 p= p0
RUMUS 9
KRITERIA n>=30
RUMUS
uji z : z= x np0 np0 q0
p1-p2= d0
RUMUS 10
n>=30
uji z : p 2 ) ( p1 p2 ) (p z= 1 q [(1 / n1 ) + (1 / n2 )] p
z=
x 0 2.75 3 = = 1,768 / n 1 / 50
Tolak H0 Terima H0
6. Kesimpulan: Tolak H0: Cukup bukti untuk menyatakan bahwa waktu tunggu pelanggan kurang dari 3 menit.
STATISTIKA Latihan
Try This (dont be fooled by a complex story) Secara teoritis, chip micro processor yang diproduksi dengan cara baru mampu berfungsi normal rata-rata 4 tahun. Untuk menguji teori tersebut perusahaan memproduksi 10 prototype chip micro processor. Jika ternyata dari 10 chip micro processor prototype tersebut mampu berfungsi normal rata-rata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori tersebut dapat dinyatakan benar pada taraf signifikansi 5%?
STATISTIKA Latihan
Latihan Bab 11:
3. Gibbs Baby Food Company ingin membandingkan berat bayi yang menggunakan produknya dibanding dengan kompetitornya. Suatu sampel yang terdiri dari 40 bayi yang mengkonsumsi Gibbs Baby Food memiliki berat rata-rata 7,6 pounds dengan standar deviasi 2,3 pounds. Suatu sampel yang lain terdiri dari 55 bayi yang mengkonsumsi makanan merek kompetitor memiliki berat rata-rata 8,1 pounds dengan standar deviasi 2,9 pounds. Pada taraf signifikansi 0,05, dapatkah kita menyimpulkan bahwa bayi yang mengkonsumsi Gibbs Baby Food memiliki berat badan lebih rendah 0,5 pounds dibanding yang mengkonsumsi produk kompetitor?
STATISTIKA Latihan
Latihan Bab 11:
4. Departemen riset yang berkantor di New Hampshire Insurance menyusun sebuah riset berkelanjutan tentang penyebab kecelakaan mobil, karakteristik pengemudi, dan lainnya. Suatu sampel random yang terdiri 400 catatan kepolisian menemukan bahwa 120 orang yang berstatus single mengalami kecelakaan setidaknya satu kali dalam tiga tahun terakhir. Sedangkan dari sampel random yang terdiri 600 catatan kepolisian menemukan,150 orang yang berstatus menikah mengalami kecelakaan setidaknya satu kali dalam tiga tahun terakhir. Dengan taraf signifikansi 0,05, apakah dapat disimpulkan bahwa proporsi orang yang single dan yang menikah yang mengalami kecelakaan setidaknya satu kali dalam tiga tahun terakhir adalah berbeda?
STATISTIKA Latihan
Latihan Bab 11:
17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk Nexus Media, Inc. Dia ingin membandingkan antara pengeluaran perjalanan harian antara staf penjualan dan staf pemeriksa anggaran. Dia mengumpulkan data sebagai berikut. Sales 131 Audit 130 135 102 146 129 165 143 136 149 142 120 139
Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan bahwa rata-rata pengeluaran perjalanan harian staf penjualan lebih besar dibanding staf pemeriksa anggaran?
STATISTIKA Latihan
Latihan Bab 11:
21. Suatu artikel akhir di The Wall Street Journal membandingkan antara biaya untuk mengadopsi anak dari China dan Rusia. Dari 16 sampel kasus adopsi anak dari China membutuhkan biaya rata-rata $11.045 dengan standar deviasi $835. Sedangkan dari 18 kasus adopsi anak dari Rusia membutuhkan biaya rata-rata $12.840 dengan standar deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia lebih tinggi?
STATISTIKA Latihan
Latihan Bab 11:
26. Pemerintah federal akhir-akhir ini mengadakan program pendanaan khusus untuk menurunkan angka kejahatan di daerah yang rawan. Suatu penelitian di 8 daerah rawan di Miami Florida menemukan data sebagai berikut. A Sblm 14 Ssdah 2 B 7 7 C 4 3 D 5 6 E 17 8 F 12 13 G 8 3 H 9 5
Dapatkah program pemerintah tersebut dikatakan berhasil? Gunakan taraf signifikansi 0,01.
STATISTIKA Latihan Try This (dont be fooled by a complex story) Secara teoritis, chip micro processor yang diproduksi dengan cara baru mampu berfungsi normal rata-rata 4 tahun. Untuk menguji teori tersebut perusahaan memproduksi 10 prototype chip micro processor. Jika ternyata dari 10 chip micro processor prototype tersebut mampu berfungsi normal ratarata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori tersebut dapat dinyatakan benar pada taraf signifikansi 5%?
STATISTIKA Latihan
Latihan Bab 11:
17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk Nexus Media, Inc. Dia ingin membandingkan antara pengeluaran perjalanan harian antara staf penjualan dan staf pemeriksa anggaran. Dia mengumpulkan data sebagai berikut. Sales 131 Audit 130 135 102 146 129 165 143 136 149 142 120 139
Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan bahwa rata-rata pengeluaran perjalanan harian staf penjualan lebih besar dibanding staf pemeriksa anggaran?
STATISTIKA Latihan
Latihan Bab 11:
21. Suatu artikel akhir di The Wall Street Journal membandingkan antara biaya untuk mengadopsi anak dari China dan Rusia. Dari 16 sampel kasus adopsi anak dari China membutuhkan biaya rata-rata $11.045 dengan standar deviasi $835. Sedangkan dari 18 kasus adopsi anak dari Rusia membutuhkan biaya rata-rata $12.840 dengan standar deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia lebih tinggi?
STATISTIKA Latihan
Latihan Bab 11:
26. Pemerintah federal akhir-akhir ini mengadakan program pendanaan khusus untuk menurunkan angka kejahatan di daerah yang rawan. Suatu penelitian di 8 daerah rawan di Miami Florida menemukan data sebagai berikut. A Sblm 14 Ssdah 2 B 7 7 C 4 3 D 5 6 E 17 8 F 12 13 G 8 3 H 9 5
Dapatkah program pemerintah tersebut dikatakan berhasil? Gunakan taraf signifikansi 0,01.
STATISTIKA Latihan
CHAPTER TEST:
Chapter 10; No. 50 Berdasarkan hasil penelitian American Pet Food Dealer Association, 63% rumah tangga di Amerika, memiliki hewan peliharaan. Sebuah laporan yang sedang disusun untuk editorial San Fransisco Chronicle. Sebagai bagian dari editorial, suatu sampel acak yang terdiri dari 300 rumah tangga, didapati 210 di antaranya memiliki hewan peliharaan. Apakah data tersebut bertentangan dengan data yang dimiliki American Pet Food Dealer Association? Jika diberikan level of significance 5%
STATISTIKA Latihan
CHAPTER TEST:
Chapter 11; No. 32 Suatu perusahaan pembuat komputer memiliki layanan hotline untuk customernya. Perusahaan tersebut menyadari bahwa kemampuan teknisi mereka untuk menyelesaikan masalah secara tepat dan tepat melalui layanan hotline berhubungan erat dengan citra perusahaan. Dari 35 telepon yang diterima berkaitan dengan masalah software, dibutuhkan waktu rata-rata 18 menit dengan standar deviasi 4,2 menit untuk memberikan solusi kepada customer. Sedangkan dari 45 telepon yang diterima berkaitan dengan masalah hardware, dibutuhkan waktu rata-rata 15,5 menit dengan standar deviasi 3,9 menit untuk memberikan solusi kepada customer. Pada taraf signifikansi 5%, dapatkan disimpulkan bahwa waktu yang dibutuhkan untuk menyelesaikan masalah yang berkaitan dengan software lebih lama dibandingkan untuk menyelesaikan masalah hardware? Berapakan nilai p-value nya?
P-Value adalah peluang menolak H0 berdasarkan hasil observasi, padahal pada kenyataannya H0 adalah benar.
STATISTIKA Latihan
CHAPTER TEST:
Chapter 11; No. 33 Perusahaan Advil yang membuat obat pereda sakit kepala, meneliti formula baru yang diklaim lebih efektif. Untuk mengevaluasinya, formula baru tersebut dicobakan kepada 200 orang responden. Setelah satu bulan penggunaan, 180 orang responden berpendapat bahwa formula baru tersebut lebih efektif. Pada saat yang bersamaan, 300 orang responden diminta untuk menguji obat yang lama tetapi diberi tahu bahwa obat yang sedang mereka coba adalah formula baru. Dari kelompok responden ini, 261 responden menyatakan bahwa obat yang mereka coba lebih ampuh. Dengan level signifikansi 5%, dapatkah disimpulkan bahwa obat yang baru lebih efektif!
Seorang Psikolog berpendapat bahwa kondisi stress akan memperlemah ingatan jangka pendek seseorang. Percobaan dilakukan terhadap 100 mahasiswa yang dipilih secara acak yang terbagi menjadi 2 kelompok, masing-masing 50 mahasiswa. Percobaan dilakukan dengan memperkenalkan 2 buah simpul tali A dan B untuk kegunaan yang sama dan sama dalam hal kesulitan pembuatannya. Dua minggu sebelum UAS, mahasiswa pada kelompok pertama diperkenalkan dengan simpul tali A, sedangkan mahasiswa pada kelompok kedua diperkenalkan dengan simpul tali B. Satu minggu sebelum UAS, mahasiswa pada kelompok pertama diperkenalkan dengan simpul tali B, dan sebaliknya. Setelah UAS yang stress, 100 Mahasiswa tersebut diminta untuk membuat simpul dengan kegunaan tersebut. Jika hasilnya adalah sebagai berikut: Membuat dengan cara Lama 62 Baru 38
T I PE S K A L A U K U R D A T A
Non-metric
metric
nominal
ordinal
interval
ratio
Tidak
Ya Ya Ya
Tidak Tidak
Ya Ya
Seringkali orang membicarakan keterkaitan antara suatu hal dengan hal lainnya. Korelasi adalah cara ilmiah yang akan memberikan informasi mengenai hubungan antara dua buah variabel.
Berdasarkan Gambar Ilustrasi tersebut. Apa yang dapat anda katakan tentang korelasi:
1. Korelasi menyatakan kekuatan hubungan antara dua buah variabel. 2. Semakin kuat hubungan antara dua buah variabel, semakin tinggi nilai korelasinya.
Nominal:
Phi coefficient
Ordinal:
Spearmans correlation, Kendalls correlation
Interval-Ratio:
Pearson Correlation
-1.0
-0.6
+0.6
+1.0
Catatan
Tanda dan + menandakan arah hubungan. (+) semakin tinggi nilai suatu variabel semakin tinggi juga nilai variabel lainnya (-) semakin tinggi nilai suatu variabel semakin rendah nilai variabel lainnya
Nominal Ordinal
Interval
Ratio
2 =
(O
i =1 j =1
ij
Eij )
Catatan:
Eij
n = banyaknya sampel
Data yang dikumpulkan sbb: Musik Rock 80-an 90-an 43 44 Non-Musik TOTAL Rock 9 4 13 52 48 100
TOTAL 87
Kesimpulannya: Ada hubungan yang lemah antara co-hort dan jenis musik tertentu
Contoh kasus: Seorang ahli pendidikan ingin mengetahui adakah hubungan antara IQ dan lamanya jam yang dihabiskan untuk menonton televisi dalam seminggu. Berikut adalah datanya:
IQ (i)
Hitung Rumus:
= 1
= 1
Kesimpulan: Terdapat korelasi yang lemah dan negatif antara IQ dan lamanya jam yang dihabiskan untuk menonton televisi selama seminggu
Contoh kasus: Seorang ahli geniologi ingin meneliti, apakah ada hubungan antara tinggi dan berat badan seseorang. Data yang didapat ternyata tidak sempurna sehingga hanya mendapat data berbentuk ranking. Person A B C D E F G H 3 4 5 1 2 5 6 7 7 8 8 6
Kesimpulan: Terdapat korelasi yang sedang antara tinggi dan berat badan seseorang
Catatan:
Sx =
(x x)
i =1 i
; St.Dev. x
n 1
Sy =
(y
i =1
y)2
; St.Dev. y
n 1
S xy =
( x x )( y
i =1 i
y)
Kovarian antara x dan y
n 1
Contoh kasus: Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu. Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah) dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut:
A 40 385
B 20 400
C 25 395
D 20 365
E 30 475
F 50 440
G 40 490
H 20 420
I 50 560
J 40 525
K 25 480
L 50 510
(x x)
5.83 -14.17 -9.17 -14.17 -4.17 15.83 5.83 -14.17 15.83 5.83 -9.17 15.83 Total
( x x )2
( y y)
( y y)2
4726.56 2889.06 3451.56 7876.56 451.56 189.06 1314.06 1139.06 11289.06 5076.56 689.06 3164.06 42256.25
34.03 -68.75 200.69 -53.75 84.03 -58.75 200.69 -88.75 17.36 21.25 250.69 -13.75 34.03 36.25 200.69 -33.75 250.69 106.25 34.03 71.25 84.03 26.25 250.69 56.25 1641.67 Total
Kesimpulan: Ada hubungan yang kuat dan positif antara biaya iklan dan nilai penjualan
Jika analisis korelasi digunakan untuk mengukur arah dan kekuatan hubungan antara dua buah variabel. Maka kemudian muncul pertanyaan, apakah mungkin untuk menduga nilai dari suatu variabel, jika nilai variabel lainnya diketahui? ANALISIS REGRESI LINIER ADALAH JAWABANNYA
ANALISIS REGRESI LINIER SEDERHANA Digunakan untuk menduga nilai suatu variabel, jika nilai variabel lainnya diketahui. Analisis regresi linier sederhana hanya melibatkan satu buah variabel independen (x), dan satu variabel dependen (y). VARIABEL INDEPENDEN Variabel yang menentukan nilai dari variabel dependen. BAGAIMANA DENGAN ARTI VARIABEL DEPENDEN?
Catatan: Jika banyaknya variabel independen yang digunakan untuk menduga nilai variabel dependen banyaknya lebih dari satu maka digunakan analisis regresi linier berganda.
Contoh kasus: Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu. Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah) dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut:
Merk Biaya Iklan Nilai Penjualan A 40 385 B 20 400 C 25 395 D 20 365 E 30 475 F 50 440 G 40 490 H 20 420 I 50 560 J 40 525 K 25 480 L 50 510
Jika Equitas Merk dari masing-masing merk dianggap sama kuatnya, tentukan: variabel independen, variabel dependen, dan alasannya!
Y = + X
Y = a + bx + e
UNTUK SAMPEL
= a + bx y
a = y bx b=
S xy
2 Sx
y x
UNTUK KASUS MUDAHMAN, BERAPAKAH NILAI konstanta (a) dan koefisien (b)?
a = y bx b=
S xy
2 Sx
S xy =
i =1
( xi x )( yi y ) n 1
2
S x2 =
i =1
( xi x ) n 1
= 3.221
UNTUK KASUS MUDAHMAN, BAGAIMANAKAH MODEL PENDUGAAN (Estimation Model) nya? = nilai duga dari nilai penjualan y
= 343.706 + 3.221x y
x = biaya iklan
SEHINGGA:
Merk Biaya Iklan Nilai Penjualan Nilai Duga dari Nilai Penjualan Merk Biaya Iklan Nilai Penjualan Nilai Duga dari Nilai Penjualan A B C D E F 40 20 25 20 30 50 385 400 395 365 475 440 472.546 408.126 424.231 408.126 440.336 504.756 G H I J K L 40 20 50 40 25 50 490 420 560 525 480 510 472.546 408.126 504.756 472.546 424.231 504.756
MENGUJI MODEL REGRESI LINIER SEDERHANA Uji Serentak Digunakan untuk menguji: apakah model regresi linier sederhana tepat digunakan sebagai model pendugaan?
H0 = model regresi linier sederhana tidak tepat digunakan sebagai model pendugaan H1 = model regresi linier sederhana tepat digunakan sebagai model pendugaan
Source
Regresi
y ) (y
n i 1
Error
2 ( ) e e i1
n 2 ( ) y y i 1
n-2
SSerror n2
Total
n-1
Sum of Degree of Mean Square Square (SS) Freedom (DF) (MS) 17031.74 25224.51 42256.25 1 10 11 17031.74 2522.45
F 6.75
Selanjutnya:
FF( v1 ,v2 )
0.05 6.75F(1 ,10 ) = 4.96
tolak H 0
MENGUJI MODEL REGRESI LINIER SEDERHANA Uji Parsial Jika dari ANOVA diketahui bahwa: model regresi linier sederhana tepat digunakan sebagai model pendugaan Maka, muncul pertanyaan: Apakah konstanta (a) dan koefisien (b) signifikan?
Everything should be made as simple as possible, but not simpler Albert Einstein
H0 : = 0
t ,n 1
vs
H1 : 0
t=
(a )S x
n
n(n 1)
2 i
Se
x
i =1
H0 : = 0
vs
H1 : 0
t=
(b )S x
Se
n 1
t ,n 1
Catatan: Sx adalah standar deviasi bagi x Se adalah standar deviasi bagi error
t=
(343.706 0)(12.216)
50.224 15650
12(11)
t = 7.675
t0.05,11
t0.05,11 = 2.228
t=
= 343.706 + 3.221x y
Selanjutnya: Mudahman ingin membuat merk sepatu yang baru. Jika Mudahman memiliki pos biaya iklan sebesar 50 juta rupiah. Ramalkanlah nilai penjualan yang mungkin didapatkan oleh Mudahman!