Anda di halaman 1dari 179

STATISTIKA-Pengantar

Pertemuan

Bahan

Statistika
Deskriptif;
Ukuran
Pemusatan
dan
Penyebaran
Statistika; Frekuensi data
Dasar-dasar teori peluang; Peluang bersyarat dan
teorema bayes
Konsep sampling dan Populasi; Nilai Ekspektasi ratarata, varian, dan kovarian
Distribusi Teoritis Diskrit; Binom, hipergeometri, poisson

2
3
4
5
6
7

Distribusi Teoritis Kontinu; Normal, Nilai Z, Normal


Baku, membaca tabel distribusi teoritis kontinu
Pendugaan Selang Kepercayaan Satu Sampel; z, t,
dan proporsi
UTS

STATISTIKA-Pengantar

Pertemuan

Bahan

Pendugaan Selang Kepercayaan Dua Sampel; z, t,


proporsi, chi-square
Konsep Hipotesis; Pengujian Hipotesis Satu Sampel; z,
t, dan proporsi
Pengujian Hipotesis Lebih dari Satu Sampel; z, t, dan
proporsi
Konsep korelasi dan Skala Ukur Data
Korelasi Kendall, Spearman, Pearson, dan Asosiasi KhiKuadrat
Regresi Linier Sederhana untuk peramalan
Aplikasi Korelasi dan Regresi Linier Sederhada di bid.
Ekonomi
UAS

9
10
11
12
13
14

STATISTIKA-Definisi Statistika

Apakah Statistika itu?


Seni mengumpulkan, mengolah, dan mengintepretasikan data menjadi
informasi yang berguna untuk pengambilan keputusan
Berdasarkan kedalaman pengolahan data/analisis, Statistika
dibedakan menjadi 2; yaitu:

Statistika Deskriptif: metode-metode yang berkaitan dengan


pengumpulan dan penyajian suatu gugus data sehingga memberikan
informasi yang berguna.
Statistika Inferensi: mencakup semua metode yang berhubungan
dengan analisis data untuk kemudian sampai pada peramalan atau
penarikan kesimpulan keseluruhan gugus data induknya.

STATISTIKA-Istilah-istilah umum

Populasi
Keseluruhan pengamatan yang menjadi perhatian si peneliti.
Sampel atau Contoh
Suatu himpunan bagian dari populasi.
Sampel acak sederhana
Suatu sampel acak sederhana n pengamatan adalah suatu contoh acak
sederhana yang dipilih dengan suatu cara tertentu, sehingga tiap
himpunan bagian yang berukuran n dari populasi tersebut memiliki
peluang terpilih yang sama.

Parameter
Sembarang nilai yang menjelaskan ciri-ciri populasi.
Statistik
Sembarang nilai yang menjelaskan ciri-ciri sampel.

STATISTIKA-Ukuran Pemusatan

Apakah Ukuran Pemusatan itu? (center of measurement)


Sembarang ukuran yang menunjukkan pusat dari suatu gugus data yang
umumnya telah diurutkan.
Misalnya: mean atau nilai rata-rata, median, dan modus

STATISTIKA-Mean

Apakah mean atau nilai rata-rata?


Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk
mendapatkan gambaran umum tentang pusat dari suatu gugus data.

Mean untuk Populasi


N

Mean untuk Sampel


n

= i =1
N

Contoh:

x = i =1
n

X i = {1,3,4,7,5}
n

x = i =1
n

x + x + x + x4 + + xn 1+ 3 + 4 + 7 + 5
= 1 2 3
=
=4
n
5

STATISTIKA-Median

Apakah median itu?


Adalah suatu cara untuk mendapatkan pusat dari data; digunakan untuk
mendapatkan gambaran umum tentang pusat dari suatu gugus data;
secara khusus untuk data berskala ukur nominal dan ordinal.
Langkah-langkah Menghitung median...
1. Urutkan data
2. Kalau n ganjil, maka nilai mediannya adalah nilai pengamatan yang tepat
membagi gugus data menjadi dua bagian yang sama besar.
Kalau n genap, maka nilai mediannya adalah rata-rata dua nilai
pengamatan yang paling tengah.

STATISTIKA-Median

Contoh:
Berapakah median dari suatu gugus data X i ={ 1, -2, 8, 2, 2, 5}?
Langkah 1: Urutkan data
-2, 1, 2, 2, 5, 8
Langkah 2: n genap

X3 X4
x Me
2

2 2
2

STATISTIKA-Modus

Apakah Modus itu?


Adalah nilai yang paling sering muncul dari suatu gugus data. Jadi nilai
modus adalah nilai yang memiliki frekuensi yang paling besar dari suatu
gugus data.
Contoh:
X i = {2,1,2,2,5,5,5,8}
Nilai
-2
1
2
5

Frekuensi
1
1
2
3

Karena nilai 5 memiliki frekuensi yang paling


besar, maka:

Mo 5

STATISTIKA-Ukuran Penyebaran

Apakah ukuran penyebaran/dispersion of measurement itu?


Adalah suatu nilai yang menunjukkan keberagaman nilai dari suatu gugus
data.
Misalnya: range/wilayah, standar deviasi/simpangan baku, varian/ragam

STATISTIKA-Range/Wilayah
Apakah Range/Wilayah itu?
Adalah suatu nilai yang menunjukkan beda antara nilai terbesar dengan
nilai terkecil dari suatu gugus data.
Rumus:
Range = NilaiTerbesar NilaiTerkecil

Contoh:
X i = {2,1,2,2,5,5,5,8}
Range = 8 (2) = 10

STATISTIKA-Standar Deviasi/Simpangan Baku


Apakah Standar Deviasi itu?
Adalah suatu nilai yang menunjukkan rata-rata, beda nilai-nilai dari suatu
gugus data terhadap mean-nya.

St.Dev untuk Populasi


=N
2
(
)

ii=
X

i
1

N
St.Dev untuk Sampel

s=

i= n
i=1

(X

x
n 1
i

STATISTIKA-Standar Deviasi/Simpangan Baku


Contoh:
X i = {2,1,2,2,5,5,5,8}

Carilah standar deviasi dari data di atas!


Ingat untuk mendapatkan St.Dev, maka diperlukan mean-nya!
x = 3.25

s=

( 2 3.25)2 + (1 3.25)2 + (2 3.25)2 ++ (8 3.25)2


7

= 3.105

STATISTIKA-Varian/Ragam
Apakah varian/ragam itu?
Adalah kuadrat dari nilai standar deviasi.

Varian untuk Populasi

2 =

=N
2
(
)

ii=
X

i
1

Varian untuk Sampel

2
i= n
2 i=1 X i x
s =

n 1

Jadi jika S=3.105, maka variannya adalah S 2 = 3.1052 = 9.641

STATISTIKA-Menggunakan Kalkulator

Menghitung mean dengan kalkulator


1. Masuk ke mode SD:
Tekan Shift
Mode
SD
2. Masukkan keseluruhan gugus data:
Tekan -2
1
DT
DT
3. Tekan x
Menghitung St.Dev dengan kalkulator
1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean.
2. Tekan x n 1

DT

STATISTIKA-Hal lainnya mengenai Ukuran Penyebaran

Nilai Z atau nilai baku...


Adalah nilai pembakuan yang menyatakan jarak suatu pengamatan x dari
mean dalam satuan standar deviasi.

Nilai Z untuk jika nilai-nilai parameter populasi diketahui


x
z=

Nilai Z untuk jika nilai-nilai parameter populasi tidak diketahui


z=

xx
s

STATISTIKA-Contoh Nilai Z

Carilah nilai Z dari X=-2


pada gugus data X =

x xx
z=
=

{2,1,2,2,5,5,5,8}!

2 3.25
=
= 1.69
3.105

Tanda negatif menyatakan, nilai -2 ada di sebelah kiri mean dari gugus data, angka
1,69 menunjukkan jarak nilai -2 dari mean dalam satuan standar deviasi.

Dalil Chebyshev:
1
Sekurang-kurangnya 1
bagian data,
k2
terletak dalam k standar deviasi dari nilai tengahnya.

STATISTIKA-Ukuran Fraksional

Apakah Ukuran Fraksional itu? (fractional measurement)


Sembarang ukuran yang membagi data menjadi fraksi-fraksi yang sama
range-nya.
Misalnya: kuartil, desil, persentil

Ada lebih dari 1 cara untuk mencari kuartil, desil, dan persentil.
Namun semuanya memiliki satu filosofi:
membagi data menjadi fraksi-fraksi yang memiliki
anggota gugus data yang kira-kira hampir sama banyaknya

STATISTIKA-Contoh Rumus Kuartil

Kuartil membagi data menjadi empat fraksi.

Q1

Q2

Langkah mencari kuartil:


1. cari posisi kuartil tersebut:

i
pQi = x(n + 1)
4

2. cari nilainya berdasarkan rumus:


Qi = jxX pQ X pQ +1+ X pQ
i
i
i

Q3

STATISTIKA-Contoh

Carilah kuartil ke-3 dari gugus data ini:


X i = {2,1,2,2,5, 8,8}

Langkah mencari kuartil:


1. cari posisi kuartil tersebut:

3
pQ3 = x8 = 6.00
4
2. cari nilainya berdasarkan rumus:

Q3 = 0.00 xX pQ X pQ +1+ X pQ = 0.00 x|8 8|+ 8 = 8


3
3
3

STATISTIKA-Ingatkah Saudara?

Apakah yang dimaksud center of measurement, dispersion measurement,


dan fractional measurement?
Ukuran apa yang paling sering digunakan?
Mean dan Standar Deviasi.
Bagaimana dengan fractional measurement?
The Pareto principle (also known as the 80-20 rule, the law of the vital few
and the principle of factor sparsity) states that, for many events, 80% of the
effects comes from 20% of the causes.

STATISTIKA-Ingatkah Saudara?

PARETO PRINCIPLE:
Business management thinker Joseph M. Juran suggested the
principle and named it after Italian economist Vilfredo Pareto, who
observed that 80% of income in Italy went to 20% of the
population. It is a common rule of thumb in business; e.g., "80% of
your sales comes from 20% of your clients." (Hukum 80/20)

Thomas Stanley, Ph.D. dan William D.


Dunks, Ph.D. sering menggunakan
ukuran fraksional untuk
menggambarkan perilaku masyarakat
Amerika.

STATISTIKA-Ingatkah Saudara?
BAGAIMANA HUKUM 80/20 DILAHIRKAN? (Sebuah Ilustrasi)
Vilfredo Pareto, mengumpulkan data pendapatan orang-orang di Italia.
Data-data yang didapatkannya diurutkan. Setelah berulang kali
mengulang pengumpulan data, dia mendapati bahwa orang-orang yang
menempati posisi data lebih besar atau sama dengan 80 (persentil
ke-80 dan seterusnya) ternyata memiliki total pendapatan 80% dari
seluruh orang-orang dalam pengamatannya.

80% data; 20% total pendapatan

20% data;
80% total pendapatan

persentil ke-80
S={ 0,1; 0,9; 1; 1; 1; 1; 1; 2; 16; 16}

STATISTIKA-Ingatkah Saudara?

Cobalah menghitung mean dan standar deviasi-nya!


X={2, 3, 1}
Y={3, 1, 4, 10, 2}
Z={1, 45, 28, 2, -10, 35, 29, 50, 98, 100, -35, 18, 1, 1, 5, -9, 10, 7, 4, 19,
3, 12, 5, 10, 19, 20, 32, 67, 8, 9, 12, -1, 0, 2}

STATISTIKA-Menggunakan Kalkulator

Menghitung mean dengan kalkulator


1. Masuk ke mode SD:
Tekan Shift
Mode
SD
2. Masukkan keseluruhan gugus data:
Tekan -2
1
DT
DT
3. Tekan x
Menghitung St.Dev dengan kalkulator
1. Ikuti langkah ke-1 dan ke-2, seperti mencari nilai mean.
2. Tekan x n 1

DT

STATISTIKA-Tabel Frekuensi Sederhana


Tabel Frekuensi Sederhana adalah tabel frekuensi yang terdiri dari kolom-kolom
nilai (xi) dan frekuensi (fi).
Contoh:
Nilai
xi
-2
1
2
5
8

Frekuensi
fi
1
1
2
1
1

Tabel di atas, sama dengan bentuk gugus data sbb:

X = { 2,1,2,2,5, 8}
i

Pertanyaan yang sering muncul adalah


Bagaimana menghitung nilai mean dan st. dev
dari data pada tabel frekuensi sederhana

STATISTIKA-Tabel Frekuensi Sederhana (Contd)


Contoh:
Nilai
Frekuensi
= { 2,1,2,2,5, 8}
i
xi
fi
-2
1
1
1
2
2
5
1
8
1
Cara menghitung mean-nya dengan rumus dasar: x =

2 1 2 2 5 8
x=
+ + + + +
6 6 6 6 6 6

1
( 2 + 1 + 2 + 2 + 5 + 8)
6
1
= (1.(2) + 1.(1) + 2(2) + 1(5) + 1(8) )
6
1
x=
( x1) + f ( x2) + K + f ( xk )
f
1
2
k
6
=

i=n
i =1

Sehingga, RUMUSnya menjadi:

1 i =k
x = i =1
n

f x
i

STATISTIKA-Tabel Frekuensi Sederhana (Contd)


Contoh:
Nilai
xi
-2
1
2
5
8

Frekuensi
fi
1
1
2
1
1

X = { 2,1,2,2,5, 8}
i

RUMUS St. Dev untuk tabel


frekuensi sederhana menjadi:

s=

f xi x
i =k
i =1

n 1

Cobalah menghitung nilai St. Dev dengan rumus di atas, bandingkan dengan
rumus St. Dev pada pertemuan ke-1!

STATISTIKA-Tabel Frekuensi untuk Data Berkelompok


6 Langkah Menyusun Tabel Frekuensi untuk Data Berkelompok:
1. Tentukan banyaknya selang kelas: (saran: bsk=1+3,3 log n)
2. Tentukan range datanya
3. Bagi range dengan banyaknya selang kelas
4. Tentukan limit kelas dan batas kelas
Ingat batas kelas selalu 0,5 digit terakhir limit kelas.
5. Tentukan titik tengah tiap selang kelas:
ttk=(batas atas+batas bawah)/2
6. Tentukan frekuensi masing-masing kelas

STATISTIKA-Tabel Frekuensi untuk Data Berkelompok


Sensus Tahun 1980
Kelompok Umur/
Age Group
(1)
0-4
5-9
10 - 14
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
+70

Jumlah/
Total
(4)
241655
234916
216003
238054
240501
192932
131065
123921
109978
82086
74411
47917
36340
20137
27611

Dengan mengeluarkan selang kelas +70


dapatkah anda menghitung mean dan
standar deviasi usia penduduk kota
Surabaya tahun 1980?
(petunjuknya: gunakan rumus untuk tabel
frekuensi sederhana tetapi ganti Xi dengan
titik tengah kelas)

STATISTIKA-Istilah Penting pada Himpunan

Ruang Contoh adalah himpunan semua kemungkinan hasil dari suatu


percobaan. Dilambangkan dengan huruf S.
Kejadian adalah himpunan bagian dari ruang contoh. Terbagi atas dua jenis
yaitu Kejadian Sederhana (anggota himpunannya tunggal) dan Kejadian
Majemuk (gabungan beberapa kejadian sederhana).
Ruang Nol/Himpunan Kosong adalah himpunan bagian dari ruang contoh yang
tidak memiliki satu anggota pun. Dilambangkan dengan

Ilustrasi Matematis:

K .Sederhana K .Majemuk RuangContoh

STATISTIKA-Istilah Penting pada Himpunan (Contd)

Bagaimana mendaftarkan anggota dari ruang contoh?


Ada beberapa cara yang populer; antara lain: Diagram Venn, dan Diagram Pohon

Bagaimana jika anggota ruang contoh sangat banyak?


Dapat menggunakan Notasi Pembentuk Himpunan

Contoh:
Kasus nilai yang muncul dari pelemparan sebuah mata dadu.

STATISTIKA-Istilah Penting pada Himpunan (Contd)


HIMPUNAN-HIMPUNAN yang mungkin terbentuk adalah:

S = {1,2,3,4,5,6}
A = {1,3,5}
B = {2,4,6}

C = {2,3,5}
D = {2}

E = {}

Notasi Pembangun Himpunan


S={x|x adalah semua nilai mata dadu yang mungkin}
A={x|x adalah mata dadu dengan nilai ganjil}
B={x|x adalah mata dadu dengan nilai genap}
C={x|x adalah mata dadu dengan nilai prima}
D={x|x adalah mata dadu dengan nilai genap sekaligus prima}
E={x|x adalah mata dadu dengan nilai }
Buatlah Diagram Venn nya!

STATISTIKA-Pengolahan Kejadian

BEBERAPA ISTILAH PENTING DALAM PENGOLAHAN


KEJADIAN:
Irisan: irisan kejadian A dan B dilambangkan dengan A B ; adalah kejadian
yang terdiri atas semua unsur persekutuan kejadian A dan B.
Saling Asing/Disjoint: disjoin antara kejadian A dan B dilambangkan dengan
A B = ; adalah kejadian di mana kejadian A dan B tidak punya unsur
persekutuan.
Paduan/Union: union kejadian A dan B dilambangkan dengan
kejadian yang mencakup semua unsur kejadian A dan B.

A B ; adalah

Komplemen: komplemen A dilambangkan dengan A; adalah himpunan semua


anggota S yang bukan anggota A.

STATISTIKA-Mencacah Titik Contoh

Apakah Titik Contoh itu?


Titik Contoh adalah kejadian sederhana yang mungkin disusun dari anggota
ruang contoh.

Ada beberapa operasi perhitungan/pencacahan pada titik contoh; yaitu:

Kaidah Penggandaan, Kaidah Permutasi, dan Kaidah Kombinasi

STATISTIKA-Kaidah Penggandaan

Apa yang kaidah penggandaan katakan?


Jika suatu operasi dapat dilakukan dengan n1 cara dan operasi kedua dapat
dilakukan dengan n2 cara, maka kedua operasi tersebut dapat dilakukan dengan
n1x n2 cara.
Rumus:
Untuk 2 operasi: n1 x n2
Untuk k operasi: n1 x n2 x x nk

STATISTIKA-Kaidah Penggandaan (Contd)

Contoh:
Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 1 jenis
saham dan 1 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan
8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan
investasinya?

Jawabannya:
n1= banyaknya jenis saham di bursa= 45
n2= banyaknya jenis mata uang= 8
Banyaknya pilihan investasi= n1x n2= 45x 8 = 360 pilihan

STATISTIKA-Permutasi

Apakah yang dimaksud permutasi?


Permutasi adalah susunan yang dapat dibentuk oleh sebagian atau keseluruhan
kumpulan benda dengan urutan yang diperhatikan.
Urutan yang diperhatikan?
Jika susunan A, B dianggap berbeda dengan B,A maka urutan diperhatikan.

Dalil-Dalil Permutasi:
1. Banyaknya permutasi n benda yang berbeda adalah n!
2. Banyaknya permutasi r benda dari n benda yang berbeda adalah
n Pr =

n!
(n r )!

STATISTIKA-Permutasi (Contd)
Dalil-Dalil Permutasi:
3. Banyaknya permutasi n benda yang berbeda yang disusun dalam suatu lingkaran
adalah (n-1)!
4. Banyaknya permutasi yang berbeda dari n benda yang n1 di antaranya berjenis
pertama, n2 berjenis kedua, , nk berjenis ke-k adalah

n!
n Pr =
n1!n2 !...nk !

STATISTIKA-Kombinasi
Apa yang dimaksud dengan Kombinasi?
Kombinasi adalah susunan banyaknya cara mengambil r benda dari n benda tanpa
memperhatikan urutannya.

RUMUS:

n!
n Cr =
r!(n r )!

STATISTIKA-Permutasi atau Kombinasi?

Contoh:
Jika seorang memutuskan untuk menginvestasikan uangnya dalam bentuk 3 jenis
saham dan 2 jenis mata uang asing. Jika di bursa saham ada 45 jenis saham dan
8 jenis mata uang yang diperdagangkan, maka berapa banyak pilihan paket
investasinya?
Perpaduan antara Kombinasi dan
Kaidah Penggandaan

STATISTIKA-Peluang Suatu Kejadian


Apa yang dimaksud dengan Peluang?
Peluang suatu kejadian A adalah jumlah peluang semua titik contoh di dalam A.
Ingat:

0 P ( A) 1 P ( ) = 0

P( S ) = 1

RUMUS:

n
P ( A) =
N
n = banyaknya titik contoh dalam kejadian A
N = banyaknya titik contoh dalam ruang contoh

STATISTIKA-Kaidah Penjumlahan
Hal yang perlu diperhatikan:
1. Bila A dan B adalah dua kejadian sembarang, maka:

P( A B) = P( A) + P( B) P( A B)
2. Bila A dan B adalah dua kejadian yang saling asing, maka:

P( A B) = P( A) + P( B)

STATISTIKA-Peluang Bersyarat

Dalam suatu kasus, mungkin saja kita mendapati bahwa kita mengetahui sejumlah
informasi awal. Dengan menggunakan informasi awal tersebut, kita dapat
memperkirakan peluang suatu kejadian dengan lebih akurat.
Peluang suatu kejadian terjadi, jika peluang kejadian yang lain diketahui
disebut sebagai PELUANG BERSYARAT.

Peluang bersyarat B, bila A diketahui dilambangkan dengan P(B|A) sbb:

P( A B)
P( B | A) =
P( A)
Catatan: P(A)>0

STATISTIKA-Peluang Bersyarat_Contoh Soal


SOAL:
Pak Kris menginvestasikan uangnya ke 2 saham yang berbeda. Peluang saham A
meningkat nilainya dalam sebulan ke depan adalah 10% dan peluang saham B
meningkat nilainya dalam sebulan ke depan adalah 15%. Jika bulan berikutnya Pak
Kris mendapat informasi bahwa harga saham turun, berapa peluangnya bahwa
harga saham A yang turun?
JAWABAN:
Umpamakan Pak Kris membeli 100 saham A dan 100 saham B.

Naik
A
B
Total

Turun
10
15
25

Total
90
100
85
100
175
200

STATISTIKA-Peluang Bersyarat_Contoh Soal


JAWABAN:

P(turun A)
P ( A | turun) =
P(turun)
90
18
200
=
=
175 35
200
Jadi peluang saham A turun nilainya adalah 18/35

STATISTIKA-Peluang Bersyarat_Contoh Soal


SOAL:
Sirkuit Donington Park di Inggris memiliki tipikal cuaca yang unik. Untuk menentukan
setting motoGP yang tepat, tim Ducati memiliki data bahwa peluang dua hari
berturut-turut hujan adalah 30%, sedangkan peluang dua hari berturut-turut cerah
adalah 40%. Peluang mix, hari ini cerah besok hujan adalah 15% demikian juga
dengan peluang hari ini hujan besok cerah adalah 15%. Jika dalam babak kualifikasi
cerah, berapakah peluangnya dalam balapan besok hari juga cerah?
JAWABAN:

Hari ini
Hujan Cerah
Hujan
30
15
Besok Hari Cerah
15
40
Total
45
55

Total
45
55
100

STATISTIKA-Peluang Bersyarat_Hal Lainnya


Bila dua kejadian bebas, maka:

P ( B | A) = P ( B)
P ( A | B ) = P ( A)
Kaidah Penggandaan:
1. Bila dalam suatu percobaan kejadian A dan B dapat terjadi sekaligus,
maka:

P ( A B) = P( A) P( B | A)
2. Bila Kejadian A dan B bebas; maka:

P ( A B) = P( A) P ( B)

STATISTIKA-Konsep Sampling dan Populasi

A
A
A
A

A
A
A

A
A

POPULASI

SAMPEL

POPULASI adalah keseluruhan pengamatan yang menjadi perhatian si


peneliti.
SAMPEL adalah suatu himpunan bagian dari populasi.

STATISTIKA-Konsep Sampling dan Populasi


MENGAPA STATISTIKA MENGGUNAKAN STATISTIK DARI SAMPEL
UNTUK MENDUGA PARAMETER POPULASI?
Trade-off antara keterbatasan waktu, sumber daya, dan biaya dengan
akurasi hasil penelitian.

Less
Accuracy

Low
Resources

High
Accuracy

High
Resources

STATISTIKA-Konsep Sampling dan Populasi


Cobalah menghitung nilai mean dari gugus data populasi berikut:
51,5514; 49,0151; 48,8834; 44,3441; 48,2312; 46.2880; 46,0068; 53,6238;
50,3008; 49,6371

Secara acak pilihlah sampel berukuran 3, 5, 7, dan 9 dari gugus data


populasi di atas dan hitunglah nilai mean-nya. Bandingkan!

Less
Accuracy

Low
Resources

High
Accuracy

High
Resources

STATISTIKA-Konsep Sampling dan Populasi


TEKNIK SAMPLING:

Probability Sampling

Non-Probability Sampling

1. Simple Random Sampling

1. Convenience Sampling

2. Stratified Random Sampling

2. Judgmental Sampling

3. Cluster Random Sampling

3. Quota Sampling

4. Systematic Random
Sampling

4. Snowball Sampling

STATISTIKA-Nilai Harapan untuk Parameter


NILAI HARAPAN (Expected Value)
Expected Value dari sebuah variabel (peubah acak) adalah jumlah dari
peluang semua kemungkinan yang ada di dalam percobaan atau himpunan
kejadian dikalikan dengan nilainya.

DEFINISI MATEMATIS:

E ( x) = X .dP

untuk diskrit:

E ( x ) = i x i

untuk kontinu:
b

E ( x) = x. f ( x).dx
a

Catatan:
Definisi diskrit dan kontinu akan dijelaskan pada pertemuan selanjutnya.

STATISTIKA-Mean Variabel
MISAL:
Ruang Contoh untuk pelemparan 2 uang logam, sbb:
S={AA, AG, GA, GG}
Jika dilakukan 16 kali pelemparan ternyata banyaknya muncul sisi gambar (Xi)
sbb:

xi
fi

Maka:

0
4

1
7

2
5

(0).(4) + (1).(7) + (2).(5)


x=
16
= (0).(4 / 16) + (1).(7 / 16) + (2).(5 / 16)
= 1,06
E ( x ) = i x i

STATISTIKA-Mean Variabel
Mean Variabel x yang memiliki nilai yang sama dengan expected value E(x).
Adalah suatu perhitungan mean populasi menggunakan frekuensi relatif
Variabel Diskrit X:

xi
P(X=x)

x1
f(x1)

x2
f(x2)

xn
f(xn)

Maka nilai expected value untuk X adalah:


n

= E( X ) = xi . f ( xi)
i =1

Variabel Kontinun X:

= E( X ) = xi . f ( xi)
i =1

= E( X ) = x. f ( x).dx

Terjadi jika X bilangan riil.

STATISTIKA-Mean Variabel

Bagaimana untuk variabel g(X)?


Variabel Diskrit g(X):

= E( X ) = g( xi). f ( xi)
i =1

Variabel Kontinu g(X):

= E( X ) = g( xi). f ( xi).dg( xi)

STATISTIKA-Varian Variabel
Varian Variabel X
Varian dari 16 kali pelemparan mata uang tersebut adalah:

(0 1,06) 2 .(4) + (1 1,06) 2 .(7) + (2 1,06) 2 .(5)


=
16
= 0,5639
2

Secara Umum Variabel X memiliki varian


Diskrit:
2

2 = E ( X ) = ( X ) . f ( x)
2

i =1

Rumus Hitung bagi varian X:

2 = E( X 2 ) 2

Kontinu:

2 = E ( X )2 =

( X ) . f ( x).dx

Bagaimana dengan
varian dari g(X)?

STATISTIKA-Kovarian Variabel

Kovarian Variabel X dan Y adalah:

xy = E (( x x )( y y ) )

Diskrit:
n

xy = ( xi x )( yi y ). f ( x). f ( y )
i =1

Kontinu

xy =

(x
i

)( yi y ). f ( x). f ( y ).dx.dy

Catatan:
Semakin kecil nilai kovarian antara variabel x dan y, maka semakin besar
independensi antara kedua variabel tersebut.

STATISTIKA-Sifat-sifat mean dan varian


Sifat-sifat

Bila a dan b adalah konstanta:


ax +b = a + b
Nilai tengah jumlah atau selisih dua atau lebih peubah acak

x y = x y
Nilai tengah hasil kali dua variabel
xy = x . y
Ragam jika b konstan
x2+b = x2 = 2

Ragam jika a konstan


ax2 = a 2 x2 = a 2 2

Jika X dan Y independen maka:

x2+ y = x2 + y2

STATISTIKA - VARIABEL: Peluang Diskrit

VARIABEL ATAU PEUBAH ACAK:


Suatu fungsi yang nilainya berupa bilangan nyata yang ditentukan oleh setiap
unsur dalam ruang contoh.

RUANG CONTOH DIBAGI MENJADI DUA:


1. Diskrit
Jumlah titik contoh TERHINGGA, merupakan hasil membilang.
contoh: tingkat preferensi yang dikodekan menjadi angka 1, 2, 3, 4, atau 5

2. Kontinu
Jumlah titik contoh TAK TERHINGGA, merupakan hasil mengukur.
contoh: tinggi seseorang yang diukur dalam satuan centimeter (174,74cm)

STATISTIKA - VARIABEL: Variabel Diskrit

ILUSTRASI: tinggi badan

Dikrit:

Kontinu: 150cm

180cm

STATISTIKA - VARIABEL: Variabel Diskrit

DISTRIBUSI PELUANG:
Untuk menghitung nilai peluang tertentu selain menggunakan cara mendaftarkan atau
membuat diagram. Ada bentuk-bentuk peluang khusus, yang nilainya dapat dicari dengan
rumus tertentu.
Distribusi peluang adalah fungsi yang digunakan untuk menghitung nilai peluang dari
suatu bentuk peluang-peluang tertentu.

Contoh:
Banyaknya gambar yang muncul dari 3 kali pelemparan 1 mata uang.
(banyaknya gambar yang muncul dari 1 kali pelemparan 3 mata uang)

Distribusi Peluang

BENTUK PELUANG

x
P(X=x)

0
1/8

1
3/8

2
3/8

3
1/8

x = banyaknya sisi gambar yang muncul

3

x
f ( x) =
8

; x = 0, 1, 2, 3

x = banyaknya sisi gambar yang muncul

STATISTIKA - VARIABEL: Variabel Diskrit


BEBERAPA DISTRIBUSI PELUANG DISKRIT YG POPULER:
Binominal; Hipergeometrik; Poisson

DISTRIBUSI BINOMINAL
Ciri-ciri:
1.

Percobaan terdiri atas n ulangan

2.

Digolongkan menjadi sukses dan gagal

3.

Nilai peluang untuk setiap ulangan tidak berubah

4.

Pengulangan bersifat bebas

RUMUS:

n
b( x; n, p ) = p x q n x
x

Arti Notasi
n = banyaknya ulangan
x = banyaknya sukses
p = peluang sukses

q =(1-p) =peluang gagal

STATISTIKA - VARIABEL: Variabel Diskrit


CONTOH SOAL:
Dari data di masa lalu, peluang nilai saham A naik dalam tahun tertentu adalah 35%;
Jika Pak Mudahman membeli saham untuk investasi selama 10 tahun. Berapa peluang
nilai sahamnya tidak mengalami kenaikan sama sekali di tiap tahunnya?
Jawaban:

p =35%

x =0

b(0;10,0.35) =0.013

n =10

STATISTIKA - VARIABEL: Variabel Diskrit


DISTRIBUSI HIPERGEOMETRIK
Ciri-ciri:
1.

Suatu percobaan yang terdiri atas contoh acak atau random sampel berukuran n diambil dari
populasi berukuran N

2.

Dengan k dari N benda diklasifikasikan sebagai berhasil dan N-k benda sebagai gagal.

RUMUS:

k N k

x nx
h( x; N , n, k ) =
N

n

Arti Notasi
k = banyaknya semesta sukses
x = banyaknya sukses
N = banyaknya semesta

n = banyaknya percobaan

STATISTIKA - VARIABEL: Variabel Diskrit


CONTOH SOAL:
Sebuah perusahaan reksadana menginvestasikan dananya pada beberapa saham.
Berdasarkan pengalaman di masa lalu dari 45 saham aktif dipasarkan di pasar modal
biasanya hanya 5 saham yang berkinerja positif di akhir tahun (asumsi 5 saham yang
berkinerja positif ini random). Jika perusahaan tersebut memiliki kebijakan untuk selalu
memecah investasinya ke dalam 3 saham. Berapa peluangnya semua sahamnya
berkinerja negatif?
Jawaban:

k =5

N =45

n =3

h(0;45,3,5) =0,696

x=0

STATISTIKA - VARIABEL: Variabel Diskrit


DISTRIBUSI POISSON
Ciri-ciri:
1.

Banyaknya hasil percobaan yang terjadi dalam suatu selang waktu tertentu atau wilayah, tidak
tergantung pada banyaknya hasil percobaan pada selang waktu atau wilayah yang berbeda.

2.

Peluang terjadinya satu hasil percobaan selama selang waktu yang singkat atau dalam wilayah yang
kecil, sebanding dengan panjang selang waktu atau besarnya wilayah tersebut

3.

Peluang bahwa lebih dari satu hasil percobaan akan terjadi dalam selang waktu yang singkat atau
wilayah yang kecil dapat diabaikan.
(Distribusi Poisson selalu berkenaan dengan peluang selang waktu atau wilayah)

RUMUS:

e x
p ( x; ) =
x!

Arti Notasi
e =bilangan natural =2.718
x =banyaknya sukses
=mean populasi (sbg pendekatan binominal jika p sangat kecil; =np)

STATISTIKA - VARIABEL: Variabel Diskrit


CONTOH SOAL:
Pasar modal mempublikasikan bahwa setiap hari dari 45 saham yang aktif dipasarkan,
ada 10 saham yang tidak bergerak nilainya. Jika pada suatu hari Pak Mudahman
sedang mengamati pasar modal, berapa peluang Pak Mudahman mendapatkan ada 8
saham yang tidak mengalami pergerakan?

Jawaban:

=10

x =8

p(8;10) =0.113

STATISTIKA - VARIABEL: Peluang Kontinu

Distribusi Peluang Kontinu:


Peluang variabel random kontinu bernilai tepat di suatu titik adalah nol.

P( X = a) = 0
Perhatikan bahwa jika x kontinu, maka:

P ( a < X b) = P ( a < X < b) + P ( X = b)


= P ( a < X < b) + 0

STATISTIKA - VARIABEL: Peluang Kontinu


Fungsi Kepekatan Peluang:
Fungsi f disebut fungsi kepekatan peluang bagi variabel random kontinu X bila luas daerah di
bawah kurva dan di atas sumbu x sama dengan 1, dan bila luas antara a dan b dibawah kurva
menyatakan peluang X untuk x=a sampai x=b.

Maka: P( - ~ < X < + ~ )=1


P( a < X < b )<1

STATISTIKA - VARIABEL: Peluang Kontinu


Sebaran Normal/Gauss
Bentuk Grafis Lonceng

Rumus Kurva Normal:

n( x; , ) =

1
2

1 x

STATISTIKA - VARIABEL: Peluang Kontinu


Ilustrasi Grafis:

Kurva Normal dengan 1<2; 1=2


1

Kurva Normal dengan 1=2; 1<2


1
2

1=2

STATISTIKA - VARIABEL: Peluang Kontinu


Ilustrasi Grafis:

Kurva Normal dengan 1<2; 1<2


1
2

2
Kesimpulan dari Ilustrasi Grafik

Semakin kecil semakin tinggi puncak dari kurva normal


Semakin besar semakin ke kanan posisi dari kurva normal

STATISTIKA - VARIABEL: Peluang Kontinu

Sifat Kurva Normal:


1. Fungsi mencapai maksimum jika Me=
2. Kurva setangkup pada suatu garis tegak yang melewati

P( ~ < x) = P( x < + ~) = 0.5


3. Kurva asimptotik terhadap sumbu datar
4. Luas kurva adalah 1.

P( ~ < x < + ~) = 1

STATISTIKA - VARIABEL: Peluang Kontinu


Luas daerah di bawah kurva normal:
Dibakukan sebagai distribusi normal baku.

Distribusi Normal Baku:


Adalah distribusi variabel random normal dengan nilai tengah nol dan ragam bernilai satu.
(normal baku; n(x;0,1))

Rumus Pembakuan:

z=

Ilustrasi Grafik:

z1

z2

STATISTIKA - VARIABEL: Peluang Kontinu


Hampiran distribusi normal terhadap:
A. Distribusi Binominal
Bila X adalah suatu sampel random binominal dengan mean =np dan varian
2=npq; maka untuk n ~ berlaku:

Z =

x np
npq

B. Distribusi Penarikan Sampel


Distribusi penarikan sampel adalah distribusi peluang suatu statistik mengikuti dalil
limit pusat.

DALIL LIMIT PUSAT


Bila sampel random berukuran n ditarik dari suatu populasi tak hingga atau besar
dengan mean dan varian 2, maka mean sampel x akan menyebar
menghampiri distribusi normal dengan mean x = dan standar deviasi x = / n

Z =

x
/ n

STATISTIKA - VARIABEL: Peluang Kontinu

Dalil limit pusat juga berlaku jika:


Sampel random berukuran n diambil dari populasi berhingga berukuran N dengan pemulihan.

Bagaimana jika sampel berukuran kecil (n<30)?


Suatu koreksi bias diperlukan untuk variabel yang terdistribusi normal dengan ukuran sampel
n<30 dan atau tidak diketahui. Koreksi bias ini dinamakan distribusi t.

STATISTIKA - VARIABEL: Peluang Kontinu

Distribusi t (ditemukan oleh W.S. Gosset student t)


Suatu koreksi bias diperlukan untuk variabel yang terdistribusi normal dengan ukuran sampel
n<30 dan atau tidak diketahui. Koreksi bias ini dinamakan distribusi t.
Distribusi t. Bila x dan s2 adalah mean dan varians dari suatu sampel random berukuran n
uang diambil dari suatu populasi normal dengan mean dan 2; maka:

x
t=
s/ n
Dimana, t merupakan variabel yang terdistribusi sesuai distribusi t dengan derajat bebas
(v=n-1).

STATISTIKA - VARIABEL: Peluang Kontinu


Ilustrasi grafis untuk distribusi t:
Kurva distribusi t untuk v= 2, 5, dan ~

v= ~
v= 5
v= 2

Kurva distribusi t adalah setangkup

t1-

STATISTIKA - VARIABEL: Peluang Kontinu


Distribusi F:
Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random.
Statistik F:

s12 / 12
f = 2 2
s2 / 2

Dengan derajat bebas (degree of freedom)


v1=n1-1; v2=n2-1

Ingat. Jika f(v1,v2) untuk f dengan v1 dan v2 derajat bebas maka::

f1 ( v1 , v 2 ) =

ILUSTRASI DISTRIBUSI F

f ( v1 , v 2 )
f0.01(3, 8) = 7,59
f0.05(5, 11) = 3,20

STATISTIKA Parameter Estimator

Pendugaan parameter atau parameter estimation adalah metode statistika


yang digunakan untuk menduga parameter menggunakan statistik.
Beberapa alasan untuk melakukan estimasi:
1. Keterbatasan waktu
2. Keterbatasan tenaga; dan
3. Keterbatasan biaya
Statistika menggunakan data yang berasal dari sampel untuk menduga
parameter dari populasi.

STATISTIKA Parameter Estimator

Apa yang dimaksud dengan estimator?


Menurut Yitnosumarto (1990), estimator adalah suatu nilai variabel dari
statistik yang mungkin untuk sebuah parameter.
Apa yang dimaksud dengan nilai duga/estimation value?
Menurut Yitnosumarto (1990), estimation value adalah nilai dari estimator
yang didapat dengan menganalisis data dari suatu sampel.

Contoh:
Mean dari Ujian Akhir Nasional adalah 5,11 dan Varian sebesar 1,89.

STATISTIKA Parameter Estimator

Point Estimator/Penduga Titik:


Pada point estimator, estimation value yang dihasilkan hanya berupa titik
pada suatu garis bilangan.
Misal:
X=x1, x2, x3, , xn
Jika peluang x1 hingga xn untuk terpilih adalah sama, maka:

x
i=n

x=

i =1

yang adalah point estimator dari mean populasi.

STATISTIKA Parameter Estimator

Sifat-sifat Parameter Estimator:


1. Unbias Estimator (tidak berbias)
Estimator haruslah mampu mendekati nilai sebenarnya dari parameter
yang diduga.
2. Efisien
Memiliki varian yang efisien.

)
V (1 )
) < 1; Varian pertama, lebih efisien dibanding varian yang kedua
V ( 2 )
3. Konsisten
Jika selisih antara estimator dan parameter selalu mendekati nol, maka
suatu estimator memiliki sifat konsisten.

STATISTIKA Parameter Estimator


Interval Estimator:
Point estimator tidak memberikan informasi yang cukup mengenai parameter
populasi, karena nilainya tergantung pada data dari sampel yang diambil.
Selanjutnya dikembangkan Interval Estimator dan Interval Estimation Value.
Catatan: Interval Estimator disebut sebagai Confidence Interval.
Contoh Notasi Estimasi:

b1 < < b2
P(b1 < < b2 ) = (1 )

Significance Level

Confidence Interval

STATISTIKA Selang Kepercayaan


Bagaimana menentukan Selang Kepercayaan (Confidence Interval) yang
akan digunakan?
1. Identifikasi banyaknya populasi
2. Identifikasi parameter apa yang ditanyakan pada populasi
3. Identifikasi banyaknya sampel yang diambil

STATISTIKA Selang Kepercayaan


Confidence Interval untuk satu populasi, parameter mean , banyak sampel
n>=30 atau standar deviasi-nya diketahui.
Ilustrasi grafis untuk CI: (mengikuti distribusi normal)

/2

/2

CI=1-
Bentuk Confidence Interval:

P( x z / 2

< < x + z / 2

) = 1

STATISTIKA Selang Kepercayaan


Confidence Interval untuk satu populasi, parameter mean , banyak sampel
n<30 dan atau standar deviasi-nya tidak diketahui.
Ilustrasi grafis untuk CI: (mengikuti distribusi t)

V=?

/2

/2

CI=1-
Bentuk Confidence Interval:

P( x t / 2,v

s
s
< < x + t / 2,v
) = 1
n
n

STATISTIKA Selang Kepercayaan


Confidence Interval untuk satu populasi, parameter proporsi p, banyak
sampel n>=30.
Ilustrasi grafis untuk CI:
(mengikuti distribusi binominal; yang dapat didekati dengan distribusi normal)

/2

/2

CI=1-
Bentuk Confidence Interval:

)
P( p z / 2

))
pq
)
< p < p + z / 2
n

))
pq
) = 1
n

STATISTIKA Selang Kepercayaan


Bagaimana menentukan Selang Kepercayaan (Confidence Interval) yang
akan digunakan?
1. Identifikasi banyaknya populasi
2. Identifikasi parameter apa yang ditanyakan pada populasi
3. Identifikasi banyaknya sampel yang diambil

Jika CI untuk satu populasi digunakan untuk menguji: apakah BESARnya ukuran-ukuran
pada sampel sama dengan nilai tertentu pada populasi,
Maka CI untuk dua populasi digunakan untuk menguji: apakah BEDA ukuran-ukuran pada
sampel sama dengan nilai tertentu pada populasi.

STATISTIKA Selang Kepercayaan


Confidence Interval untuk dua populasi, parameter mean 1-2, banyak
sampel n>=30 atau standar deviasi-nya 1 dan 2 diketahui.
Ilustrasi grafis untuk CI: (mengikuti distribusi normal)

/2

/2

CI=1-
Bentuk Confidence Interval:

P(( x1 x2 ) z / 2 ( 12 / n1 ) + ( 22 / n2 ) < 1 2 < ( x1 x2 ) + z / 2 ( 12 / n1 ) + ( 22 / n2 ) ) = 1

STATISTIKA Selang Kepercayaan


Confidence Interval untuk dua populasi, parameter mean 1-2, banyak
sampel n<30 atau standar deviasi-nya 1 dan 2 tidak diketahui; tetapi 1=2
Ilustrasi grafis untuk CI: (mengikuti distribusi t)

V=?

/2

/2

CI=1-
Bentuk Confidence Interval:

P(( x1 x2 ) t / 2,v .s p (1 / n1 ) + (1 / n2 ) < 1 2 < ( x1 x2 ) + t / 2,v .s p (1 / n1 ) + (1 / n2 ) ) = 1


(n1 1) s12 + (n2 1) s22
Hal lain yang perlu diketahui: s =
n1 + n2 2
2
p

v = n1 + n2 2

STATISTIKA Selang Kepercayaan


Confidence Interval untuk dua populasi, parameter mean 1-2, banyak
sampel n<30 atau standar deviasi-nya 1 dan 2 tidak diketahui; tetapi 12
Ilustrasi grafis untuk CI: (mengikuti distribusi t)

/2

V=?

/2

CI=1-
Bentuk Confidence Interval:

P(( x1 x2 ) t / 2,v ( s12 / n1 ) + ( s22 / n2 ) < 1 2 < ( x1 x2 ) + t / 2,v . ( s12 / n1 ) + ( s22 / n2 ) ) = 1


( s12 / n1 + s22 / n2 ) 2
Hal lain yang perlu diketahui: v = 2
( s1 / n1 ) 2 ( s22 / n2 ) 2
v selalu dibulatkan ke atas
+
n1 1
n2 1

STATISTIKA Selang Kepercayaan


Bagaimana saya dapat mengetahui apakah 1=2 atau 12 ?
Bandingkanlah varian-nya sbb:

Ingat!!! Distribusi F:
Digunakan untuk menduga rasio dua buah varians dari dua buah sampel random.
Statistik F:

s12
f = 2 ~ F ,v1 ,v2
s2

Dengan derajat bebas (degree of freedom)


v1=n1-1; v2=n2-1

Jika f<F, maka 1=2, Jika f>F, maka 12

STATISTIKA Selang Kepercayaan


Confidence Interval untuk data berpasangan, parameter mean d
Kata kunci: sebelum-sesudah, satu unit pengamatan diamati dua kali.
Ilustrasi grafis untuk CI: (mengikuti distribusi t)

/2

V=?

/2

CI=1-

Bentuk Confidence Interval:

P( xd t / 2,v .sd / n < d < xd + t / 2,v .sd / n = 1

STATISTIKA Selang Kepercayaan


Confidence Interval untuk dua populasi, parameter proporsi p1-p2, banyak
sampel n>=30.
Ilustrasi grafis untuk CI:
(mengikuti distribusi binominal; yang dapat didekati dengan distribusi normal)

/2

/2

CI=1-
Bentuk Confidence Interval:

) )
P(( p1 p2 ) z / 2

))
) )
p1q1 p2 q2
) )
+
< p1 p2 < ( p1 p2 ) + z / 2
n1
n2

))
) )
p1q1 p2 q2
+
) = 1
n1
n2

STATISTIKA PENGUJIAN HIPOTESIS

Sering kali untuk menarik suatu kesimpulan kita tidak mungkin meneliti
keseluruhan populasi karena kendala waktu, tenaga, dan biaya.
Statistika memberikan solusi untuk penarikan kesimpulan
menggunakan data-data yang kita dapatkan dari sampel. Penarikan
kesimpulan secara demikian dinamakan pengujian hipotesis

STATISTIKA PENGUJIAN HIPOTESIS

Hipotesis Statistik:
Pernyataan atau dugaan mengenai ciri-ciri atau sifat dari satu atau lebih
populasi
Catatan: benar atau salahnya suatu hipotesis tidak penah diketahui
kecuali kita memeriksa seluruh populasi.
Ada 2 Macam Hipotesis:
Hipotesis Nol:
Hipotesis yang dirumuskan dengan harapan akan ditolak.
Hipotesi Alternatif:
Hipotesis yang dirumuskan dengan harapan akan diterima

STATISTIKA PENGUJIAN HIPOTESIS

Mengapa harus dilakukan PENGUJIAN HIPOTESIS?


Untuk mendapatkan cukup fakta yang dapat membantu kita menilai
derajat kebenaran suatu hipotesis.

KENYATAAN

DUGAAN
H0 benar H1 benar
H0 benar

ok

H1 benar

ok

Power of Test (Kekuatan Uji) = 1 -

STATISTIKA PENGUJIAN HIPOTESIS

Ilustrasi Grafis untuk

dan :

2
=

Catatan:
Peluang tidak mungkin dihitung kecuali kita memiliki hipotesis
alternatif yang spesifik. (ditandai dengan = )

STATISTIKA PENGUJIAN HIPOTESIS


Contoh perhitungan

dan :

Seorang meneliti vaksin influensa jenis baru. Jika 25% penerima


vaksin masih memiliki ketahanan terhadap influensa lebih dari 2
tahun, maka vaksin tersebut dinyatakan lebih baik dari vaksin yang
lama.
Data yang didapatkan (9 dari 20 penerima vaksin masih memiliki ketahanan terhadap influensa
lebih dari 2 tahun)

Hipotesis:

H0: p = 25%
H1: p > 25%

STATISTIKA PENGUJIAN HIPOTESIS


Perhitungan

= P(error jenis 1)
= P(X>=9 jika p=25%)
=

20

b( x;20;0.25)
x =9

= 1 b( x;20;0.25)
x =0

= 0,0409
Perhitungan

: jika p=50%

= P(error jenis 2)
= P(X<9 jika p=50%)
8

Catatan:
Untuk memperkecil dan
maka n harus diperbesar

= b( x;20;0.25)
x =0

= 0,2517

STATISTIKA PENGUJIAN HIPOTESIS


Uji 1 arah (one tail test) dan uji 2 arah (two tail test):
Bersifat 1 arah:
H0: = 0

atau

H1: > 0

H0: = 0
H1: < 0

Bersifat 2 arah:
H0: = 0
H1: 0

/2

/2

STATISTIKA PENGUJIAN HIPOTESIS


Contoh kasus:
Bersifat 1 arah:
Perusahaan rokok menyatakan bahwa kadar nikotin rokoknya TIDAK
MELEBIHI 2,5 mg
Bersifat 2 arah:
Perusahan rokok menyatakan bahwa kadar nikotin rokoknya
ADALAH 2,5 mg

Sifat 1 arah dan 2 arah, ditentukan dari kejelasan ARAH PERNYATAAN.


Sifat 1 arah; TIDAK LEBIH, KURANG DARI, LEBIH DARI
Sifat 2 arah; ADALAH, SAMA DENGAN

STATISTIKA PENGUJIAN HIPOTESIS

Uji Hipotesis:
6 Langkah Menguji Statistik:
1. Nyatakan hipotesis nol-nya H0 bahwa = 0
2. Pilihlah hipotesis alternatif H1 yang sesuai diantara > 0, < 0,
atau 0
3. Tentukan taraf nyata (significance)
4. Pilih statistik uji (statistical test) yang sesuai dan tentukan wilayah
kritiknya
5. Hitung nilai statistik uji berdasarkan data pada contoh
6. KEPUTUSAN: Tolak H0 bila nilai uji statistik tersebut jatuh pada
wilayah kritik.

Saya akan membantu anda!!!


Setiap kali anda diminta untuk menduga suatu
hipotesis; tanyakanlah Hal-hal berikut!!!
Pendugaan
Hipotesis

Mean

1 Populasi

Varian

2 Populasi

1 Populasi

2 Populasi

Proporsi

1 Populasi

2 Populasi

Saya akan membantu anda!!!


Jika bertanya tentang Mean???

Mean

1 Populasi

n>=30, atau
diketahui
Nilainya; Rumus 1

n<30; dan
tidak diketahui
Nilainya;
Rumus 2

2 Populasi

Tidak
Berpasangan

Berpasangan;
Rumus 6

Saya akan membantu anda!!!


Jika bertanya tentang Mean 2 Populasi Tidak
Berpasangan???

Tidak
Berpasangan

n<30;
n>=30;
atau 1 dan 2
diketahui nilainya;
Rumus 3

n<30;
atau 1 dan 2
tidak diketahui nilainya; 1=2;
Rumus 4

atau 1 dan 2
tidak diketahui nilainya; 12;
Rumus 5

Saya akan membantu anda!!!


Jika bertanya tentang Varians???
Varians

1 Populasi;
Rumus 7

2 Populasi;
Rumus 8

Jika bertanya tentang Proporsi???


Proporsi

1 Populasi;
Rumus 9

2 Populasi;
Rumus 10

STATISTIKA TABEL STATISTIK UJI


Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI
SATU POPULASI:
H0
= 0
RUMUS 1

= 0
RUMUS 2

KRITERIA
n>=30; atau
diketahui nilainya

n<30; dan nilainya


tidak diketahui

RUMUS

uji z :
x 0
z=
/ n
uji t :
x 0
t=
s/ n

STATISTIKA TABEL STATISTIK UJI


Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI
DUA POPULASI:
H0
1-2=d0
RUMUS 3

1-2=d0
RUMUS 4

KRITERIA
n>=30; atau 1 dan 2
diketahui nilainya

RUMUS

uji z :
z=

n<30; atau 1 dan 2


diketahui tidak
nilainya; 1=2

( x1 x 2 ) d 0
( 12 / n1 ) + ( 22 / n2 )

uji t :
t=

( x1 x 2 ) d 0
s p (1 / n1 ) + (1 / n2 )

(n1 1) s12 + (n2 1) s22


s =
n1 + n2 2
2
p

v = n1 + n2 2

STATISTIKA TABEL STATISTIK UJI


Tabel pengujian HIPOTESIS untuk NILAI TENGAH POPULASI
DUA POPULASI:
H0
1-2=d0
RUMUS 5

KRITERIA
n<30; atau 1 dan 2
diketahui tidak
nilainya; 12

RUMUS
uji t :
t=

( x1 x 2 ) d 0
( s12 / n1 ) + ( s22 / n2 )

( s12 / n1 + s22 / n2 ) 2
v= 2
( s1 / n1 ) 2 ( s22 / n2 ) 2
+
n1 1
n2 1

d=d0
RUMUS 6

pengamatan
berpasangan

uji t :
t=

d d0
sd / n

STATISTIKA TABEL STATISTIK UJI


Tabel pengujian HIPOTESIS untuk Varian

H0
2= 02

KRITERIA
Tidak ada

RUMUS 7

12= 22

RUMUS 8

RUMUS
uji 2 :

=
2

Jika s1>s2 gunakan


rumus 1.
Jika s1<s2 gunakan
rumus 2

(n 1) s 2

2
0

; v = n 1

uji F : (rumus 1)
s12 (v , v )
F= 2; 1 2
s2
uji F : (rumus 2)
s22
F = 2 ; (v2 , v1 )
s1

STATISTIKA TABEL STATISTIK UJI


Tabel pengujian HIPOTESIS untuk Proporsi

H0
p= p0

KRITERIA
n>=30

RUMUS 10

uji z :
z=

RUMUS 9

p1-p2= d0

RUMUS

n>=30

x np0
np0 q0

uji z :
( p p 2 ) ( p1 p2 )
z= 1
p q[(1 / n1 ) + (1 / n2 )]

STATISTIKA CONTOH PENGUJIAN


Halaman 344 no. 6
Jaringan restoran MacBurger mengklaim bahwa rata-rata waktu tunggu pelanggan adalah 3
menit dengan standar deviasi populasi 1 menit. Departemen quality assurance menemukan
bahwa dari 50 pelanggan di cabang Warren Road MacBurger memiliki rata-rata waktu
tunggu 2,75. Dengan taraf nyata (level of significance) 0,05; dapatkah disimpulkan bahwa
rata-rata waktu tunggu kurang dari 3 menit?
Langkah menjawab:
1. Menentukan Hipotesis Null
2. Menentukan Hipotesi Alternatif
H0: = 3 menit
H1: < 3 menit
3. Tentukan taraf signifikansi: =5%

STATISTIKA CONTOH PENGUJIAN


Halaman 344 no. 6
4. Tentukan statistik uji yang sesuai dan wilayah kritiknya: Rumus 1.

Z = -1,64
5. Hitung statistik uji-nya

x 0 2.75 3
z=
=
= 1,768
/ n 1 / 50
Tolak H0

Terima H0

6. Kesimpulan:
Tolak H0: Cukup bukti untuk menyatakan bahwa waktu tunggu pelanggan kurang dari
3 menit.

STATISTIKA Latihan
Try This (dont be fooled by a complex story)
Secara teoritis, chip micro processor yang diproduksi dengan cara baru
mampu berfungsi normal rata-rata 4 tahun. Untuk menguji teori tersebut
perusahaan memproduksi 10 prototype chip micro processor. Jika ternyata
dari 10 chip micro processor prototype tersebut mampu berfungsi normal
rata-rata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori tersebut
dapat dinyatakan benar pada taraf signifikansi 5%?

STATISTIKA Latihan
Latihan Bab 11:

3. Gibbs Baby Food Company ingin membandingkan berat


bayi yang menggunakan produknya dibanding dengan
kompetitornya. Suatu sampel yang terdiri dari 40 bayi yang
mengkonsumsi Gibbs Baby Food memiliki berat rata-rata 7,6
pounds dengan standar deviasi 2,3 pounds. Suatu sampel
yang lain terdiri dari 55 bayi yang mengkonsumsi makanan
merek kompetitor memiliki berat rata-rata 8,1 pounds dengan
standar deviasi 2,9 pounds. Pada taraf signifikansi 0,05,
dapatkah kita menyimpulkan bahwa bayi yang mengkonsumsi
Gibbs Baby Food memiliki berat badan lebih rendah 0,5
pounds dibanding yang mengkonsumsi produk kompetitor?

STATISTIKA Latihan
Latihan Bab 11:

4. Departemen riset yang berkantor di New Hampshire


Insurance menyusun sebuah riset berkelanjutan tentang
penyebab kecelakaan mobil, karakteristik pengemudi, dan
lainnya. Suatu sampel random yang terdiri 400 catatan
kepolisian menemukan bahwa 120 orang yang berstatus
single mengalami kecelakaan setidaknya satu kali dalam tiga
tahun terakhir. Sedangkan dari sampel random yang terdiri
600 catatan kepolisian menemukan,150 orang yang berstatus
menikah mengalami kecelakaan setidaknya satu kali dalam
tiga tahun terakhir. Dengan taraf signifikansi 0,05, apakah
dapat disimpulkan bahwa proporsi orang yang single dan
yang menikah yang mengalami kecelakaan setidaknya satu
kali dalam tiga tahun terakhir adalah berbeda?

STATISTIKA Latihan
Latihan Bab 11:

17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk


Nexus Media, Inc. Dia ingin membandingkan antara
pengeluaran perjalanan harian antara staf penjualan dan staf
pemeriksa anggaran. Dia mengumpulkan data sebagai
berikut.
Sales 131

135

146

165

136

142

Audit 130

102

129

143

149

120

139

Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan


bahwa rata-rata pengeluaran perjalanan harian staf penjualan
lebih besar dibanding staf pemeriksa anggaran?

STATISTIKA Latihan
Latihan Bab 11:

21. Suatu artikel akhir di The Wall Street Journal


membandingkan antara biaya untuk mengadopsi anak dari
China dan Rusia. Dari 16 sampel kasus adopsi anak dari
China membutuhkan biaya rata-rata $11.045 dengan standar
deviasi $835. Sedangkan dari 18 kasus adopsi anak dari
Rusia membutuhkan biaya rata-rata $12.840 dengan standar
deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah
disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia
lebih tinggi?

STATISTIKA Latihan
Latihan Bab 11:

26. Pemerintah federal akhir-akhir ini mengadakan program


pendanaan khusus untuk menurunkan angka kejahatan di
daerah yang rawan. Suatu penelitian di 8 daerah rawan di
Miami Florida menemukan data sebagai berikut.
A

Sblm 14

17

12

Ssdah 2

13

Dapatkah program pemerintah tersebut dikatakan berhasil?


Gunakan taraf signifikansi 0,01.

STATISTIKA Latihan
Try This (dont be fooled by a complex story)
Secara teoritis, chip micro processor yang diproduksi dengan
cara baru mampu berfungsi normal rata-rata 4 tahun. Untuk
menguji teori tersebut perusahaan memproduksi 10 prototype
chip micro processor. Jika ternyata dari 10 chip micro
processor prototype tersebut mampu berfungsi normal ratarata 3,5 tahun dengan standar deviasi 1 tahun, apakah teori
tersebut dapat dinyatakan benar pada taraf signifikansi 5%?

STATISTIKA Latihan
Latihan Bab 11:

17. Ms. Lisa Monnin adalah seorang direktur anggaran untuk


Nexus Media, Inc. Dia ingin membandingkan antara
pengeluaran perjalanan harian antara staf penjualan dan staf
pemeriksa anggaran. Dia mengumpulkan data sebagai
berikut.
Sales 131

135

146

165

136

142

Audit 130

102

129

143

149

120

139

Dengan taraf signifikansi 0,10, dapatkah dia menyimpulkan


bahwa rata-rata pengeluaran perjalanan harian staf penjualan
lebih besar dibanding staf pemeriksa anggaran?

STATISTIKA Latihan
Latihan Bab 11:

21. Suatu artikel akhir di The Wall Street Journal


membandingkan antara biaya untuk mengadopsi anak dari
China dan Rusia. Dari 16 sampel kasus adopsi anak dari
China membutuhkan biaya rata-rata $11.045 dengan standar
deviasi $835. Sedangkan dari 18 kasus adopsi anak dari
Rusia membutuhkan biaya rata-rata $12.840 dengan standar
deviasi $1.545. Dengan taraf signifikansi 0,05, dapatkah
disimpulkan bahwa biaya rata-rata adopsi anak dari Rusia
lebih tinggi?

STATISTIKA Latihan
Latihan Bab 11:

26. Pemerintah federal akhir-akhir ini mengadakan program


pendanaan khusus untuk menurunkan angka kejahatan di
daerah yang rawan. Suatu penelitian di 8 daerah rawan di
Miami Florida menemukan data sebagai berikut.
A

Sblm 14

17

12

Ssdah 2

13

Dapatkah program pemerintah tersebut dikatakan berhasil?


Gunakan taraf signifikansi 0,01.

STATISTIKA Latihan
CHAPTER TEST:

Chapter 10; No. 50


Berdasarkan hasil penelitian American Pet Food Dealer Association, 63% rumah
tangga di Amerika, memiliki hewan peliharaan. Sebuah laporan yang sedang
disusun untuk editorial San Fransisco Chronicle. Sebagai bagian dari editorial,
suatu sampel acak yang terdiri dari 300 rumah tangga, didapati 210 di antaranya
memiliki hewan peliharaan. Apakah data tersebut bertentangan dengan data yang
dimiliki American Pet Food Dealer Association? Jika diberikan level of significance
5%

STATISTIKA Latihan
CHAPTER TEST:

Chapter 11; No. 32


Suatu perusahaan pembuat komputer memiliki layanan hotline untuk customernya.
Perusahaan tersebut menyadari bahwa kemampuan teknisi mereka untuk
menyelesaikan masalah secara tepat dan tepat melalui layanan hotline
berhubungan erat dengan citra perusahaan. Dari 35 telepon yang diterima
berkaitan dengan masalah software, dibutuhkan waktu rata-rata 18 menit dengan
standar deviasi 4,2 menit untuk memberikan solusi kepada customer. Sedangkan
dari 45 telepon yang diterima berkaitan dengan masalah hardware, dibutuhkan
waktu rata-rata 15,5 menit dengan standar deviasi 3,9 menit untuk memberikan
solusi kepada customer. Pada taraf signifikansi 5%, dapatkan disimpulkan bahwa
waktu yang dibutuhkan untuk menyelesaikan masalah yang berkaitan dengan
software lebih lama dibandingkan untuk menyelesaikan masalah hardware?
Berapakan nilai p-value nya?

P-Value adalah peluang menolak H0 berdasarkan hasil observasi,


padahal pada kenyataannya H0 adalah benar.

STATISTIKA Latihan
CHAPTER TEST:

Chapter 11; No. 33


Perusahaan Advil yang membuat obat pereda sakit kepala, meneliti formula baru
yang diklaim lebih efektif. Untuk mengevaluasinya, formula baru tersebut
dicobakan kepada 200 orang responden. Setelah satu bulan penggunaan, 180
orang responden berpendapat bahwa formula baru tersebut lebih efektif. Pada saat
yang bersamaan, 300 orang responden diminta untuk menguji obat yang lama
tetapi diberi tahu bahwa obat yang sedang mereka coba adalah formula baru.
Dari kelompok responden ini, 261 responden menyatakan bahwa obat yang
mereka coba lebih ampuh. Dengan level signifikansi 5%, dapatkah disimpulkan
bahwa obat yang baru lebih efektif!

STATISTIKA Latihan Pengembangan


LATIHAN PENGEMBANGAN: (Perhatikan Bagaimana Para Peneliti Menggunakan Cara
Sederhana untuk Menguji Hal Berikut)

Seorang Psikolog berpendapat bahwa kondisi stress akan memperlemah ingatan


jangka pendek seseorang. Percobaan dilakukan terhadap 100 mahasiswa yang
dipilih secara acak yang terbagi menjadi 2 kelompok, masing-masing 50
mahasiswa. Percobaan dilakukan dengan memperkenalkan 2 buah simpul tali A
dan B untuk kegunaan yang sama dan sama dalam hal kesulitan pembuatannya.
Dua minggu sebelum UAS, mahasiswa pada kelompok pertama diperkenalkan
dengan simpul tali A, sedangkan mahasiswa pada kelompok kedua diperkenalkan
dengan simpul tali B. Satu minggu sebelum UAS, mahasiswa pada kelompok
pertama diperkenalkan dengan simpul tali B, dan sebaliknya. Setelah UAS yang
stress, 100 Mahasiswa tersebut diminta untuk membuat simpul dengan kegunaan
tersebut. Jika hasilnya adalah sebagai berikut:
Membuat dengan cara
Lama

Baru

62

38

Dapatkah disimpulkan bahwa pendapat Psikolog tersebut benar? Sig. 0,05

STATISTIKA-Skala Ukur Data dan Korelasi

T I PE S K A L A U K U R D A T A

Skala Ukur Data

Non-metric

nominal

ordinal

metric

interval

ratio

STATISTIKA-Skala Ukur Data dan Korelasi

Skala Ukur Nominal


Angka yang diberikan kepada obyek
hanya sebagai label atau nama saja.
Contoh:
Nomor Telepon dan Nomor Pemain Sepak
Bola

STATISTIKA-Skala Ukur Data dan Korelasi

Skala Ukur Ordinal


Angka yang diberikan kepada suatu
obyek memiliki urutan.
Contoh:
Pemenang Lomba F1 atau MotoGP,
urutan juara kelas.

STATISTIKA-Skala Ukur Data dan Korelasi

Skala Ukur Interval


Angka yang diberikan kepada objek
memiliki semua sifat skala ukur ordinal,
ditambah dengan sifat kesamaan jarak
antara masing-masing pengukuran.
TETAPI RASIO antar angka-angka
tersebut tidak memiliki arti.
Contoh:
Derajat celcius atau fahreinheit, dan tanggal
dalam kalender

STATISTIKA-Skala Ukur Data dan Korelasi

Skala Ukur Rasio


Angka yang diberikan kepada obyek
memiliki semua sifat dari skala ukur
interval dan rasio antara angka-anka
tersebut memiliki arti
Contoh:
Jarak dalam kilometer

STATISTIKA-Skala Ukur Data dan Korelasi

Skala Ukur Data


Deskripsi

Urutan

Jarak

Rasio

Nominal

Ya

Tidak

Tidak

Tidak

Ordinal

Ya

Ya

Tidak

Tidak

Interval

Ya

Ya

Ya

Tidak

Ratio

Ya

Ya

Ya

Ya

STATISTIKA-Skala Ukur Data dan Korelasi

Seringkali orang
membicarakan
keterkaitan antara
suatu hal dengan hal
lainnya. Korelasi
adalah cara ilmiah
yang akan
memberikan informasi
mengenai hubungan
antara dua buah
variabel.

STATISTIKA-Skala Ukur Data dan Korelasi

Berdasarkan Gambar Ilustrasi tersebut. Apa yang dapat


anda katakan tentang korelasi:
1. Korelasi menyatakan kekuatan hubungan antara dua buah
variabel.
2. Semakin kuat hubungan antara dua buah variabel, semakin tinggi
nilai korelasinya.

STATISTIKA-Skala Ukur Data dan Korelasi

KORELASI SESUAI SKALA UKUR DATA

Nominal:
Phi coefficient

Ordinal:
Spearmans correlation, Kendalls
correlation

Interval-Ratio:
Pearson Correlation

STATISTIKA-Skala Ukur Data dan Korelasi


NILAI KORELASI DATA

-1.0

Nominal
Ordinal

Interval

Ratio

-0.6

-0.3 -0.1 0 +0.1 +0.3

+0.6

+1.0

Catatan
Tanda dan +
menandakan
arah hubungan.
(+) semakin tinggi
nilai suatu variabel
semakin tinggi juga
nilai variabel lainnya
(-) semakin tinggi
nilai suatu variabel
semakin rendah
nilai variabel lainnya

STATISTIKA-Skala Ukur Data dan Korelasi


Nominal: Phi coefficient
Langkah menghitung Phi-Coefficient:
1. Buat Tabel Kontingensi
2. Hitung Nilai Chi-Square tabel tersebut dgn rumus:
k

2 =

(O
i =1 j =1

ij

Eij )

Eij

3. Hitung Phi-Coefficient menggunakan rumus:

Catatan:

Oij = frekuensi observasi


Eij = (ni. x n.j)/n
frekuensi ekspektasi

n = banyaknya sampel

STATISTIKA-Skala Ukur Data dan Korelasi


Nominal: Phi coefficient
Contoh Kasus:
Seorang ahli pemasaran ingin meneliti apakah co-hort (generasi) tertentu
memiliki kecendrungan tertentu dalam jenis musik yang disukainya.
---adakah hubungan antara co-hort dan jenis musik tertentu---

Data yang dikumpulkan sbb:


Musik
Rock

Non-Musik TOTAL
Rock

80-an

43

52

90-an

44

48

13

100

TOTAL 87

STATISTIKA-Skala Ukur Data dan Korelasi


Nominal: Phi coefficient
Langkah Pengerjaannya:
1. Buat Tabel Kontingesi
2. Hitung nilai Chi-Squarenya:
E11 = (n1. x n.1)/n = (52 x 87)/100 = 45.24
E21 = (n2. x n.1)/n = (48 x 87)/100 = 41.76
E12 = (n1. x n.2)/n = (52 x 13)/100 = 6.76
E22 = (n2. x n.2)/n = (48 x 13)/100 = 6.24
Chi-Square:

2 = (43 45.24)2 / 45.24 + (44 41.76)2 / 41.76


+ (9 6.76)2 / 6.76 + (4 6.24)2 / 6.24
= 1.778

STATISTIKA-Skala Ukur Data dan Korelasi


Nominal: Phi coefficient

Langkah Pengerjaannya:
3. Hitung phi-coefficient nya:
=

1.778
= 0.133
100

Kesimpulannya:
Ada hubungan yang lemah antara co-hort dan jenis musik tertentu

STATISTIKA-Skala Ukur Data dan Korelasi


Ordinal: Spearman Correlation
Rumus rho-coefficient:
n

= 1

6 d i2
i =1
2

n(n 1)

d = different / beda ranking

Contoh kasus:
Seorang ahli pendidikan ingin mengetahui adakah hubungan antara IQ dan
lamanya jam yang dihabiskan untuk menonton televisi dalam seminggu.
Berikut adalah datanya:

IQ (i)
Hours of TV
per week (t)

86 97 99 100 100 103 106 110 113 113


0 20 28

50

28

28

17

12

STATISTIKA-Skala Ukur Data dan Korelasi


Ordinal: Spearman Correlation
Langkah pengerjaan:
Hours of
TV per
week (t)

IQ (i)
86
97
99
100
100
103
106
110
113
113

0
20
28
50
28
28
7
17
7
12

rank (i)

rank (t)
1
2
3
4.5
4.5
6
7
8
9.5
9.5

1
6
8
10
8
8
2.5
5
2.5
4

d2

d
0
4
5
5.5
3.5
2
4.5
3
7
5.5

0
16
25
30.25
12.25
4
20.25
9
49
30.25

Hitung Rumus:

= 1

6(196)
= 0.188
10(99)

STATISTIKA-Skala Ukur Data dan Korelasi


Ordinal: Spearman Correlation
Langkah pengerjaan:
Hitung Rumus:

= 1

6(196)
= 0.188
10(99)

Kesimpulan:
Terdapat korelasi yang lemah dan negatif antara IQ dan lamanya jam yang
dihabiskan untuk menonton televisi selama seminggu

STATISTIKA-Skala Ukur Data dan Korelasi


Ordinal: Kendall Correlation
Rumus tau-coefficient:
=

2P
1
n(n 1)
2

Contoh kasus:
Seorang ahli geniologi ingin meneliti, apakah ada hubungan antara tinggi dan
berat badan seseorang. Data yang didapat ternyata tidak sempurna sehingga
hanya mendapat data berbentuk ranking.
Person

A B C D E F G H

Rank by Height 1 2

3 4 5

6 7

Rank by Weight 3 4

1 2 5

7 8

STATISTIKA-Skala Ukur Data dan Korelasi


Ordinal: Kendall Correlation
Langkah pengerjaan:
P = 5 + 4 + 5 + 4 + 3 + 1 + 0 + 0 = 22
2(22)
1 = 0.57
=
1
(8)(7)
2

Kesimpulan:
Terdapat korelasi yang sedang antara tinggi dan berat badan seseorang

STATISTIKA-Skala Ukur Data dan Korelasi


Rasio: Pearson Correlation
Rumus r coefficient:
rxy =

S xy
S x .S y

Catatan:
n

Sx =

(x x)
i =1

; St.Dev. x

n 1
n

S xy =

( x x )( y
i =1

n 1

Sy =

(y
i =1

y)2

n 1

y)
Kovarian antara x dan y

; St.Dev. y

STATISTIKA-Skala Ukur Data dan Korelasi


Rasio: Pearson Correlation

Contoh kasus:
Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu.
Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah)
dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut:

Merk
Biaya Iklan
Nilai Penjualan

A
40
385

B
20
400

C
25
395

D
20
365

E
30
475

F
50
440

G
40
490

H
20
420

Apakah ada hubungan antara biaya iklan dan nilai penjualan?

I
50
560

J
40
525

K
25
480

L
50
510

STATISTIKA-Skala Ukur Data dan Korelasi


Rasio: Pearson Correlation
Langkah Pengerjaannya:
Merk
A
B
C
D
E
F
G
H
I
J
K
L

Biaya Iklan
40
20
25
20
30
50
40
20
50
40
25
50

Nilai
Penjualan
385
400
395
365
475
440
490
420
560
525
480
510

(x x)
5.83
-14.17
-9.17
-14.17
-4.17
15.83
5.83
-14.17
15.83
5.83
-9.17
15.83
Total

( x x )2

( y y)

34.03
-68.75
200.69
-53.75
84.03
-58.75
200.69
-88.75
17.36
21.25
250.69
-13.75
34.03
36.25
200.69
-33.75
250.69
106.25
34.03
71.25
84.03
26.25
250.69
56.25
1641.67 Total

( y y)2
4726.56
2889.06
3451.56
7876.56
451.56
189.06
1314.06
1139.06
11289.06
5076.56
689.06
3164.06
42256.25

STATISTIKA-Skala Ukur Data dan Korelasi


Rasio: Pearson Correlation
Langkah Pengerjaannya:
Merk
A
B
C
D
E
F
G
H
I
J
K
L

Biaya Iklan
40
20
25
20
30
50
40
20
50
40
25
50

Nilai
( x x )( y y )
Penjualan
385
-401.04
400
761.46
395
538.54
365
1257.29
475
-88.54
440
-217.71
490
211.46
420
478.13
560
1682.29
525
415.63
480
-240.63
510
890.63
5287.50
Total

Hitung Rumus:
Sxy= (5287.50)/11
Sx = sqrt(1641.67/11)
Sy = sqrt(42256.25/11)
r = 0.635

Kesimpulan:
Ada hubungan yang kuat dan positif antara biaya iklan dan nilai penjualan

STATISTIKA-Skala Ukur Data dan Korelasi


Contoh kasus:
Pikirkanlah kasus-kasus pemasaran di bawah ini, tentukan dengan skala ukur apa
variabel-variabelnya dapat diukur dan korelasi apa yang tepat untuk variabelvariabel tersebut.
- Market Share ada hubungannya dengan Brand Share
- Kepuasan berhubungan dengan kualitas layanan
- Preferensi berhubungan dengan keputusan membeli

STATISTIKA-Regresi Linier Sederhana

Jika analisis korelasi digunakan untuk mengukur arah dan kekuatan


hubungan antara dua buah variabel. Maka kemudian muncul pertanyaan,
apakah mungkin untuk menduga nilai dari suatu variabel, jika nilai
variabel lainnya diketahui?
ANALISIS
REGRESI LINIER
ADALAH
JAWABANNYA

STATISTIKA-Regresi Linier Sederhana

ANALISIS REGRESI LINIER SEDERHANA


Digunakan untuk menduga nilai suatu variabel, jika nilai variabel lainnya diketahui.
Analisis regresi linier sederhana hanya melibatkan satu buah variabel independen
(x), dan satu variabel dependen (y).
VARIABEL INDEPENDEN
Variabel yang menentukan nilai dari variabel dependen.
BAGAIMANA DENGAN ARTI VARIABEL DEPENDEN?

Catatan:
Jika banyaknya variabel independen yang digunakan untuk menduga nilai variabel
dependen banyaknya lebih dari satu maka digunakan analisis regresi linier berganda.

STATISTIKA-Regresi Linier Sederhana

Contoh kasus:
Mudahman memiliki data-data mengenai biaya iklan dan nilai penjualan 12 merk sepatu.
Data tersebut dikumpulkannya dari publikasi tahunan laporan keuangan (dalam juta rupiah)
dari masing-masing merk sepatu. Data tersebut adalah sebagai berikut:
Merk
Biaya Iklan
Nilai Penjualan

A
40
385

B
20
400

C
25
395

D
20
365

E
30
475

F
50
440

G
40
490

H
20
420

I
50
560

J
40
525

K
25
480

Jika Equitas Merk dari masing-masing merk dianggap sama kuatnya, tentukan:
variabel independen, variabel dependen, dan alasannya!

L
50
510

STATISTIKA-Regresi Linier Sederhana

BENTUK FUNGSI MATEMATIS DARI REGRESI LINIER SEDERHANA:


UNTUK POPULASI

Y = + X

UNTUK SAMPEL

Y = a + bx + e

UNTUK MODEL PENDUGAAN

y = a + bx

Y=variabel dependen
X; x=variabel independen
;a=konstanta
;b=koefisien
e=error fungsi

y =nilai duga dari variabel dependen

STATISTIKA-Regresi Linier Sederhana

BAGAIMANA MENDAPATKAN NILAI untuk konstanta (a) dan


koefisien (b)?

a = y bx
b=

S xy
S x2

y
x

= Mean dari y
= Mean dari x

S xy = Kovarian antara x dan y


S x2 = Varian dari x

STATISTIKA-Regresi Linier Sederhana

UNTUK KASUS MUDAHMAN, BERAPAKAH NILAI konstanta (a) dan


koefisien (b)?

a = y bx
b=

S xy =

S xy
S x2

a = (453.750) (3.221)(34.167)
= 343.706

( xi x )( yi y )

i =1

n 1

S x2 =

( xi x )

i =1

n 1

440.625
b = 149
.242

= 3.221

STATISTIKA-Regresi Linier Sederhana

UNTUK KASUS MUDAHMAN, BAGAIMANAKAH MODEL PENDUGAAN


(Estimation Model) nya?
y = nilai duga dari nilai penjualan

y = 343.706 + 3.221x

x = biaya iklan

SEHINGGA:
Merk
Biaya Iklan
Nilai Penjualan
Nilai Duga dari Nilai Penjualan
Merk
Biaya Iklan
Nilai Penjualan
Nilai Duga dari Nilai Penjualan

40
20
25
20
30
50
385
400
395
365
475
440
472.546 408.126 424.231 408.126 440.336 504.756
G
H
I
J
K
L
40
20
50
40
25
50
490
420
560
525
480
510
472.546 408.126 504.756 472.546 424.231 504.756

STATISTIKA-Regresi Linier Sederhana

MENGUJI MODEL REGRESI LINIER SEDERHANA Uji Serentak


Digunakan untuk menguji: apakah model regresi linier sederhana tepat
digunakan sebagai model pendugaan?
H0 = model regresi linier sederhana tidak tepat digunakan sebagai model pendugaan
H1 = model regresi linier sederhana tepat digunakan sebagai model pendugaan

STATISTIKA-Regresi Linier Sederhana


UJI SERENTAK: Menggunakan tabel ANOVA (Analysis of Varian)

Source

Sum of
Degree of
Mean Square
Square (SS) Freedom (DF)
(MS)

(y y )
n

Regresi

i 1

Error

2
(
)
e

i1

n-2

Total

2
(
)
y

i 1

n-1

SSregresi MSregres
MSerror
1

SSerror
n2

STATISTIKA-Regresi Linier Sederhana


UJI SERENTAK: Untuk kasus Mudahman

Source

Sum of
Degree of
Mean Square
Square (SS) Freedom (DF)
(MS)

Regresi

17031.74

17031.74

Error

25224.51

10

2522.45

Total

42256.25

11

F
6.75

Selanjutnya:

FF(v1 ,v2 )
05
6.75F(10,.10
) = 4.96

tolak H 0

model regresi linier sederhana tepat digunakan


sebagai model pendugaan

STATISTIKA-Regresi Linier Sederhana

MENGUJI MODEL REGRESI LINIER SEDERHANA Uji Parsial


Jika dari ANOVA diketahui bahwa:
model regresi linier sederhana tepat digunakan sebagai model pendugaan
Maka, muncul pertanyaan:
Apakah konstanta (a) dan koefisien (b) signifikan?

Everything should be made as simple as possible, but not


simpler Albert Einstein

STATISTIKA-Regresi Linier Sederhana


UJI PARSIAL untuk Konstanta:

t=

(a )S x

n(n 1)
n

Se

x
i =1

(b )S x
Se

vs

H1 : 0

t ,n 1

2
i

UJI PARSIAL untuk Koefisien:

t=

H0 : = 0

n 1

Catatan:
Sx adalah standar deviasi bagi x
Se adalah standar deviasi bagi error

H0 : = 0

t ,n 1

vs

H1 : 0

STATISTIKA-Regresi Linier Sederhana


UJI PARSIAL - konstanta: Untuk kasus Mudahman

t=

(343.706 0)(12.216)

12(11)

t0.05,11

t = 7.675

t0.05,11 = 2.228

50.224 15650

tolak H 0 Nilai konstanta signifikan berbeda dari nilai 0


UJI PARSIAL - koefisien: Untuk kasus Mudahman

t=

(3.221 0)(12.216) 11
50.224
t = 2.598

t0.05,11

t0.05,11 = 2.228

tolak H 0 Nilai koefisien signifikan berbeda dari nilai 0


Sehingga Model Regresi Linier Sederhana-nya adalah

y = 343.706 + 3.221x

STATISTIKA-Regresi Linier Sederhana

Sehingga Model Regresi Linier Sederhana-nya adalah

y = 343.706 + 3.221x

Selanjutnya:
Mudahman ingin membuat merk sepatu yang baru. Jika Mudahman memiliki pos
biaya iklan sebesar 50 juta rupiah. Ramalkanlah nilai penjualan yang mungkin
didapatkan oleh Mudahman!

y = 343.706 + 3.221x
y = 343.706 + 3.221(50)
= 504.756
Nilai penjualan yang mungkin didapatkan oleh Mudahman adalah 504.706
juta rupiah.

Beri Nilai