Anda di halaman 1dari 64

STATISTIK SOSIAL,

PROBABILITAS DAN
REGRESI

Dr. Fahrial, SP, SE, ME,


PEKANBARU, 04 Mei 2021
1. Konsep Statistika

STATISTIKA :
Kegiatan untuk :
KEGUNAAN
• mengumpulkan data
• menyajikan data
• menganalisis data dengan metode tertentu ?
• menginterpretasikan hasil analisis

Melalui fase

STATISTIKA DESKRIPTIF :
Berkenaan dengan pengumpulan, pengolahan, dan penyajian sebagian
atau seluruh data (pengamatan) tanpa pengambilan kesimpulan

dan fase

STATISTIKA INFERENSI :
Setelah data dikumpulkan, maka dilakukan berbagai metode statistik untuk
menganalisis data, dan kemudian dilakukan interpretasi serta diambil kesimpulan.
Statistika inferensi akan menghasilkan generalisasi (jika sampel representatif)
2. Statistika & Metode Ilmiah

METODE ILMIAH :
Adalah salah satu cara mencari kebenaran yang bila ditinjau dari segi
penerapannya, resiko untuk keliru paling kecil.

LANGKAH-LANGKAH DALAM METODE ILMIAH :


1. Merumuskan masalah
2. Melakukan studi literatur
3. Membuat dugaan-dugaan, pertanyaan-pertanyaan atau hipotesis

4. Mengumpulkan dan mengolah data, menguji hipotesis,


atau menjawab pertanyaan

5. Mengambil kesimpulan

INSTRUMEN

SAMPEL

SIFAT DATA
PERAN STATISTIKA
VARIABEL

METODE ANALISIS
3. Data

DATA terbagi atas DATA KUALITATIF dan DATA KUANTITATIF

DATA KUALITATIF : DATA KUANTITATIF :


Data yang dinyatakan dalam Data yang dinyatakan dalam
bentuk bukan angka. bentuk angka
Contoh : jenis pekerjaan, Contoh : lama bekerja,
status marital, tingkat jumlah gaji, usia, hasil
kepuasan kerja ulangan

DATA

KUALITATIF JENIS KUANTITATIF


DATA

NOMINAL INTERVAL
ORDINAL RASIO
4. Data
DATA NOMINAL :
Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi.
CIRI : posisi data setara
tidak bisa dilakukan operasi matematika (+, -, x, :)
CONTOH : jenis kelamin, jenis pekerjaan

DATA ORDINAL :
Data berskala ordinal adalah data yang dipeoleh dengan cara kategorisasi atau klasifikasi, tetapi
di antara data tersebut terdapat hubungan
CIRI : posisi data tidak setara
tidak bisa dilakukan operasi matematika (+, -, x, :)
CONTOH : kepuasan kerja, motivasi

DATA INTERVAL :
Data berskala interval adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara
dua titik skala sudah diketahui.
CIRI : Tidak ada kategorisasi
bisa dilakukan operasi matematika
CONTOH : temperatur yang diukur berdasarkan 0C dan 0F, sistem kalender

DATA RASIO :
Data berskala rasio adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara
dua titik skala sudah diketahui dan mempunyai titik 0 absolut.
CIRI : tidak ada kategorisasi
bisa dilakukan operasi matematika
CONTOH : gaji, skor ujian, jumlah buku
5. Pengolahan Data

PROSEDUR PENGOLAHAN DATA :

A. PARAMETER : Berdasarkan parameter yang ada statistik dibagi menjadi

• Statistik PARAMETRIK : berhubungan dengan inferensi statistik yang


membahas parameter-parameter populasi; jenis data interval atau rasio;
distribusi data normal atau mendekati normal.

• Statistik NONPARAMETRIK : inferensi statistik membahas parameter-


parameter populasi; jenis data nominal atau ordinal; distribusi data tidak
diketahui atau tidak normal

B. JUMLAH VARIABEL : berdasarkan jumlah variabel dibagi menjadi

• Analisis UNIVARIAT : hanya ada 1 pengukuran (variabel) untuk n


sampel atau beberapa variabel tetapi masing-masing variabel dianalisis
sendiri-sendiri. Contoh : korelasi motivasi dengan pencapaian akademik.

• Analisis MULTIVARIAT : dua atau lebih pengukuran (variabel) untuk n


sampel di mana analisis antar variabel dilakukan bersamaan. Contoh :
pengaruh motivasi terhadap pencapaian akademik yang dipengaruhi oleh
faktor latar belakang pendidikan orang tua, faktor sosial ekonomi, faktor
sekolah.
7. Penyajian Data

TABEL
Tabel 1.1 Bidang Pekerjaan berdasarkan Latar Belakang Pendidikan

Count
pendidikan
SMU Akademi Sarjana Jumlah
bidang administrasi 1 8 6 15
pekerjaan personalia 1 7 8
produksi 4 3 5 12
marketing 2 14 11 27
keuangan 3 4 6 13
Jumlah 10 30 35 75

bidang pekerjaan
GRAFIK administrasi
personalia
produksi
marketing
keuangan

Pies show counts


8. Membuat Tabel

TABEL : memberikan informasi secara rinci. Terdiri atas kolom dan baris

Kolom pertama : LABEL


KOLOM
Kolom kedua …. n : Frekuensi atau label
TABEL
BARIS Berisikan data berdasarkan kolom

Tabel Tabulasi Silang

Pendapat tentang sertifikasi


Asal Wilayah Sangat Perlu Tidak Tidak Sangat Jumlah
perlu tahu perlu tdk
perlu
Jawa Barat
Jawa Tengah
Jawa Timur
NTT
Papua
Jumlah
9. Membuat Grafik

GRAFIK : memberikan informasi dengan benar dan cepat, tetapi tidak rinci.

Syarat :
1. Pemilihan sumbu (sumbu tegak dan sumbu datar), kecuali grafik lingkaran
2. Penetapan skala (skala biasa, skala logaritma, skala lain)
3. Ukuran grafik (tidak terlalu besar, tinggi, pendek)

Jenis Grafik :
4
• Grafik Batang (Bar)
Sumbu tegak

3
• Grafik Garis (line)
2
• Grafik Lingkaran (Pie)
1
• Grafik Interaksi (Interactive)
0
1 2 3 4
Titik
pangkal Sumbu datar
10. Jenis Grafik

Grafik Batang (Bar) Grafik Garis (line)


30 30

20 20

10 10

Jumlah
Count

0 0
administrasi personalia produksi marketing keuangan administrasi personalia produksi marketing keuangan

bidang pekerjaan bidang pekerjaan

Grafik lingkaran (pie) Grafik Interaksi (interactive)


800000

keuangan
administrasi

700000

600000

personalia
500000
Mean gaji perbulan

Jenis kelamin
400000
marketing
laki-laki
produksi
300000 w anita
sangat jelek jelek cukup baik baik sangat baik

prestasi kerja
11. Frekuensi

FREKUENSI : banyaknya data untuk satu kelompok/klasifikasi

KELOMPOK FREKUENSI
Kelompok ke-1 f1 Pendidikan Frekuensi

Kelompok ke-2 f2
S1 62
Kelompok ke-3 f3
S2 19
Kelompok ke-i fi
S3 9
Kelompok ke-k fk
k 90
n = Σ fi
i=1

k
n = Σ fi = f1 + f2 + f3 +….. + fi + …… + fk
i=1
12. Distribusi Frekuensi

DISTRIBUSI FREKUENSI : mengelompokkan data interval/rasio dan menghitung


banyaknya data dalam satu kelompok/klasifikasi

USIA FREKUENSI Membuat distribusi frekuensi :


1. Mencari sebaran (range) yakni selisih antara data paling besar
20 5
dengan data paling kecil)  35 – 20 = 15
21 6 2. Menentukan banyak kelas dengan rumus k = 1 + 3,3 log n
22 13 7
1. Menentukan panjang kelas dengan rumus
23 4 p = sebaran / banyak kelas  15/7 = 2
24 7
25 7 KELOMPOK USIA FREKUENSI
26 7 20 – 21 11
27 5 22 – 23 17
28 3 24 – 25 14
29 4 26 – 27 12
30 15 28 – 29 7
31 3 30 – 31 18
33 5 32 - 33 5
35 1 34 - 35 1
13. Ukuran Tendensi Sentral

RATA-RATA : suatu bilangan yang bertindak mewakili sekumpulan bilangan


RATA-RATA HITUNG (RERATA) : jumlah bilangan dibagi banyaknya

n
X + X2 + X3 + … + Xn
X= 1 Σ Xi
n i =1

n
Bila terdapat sekumpulan bilangan di mana masing-masing bilangannya memiliki frekuensi,
maka rata-rata hitung menjadi :
k
X f + X2 f2 + X3 f3 + … + Xkfk Σ Xifi
X= 1 1
f1 + f2 + f3 + … + fk i =1

k
Σ fi
Cara menghitung : i =1

Bilangan (Xi) Frekuensi (fi) X i fi


70 3 210
63 5 315
Maka : X = 695 = 69.5
10
85 2 170
Jumlah 10 695
14. Median

MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.

Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55.
Pertanyaannya adalah apakah siswa yang memperoleh nilai 7
termasuk istimewa, baik, atau biasa-biasa saja ?

Jika nilai ulangan tersebut adalah : 10 10 8 7 7 6 5 5 5 5 4,


maka rata-rata hitung = 6.55, median = 6
Kesimpulan : nilai 7 termasuk kategori baik sebab berada di atas rata-rata hitung
dan median (kelompok 50% atas)

Jika nilai ulangan tersebut adalah : 8 8 8 8 8 8 7 5 5 4 3,


maka rata-rata hitung = 6.55, median = 8
Kesimpulan : nilai 7 termasuk kategori kurang sebab berada di bawah median
(kelompok 50% bawah)

Jika sekumpulan data banyak bilangannya genap (tidak mempunyai bilangan tengah)
Maka mediannya adalah rerata dari dua bilangan yang ditengahnya.
Contoh : 1 2 3 4 5 6 7 8 8 9 maka median (5+6) : 2 = 5.5
15. Modus

MODUS : bilangan yang paling banyak muncul dari sekumpulan bilangan,


yang fungsinya untuk melihat kecenderungan dari sekumpulan bilangan tersebut.

Contoh : nilai ulangan 10 10 8 7 7 6 5 5 5 5 4


Maka : s = 6 ; k = 3 ; p =2
rata-rata hitung = 6.55 ; median = 6
modus = 5 ; kelas modus = 5 - 7

Nilai Frekuensi Nilai Frekuensi


10 2 8 – 10 3
8 1 5–7 7
7 2 2–4 1
6 1 Jumlah 11
5 4
4 1
Jumlah 11 - +
Mo X Me

Kurva positif apabila rata-rata hitung > modus / median


Kurva negatif apabila rata-rata hitung < modus / median
16. Ukuran Penyebaran

UKURAN YANG MENYATAKAN HOMOGENITAS / HETEROGENITAS :


1. RENTANG (Range)
2. DEVIASI RATA-RATA (Average Deviation)
3. VARIANS (Variance)
4. DEVIASI STANDAR (Standard Deviation)

Rentang (range) : selisih bilangan terbesar dengan bilangan terkecil.


Sebaran merupakan ukuran penyebaran yang sangat kasar, sebab hanya bersangkutan
dengan bilangan terbesar dan terkecil.

Contoh : A : 100 90 80 70 60 50 40 30 20 10
X = 55
B : 100 100 100 100 100 10 10 10 10 10
r = 100 – 10 = 90
C : 100 100 100 90 80 30 20 10 10 10

Rata-rata
17. Deviasi rata-rata
Deviasi Rata-rata : penyebaran
Berdasarkan harga mutlak simpangan Kelompok A Kelompok B
bilangan-bilangan terhadap rata- Nilai X X-X |X – X| Nilai X X-X |X – X|
ratanya. 100 45 45 100 45 45
90 35 35 100 45 45
80 25 25 100 45 45
70 15 15 90 35 35
60 5 5 80 25 25

Rata-rata 50 -5 5 30 -25 25
40 -15 15 20 -35 35
30 -25 25 10 -45 45
20 -35 35 10 -45 45
10 -45 45 10 -45 45
Jumlah 0 250 Jumlah 0 390
DR = 250 = 25 DR = 390 = 39
10 10

n
|Xi – X|
Rata-rata DR = Σ
n
i=1

Makin besar simpangan,


makin besar nilai deviasi rata-rata
18. Varians & Deviasi Standar

Varians : penyebaran berdasarkan Kelompok A Kelompok B


jumlah kuadrat simpangan bilangan- Nilai X X -X (X–X)2 Nilai X X -X (X –X)2
bilangan terhadap rata-ratanya ; 100 45 2025 100 45 2025
melihat ketidaksamaan sekelompok data
90 35 1225 100 45 2025
80 25 625 100 45 2025
n
s = Σ (Xi – X)
2 70 15 225 90 35 1225
2

i=1 n-1 60 5 25 80 25 625


50 -5 25 30 -25 625
40 -15 225 20 -35 1225

Deviasi Standar : penyebaran 30 -25 625 10 -45 2025


berdasarkan akar dari varians ; 20 -35 1225 10 -45 2025
menunjukkan keragaman kelompok data 10 -45 2025 10 -45 2025
Jumlah 8250 Jumlah 15850

8250 15850
n s= √ 9 = 30.28 s= √ 9 = 41.97
√ Σ (Xi – X)
2
s=
i=1 n-1
Kesimpulan :
Kelompok A : rata-rata = 55 ; DR = 25 ; s = 30.28
Kelompok B : rata-rata = 55 ; DR = 39 ; s = 41.97
Maka data kelompok B lebih tersebar daripada kelompok A
19. Normalitas, Hipotesis, Pengujian

Distribusi Normal : kurva berbentuk bel, simetris, simetris terhadap sumbu yang
melalui nilai rata-rata

Kurtosis = keruncingan

Skewness = kemiringan

+3s  +2s  -s   +s  +2s  +3s


68%
95%
99%

• Lakukan uji normalitas


• Rasio Skewness & Kurtosis berada –2 sampai +2
Rasio = nilai
Standard error
• Jika tidak berdistribusi normal, lakukan uji normalitas non parametrik (Wilcoxon,

Mann-White, Tau Kendall)


20. Normalitas, Hipotesis, Pengujian

Hipotesis : uji signifikansi (keberartian) terhadap hipotesis yang dibuat ;


berbentuk hipotesis penelitian dan hipotesis statistik (H0) ;
hipotesis bisa terarah, bisa juga tidak terarah ;
akibat dari adanya Ho, maka akan ada Ha (hipotesis alternatif) yakni
hipotesis yang akan diterima seandainya Ho ditolak

HIPOTESIS TERARAH TIDAK TERARAH


Hipotesis Siswa yang belajar bahasa lebih Ada perbedaan keseriusan siswa
Penelitian serius daripada siswa yang antara yang belajar bahasa dengan
belajar IPS yang belajar IPS
Hipotesis Nol Siswa yang belajar bahasa tidak Tidak terdapat perbedaan
(Yang diuji) menunjukkan kelebihan keseriusan belajar siswa antara
keseriusan daripada yang belajar bahasa dan IPS
IPS
Ho : b < i Ho : b = i
Ha : b > i Ha : b ≠ I
21. Normalitas, Hipotesis, Pengujian

Pengujian : bila Ho terarah, maka pengujian signifikansi satu pihak


bila Ho tidak terarah, maka pengujian signifikansi dua pihak

Pengujian signifikansi satu arah (hipotesis terarah):


Siswa yang belajar bahasa tidak menunjukkan kelebihan keseriusan daripada
yang belajar IPS  Ho : b < i
Jika Ho ditolak, maka Ha diterima ; daerah penolakan berada di sebelah kanan

5% 2.5% 2.5%

Daerah penerimaan hipotesis Daerah Daerah Daerah penerimaan hipotesis Daerah


penolakan penolakan penolakan
hipotesis hipotesis hipotesis

Pengujian signifikansi dua arah (hipotesis tidak terarah):


Tidak terdapat perbedaan keseriusan belajar siswa antara bahasa dan IPS
 Ho : b = i
Jika Ho ditolak, maka Ha diterima ; daerah penolakan bisa berada di sebelah kiri atau kanan
22. Uji t

Uji t : menguji apakah rata-rata suatu populasi sama dengan suatu harga tertentu atau
apakah rata-rata dua populasi sama/berbeda secara signifikan.

1. Uji t satu sampel


Menguji apakah satu sampel sama/berbeda dengan ( - )
rata-rata populasinya t =
• hitung rata-rata dan std. dev (s) s / √n
• df = n – 1
α
• tingkat signifikansi ( = 0.025 atau 0.05)
• pengujian apakah menggunakan 1 ekor atau 2 ekor
• diperoleh t hitung ; lalu bandingkan dengan t tabel : jika t hitung > t tabel Ho ditolak

Contoh :
Peneliti ingin mengetahui apakah guru yang bekerja selama 8 tahun memang berbeda
dibandingkan dengan guru lainnya.
Ho : p1 = p2
Diperoleh rata2 = 17.26 ; std. Dev = 7.6 ; df = 89 ; t hitung = 11.55
α
Berdasarkan tabel df=89 dan = 0.05 diperoleh t tabel = 1.987
Kesimpulan : t hitung > t tabel sehingga Ho ditolak
guru yang bekerja selama 8 tahun secara signifikan berbeda dengan
guru lainnya
23. Uji t
2. Uji t dua sampel bebas
Menguji apakah rata-rata dua kelompok yang tidak berhubungan sama/berbeda

(X – Y) (Σx2 + Σy2) (1/nx + 1/ny)


t=
Sx-y
Di mana Sx-y =
√ (nx + ny – 2)

Contoh :
Peneliti ingin mengetahi apakah ada perbedaan penghasilan (sebelum sertifikasi) antara
guru yang lulusan S1 dengan yang lulusan S3
Ho : Pb = Pk
Diperoleh : rata2 x = 1951613 ; y = 2722222 ; t hitung = - 7.369
α
Berdasarkan tabel df=69 dan = 0.025 diperoleh t tabel = 1.994
Kesimpulan : t hitung > t tabel sehingga Ho ditolak
Rata-rata penghasilan guru yang S1 berbeda secara signifikan dengan
penghasilan guru yang S3
24. Uji t

3. Uji t dua sampel berpasangan


Menguji apakah rata-rata dua sampel yang berpasangan sama/berbeda

D
t= s Di mana D = rata-rata selisih skor pasangan
D

ΣD2 – (ΣD)2

sD = Σ d2 Σd =
2

N(N-1) N

Contoh :
Seorang guru ingin mengetahui efektivitas model pembelajaran diskusi. Setelah selesai
pembelajaran pertama, ia memberikan tes dan setelah selesai pembelajaran kedua
kembali ia memberikan tes. Kedua hasil tes tersebut dibandingkan dengan harapan
adanya perbedaan rata-rata tes pertama dengan kedua.
Ho : Nd = Nc
Diperoleh rata2d = 66.28 ; rata2c = 73.84 ; t hitung = -8.904
α
Berdasarkan tabel df=163 dan = 0.05 diperoleh t tabel = 1.960
Kesimpulan : t hitung > t tabel sehingga Ho ditolak
Terdapat perbedaan yang signifikan antara hasil tes pertama dengan
hasil tes kedua, sehingga ia menyimpulkan model diskusi efektif
meningkatkan hasil belajar siswanya
25. Uji Keterkaitan

Korelasi : hubungan keterkaitan antara dua atau lebih variabel.


Angka koefisien korelasi ( r ) bergerak -1 ≤ r ≤ +1

POSITIF NEGATIF
makin besar nilai variabel 1 makin besar nilai variabel 1
menyebabkan makin besar menyebabkan makin kecil
pula nilai variabel 2 nilai variabel 2
Contoh : makin banyak waktu contoh : makin banyak waktu
belajar, makin tinggi skor bermain, makin kecil skor
Ulangan  korelasi positif Ulangan  korelasi negatif
antara waktu belajar antara waktu bermain
dengan nilai ulangan dengan nilai ulangan

NOL
tidak ada atau tidak menentunya hubungan dua variabel
contoh : pandai matematika dan jago olah raga ; pandai
matematika dan tidak bisa olah raga ; tidak pandai
matematika dan tidak bisa olah raga
 korelasi nol antara matematika dengan olah raga
26. Uji Keterkaitan

1. KORELASI PEARSON :
apakah di antara kedua variabel terdapat hubungan, dan jika ada hubungan bagaimana
arah hubungan dan berapa besar hubungan tersebut.
Digunakan jika data variabel kontinyu dan kuantitatif

NΣXY – (ΣX) (ΣY) Di mana : ΣXY = jumlah perkalian X dan Y


r= ΣX2 = jumlah kuadrat X
√ NΣX2 – (ΣX)2 x √ NΣY2 – (ΣY)2 ΣY2 = jumlah kuadrat Y
N = banyak pasangan nilai

Contoh :
10 orang siswa yang memiliki waktu belajar berbeda dites dengan tes IPS
Siswa : A B C D E F G H I J
Waktu (X) : 2 2 1 3 4 3 4 1 1 2
Tes (Y) : 6 6 4 8 8 7 9 5 4 6
Apakah ada korelasi antara waktu belajar dengan hasil tes ?

Siswa X X2 Y Y2 XY
A
B
ΣX ΣX2 ΣY ΣY2 ΣXY
27. Uji Keterkaitan

2. KORELASI SPEARMAN (rho) dan Kendall (tau) :


Digunakan jika data variabel ordinal (berjenjang atau peringkat). Disebut juga korelasi
non parametrik

6Σd2 Di mana : N = banyak pasangan


rp = 1 -
N(N – 1)
2 d = selisih peringkat

Contoh :
10 orang siswa yang memiliki perilaku (sangat baik, baik, cukup, kurang) dibandingkan
dengan tingkat kerajinannya (sangat rajin, rajin, biasa, malas)
Siswa : A B C D E F G H I J
Perilaku : 2 4 1 3 4 2 3 1 3 2
Kerajinan : 3 2 1 4 4 3 2 1 2 3
Apakah ada korelasi antara perilaku siswa dengan kerajinannya ?

Siswa A B C D
Perilaku
Kerajinan
d
d2 Σd2
1.Definisi

• Probabilitas atau peluang:


– Merupakan ukuran numeric tentang seberapa
sering peristiwa itu akan terjadi. Semakin besar
nilai probabilitas menyatakan bahwa peristiwa
itu akan sering terjadi.
2. Himpunan
• Beberapa komponen yang berhubungan :
• Eksperimen
– Proses pengumpulan data dari sebuah fenomena yang memperlihatkan
variasi pada hasilnya.
• Ruang sampel
– Kumpulan dari seluruh kemungkinan hasil yang didapatkan dari suatu
eksperimen, dilambangkan dengan S.
• Peristiwa/Event/Kejadian
– Kumpulan hasil-hasil dasar yang digolongkan oleh suatu ciri tertentu.
3. Probabilitas Suatu Peristiwa

• Probabilitas memberikan nilai kuantitatif


pada peryataan seberapa sering suatu
peristiwa terjadi. n
p ( A) 
• Probabilitas peristiwa A : N
• Beberapa sifat :
a.P(A)=1-P(A’)
b.b.0<=P(A)<=1
c. P(S)=P(A)+P(A’)
Contoh Soal :

• 1). Suatu kemasan berisi 6 Flash Disk A, 4 Flash


Disk B dan 3 Flash Disk C. Bila sesorang
mengambila satu Flash Disk secara acak, maka :
– Peluang terambil satu Flash DIsk A
Karena 6 dari 13 disket adalah Flash A, maka peluang
peristiwa A, satu Flash A terpilih secara acak adalah :
P(A)=6/13
– Peluang terambil satu disket B (peristiwa B) atau
disket C(peristiwa C) karena terdapat 7 dari 13
disket adalah disket B atau disket C maka :
P ( B  C )  7 / 13
2). Suatu tranmiter membutuhkan energi yang berasal dari 2 sumber
yaitu power supply A dan B. Probabilitas power supply A rusak
(peristiwa A) adalah 2/3 dan probabilitas power supply B(peristiwa
B) rusak adalah 4/9. Bila probabilitas kedua sumber itu rusak adalah
¼, maka probailitas paling sedikit satu sumber rusak adalah :

P( A  B)  P( A)  P( B)  P( A  B)
= 2/3+4/9-
1/4
Soal :

Bila probabilitas peristiwa komputer A,B,C dan D


rusak masing-masing 0.09; 0.015; 0.21; dan
0.23,
maka berapakah peluang salah satu dari keempat
komputer akan rusak?
Probabilitas bersyarat

• Probabilitas suatu peristiwa A seringkali harus


dimodifikasikan bila ada informasi bahwa terdapat
peristiwa b yang berkaitan dengan peristiwa a
tersebut telah terjadi sebelumnya.Perubahan nilai
probabilitas peristiwa A bila diketahui bahwa
peristiwa b telah terjadi disebut sebagai
probabilitas bersyarat a bila diketahui b terjadi dan
dinotasikan dengan P(A|B).
P( A  B)
P( A / B)  ; bilaP( B )  0
P( B)
Jadi:

• Rumus dapat ditulis kembali sebagai :


P ( A  B )  P ( B ).P ( A / B )
dan dinyatakan sebagai aturan perkalian, bila terdapat tiga peristiwa A,B, dan C
maka sesuai dengan aturan perkalian didapatkan:

P( A1  A2  A3 ....  Ak )  P( A1 ) P( A2 | A1 ) P( A3 | A1  A2 )....P( Ak | A1  A2  ....  Ak 1 )

Apabila terdapat suatu kondisi dimana probabilitas P(A/B)


menjadi bernilai sama dengan P(A), maka dalam hal ini peristiwa B tidak mempunyai pengaruh
terhadap terjadinya peristiwa A, sehingga :

P(B/A)=P(B)
Atau P(A/B)=P(A)
P(B/A)=P(B)
Atau P(A/B)=P(A)

• Kondisi ini dinamakan sebagai peristiwa yang


saling bebas(independent) antara A dan B,Sesuai
dengan aturan perkalian maka kondisi saling bebas
tersebut :
p ( A  B )  P ( A) P ( B )

Dengan demikian, bila terdapat peristiwa A1, A2,.....,Ak yang saling bebas
maka:

P( A1  A2  A3....  Ak )  P( A1 ).P( A2 ).....P( Ak )


Contoh:
• Misalkan ruang sampel menyatakan populasi media penyimpanan data(disket
dan CD) pada suatu kantor tertentu.Media penyimpan data tersebut
dikelompokan menurut kondisinya:

• Diadakan audit untuk mengetahui kondidi media penyimpanan data dikantor tsb.
Dengan cara mengambil sampel secara acak pada kotak media
penyimpanan.Bila media yang terpilih ternyata mempunyai kondisi baik,
berapakah peluang yang terpilih itu media CD?
• Jawab :
• Bila M=CD yang terpilih
• E=Kondisi media yang terpilih baik :
2.Dalam sebuah kotak terdapat 10 gulungan film, dan diketahui bahwa 3 diantaranya rusak.
Hitung peluang bila 2 buah gulungan filem diambil acak satu persatu secara beruutan.
Jawab:
Misal A: peristiwa terambil gulungan pertama eusak
B: peristiwa terambil gulungan kedua rusak
Maka peluang kedua gulungan rusak adalah :
Regresi vs Korelasi
Regresi vs Korelasi
Analisis Regresi
2 variabel:
•Variabel bebas / independen (yang mempengaruhi)
– Nilai prediktor ditulis pada sumbu X (sumbu horizontal)
•Variabel tak bebas / dependen (yang dipengaruhi)
– Nilai terikat ditulis pada sumbu Y (sumbu vertikal)

•Variabel tak bebas (Y) dalam penelitian merupakan respon


(outcome) yang diukur akibat perlakuan dari variabel bebas (X)

CONTOH
•Umur vs Tinggi Tanaman (X: Umur; Y: Tinggi)
•Biaya Promosi vs Volume Penjualan (X: Biaya; Y: Volume)
Variabel Bebas vs Tak Bebas
Case Summariesa

berat badan umur


1
CONTOH
15.00 20.00
2 13.00 16.00
3 9.00 12.00
4 6.00 6.00
5 6.00 10.00
6 18.00 34.00
7 16.00 25.00
8 11.00 20.00
9 6.00 8.00
10 12.00 14.00
11 18.00 30.00
12 22.00 36.00
13 7.00 9.00
14 10.00 10.00
15 10.00 15.00
16 14.00 24.00
17 20.00 30.00
Total N 17 17
a. Limited to first 100 cases.
Regresi Linear
• Persamaan Regresi
– memungkinkan peramalan nilai suatu variabel
tak bebas (Y) dari nilai variabel bebas (X)
• Garis Regresi
– Garis linear yang menunjukkan pola hubungan
antara dua variabel, misalnya variabel X dan Y
– Sebenarnya hanya garis taksiran yang dipakai
untuk mewakili pola sebaran data tersebut
Regresi Linear
Tujuan Regresi Linear
• Untuk melihat hubungan linear antara 2
variabel
y
atau lebih

Garis Regresi Linier


dengan persamaan
y = a + bx
dimana
a = konstanta
b = koefisiensi regresi

x
Persamaan Regresi Linear
Persamaan umum:
Y = a + bX
•Rumus untuk menentukan persamaan garis
regresi: n  xy -   x   y 
b
n x 2   x 
2

  y   x 2     x   xy 
a
n x 2   x 
2

a  y  bx
Contoh Kasus 1
Berikut adalah data biaya promosi dan volume penjualan roti.
Tentukan persamaan garis regresi dari data berikut!
X = biaya promosi (juta rupiah)
Y = volume penjualan (ratusan potong roti)
Tahun X Y

1992 2 5

1993 4 6

1994 5 8

1995 7 10

1996 8 11

n=5 ∑x = 26 ∑y = 40
Contoh Kasus 1
Tahun X Y X2 Y2 XY

1992 2 5 4 25 10

1993 4 6 16 36 24

1994 5 8 25 64 40

1995 7 10 49 100 70

1996 8 11 64 121 88

n=5 ∑x = 26 ∑y = 40 ∑x2 = 158 ∑y2 = 346 ∑xy = 232


Contoh Kasus 1
JAWAB:
Bentuk umum persamaan regresi linear
sederhana:
Y = a + bX
n=5
Contoh Kasus 2
Peramalan dengan Persamaan Regresi:
Y = 2,530 + 1,053 X
Dari persamaan regresi linear tersebut, bila biaya promosi 10
juta, berapa volume penjualannya?
Y = 2,530 + 1,053 X
X = 10
Y = 2,53 + 1,053 (10) = 2,53 + 10,53 = 13,06 (ratusan juta
kue)
Volume penjualan = 13,06 x 100 kue
Contoh Kasus 2
Tahun X Y Y = 2,530 + 1,053 X

1992 2 5 4,636

1993 4 6 6,742

1994 5 8 7,795

1995 7 10 9,901

1996 8 11 10,954

10 13,06

n=5 ∑x = 26 ∑y = 40
Korelasi
• Korelasi (r) atau koefisien korelasi
– Menyatakan tingkat keeratan atau seberapa kuat hubungan antara dua
variabel = ukuran hubungan dua variabel

• Nilai r berkisar antara (-1) hingga (+1)

• Nilai r yang (+) ditandai oleh nilai kovarians yang (+)


• Nilai r yang (-) ditandai oleh nilai kovarians yang (-)

• Jika nilai r mendekati (-1) atau (+1), maka X dan Y memiliki korelasi
linear yang tinggi
• Jika nilai r = -1 atau r = +1, maka X dan Y memiliki korelasi linear
sempurna
• Jika nilai r = 0, maka X dan Y tidak memiliki relasi linear
Korelasi Positif
16
Koefisien relasi (X dan Y) mempunyai hubungan positif
14

12

10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13
Korelasi Negatif
Koefisien relasi (X dan Y) mempunyai hubungan negatif
16

14

12

10

0 1 2 3 4 5 6 7 8 9 10 11 12 13
Tidak Berkorelasi
YKoefisien
relasi (X dan Y) tidak mempunyai
Y hubungan atau
hubungan lemah sekali

atau

0 X 0 X
Koefisien Korelasi
Derajat hubungan antara x dan y dinyatakan
J xx • r bergantung b
rb
J yy • r bernilai (-) berhubungan terbalik
• r2 = koefisien determinasi
Dengan
sumbangan variabel terikat terhadap

J xx   x2 
  x  2 variabel bebas
n

J yy   y2 
  y  2

n
Koefisien Determinasi
• X dikatakan mempengaruhi Y, jika berubahnya nilai X
akan menyebabkan perubahan nilai Y
• Akan tetapi, naik-turunnya Y adalah sedemikian rupa
sehingga nilai Y bervariasi, tidak semata-mata
disebabkan oleh X, karena masih ada faktor lain yang
menyebabkannya
• Jadi untuk mengetahui berapa besar kontribusi dari X
terhadap naik-turunnya nilai Y, maka harus dihitung
dengan koefisien penentuan (koefisien determinasi)

Koefisien Determinasi = r2
Contoh Kasus 3
Diketahui suatu penelitian terhadap hubungan antara
nilai biaya periklanan dengan tingkat penjualan dari
sebuah koperasi adalah sebagai berikut. (dalam ribuan
rupiah) No Biaya Tingkat
periklanan Penjualan
1 50 40
2 51 46
3 52 44
4 53 55
5 54 49

a)Tentukan persamaan regresinya!


b)Berapa besarnya koefisien korelasi dan koefisien
determinasinya?
Contoh Kasus 3
No X Y XY X2 Y2

1 50 40 2000 2500 1600

2 51 46 2346 2601 2116

3 52 44 2288 2704 1936

4 53 55 2915 2809 3025

5 54 49 2646 2916 2401

Total 260 234 12195 13530 11078

Menentukan koefisien a dan koefisien b


n. xy -   x   y  (5)(12195)  ( 260)(234) Persamaan regresi linier
b   2.7
n x 2   x  (5)(13530)  (260) 2
2
sederhana:
Y = a + b (X)
a  y  bx
Y = -93,6 + 2,7 (X)
a
  y - b x   (234  (2.7)(260))  93.6
n 5
Contoh Kasus 3
Menentukan koefisien korelasi dan koefisien determinasinya.

rb
J xx  x 2

J yy x 2

n
rb
Dengan   y 2
 x 2 y 2

n
J xx   x 2

n

J yy   y 2 
  y 2

n
13530 
 260
2

5 13530  13520 10
r  2.7 *  2.7  2 .7
11078 
 234
2
11078  10951 127
5
 2.7 x 0.281  0,7587  0,76

KD  r 2   0,76  0,58 x 100%  58%


2
Review
Berikut ini data mengenai pengalaman kerja dan
penjualan
X = pengalaman kerja (tahun)
Y = omzet penjualan (ribuan)
X 2 3 2 5 6 1 4 1
Y 5 8 8 7 11 3 10 4

1.Tentukan nilai a dan b!


2.Buatkan persamaan regresinya!
3.Berapa omzet penjualan dari seorang
karyawan yang pengalaman kerjanya 3,5 tahun?
Review
Suatu penelitian yang bertujuan untuk menentukan
hubungan antara energi listrik dengan waktu yang
diperoleh data sbb:
Waktu Daya
No
(jam) (Joule)
1 1 10
2 2 25
3 3 30
4 4 40

1.Tentukan persamaan regresi linearnya!


2.Seberapa besarkah pengaruh waktu terhadap daya?

Anda mungkin juga menyukai