Anda di halaman 1dari 69

STATISTIKA

PRODI S2 TEKNOLOGI PENDIDIKAN


Dosen : Dr. Retno Subekti, M.Sc
Deskripsi MK
Pada mata kuliah ini akan dibahas mengenai
• pengenalan Statistika, Variabel, Data, Variabel random diskrit, kontinu,
• distribusi normal, dan distribusi normal baku, distribusi- t, dan distribusi F,
• Korelasi, regresi linear, regresi non linear,
• pengenalan Hipotesis dan uji hipotesis, Uji-t,
• Anova, Anacova, Uji chi-kuadrat (data nominal), dan Uji T-Hotelling.
Pertemuan 1 - 8
• Pendahuluan
• Uji Univariat untuk Rata-Rata Satu Populasi
• Uji Univariat untuk Rata-Rata Dua Populasi
• Uji Univariat untuk Proporsi Satu dan Dua
Populasi
• Uji Normalitas dan Uji Homogenitas
Univariat
• Anava Satu Faktor
• Uji Lanjut Setelah Anava
• UTS
Pertemuan 9-16
• Anava Dua Faktor

• Ankova dengan Satu Kovariat

• Pengantar Multivariat

• Manova Satu Faktor

• Uji lanjut setelah Manova

• Uji Normalitas Mutivariat dan Uji Homogenitas Matriks Variansi Kovariansi

• Mankova dengan Satu Kovariat

• Review
Metode perkuliahan dan penilaian
• Pembelajaran Langsung
• Diskusi
• Presentasi
• Tanya jawab

• Penilaian : penugasan, sikap dan keaktifan, UTS UAS


Referensi
Pituch, K.A., & Stevens, J.P. 2016. Applied multivariate
statistics for the social sciences 6th edition. New York:
Routledge.
Johnson, R.A., & Wichern, D.W. 2007. Applied multivariate
statistical analysis. New Jersey: Pearson Prentice Hall.
Meyers, L.S., Gamst, G., & Guarino, A.J. 2006. Applied
multivariate research: design and interpretation. London: Sage.
Glass, G.V. & Hopkins, K.D. (1984). Statistical methods in
education and psychology. Engewood Cliffs, New Jersey:
Prentice Hall, Inc.
Walpole, R.E. (1992). Pengantar Statistika (Terjemahan).
Jakarta: Gramedia
STATISTIKA DESKRIPTIF
• STATISTIKA ?
• STATISTIK ?
• STATISTIKA DESKRIPTIF ?

• Statistika inferensi
• Populasi
• Sampel
• Parameter
• Statistik
Data• Nilai ujian metode stastistik 20 orang mahasiswa
adalah : 91 50 73 74 55 86 70 43 47 80
40 85 64 61 58 95 52 67 83 92

• Misalkan diketahui nilai ujian komputasi statistika 50


mahasiswa
44,7 59,8 67,1 57,1 58,2 69,5 60,6 44,2 76 51,2
48,4 63,9 67,8 56,2 60 68,2 48,5 46 72,6 52
42,5 57,2 70,2 57 62,2 70,3 50 76,8 74 65,1
49,1 64,7 74,6 63,6 63 72,2 75,3 75 55,4 67,7
43,1 76,5 68,7 59,9 63,5 72,6 77 73,5 56,3 77,3
• Banyaknya penjualan Sepatu di suatu toko:
Merek Penjualan
Sepatu
Adidas 56
Nike 45
Reebok 32
Diadora 22
Lain 45
• Cari data lain (relevan)
Skala pengukuran
• Nominal
• Ordinal
• Interval
• Rasio
Contoh:
• Nominal: jenis pekerjaan, warna
• Ordinal: kepangkatan, tingkat pendidikan
• Interval: tahun kalender (Masehi, Hijriyah), temperatur
(Celcius, Fahrenheit)
• Rasio: berat, panjang, isi
Statistika deskriptif
• Metode atau cara-cara yang digunakan untuk meringkas dan
menyajikan data dalam bentuk tabel, grafik atau ringkasan numerik
data.
Grafik Stem-and-leaf
• Untuk menunjukkan bentuk distribusi data
• Data berupa angka dengan minimal dua digit
• Contoh (Data penghasilan buruh):
439
511555689
602334445556777889
7122344558
8349
92
Stem= 10, Leaf = 1
Distribusi Frekuensi
• Merupakan suatu tabel yang menunjukkan frekuensi
kemunculan data atau frekuensi relatifnya dan
berguna untuk meringkas data numerik maupun
kategori.
• Untuk data diskret atau data kategori, banyaknya nilai
yang dihitung kemunculannya biasanya sesuai dengan
banyaknya nilai data yang berbeda dari data diskret
atau kategori tersebut
• Untuk data kontinu, biasanya dibuat kelas interval 5-
20 banyaknya.
Data
• Data : sekumpulan datum
• Data tunggal, berkelompok, tabel distribusi frekuensi.
• Beberapa istilah dalam data tabel distribusi frekuensi :jangkauan/rentang,
panjang kelas, batas kelas.
• Data disajikan dalam bentuk tabel distribusi frekuensi
Kelas fi Titik tengah kelas xi
31-40 4 35,5
41-50 3 45,5
51-60 11 55,5
61-70 21 65,5
71-80 33 75,5
81-90 15 85,5
91-100 3 95,5
• Midpoint,titik tengah kelas,tanda kelas dicari dengan cara menghitung rata-rata dari
kedua ujung kelas
• Batas interval kelas, ujung-ujung kelas
• rentang,jangkauan =skor terbesar-skor terkecil
• Panjang interval, lebar kelas= batas atas kelas-batas bawah kelas

Nilai Ujung Ujung Titik Batas bawah Batas atas


fi bawah atas tengah kelas kelas
kelas kelas kelas
31-40 4 31 40 35,5 30,5 40,5
41-50 3 41 50 45,5 40,5 50,5
51-60 11 51 60 55,5 50,5 60,5
61-70 21 61 70 65,5 60,5 70,5
71-80 33 71 80 75,5 70,5 80,5
81-90 15 81 90 85,5 80,5 90,5
91-100 3 91 100 95,5 90,5 100,5
• Tabel distribusi frekuensi
• Tabel distribusi rekuensi relatif
• Tabel distr.frek.kumulatif lebih dari, kurang dari
• Tabel distr. frek.relatif kumulatif lebih dari, kurang dari

Kelas Frekuensi Kelas Frekuensi relatif

92,1-99,0 2 92,1-99,0 2/80


85,1-92,0 6 85,1-92,0 6/80
78,1-85,0 10 78,1-85,0 10/80
71,1-78,0 40 71,1-78,0 40/80
64,1-71,0 16 64,1-71,0 16/80
57,1-64,0 6 57,1-64,0 6/80
jumlah 80 jumlah 1
• Penyajian data tabel distribusi frekuensi
Kelas Frekuensi Kelas Frekuensi relatif
> 92,0 2 > 92,0 2,5%
>85,0 8 >85,0 10,0%
>78,0 18 >78,0 22,5%
>71,0 58 >71,0 72,5%
>64,0 74 >64,0 92,5%
>57,0 80 >57,0 100%
Kelas Frekuensi
Kelas Frekuensi relatif
<99,1 80
<92,1 78 <64,1 0,075
<85,1 72 <71,1 0,275
<78,1 62 <78,1 0,775
<71,1 22 <85,1 0,900
<64,1 6 <92,1 0,975
<57,1 0 <99,1 1
Histogram
• Representasi grafik dari distribusi frekuensi data kontinu.
• Contoh (Data penghasilan buruh):
Poligon Frekuensi
• Representasi grafik dari distribusi frekuensi data kontinu dengan
mengambil nilai tengah tiap kelas.
• Contoh (Data penghasilan buruh):
Ogive Frekuensi Kumulatif
• Plot frekuensi kumulatif dengan batas atas interval dari distribusi
frekuensi.
• Contoh (Data penghasilan buruh):
Diagram Batang
• Representasi grafik dari distribusi frekuensi data diskret atau kategori.
• Contoh data penjualan sepatu
Diagram Lingkaran
• Representasi grafik dari distribusi frekuensi data diskret atau kategori.
• Contoh penjualan sepatu
Notasi Himpunan Data
• Data statistik sering dilambangkan dengan huruf X, Y dilengkapi dengan
indeks.
• Contoh (Data penghasilan buruh):
X: penghasilan mingguan buruh (dalam ribuan rupiah)
X1 = 58; X2 = 72; X10 = 73; X40 = 75;
• Contoh (Data tinggi dan berat mahasiswa):
X : tinggi mahasiswa (cm)
Y : berat mahasiswa (kg)
X1 = 170; Y1 = 70;
X7 = 1683; Y7 = 60;
Notasi Sigma
Ringkasan Numerik
• Ringkasan Numerik atau statistik:
• Data tunggal (tidak dikelompokkan), dengan n observasi
dinotasikan sebagai
x1, x2, . . . , xn
• Data berkelompok (distribusi frekuensi), dengan k nilai
tunggal dinotasikan sebagai
x1, x2, . . . , xk
yang masing-masing mempunyai frekuensi
f1, f2, . . . , fk dan total observasi adalah n,
Arithmetic Mean
• The arithmetic mean (mean) is the most common
measure of central tendency
• For a population of N values:
N

∑x i
x1 + x 2 +  + x N Population
μ= = i=1
values
N N
n Population size
∑ x
• For a sample of size nx
i
+ x 2 +  + xn
x= i=1
= 1 Observed
n n values
Sample size
Arithmetic Mean
(continued)

• The most common measure of central tendency


• Mean = sum of values divided by the number of values
• Affected by extreme values (outliers)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mean = 3 Mean = 4

1 + 2 + 3 + 4 + 5 15 1 + 2 + 3 + 4 + 10 20
= =3 = =4
5 5 5 5
Arithmetic Mean
(continued)
k
• Untuk data berkelompok ∑fx i i
x= i =1
k

∑f i =1
i

• Contoh :
xi fi f i xi k

4 3 12 ∑fx i i
294
5 18 90 x= i =1
k
= = 5,88
6 15 90 50
7
8
10
4
70
32
∑f
i =1
i

∑ 50 294
• Tabel distribusi
• Dicari dulu titik tengahnya (xi)
Nilai fi Titik tengah kelas k
xi fi xi
31-40 4 35,5
∑fx i i
6325
x= i =1
k
=
41-50 3 45,5 90
51-60
61-70
11
21
55,5
65,5
∑f
i =1
i

71-80 33 75,5
81-90 15 85,5 = 70,3
91-100 3 95,5
90

Teknik pengkodean
• Dicari dulu titik tengahnya (xi), beri kode nol untuk salah satu titik tengah dengan frekuensi terbesar . Untuk
titik tengah –titik tengah yang lebih kecil diberi kode lebih kecil berurutan dari nol, dan untuk titik tengah
yang lebih besar diberi kode lebih besar dari nol.

Nilai
fi Titik tengah kelas
xi
Kode
ci  k 
 ∑ f i ci 
31-40 4 35,5 -4 x = xs + p  i =1k 
41-50 3 45,5 -3  
 ∑
51-60 11 55,5 -2 f i 
61-70 21 65,5 -1 i =1 
71-80 33 75,5 0
81-90 15 85,5 1  − 47 
91-100 3 95,5 2
= 75,5 + 10  
 90 
∑ 90
= 70,3
Geometric Mean
• Rata- rata ukur
1
Ru = ( x1 ⋅ x2 ⋅ ... ⋅ xn ) n

• Untuk bilangan-bilangan bernilai besar :


n

∑ log x i
log Ru = i =1
n
Geometric Mean
• Untuk data berkelompok , rata- rata ukurnya:

= (x )
1 k

Ru 1
f1
⋅ x2
f2
⋅ ... ⋅ xk
fk n n= ∑
i =1
fi

• k adalah banyaknya kelas dan

• Untuk bilangan-bilangan bernilai besar :


k

∑ f i log xi
log Ru = i =1
n
Geometric Mean
• Untuk data dalam tabel distribusi frekuensi, rata- rata
ukurnya:
( )
1
f f f
Ru = x1 1
⋅ x2 2
⋅ ... ⋅ xk k n
k
n= ∑i =1
fi
• k adalah banyaknya kelas , xi adalah titik tengah kelas
• Untuk bilangan-bilangan bernilai besar :
k

∑ f i log xi
log Ru = i =1

n
Harmonic mean
• Rata-rata harmonis
n
Rh =
 1 1 1 

 x + x + ... + x 
 1 2 n 

• Untuk data berkelompok ,


k

n ∑ fi
Rh = = i =1

 f1 f2 fk  k
fi

 x + x + ... + x 
 ∑ xi
 1 2 k  i =1
Contoh penggunaan rata-rata harmonis
• Menghitung kecepatan (km/jam)
• Ilustrasi : Arief menempuh perjalanan dari kota A ke kota B yg
berjarak 300 km , pergi-pulang. Untuk perginya ia
mengendarai motor dengan kecepatan 100 km/jam,
sedangkan pulangnya dari kota B ke kota A kecepatannya
150km/jam. Berapakah rata-rata kecepatan pergi pulangnya?
• Kota A B : waktu tempuh 3 jam
• Kota B A : waktu tempuh 2 jam, total waktu tempuh adalah
5 jam
• Sehingga kecepatan : 600 km/5 jam = 120 km/ jam
• Atau : 2
Rh = = 120
 1 1 
 + 
 100 150 
Median
• In an ordered list, the median is the “middle” number
(50% above, 50% below)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Median = 3 Median = 3

• Not affected by extreme values


Finding the Median
• The location of the median:
n +1
Median position = position in the ordered data
2
• If the number of values is odd(ganjil), the median is the middle number
• If the number of values is even (genap), the median is the average of the
two middle numbers

n +1
• Note that is not the value of the median, only the position
2
of the median in the ranked data
Median : data tabel distribusi frekuensi
• Bilangan yang dapat dianggap sebagai statistik urutan ke n/2 seandainya
dalam setiap kelas, skor data tersebar merata di dalam interval kelasnya.
n 
2 −F 
Med = Bmed + p 
 f med 
 
• Bmed = batas bawah kelas median
• F =jumlah semua frekuensi kelas sebelum kelas median
• f med = frekuensi kelas median
• n = jumlah semua frekuensi
• p= panjang kelas
Modus
• Mode, modus = datum yang paling sering muncul atau
frekuensinya tinggi (Value that occurs most often)
• Unimodus, bimodus, multimodus, tidak ada modus
• Not affected by extreme values
• Used for either numerical or categorical data
• There may be no mode 0r there may be several modes

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

No Mode
Mode = 9
Modus : data dalam tabel distribusi frekuensi
• Modus yang sebenarnya tidak dapat dicari
• Kelas dengan frekuensi tertinggi adalah kelas modus
 b1 
Mode = Bmod + p  
b
 1 + b2 

• B mod =batas bawah kelas modus


• b1 = fmod – f seb
• b2 = fmod – f ses
• fmod =frekuensi kelas modus
• f seb = frekuensi kelas sebelumnya
• f ses= frekuensi kelas sesudahnya
Soal
• Carilah mean, median dan modusnya

Kelas Frekuensi

92,1-99,0 2
85,1-92,0 6
78,1-85,0 10
71,1-78,0 40
64,1-71,0 16
57,1-64,0 6
jumlah 80
Penyelesaian : Mean
• Mean
Kelas Frekue x f.x f. log x f/x
nsi
92,1-99,0 2 95,55
85,1-92,0 6 88,55
78,1-85,0 10 81,55
71,1-78,0 40 74,55
64,1-71,0 16 67,55
57,1-64,0 6 60,55

jumlah 80 5964
Mean=74,55 Ru Rh=80/1,0839=
=344,5184/80 73,8075
=74,1789
Modus
• Kelas modus (f mod=40) :71,1 – 78,0
• B mod=71,05
• f seb =16
• f ses = 10
• b1=40-16=24
• b2=40-10=30
• p= 7
• Modus =74,16
Median
• Mencari data yang ke-40 (bilangan yang dianggap statistik urutan ke
40)
• Kelas median:
• 6+16=22 <40
• 6+16+40 =62 > 40
• Kelas pemuat median : [71,1 ; 78,0]
• Median = 71,05 +(7/40)(40-22) =
Shape of a Distribution
• Describes how data are distributed
• Measures of shape
• Symmetric or skewed

Left-Skewed Symmetric Right-Skewed


Mean < Median Mean = Median Median < Mean
Measures of Variability
Variation

Range Interquartile Variance Standard Coefficient of


Range Deviation Variation

 Measures of variation give information Same center,


on the spread or variability of the data different variation
values.
Range
• Simplest measure of variation
• Difference between the largest and the smallest
observations:

Range = Xlargest – Xsmallest

Example:

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Range = 14 - 1 = 13
Disadvantages of the Range
• Ignores the way in which data are distributed

7 8 9 10 11 12 7 8 9 10 11 12
Range = 12 - 7 = 5 Range = 12 - 7 = 5

• Sensitive to outliers
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Range = 5 - 1 = 4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Range = 120 - 1 = 119


Population Variance
• Average of squared deviations of values from the mean

• Population variance:
N

2
∑ (x − μ) i
2

σ = i=1
N -1
Where μ = population mean
N = population size
xi = ith value of the variable x
Sample Variance

• Average (approximately) of squared deviations of values from the


mean

n
• Sample variance:

2
∑ (x − x)
i
2

s = i=1
n -1
Where X= arithmetic mean
n = sample size
Xi = ith value of the variable X
Population Standard Deviation
• Most commonly used measure of variation
• Shows variation about the mean
• Has the same units as the original data

• Population standard deviation:

∑ i
(x − μ) 2

σ= i=1
N -1
Sample Standard Deviation
• Most commonly used measure of variation
• Shows variation about the mean
• Has the same units as the original data

• Sample standard deviation:

∑ i
(x − x) 2

S= i=1
n -1
Calculation Example:
Sample Standard Deviation

Sample
Data (xi) : 10 12 14 15 17 18 18 24

n=8 Mean = x = 16

(10 − X)2 + (12 − x)2 + (14 − x)2 +  + (24 − x)2


s=
n −1

(10 − 16)2 + (12 − 16)2 + (14 − 16)2 +  + (24 − 16)2


=
8 −1

A measure of the “average” scatter


126 around the mean
= = 4.2426
7
Measuring variation

Small standard deviation

Large standard deviation


Comparing Standard Deviations
Data A
Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21
s = 3.338

Data B
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.926
Data C

Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21 s = 4.570
Advantages of Variance and
Standard Deviation
• Each value in the data set is used in the
calculation

• Values far from the mean are given extra weight


(because deviations from the mean are squared)
Variansi
VARIABEL RANDOM
• Variabel random adalah suatu cara memberi harga angka kepada
setiap elemen ruang sampel, atau suatu fungsi bernilai real yang
harganya ditentukan oleh setiap elemen dalam ruang sampel
• Contoh:
• Eksperimen (proses random) melemparkan uang logam tiga kali,
S = {BBB, BBM, BMB, MBB, BMM, MBM, MMB, MMM}.
• Didefinisikan variabel random X : banyak M (muka) muncul dalam
pelemparan uang logam tiga kali.
• Contoh (variabel random):
Jenis Variabel Random
• Variabel random diskret: Suatu variabel random yang hanya dapat menjalani
harga-harga yang berbeda yang berhingga banyaknya (sama banyaknya dengan
bilangan bulat)
• Variabel random kontinu: Suatu variabel random yang dapat menjalani setiap
harga dalam suatu interval (tak berhingga banyaknya)
• Distribusi Peluang: Model matematik yang menghubungkan semua nilai
variabel random dengan peluang terjadinya nilai tersebut dalam ruang sampel.
Distribusi peluang dapat direpresentasikan dalam bentuk fungsi, tabel, atau
grafik. Distribusi peluang dapat dianggap sebagai frekuensi relatif jangka
panjang.
Probability
Distributions

Discrete Continuous
Probability Probability
Distributions Distributions

Binomial Uniform

Hypergeometric Normal

Poisson Exponential
Membaca Tabel
• Tabel z, t, Chi square, F
Proses estimasi
Random Sample I am 95%
confident
Population that μ is
Mean between 40
(mean, μ, is X = 50 & 60.
unknown)

Sample
populasi

parameter

sampel

statistik
• Estimasi titik adalah sebuah nilai tunggal
• Interval konfidensi/selang kepercayaan memberikan informasi
tambahan tentang keragamannya.
• Untuk mean Population, μ
• Jika σ2 diketahui
• Jika σ2 tidak diketahui
• Jika σ2 tidak diketahui, tetapi n≥30

Parameter populasi Estimasi titik

Mean μ x
Proporsi
P p̂
• Seberapa yakin kita dengan estimasi titik sebuah
populasi parameter?

• Estimasi interval memberikan informasi lebih


mengenai karakteristik populasi daripada estimasi
titik

• Estimasi interval ini dinamakan interval confidence


• Dinyatakan dengan tingkat keyakinan yang tidak
akan pernah melebihi 100%
• Misalkan tingkat keyakinan 95%
• Ditulis juga dengan (1 - α) = 0.95
• Interpretasi :
• From repeated samples, 95% of all the confidence intervals that can be
constructed will contain the unknown true parameter
Interval konfidensi (1-α)100% untuk μ jika simpangan baku populasi σ diketahui

σ σ
x − z α/2 < μ < x + z α/2
n n
Interval konfidensi (1-α)100% untuk μ jika simpangan baku populasi σ tidak
diketahui
S S
x − t n-1,α/2 < μ < x + t n-1,α/2
n n
Interval konfidensi (1-α)100% untuk μ jika simpangan baku populasi σ tidak
diketahui, tetapi ukuran sampel >30
s s
x − z α/2 < μ < x + z α/2
n n

Anda mungkin juga menyukai