Pengenalan Statistika Dasar ini merupakan hasil studi yang saya tempuh selama menjadi mahasiswa
program S1 jurusan Matematika di Universitas Udayana.
Modul Statistika Dasar by Moh. Heri Setiawan
MODUL STATISTIK
Oleh Moh. Heri Setiawan
BAB I
KONSEP DASAR STATISTIKA
Keterangan :
A. Skala Non-Metrik : skala pengukuran yang tergolong tingkat penskalaan “rendah”
dalam statistika, umumnya terkait erat dengan variable yang bersifat kualitatif, dimana
karakteristik obyek diperoleh dengan cara meminta pendapat responden.
B. Skala Metrik : skala pengukuran ang tergolong tingkat penskalaan “tinggi” dalam
statistika, umumnya terkait erat dengan variable yang bersfat kuantitatif dimana nilai
karakteristik obyek diperoleh dengan cara mencacah atau mengukur obyek pengamatan.
C. Skala Nominal : sering disebut skala kategori, merupakan skala pengukuran terendah
yang hanya mampu melakukan pengelompokan menurut kategori/klas yang dibentuk.
Misal : laki, perempuan, ayah, ibu, anak, dll.
D. Skala Ordinal : skala pengukuran yang mampu melakukan pengelompokan dan
pemeringkatan (urutan) dari karakteristik obyek yang diamati. Sebuah kategori/klas dari
variable yang diamati dapat dibandingkan dengan kategori /klas lainnya melalui
hubungan “lebih besar” atau “kurang dari”.
E. Skala interval : skala pengukuran yang memiliki kemampuan untuk mengelompokkan,
mengurutkan, dan menghitung interval 2 nilai pengamatan. Skala ini belum mampu
menghitung rasio dua nilai, dikatakan bahwa skala interval belum memiliki titik 0
absolut. Contoh : missal suhu benda A 80o F dan benda B suhunya 40o F, namun tidak
dapat dikatakan bahwa suhu benda A dua kali suhu benda B. karena jika suhu dinyatakan
dalam satuan Celsius atau Reamur akan diperoleh angka – angka yang berbeda.
F. Skala rasio : merupakan skala pengukuran tertinggi dalam terminology statistika,
mempunyai kemampuan untuk mengelompokkan, mengurutkan, menghitung interval 2
nilai, dan menghitung rasio 2 nilai pengamatan dengan dicirikan telah adanya titik 0
absolut. Missal berat badan si A 50 kg dan berat si B 100 kg, maka berat si B 2 kali berat
si A apapun satuan yang digunakan.
Data yang telah diolah dapat disajikan dalam bentuk grafik antara lain :
a. Diagram batang
b. Diagram lingkaran
c. Diagram garis
d. Histogram
e. Diagram dahan daun (stem and leaf)
f. Diagram kotak baris dll.
Notasi penjumlahan
Dalam statistika, sering kali melakukan penjumlahan data yang cukup banyak. Untuk
menyederhanakan cara penulisan data, digunakan notasi sigma “∑”.
𝑛
� 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑖=1
a. ∑𝒏𝒌=𝟏 𝒌 = ∑𝒏𝒊=𝟏 𝒊
b. ∑𝒏𝒌=𝒎 𝒄 = (𝒏 − 𝒎 + 𝟏)𝒄 ; 𝒄 = 𝒌𝒐𝒏𝒔𝒕𝒂𝒏𝒕𝒂
c. ∑𝒏𝒌=𝟏 𝒄 𝒌 = 𝒄 ∑𝒏𝒌=𝟏 𝒌 ; 𝒄 = 𝒌𝒐𝒏𝒔𝒕𝒂𝒏𝒕𝒂
d. ∑𝒏𝒌=𝒎 𝒌 = ∑𝒏+𝒑
𝒌=𝒎+𝒑(𝒌 − 𝒑) ; 𝒑 = 𝒃𝒊𝒍. 𝒃𝒖𝒍𝒂𝒕
e. ∑𝒎−𝟏 𝒏 𝒏
𝒌=𝟏 𝒌 + ∑𝒌=𝒎 𝒌 = ∑𝒌=𝟏 𝒌 ; 𝒎 < 𝑛
𝒔
f. ∑𝒌=𝒔 𝒌 = 𝒔
a. ∑𝒏𝒌=𝟏 𝒂𝒌 = ∑𝒏𝒊=𝟏 𝒂𝒊
b. ∑𝒏𝒌=𝟏 𝒄 𝒂𝒌 = 𝒄 ∑𝒏𝒌=𝟏 𝒂𝒌
c. ∑𝒏𝒌=𝟏(𝒂𝒌 ± 𝒃𝒌 ) = ∑𝒏𝒌=𝟏 𝒂𝒌 + ∑𝒏𝒌=𝟏 𝒃𝒌
d. ∑𝒏𝒌=𝒎 𝒂𝒌 = ∑𝒏+𝒑
𝒌=𝒎+𝒑 𝒂(𝒌−𝒑) ; 𝒑 𝒃𝒊𝒍. 𝒃𝒖𝒍𝒂𝒕
e. ∑𝒌=𝟏 𝒂𝒌 + ∑𝒌=𝒎 𝒂𝒌 = ∑𝒏𝒌=𝟏 𝒂𝒌 ; 𝒎 < 𝑛
𝒎−𝟏 𝒏
f. ∑𝒔𝒌=𝒔 𝒂𝒌 = 𝒂𝒔 ; 𝒂 = 𝟏, 𝟐, 𝟑, 𝟒, … , 𝒏
BAB II
UKURAN STATISTIK BAGI DATA
∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1(𝑥𝑖 + 𝑎)
𝑦� = = = 𝑥̅ + 𝑎
𝑛 𝑛
Bila terdapat hubungan yi = c xi maka :
∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑐 𝑥𝑖
𝑦� = = = 𝑐𝑥̅
𝑛 𝑛
Tengah wilayah merupakan ukuran yang didefinisikan sebagai rata – rata
pengamatan terkecil dan terbesar.
𝑥𝑚𝑖𝑛 + 𝑥𝑚𝑎𝑥 𝑥1 + 𝑥𝑛
𝑥= =
2 2
Median
Median segugus data yang telah terurus dari nilai terkecil sampai nilai
terbesar atau sebaliknya dari terbesar sampai terkecil adalah pengamatan yang
tepat di tengah – tengah bila banyak pengamatan ganjil (n=ganjil) atau rata – rata
kedua pengamatan yang ditengah bila n = genap
∑𝑘𝑖=1 𝑛𝑖 𝑥̅𝑖
𝑥̅𝑔 =
∑𝑘𝑖=1 𝑛𝑖
Nilai tengah geometric
Nilai tengah geometric, G dari k bilangan positif x1, x2, x3, … , xk adalah akar ke-
k dari hasil kali semua bilangan itu.
𝐺 = 𝑘�𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑘
Nilai tengah harmonic
Nilai tengah harmonic dari k bilangan x1, x2, x3, … , xk adalah k dibagi dengan
jumlah kebalikan bilangan – bilangan tersebut.
𝑘
𝐻=
1
∑𝑘𝑖=1
𝑥𝑖
Ukuran keragaman data/penyebaran data
Keragaman/Dispersi data menunjukkan seberapa jauh pengamatan – pengamatan
itu menyebar dari nilai tengahnya. Sangat mungkin kita memiliki dua kumpulan
pengamatan yang mempunyai nilai tengah atau median yang sama namun sangat berbeda
keragamannya. Statistic yang paling penting untuk mengukur keragaman data adalah
wilayah/range dan ragam.
Wilayah/range
Wilayah/range sekumpulan data adalah beda antara pengamatan terbesar dan
terkecil dalam kumpulan tersebut.
𝑅𝑎𝑛𝑔𝑒 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
Ragam dan simpangan baku
Ragam populasi terhingga x1, x2, x3, … , xN didefinisikan sebagai :
2
∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2
𝜎 =
𝑁
Ragam contoh terhingga x1, x2, x3, … , xn didefinisikan sebagai :
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑆2 =
𝑛−1
Dalil Chebyshev
Dua nilai yang digunakan statistikawan adalah nilai tengah dan simpangan baku.
Simpangan baku yang kecil mengindikasikan bahwa sebagian besar data mengumpul di
sekitar nilai tengahnya, sebaliknya simpangan baku yang besar menunjukkan pengamatan
– pengamatan lebih menyebar jauh dari nilai tengahnya.
Ahli matematika Rusia, P. L. Chebyshev (1821-1894) menemukan bahwa
proporsi pengukuran yang jatuh antara dua nilai yang setangkup terhadap nilai tengahnya
berhungan simpangan bakunya.
Dalil Chebyshev berbunyi “sekurang – kurangnya 1 – 1/k2 bagian data terletak
dalam simpangan baku dan nilai tengahnya”. Untuk k = 2, dalil ini menyatakan bahwa
sekurang – kurangnya 1 – ½2 = ¾ (75%) datanya pasti terletak dalam batas – batas 2
simpangan baku nilai tengahnya. Dengan kalimat lain, 75% atau lebih bagian
pengamatan suatu populasi pasti terletak dalam selang µ ± 2σ. Bila datanya merupakan
data contoh maka dinyatakan sebagai :
𝑥̅ ± 𝑘𝑆
Nilai Z
Bagaimana membandingkan dua pengamatan dari dua populasi yang berbeda
sehingga dapat menentukan tingkatan atau rank relatifnya. Salah satu cara menentukan
tingkatan kedua pengamatan tersebut adalah mengubahnya menjadi satuan baku yang
dikenal sebagai nilai z atau skor z.
Suatu pengamatan x dari suatu populasi yang mempunyai nilai µ dan simpangan
baku σ, mempunyai nilai z atau skor z yang didefinisikan sebagai :
𝑥− 𝜇
𝑧= ; 𝑢𝑛𝑡𝑢𝑘 𝑠𝑘𝑜𝑟 𝑧 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖
𝜎
𝑥 − 𝑥̅
𝑧= ; 𝑢𝑛𝑡𝑢𝑘 𝑠𝑘𝑜𝑟 𝑧 𝑐𝑜𝑛𝑡𝑜ℎ
𝑆
Sebaran Frekuensi untuk data kelompok
Mean
Mean atau rata – rata didefinisikan sebagai :
∑ 𝑥𝑖 ∑ 𝑥𝑖
𝑥̅ = =
𝑛 ∑ 𝑓𝑖
Keterangan :
𝑥̅ = mean
∑ 𝑥𝑖 = jumlah nilai data
𝑛 = ∑ 𝑓𝑖 = jumlah frekuensi
Median
Median atau nilai tengah didefinisikan sebagai berikut :
1
𝑄2 = 2
�𝑥(𝑛+1) � ; untuk n ganjil
1
𝑄2 = 2
�𝑥�𝑛� + 𝑥�𝑛 + 1� � ; untuk n genap
2 2
Kuartil
Kuartil merupakan pembagian data yang sudah terurut menjadi 3, dapat
dituliskan sebagai berikut :
𝑖
𝑄𝑖 = 4
�𝑥(𝑛+1) � ; (i = 1,2,3) untuk n ganjil
𝑖
𝑄𝑖 = [𝑛 + 2 ] ; (i = 1,2,3) untuk n genap
4
Desil
Desil merupakan pembagian data yang sudah terurut menjadi 10 bagian,
dapat dituliskan sebagai berikut :
𝑖
𝐷𝑖 = 10
�𝑥(𝑛+1) � ; (i = 1,2,3, … , 9) untuk n ganjil
𝑖
𝐷𝑖 = [𝑛 + 2 ] ; (i = 1,2,3, … , 9) untuk n genap
10
Persentil
Persentil merupakan pembagian data yang sudah terurut menjadi 100
bagian, dapat dituliskan sebagai berikut :
𝑖
𝑃𝑖 = 100
�𝑥(𝑛+1) � ; (i = 1,2,3, … , 99) untuk n ganjil
𝑖
𝑃𝑖 = [𝑛 + 2 ] ; (i = 1,2,3, … , 99) untuk n genap
100
Ragam contoh
Ragam contoh didefinisikan sebagai berikut :
∑ 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑆2 =
∑𝑓 −1
Statistika deskriptif
Skewnass
3(𝑥̅ − 𝑥�)
𝑆𝑘𝑤 =
𝑆
∑(𝑥𝑖 − 𝑥̅ )3
𝑆𝑘𝑤 =
𝑆3
Keterangan :
𝑥̅ = mean
𝑥� = median
S = simpangan baku
Kurtasi
I. Peubah Acak
Misalkan dalam suatu percobaan dengan satu mata uang yang dilemparkan
sebanyak tiga kali. Maka ruang kejadian yang mungkin adalah :
S = {AAA, AAG, AGA, AGG, GAA, GAG, GGA, GGG}
G = Muncul gambar
A = Muncul angka
Bila yang diperlukan adalah jumlah gambar yang muncul dalam percobaan
itu, maka dapat diperoleh daftar berikut :
Jumlah gambar yang
Frekuensi
muncul
0 1
1 3
2 3
3 1
Bila 0, 1, 2, dan 3 yang menyatakan jumlah muka yang muncul merupakan
peubah acak. Jadi, peubah acak adalah suatu fungsi bernilai real yang harganya
ditentukan oleh tipa anggota dalam ruang kejadian (ruang sampel).
Definisi Peubah Acak
Suatu fungsi bernilai bilangan real yang harganya ditentukan oleh tiap
anggota dalam ruang kejadian (ruang contoh).
x 0 1 2 3
Frekuensi 1 3 3 1
P(X=x) 1/8 3/8 3/8 3/8
Contoh :
Hitunglah peluang jumlah bilangan yang muncul bila dua dadu dilemparkan.
Jawab :
Jika 2 dadu dilemparkan, maka jumlah mata yang muncul bisa digambarkan
sebagai berikut :
1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Misalkan X peubah acak dengan nilai x, maka P(X=3) = 3/36, P(X=2) = 1/36 .
sehingga diperoleh sebaran peluang diskret sebagai berikut :
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
Sebaran peluang kontinu tidak dapat disajikan dalam bentuk tabel, tetapi
menggunakan suatu rumusan yang merupakan fungsi nilai-nilai variable kontinu,
sehingga dapat digambarkan sebagai kurva.
f(x)
x
a b
𝒃
𝑷(𝒂 < 𝒙 < 𝒃) = � 𝒇(𝒙)𝒅𝒙 = 𝟏
𝒂
Jika digambarkan dalam bentuk grafik, fungsi densitas peubah acak kontinu
umumnya berbentuk :
X
p(x,y) Total Baris
0 1 2 3
0 10/220 30/220 15/220 1/220 56/220
1 40/220 60/220 12/220 12/220
y
2 30/220 18/220 8/220
3 4/220 4/220
Sebaran peluang bersama bagi X dan Y untuk contoh ini dapat dinyatakan
dalam rumus berikut
Untuk X=0,1,2,3; Y=0,1,2,3; 0≤ X+Y ≤3
3 4 5
x x 3 − x − y
p ( x, y ) =
12
3
B. Sebaran peluang bersama untuk peubah acak kontinu
Contoh :
1/ 2, 0 ≤ x ≤ y, 0 ≤ y ≤ 2
f ( x, y ) =
0, selainnya
Hitunglah peluang soft drink yang terjual adalah kurang dari ½ gallon jika
mesin tersebut berisi 1 galon di awal hari
Jawab :
1/ 2 1/ 2
1
∫ f ( x | y= ∫ =dx x=
1/ 2
P(X≤1/2|Y=1) = )dx 1/ 2
0
0 0
1
𝜇X = E(X) = � xi p(xi )
𝑖=1
b. Ragam peubah acak
Varian X merupakan ukuran sebaran suatu distribusi
Var(X) merupakan nilai harapan dari kuadrat beda terhadap mean,
sehingga :
𝜎𝑋 2 = 𝑉𝑎𝑟(𝑋) = 𝐸⌊(𝑋 − 𝜇𝑋 )2 ⌋
B. Nilai tengah (nilai harapan) dan ragam peubah acak untuk distribusi
peluang kontinu
HIMATIKA UNUD Page | 14
Modul Statistika Dasar by Moh. Heri Setiawan
b. Sebaran Binomial
Sebaran binomial memiliki ciri – ciri antara lain :
Percobaan terdiri atas n kali Bernoulli trial yang identik
Hanya ada 2 keluaran, yaitu S = SUKSES dan F = GAGAL untuk tiap trial
P(S) = p dan P(F) = q, bernilai tetap dari satu trial ke trial lain
Semua trial saling independent
𝑛
𝑃(𝑋 = 𝑥) = � � 𝑝 𝑥 𝑞 𝑛−𝑥 , 𝑢𝑛𝑡𝑢𝑘 𝑥 = 1,2,3, … , 𝑛
𝑥
Keterangan :
p = peluang sukses dalam trial tunggal
q=1–p
n = jumlah trial
x = jumlah sukses dalam trial
Contoh kasus :
Seorang insinyur elektro sedang mengamati problem arus listrik pada
computer. Hasil survey terakhir menunjukkan bahwa 10% computer yang
dipakai mengalami problem ini. Jika 5 sampel random dipilih dari seluruh
populasi amatan, hitung peluang :
a. Terdapat 3 komputer terpilih mengalami kerusakan
b. Paling sedikit 3 komputer terpilih mengalami kerusakan
c. Kurang dari 3 komputer terpilih mengalami kerusakan
Jawab :
a. Tepat 3 komputer, x = 3
5
𝑃(3) = � � (10%)2 (90%)(2) = 0,0081
3
b. Paling sedikit 3 komputer, x = 3, 4, dan 5
P(X ≥ 3) = P(3) + P(4) + P(5)
P(3) = 0,0081
5
𝑃(4) = � � (10%)4 (90%)(1) = 0,00045
4
5
𝑃(5) = � � (10%)5 (90%)(0) = 0,00001
5
Maka P(X ≥ 3) = 0,0081 + 0,00045 + 0,00001 = 0,00856
d. Sebaran Multinomial
Keterangan :
pi = peluang keluaran ke-I dalam trial tunggal
p1 + p2 + p3 + … + pk = 1
n = y1+ y2+ y3+ …+ yk= jumlah trial
yi= jumlah kemunculan keluaran ke–i dalamn trial
Contoh :
Sebuah penelitian menunjukkan bahwa 10% monitor komputer memberikan
radiasi tinggi, 30 % sedang, dan 60% rendah. Bila diambil sampel acak 40
monitor dari sebuah populasi amatan, hitunglah :
a. Peluang bahwa10 monitor memilikiradiasitinggi, 10 sedang, 20 rendah
Jawab :
Ditentukan :
y1 = jumlah monitor radiasi tinggi
y2 = jumlah monitor radiasi sedang
y3 = jumlah monitor radiasi rendah
p1 = peluang terpilihnya monitor radiasi tinggi
p2 = peluang terpilihnya monitor radiasi sedang
p3 = peluang terpilihnya monitor radiasirendah
Sehingga:
40!
P(10,10,20) = (10%)10 (30%)10 (60%)20 = 0,0005498
10! 10! 20!
e. Sebaran Hipergeometri
Sebaran hipergeometri memiliki ciri – ciri :
Contoh :
Dari 10 katalis yang ada diperlukan 3 untuk keperluan pembuatan produk
kimia baru. Dari sepuluh katalis tersebut terdapat 4 jenis katalisberkadar asam
tinggi dan 6 jenisberkadar asam rendah.
a. tentukan peluang bahwa katalis yang terpilih semua berkadar asam rendah
b. tentukan peluang bahwa dari3 katalis yang dipilih, hanya1 yang memiliki
kadar asam tinggi.
Jawab :
y = jumlah katalis berkadar asam tinggi dari 3 katalis terpilih
N = 10, n = 3, r = 4
Maka
4 6
� �� �
y 3-y
P(Y = y) =
10
� �
3
4 6
� �� � 1
0 3
a. P(Y = 0) = 10 = 6
� �
3
4 6
� �� � 1
1 2
b. P(Y = 1) = 10 = 2
� �
3
f. Sebaran Poisson
Sebaran poisson memiliki cirri-ciri sebagai berikut :
1. Variabel random y = jumlah kemunculan kejadian yang diamati selama unit
ukuran tertentu(contoh: jarak, area, volume, dll)
2. Nilai peluang dari sebuah kejadian adalah sama untuk setiap ukuran tertentu
Contoh :
Sejumlah y retak pada spesimen beton untuk sebuah jenis semen mengikuti
distribusi poisson. Dengan pengamatan awal diketahui bahwa jumlah rata–rata
keretakan setiap spesimen adalah 2,5. Tentukan peluang bahwa sebuah
spesimen yang dipilih secara random memiliki jumlah keretakan 5
Jawab :
μ= =ג2,5
sehingga
2,55 𝑒−2,5
P(Y = 5) = = 0,067
5!