Anda di halaman 1dari 61

STATISTIKA

Created :K. B Siahaan


BAB 1
PENDAHULUAN
Defenisi Dasar

Statistika adalah suatu metode dasar dalam mengumpulkan,


mengklasifikasikan, meringkas, menyajikan, menginterprestasikan
dan menganalisa data guna mendukung pengambilan kesimpulan
yang valid dan berguna.

Populasi adalah kumpulan dari


keseluruhan pengukuran objek atau
individu yang sedang dikaji

Sampel adalah sebagian (sub set)


dari suatu populasi
Contoh :

Untuk menudahkan penelitian tentang kekuatan blok


beton yang dikerjakan mahasiswa teknik sipil Polmed Sem.
1, maka akan diuji hanya 5 blok beton setiap kelas

Populasi 150 Blok Beton


Sampek 30 Blok Beton
Parameter adalah bilangan atau angka yang menggambarkan
karakteristik dari suatu populai. Sedangkan Statistik adalah
bilangan atau angka yang menggambarkan karakteristik dri
sampel

Contoh :

Jika dilakukan pengukuran massa kubus beton yang dibuat


seluruh mashasiswa semester satu jurusan Teknik Sipil
Polmes, maka rata – rata massa bolk beton disebut sebagai
data Populasi. Sedangkan jika massa yang diukur diperoleh
dari perwakilan 5 kubus beton perkelas, maka massa rata –
rata yang diperoleh disebut sebagai data statistik
Statistik Deskriptif/ Deduktif

Statistik deskriptif adalah tahapan


statistik yang mengumpulkan,
mengklasifikasikan,
menginterprestasikan dan menyajikan
data dari suatu kelompok yang
terbatas tanpa menganalisa dan
menarik kesimpulan yang berlaku bagi
kelompok yang lebih luas.

Statistik Inferensi/ Induktif


Statistik Inferensi adalah kegiatan statistik yang mengambil
kesimpulan mengenai parameter populas,i yang tidak diketahui
nilainya, berdasarkan informasi yang diperoleh dari statistik
sampel.
Proses Inferensi Secara Statistik
Nilai pada Populasi Nilai pada Sampel
yang dikaji yang dipilih

Pemilihan
Sampel

Parameter Perkiraaan mengenai Statistik


(Tak Diketahui) parameter populasi (Diketahui)
Mulai

Kumpulan Data

Klasifikasi, ringkas
Statistik Deskriptif

Dan Proses Data

Sajikan , Sampaikan
Ringkasan informasi

Inferensi

Statistik Inferensi
Gunakan inferensi data sampel
dari Sampel untuk menyimpulkan populasi

Gunakan data semua untuk Tarik kesimpulan tentang


menganalisa karakteristik karakteristik populasi
populasi yang diuji (Parameter) yang dikaji

Selesai
Data

Data Kualitatif : bukan berupa angka/ bilangan (Tidak


dapat dikenai operasi hitung aljabar)

Data Nominal : Hanya ada satu kategori


Contoh : Data Jenis Kelamin, Data tempat lahir

Data Ordinal : Lebih dari satu kategori


Contoh : Data perilaku konsumen

Data Kuantitatif : berbentuk angka / bilangan. (Dapat


dikenai operasi hitung)

Data Diskrit : hasil pencacahan (enumerasi


),biasanya berbentuk bilangan bulat 0, 1, 2, 3, . . .

Data Kontiniu : hasil pengukuran dengan suatu


instrumen (alat ukur),
STRUKTUR DATA
DATA

Data Kualitatif (atribut


Dta Kulitatif (numerik) yang
kategori) yg tidak
berbentuk angka
berbentuk angka

Data Kontiniu Data Diskrit


Data Numerik Data Ordinal
(Hasil Pengukuran (Hasil Penccahan)

Data Data
Interval Rasio
Ukuran Pemustan (Tendency) Data Tunggal Dan
Berdistribusi Frekuensi)

Data Tunggal Data Berkelompok


x1 , x2 , x3 ..., xn1 , xn Jenis Pekerjaan Jumlah (kk)
Wiraswasta 30
Data Berdistribusi frekuensi
Karyawan 156
Data Frekuensi (f) Petani 64
Batas Bawah PNS 40
Kelas pertama
50 – 59 8
Pefagang 80
60 – 69 10
TNI/ POLRI 30
70 – 79 16
Batas atas Total 400
Kelas pertama 80 – 89 15 Kelas I
90 – 99 10 50 - 59
100 – 109 8 Tepi bawah = 50 – 0,5 = 49,5
110 - 119 3 Tepi atas = 59 + 0,5 = 59,5
Diagram Batang (Histogram)

160

140

120

100

80

60

40

20

0
Wiraswsta Karyawan Petani Pegi Pefagang TNI/ POLRI
Pemerintah

Diagram Garis

Jumlah (kk)
180
160
140
120
100
80
60
40
20
0
Wiraswsta Karyawan Petani Pegi Pemerintah Pefagang TNI/ POLRI
Diagram Lingkaran

Wiraswsta
Karyawan
Petani
Pegi Pemerintah
Pefagang

Diagram Pancar (Scatter Plot)


180

160

140

120

100

80

60

40

20

0
0 1 2 3 4 5 6 7
Ukuran Pemustan Data
(Measure of Central Tendency)

1. Rata-rata (Mean) Aritmatika


n
X  1
n  xi
i 1
Untuk Data Tunggal(Tak Berdistribusi)

f x i i
X  i 1
n
Untuk Data Berdistribusi Frekuensi

f
i 1
i

xi = Titik tengah kelas ke i


Fi = Frekuensi kelas ke -i
Contoh Hitunglah rata-rata dari data-data berikut.

1. Massa dari ke 10 kubus beton tersebut adalah 3 kg, 4 kg, 5


kg, 3 kg, 6 kg, 4 kg, 5 kg, 4 kg, 6kg, 7 kg.

2. Massa (kg) 4,5 5 5,5 6 6,5 7


Frek 4 3 5 6 5 2

3. Data Frekuensi (f)


50 – 59 8
60 – 69 10
70 – 79 16
80 – 89 15
90 – 99 10
100 – 109 8
110 – 119 3
2. Rata-rata (Mean) Harmonik
1 n n
H n
 n

1 1 1 1 1 1

n i 1 xi

i 1 xi

x1 x2
 ... 
xn
3. Rata-rata (Mean) Geometrik
1/ n
  n
G   xi   n x1.x2 ....xn
 i 1 
Contoh
Sepuluh orang mahasiswa Politeknik mendapat tugas
membuat kubus beton, Massa dari ke 10 kubus beton
tersebut adalah 3 kg, 4 kg, 5 kg, 3 kg, 6 kg, 4 kg, 5 kg, 4 kg,
6kg, 7 kg. Bandingkanlah rataan aritmatik, rataan harmonik
dan rataan geometrik dari kubus beton tersebut.
4. Median

Median menyatakan nilai tengah setelah data diurutkan


Untuk data tunggal
 x p ,dengan p  1 / 2(n  1)
Me   1 Jumlah frek semua kls
 2 ( x p  x( p 1) ), dengan p  n/2 sebelum kls modus

Untuk berdistibusi frekuensi


Data Frek (f) Total Frekuensi
 N 
50 – 59 8
  FKum 
Med  tb  c 2 
60 – 69 10

 
70 – 79 16
f Med
80 – 89 15
Tepi bawah Kls
 
90 – 99 10
Panjung Kelas
 
100 – 109 8
110 – 119 3
Ukuran Letak Data
(Measure of Position)

1. Modus

Data yang paling sering muncul atau data dengan frekuensi


terbesar
Untuk berdistibusi frekuensi
Data Frekuensi (f)

 s1  50 – 59 8
Mod  tb  c  60 – 69 10
 s1  s2  70 – 79 16

S1 = Selisih Frekuensi kelas modus 80 – 89 15


dengan kelas sebelumnya 90 – 99 10
S2 = Selisih Frekuensi kelas modus 100 – 109 8
dengan kelas sesudahnya
110 – 119 3
2. Kuartil (Q)

Data yang membagi semua data terurut menjadi empat


bagian sama banyak
25 % 25 % 25 % 25 %

Q1 ( Bawah) Q2 (Tengah) Q3 ( Atas)


Untuk berdistibusi frekuensi Data Frek (f)
50 – 59 8
 iN  F 
  60 – 69 10
Qi  tb  c 4 kum  70 – 79 16
 f 
I = 1, 2 dan 3   80 – 89 15
 
90 – 99 10
100 – 109 8
110 – 119 3
3. Desil (D)
Data yang membagi semua data terurut menjadi sepuluh
bagian sama banyak
 iN  F 
 
Di  tb  c 10 kum 
 f 
 
I = 1, 2, . . . , 9  

4. Persentil (P)

Data yang membagi semua data terurut menjadi seratus


bagian sama banyak
 iN 
 F 
Pi  tb  c 100 kum 
 f 
 
I = 1, 2, . . . , 99  
Ukuran Penyebaran (Dispersy) Data
Tunggal Dan Berdistribusi Frekuensi)

1. Jangkauan Data (Range)


Untuk menggambarkan
seberapa jauh data Jangkauan  xmax  xmin
menyebar dan seberapa
baik nilai rata – rata
menggambarkan data. 2. Jangkauan Kuartil (JK)

JK  Q3  Q1
Contoh 3. Simpangan Kuartil (SK)

SK  Q3  Q1 
Dari data pada contoh sebelumnya, 1
Tentukan nilai Jangkauan kuartil (JK)
dan Simpangan Kuartil (SK) 2
4. Simpangan Mutlak Rata-rata (Mean Absoulut Deviation)

Data Tunggal
Mengukur seberapa besar n
penyimpangan setiap data
pada nilai rata - rata x i x
MD  i 1
n
Data Berdistribusi
n
Data Freki (f)

 f x x i i
50 – 59 8

MD  i 1
60 – 69 10
f i 70 – 79 16
Contoh
80 – 89 15
Dari data pada contoh
sebelumnya, Tentukan nilai 90 – 99 10
simpangan mutlak rata-ratanya 100 – 109 8
110 - 119 3
5. Varians (Ragam)

Varians adalah rata-rata dari kuadrat pemyimpangan data


terhadap rataan data
Data tunggal (Tak berdistribusi frekuensi)
2

 x  x 
n
 m
2   n
n  xi     xi 
2
i
s2  i 1
  i 1   i 1 
n 1 n(n  1)
Data berkelompok (Berdistribusi frekuensi)
2 2

 f x  x 
 2  
n 2 n n

i i
n  f i xi     f i xi 
s i 1
  i 1   i 1 
n 1 nn  1
6. Deviasi Standart/ simpangan Baku

Akar dari ragam/ varians data

Data tunggal (Tak berdistribusi frekuensi)


2

 x  x 
n
 m
2  
n
n  xi     xi 
2
i
s i 1
  i 1   i 1 
n 1 n(n  1)
Contoh

Dari data pada contoh sebelumnya, Tentukan nilai simpangan


mutlak rata-ratanya. (3 kg, 4 kg, 5 kg, 3 kg, 6 kg, 4 kg, 5 kg, 4
kg, 6kg, 7 kg
Data berdistibusi frekuensi
2 2

 f x  x 
 2  
n 2 n n

i i
n  f i xi     f i xi 
s i 1
  i 1   i 1 
n 1 nn  1
Contoh Data Frek (f)

50 – 59 8
Dari data pada contoh sebelumnya,
60 – 69 10
Tentukan nilai simpangan mutlak
rata-ratanya 70 – 79 16
80 – 89 15
90 – 99 10
100 – 109 8
109 - 119 3
Langkah-langkah menyusun daftar distribusi Frekuensi

1. Tentukan jangkauan data (J) = Data terbesar – Data terkeci


2. Tentukan banyak kelas (k) dengan menggunakan rumus k = 1
+ 3,3log(n). dengan n adalah banyak data. (umnya banyak
kelas sekitar 5 – 20 ).
3. Interval kelas dipilih sedemikian rupa sehingga seluruh data
harus ikut tesertakan.
4. Setiap data hanya sekali dimasukkan dan hanya satu kelas.
5. Lebar setiap kelas adaah keliapatan 5, 10, 100 . . ., 1000 dst.
6. Jika mungkin , interval kelas dipilih sedemikian rupa sehinga
nlai tenah kelasnya bersesuai denan nilai data terkonsentrasi.
PENYAJIAN DATA

Berikut ini data massa (gram) kubus beton berukuran 15 cm


yang dibuat oleh 100 orang mahasiswa
1171 1186 1264 1205 1316 1437 1185 1150 1338 1290
1042 1110 1192 1196 1406 1161 1492 1170 1258 1152
1218 1181 1273 1020 1042 1136 1233 1158 1233 1312
1141 1040 1217 1175 1273 1163 1235 931 1270 1246
1298 1185 1051 1218 1303 1055 1081 1162 1333 1285
1083 1197 1146 1231 923 1303 1302 1249 1368 1327
1225 1095 1051 1250 1021 1152 1482 1028 1341 1106
939 1124 1200 1058 1449 1094 1254 1160 1141 1062
1077 1065 1141 1416 1055 1399 924 1361 1216 1289
1275 1464 1133 1208 1314 1209 1146 1274 1156 1090
Distribusi Normal
(Distribusi Probabilitas Kontinyu)
Kurva Normal dan Variabel Random
Normal
 Distribusi probabilitas kontinyu yang terpenting
adalah distribusi normal dan grafiknya disebut
kurva normal.
 Variabel random X yang distribusinya berbentuk
seperti lonceng disebut variabel random
normal.

 

 x
Sifat kurva normal, yaitu :
 Kurva mencapai maksimum pada x  
 Kurva setangkup terhadap garis tegak yang
melalui x  
 Kurva mempunyai titik belok pada x    
 Sumbu x merupakan asimtot dari kurva
normal
 Seluruh luas di bawah kurva, di atas sumbu x
adalah 1
DISTRIBUSI NORMAL
Sifat-sifat distribusi normal :
◦ Bentuknya menyerupai lonceng dengan sebuah puncak
◦ Nilai rata-rata (mean) pada distribusi normal akan
terletak ditengah-tengah dari kurve normal.
◦ Bentuknya simetris dengan nilai mean = median =modus
◦ Ujung masing-masing sisi kurve sejajar dgn sumbu
horisontal dan tidak memotong sumbu horisontal tsb.
◦ Sebagian besar data ada ditengah-tengah dan sebagian
kecil ada pada masing-masing sisi/tepi.
◦ 68% data berada dalam jarak ± 1 standar deviasi ,
95% data berada dalam jarak ± 2 standar deviasi,
99% data berada dalam jarak ± 3 standar deviasi.
Distribusi Normal
 Variabel random X berdistribusi normal,
dengan mean dan variansi mempunyai
fungsi densitas
1  ( x   ) 2 ( 2 2 )
n( x; , )  e   x  
 2

 Mean dan Variansi distribusi normal


luas daerah di bawah kurva dinyatakan dengan :
 P(x1  X  x 2 )

x
X1  X2

x2 x2
1  ( x   ) 2 ( 2 2 )
P( x1  X  x 2 )   n( x;, )dx   e dx
x
 2 x
1 1


1  ( x   ) 2 ( 2 2 )
P(   X   )  
 2  
e dx  1
Distribusi Normal Standar

apabila variabel X ditransformasikan


dengan substitusi Z  x  

 maka :
z2 1 z2 1 z2
1  z2 1  z2
P(z1  Z  z 2 ) 
 2  e 2 dz 
2  
e 2 dz  n (z;0,1)dz
z1 z1 z1

x
ternyata substitusi Z

menyebabkan distribusi normal n (z; , ) menjadi
n( z;0,1) , yang disebut distribusi normal standar.
 Karena transformasi ini, maka selanjutnya
nilai
P(x1  X  x 2 )
ini dapat dihitung dengan menggunakan
tabel distribusi normal standar.
Contoh :
1. Diketahui data berdistribusi normal dengan
mean  = 55 dan deviasi standar = 15
a) P(55≤x≤75) =

=
= P(0≤Z≤1,33)
= 0,4082 (Tabel)
Atau

Tabel  A = 0,4082
b) P(60≤x≤80) =
= P(0,33≤Z≤1,67)
= P(0≤Z≤1,67) – P(0≤Z≤0,33)
= 0,4525 – 0,1293 = 0,3232

Z1 = = 0,33  B = 0,1293

Z2 = = 1,67  A = 0,4525
C = A – B = 0,3232
c) P(40≤x≤60)= A + B

=
= P(-1,00≤Z≤0,33)
= P(-1,00≤Z≤0) + P(0≤Z≤0,33)
= 0,3412 + 0,1293
= 0,4705
Atau : Z1 = = -1,00
 A = 0,3412
Z2 = = 0,33
 B = 0,1293
d) P(x ≤ 40) = 0,5 – A
= 0,5 – 0,3412
= 0,1588

e) P(x ≥ 85)

f) P(x ≤ 85) = 0,5 + A


= 0,5 + 0,4772
= 0,9772
Contoh.
Nilai rata-rata mata kuliah statistik dari 200 orang
mahasiswa adalah 6 dengan standar deviasi 2. Berapa
jumlah mahasiswa yang mendapat nilai 8 keatas?
jawab :
( x   ) (8  6)
z  1
s 2
 Dengan melihat tabel kurve normal dapat dilihat bahwa
luas daerah 0 sampai dengan 1 adalah 34,13 %
(prosentase jumlah mahasiswa yang nilainya 6 sampai 8)
 Jadi prosentase mahasiswa yang nilainya di atas 8 adalah
50% - 34,13% = 15,87%
 Dengan demikian jumlah mahasiswa yang nilainya di atas
8 adalah 200 x 15,87% = 31,74 = 32 orang.
Contoh
 Setelah dimulainya suatu program pelestarian energi,
PLN mencatat bahwa penghematan penggunaan listrik
yang dilakukan oleh para pemakai di daerah tertentu
rata-rata adalah 10,4 KWH setiap bulannya dengan
standar deviasi 7,8 KWH. Apabila rekening untuk
seseorang pelanggan dipilih secara acak. Hitunglah
probabilitanya:
1. Penghematan listrik yang digunakan lebih dari 5
KWH
2. Penghematan listrik yang digunakan antara 5-15
KWH.
3. Penghematan listrik yang digunakan kurang dari 5
KWH
Quiz.
Ujian negara statistik pada akhir tahun 1990 diikuti sebanyak
2.000 peserta dengan rata-rata nilai ujian=58 dari
variansi=100. Bila distribusi nilai ujian dianggap berdistribusi
normal, maka hitunglah probabilitas :
a) Peserta yang memperoleh nilai (Xi  70)
b) Bila nilai ujian untuk lulus=53,5 maka berapa persen yang
tidak lulus
c) Bila terdapat 5 peserta yang memperoleh nilai A, maka
berapa nilai minimal (terendah) untuk memperoleh nilai A
Quiz.
The fill volume of an automated filling machine used for filling
cans of carbonated beverage is normally distributed with a
mean of 12.4 fluid ounces and a standard deviation of 0.1 fluid
ounce.
(a) What is the probability a fill volume is less than 12 fluid
ounces?
(b) If all cans less than 12.1 or greater than 12.6 ounces are
scrapped, what proportion of cans is scrapped?
(c) Determine specifications that are symmetric about the
mean that include 99% of all cans.
Example Settlement of bridge foundations
A proposed bridge across a stream is supported at the two
ends and on a center pier. Although the design allows for
relative settlements of the foundations, the engineer needs to
keep these within limits. Settlements caused by the sum of
numerous dead loads and impacts of moving vehicles may be
assumed to be normally distributed, with the variability arising
from the effects on the soil by the foundations. By correlating
with results of tests on similar structures and soil conditions,
the means and standard deviations of the settlements are
estimated at the left end, center pier, and right end as 3.0, 5.0,
and 3.0 cm and 1.0, 1.5, and 1.0 cm, respectively, with the
higher values pertaining to the foundation of the center pier.
It is also assumed as an initial approximation that the
settlements are independent.
(a) What is the probability that the maximum settlement is in
excess of 7.5 cm ?

(b) Specify the maximum relative settlement of the center pier for
which the engineer should design on the basis that this will
be exceeded with a probability of 0.0001
Distribusi Gamma &
Eksponensial
(Distribusi Probabilitas Kontinyu)
Distribsi Gamma
Distribusi Gamma dan Eksponensial memaikan peran
yang sangat penting di bidang teori antrian dan teori
keandalan (reliabilitas). Distribusi Eksponensial merupakan
keadaan khusus dari distribusi gamma. Distribusi gamma
mendapat namanya dari fungsi gamma yang sudah dikenal luas.
Fungsi Gamma didefenisikan sebagai ;
~
    x 1e  x dx, untuk x  0
Untuk 0
 
x x
  1  (1)   e dx  e  1
0
Jadi 0
(1)  1

49
Sifat – sifat fungsi Gamma
1. (n  1)  n.(n)
2.  12   
3. (n)  (n  1)!
Jika X suatu variabel acak berdistribusi Gamma dengan
parameter α > 0, dan β > 0, maka fungsi probabilitasnya
dinyatakan dengan
 1  1  x / 
  x e ,x 0
f ( x)    ( )

 0, untuk x yang lain
Mean dan variansi dari fungsi Gamma dengan parameter α
> 0, dan β > 0 adalah
Mean    Variansi    2 2
Contoh
Komsumsi bahan bakar harian dari suatu perusahaan
penerbangan dalam jutaan galon, dianggap berdistribusi
Gamma dengan α = 3, β = 1.
(a) Berapa peluang komsumsi bahan bakar kurang dari 1 juta
galon.
(b) Andaikan kapasitas penyimpanan bahan bakar hanya 2
juta galon. Berapa peluang bahwa persedian tersebut tidak
akan cukup untuk menyuplai kebutuhan bahan bakar
penerbangan.
Distribusi Eksponensial

Variabel random Eksponensial sering digunakan untuk


menggambarkan masa pakai (lifetime) dari komponen elektronika
Jika X suatu variabel acak kontiniu berdistribusi Eksponensial
dengan parameter β > 0, maka fungsi kepadatan
probabilitasnya dinyatakan dengan

 1 x / 
 e
f ( x)    ,x 0

0, untuk x lainnya
Mean dan variansi dari fungsi distribusi Eksponensial
dengan parameter β > 0 adalah

Mean    Variansi   
2 2
Kurva Distribusi Eksponensial
Contoh
Waktu operasional (dalam jam) dari suatu mesin pembangkit
berdistribusi eksponensial dengan β = 160. Berapa peluang
generator jenis ini
(a) beroperasi kurang dari 40 jam ?
(b) beroperasi antara 60 sampai 160 jam ?
(c) mampu beroperasi lebih dari 200 jam ?
Coba
Perusahaan alat olahraga mengembangkan jenis barang
pancing sintetik yang diklaim mempunyai rata-rata kekuatan
8 kg dan simpangan baku 0,5 kg. Telah diketahui bahwa
dengan sampel 50 pancing sintetik rata-rata kekuatannya
adalah 7,8 kg. Dengan taraf signifikasi sebesar 0,01, Ujilah
hipotesis bahwa rata-rata populasinya tidak sama dengan 8 kg
?
Langkah-langkah menjawab soal diatas adalah sebagai
berikut.
SOAL 1
Di sebuah kompleks perumahan “ Sederhana dan Bahagia” petugas PLN
mencatat perubahankonsumsi/penggunaan listrik sebagai dampak dari
perubahan tegangan (dari 110v menjadi 220v).Sebelum ada perubahan
tegangan, konsumsi listrik rata-rata untuk setiap pelangan per bulan
adalah84Kwh. Setelah terjadi perubahan tegangan menjadi 220v, diadakan
survei ke 100 pelanggan dikompleks tersebut. Hasilnya menunjukkan
bahwa konsumsi listrik rata-rata memiliki peningkatanmenjadi 86.5Kwh
dengan standar deviasi 14Kwh. Berdasarkan data tersebut, ujilah pendapat
yangmenyatakan bahwa perubahan tegangan tersebut mempunyai
pengaruh kuat terhadap peningkatankonsumsi listrik di kompleks tersebut.
(asumsi α=5%)
JAWAB
H0 : μ =
Contoh Tabel di bawah ini menunjukkan debit maksimum tahanan sungai.
Lakukan uji hipotesis debit rata-rata tahanan sungai tersebut adalah
650 m3/s dan dan variansinya 4500 m6/s2

Anda mungkin juga menyukai