Anda di halaman 1dari 66

Metode Statistika

(STK211)
Pertemuan II
Statistika Dasar (Basic Statistic)

1
Konsep Peubah (Variables)
• Definisi
– Peubah (variable) merupakan karakteristik
dari objek yang sedang diamati, seperti
tinggi tanaman, jumlah produksi, kondisi
barang, dll

 Sesuatu yang diukur, dengan skala


pengukuran: nominal, ordinal, interval, atau
ratio

2
Variables

y = 4 + 5x

Constants

3
Variables…

• A variable is defined as anything that has a


quantity or quality that varies. The
dependent variable is the variable a researcher
is interested in.

• An independent variable is a variable believed to


affect the dependent variable.

4
• An independent variable
≈ experimental or predictor variable, is a variable
that is being manipulated in an experiment in
order to observe the effect on
a dependent variable, sometimes called
an outcome variable.
• Dependent variables. This variable is
predicted..
• Synonyms of dependent variables: Effect,
outcome, consequence, result,…

5
• The main groups of variables:
– categorical variables
– continuous variables.

• Type of variable:
– Dependent variables
– Independent variables

6
Parameter
• Suatu parameter adalah suatu karakteristik,
fitur, atau faktor terukur yang dapat membantu
dalam mendefinisikan suatu sistem tertentu

• Suatu paramter merupakan suatu elemen


penting dalam evaluasi atau penggambaran
suatu kejadian, projek, atau situasi

• Singkatnya, parameter dapat didefinisikan


sebagai ringkasan tentang suatu pupulasi

7
• Statistik adalah karakteristik matematis dari
sampel yang dapat digunakan sebagai penduga
parameter, karakteristik matematik dari pupulasi
yang darinya sampel diambil

• Contoh:
– Rata-rata tinggi tanaman sampel (X) dapat digunakan
sebagai penduga parameter rata-rata tinggi populasi
tanaman (μ) yang darinya sampel tersebut diambil

8
Population, sample, parameter, and statistics
Population vs Sample

10
Population vs Sample

11
12
Skala Pengukuran

• Skala pengukuran peubah: Nominal, ordinal,


interval, dan rasio
• Jenis data kuantitatif:
– Nominal: mengklasifikasikan
– Ordinal: mengklasifikasikan dan mengurutkan
– Interval: mengklasifikasikan, mengurutkan
dan membedakan
– Rasio: mengklasifikasikan, mengurutkan,
membedakan dan membandingkan

13
• Data nominal/diskrit:
– Angka yang berfungsi sebagai pengganti nama atau
sebagai sebutan saja; hanya merupakan lambang

– Disebut juga skala klasifikasi, karena ia hanya


merupakan angka-angka yang digunakan untuk
mengklasifikasikan suatu benda, sifat, atau jenis.
• Misalnya:
– Pria = 1 dan wanita = 2;
– Ya = 1 dan tidak = 0
– Jenis statistik yang cocok untuk mengolah data ini
adalah statistik deskriptif, misalnya perhitungan
frekuensi kemunculannya, persentase, mode, dan
proporsi
14
Data ordinal:
– Angka yang selain berfungsi sebagai pengganti
nama, juga menunjukkan peringkat.
– Disebut juga skala peringkat atau ranking.
– Misalnya:
• Peringkat 1, 2, dan 3, atau
• Baik = 3, sedang = 2, dan kurang = 1
– Bila dinyatakan dalam nilai, jarak satu nilai dengan
nilai lainnya tidak sama, atau tidak ada.
– Jenis statistik yang cocok untuk mengolah data ini
adalah statistik deskriptif, atau statistik non-
parametrik.

15
Data Interval:
– Data yang mempunyai ciri-ciri skala ordinal, jarak
antar bilangan diketahui, tetapi tidak memiliki nilai nol
absolut (nol yang sebenarnya).

– Jarak data interval bersifat pasti atau tetap.

– Contoh: skala termometer; air dengan suhu 0oC tidak


berarti air tersebut tidak memiliki suhu; Skala
penilaian: 0-100

– Semua operasi matematik dapat digunakan pada


data interval, misalnya perhitungan rata-rata,
simpangan baku, tingkat persentil, uji hipotesis, uji
korelasi, prediksi/regresi, dll. 16
Data rasio:
– Data yang memiliki ciri-ciri skala interval, namum
memiliki bilangan nol absolut,
– Berbentuk interval yang jaraknya dibandingkan
dengan nilai nol absolut.
– Contoh: hasil pengukuran berat. Misalnya, bayi A
memiliki berat badan 8 kg, dan bayi B memiliki
berat badan 4 kg, maka dapat disimpulkan bahwa
bayi A dua kali lebih berat daripada bayi B.

– Merupakan bilangan yang sebenarnya dan


semua operasi matematik dapat digunakan untuk
pengolahan data berskala ratio

17
Contoh skala pengukuran nominal, ordinal, interval dan rasio
No Nama Kelas Nilai Total Juara ke- Hadiah
1. Adit 3 233 1 Rp 25 jt
2. Irma 3 229 2 Rp 15 jt
3. Ika 4 228 3 Rp 10 jt
4. Desi 3 214 4 Rp 7,5 jt
5. Eko 4 212 50 buku
6. Uun 4 206 50 buku
7. Ani 5 200 50 buku
8. Lia 5 196 50 buku
9. Iin 6 182 50 buku
10. Ana 6 176 50 buku

Skala
Skala ordinal
Skala Skala Skala rasio
Nominal ordinal interval
18
Type of measurement

19
Statistika Deskripsi dan Eksplorasi
• Merupakan teknik penyajian dan peringkasan data
sehingga menjadi informasi yang mudah dipahami.

• Penyajian data dapat dilakukan melalui:


– Tabel
– Gambar (histogram, plot, stem-leaf, box-plot)

• Peringkasan data dinyatakan dalam dua ukuran


yaitu:
– Pemusatan (Median, Modus, Kuartil, Mean, dll)
– Penyebaran (Range, Interquartile Range, Ragam)

20
Tabular and Graphical Procedures

Data
Qualitative Data Quantitative Data

Tabular Graphical Tabular Graphical


Methods Methods Methods Methods

•Frequency •Bar Graph •Frequency


•Pie Chart •Dot Plot
Distribution Distribution •Histogram
•Rel. Freq. Dist. •Rel. Freq. Dist. •Scatter
•Percent Freq. •Cum. Freq. Dist. Diagram
Distribution •Cum. Rel. Freq.
•Crosstabulation Distribution
•Stem-and-Leaf
Display
•Crosstabulation 21
Jenis
No Tinggi Berat Agama
Kelamin

1 1 167 63 Islam

Ilustrasi I: 2 1 172 74 Islam

3 0 161 53 Kristen
Penyajikan Tabular 4 0 157 47 Hindu

5 1 165 58 Islam

6 0 167 60 Islam

7 1 162 52 Budha

8 0 151 45 Katholik

9 0 158 54 Kristen

10 1 162 63 Islam

11 1 176 82 Islam

12 1 167 69 Islam

13 0 163 57 Kristen

14 0 158 60 Islam

15 1 164 58 Katholik

16 0 161 50 Islam

17 1 159 61 Kristen

18 1 163 65 Islam

19 1 165 62 Islam

20 0 169 59 Islam

21 1 173 70 Islam

22
Penyajian Tabel
Tabel 1. Rekapitulasi menurut Agama
Agama Frekuensi Persen Tabel 2. Rekapitulasi menurut
jenis kelamin
Islam 13 61.90
Sex Frek. Persen
Kristen 4 19.05
Katholik 2 9.52 Laki-laki 12 57.14

Hindu 1 4.76 Perempuan 9 42.86


Budha 1 4.76

Tabel 3. Rata-rata Tinggi & Berat


Tinggi Berat
Laki-laki 166.25 64.75
Perempuan 160.56 53.89
Gabungan 163.81 60.10

23
Penyajian Grafik

43%
200.00 Laki-laki
57%
Perempuan
150.00
Laki-laki
Perempuan
100.00

10%
5% 5% 50.00

19% 61%
0.00
Tinggi Berat
Islam Kristen Katholik Hindu Budha

24
Ilustrasi II
Data Pengamatan Tanaman

Tinggi Diameter
Pohon Pohon Penyajian Dengan Tabel
Obs (m) (m) Varietas

1 3.5 0.25 A
Varietas Count CumCnt Percent CumPct
2 4.0 0.40 A
A 5 5 33.33 33.33
3 2.8 0.20 B B 3 8 20.00 53.33
4 3.2 0.21 C C 3 11 20.00 73.33
D 4 15 26.67 100.00
5 3.6 0.30 C

6 4.2 0.35 C

7 2.9 0.22 B

8 2.5 0.18 B

9 3.8 0.38 A

10 4.6 0.41 A

11 2.2 0.15 A

12 3.4 0.28 D

13 4.2 0.37 D

14 4.8 0.39 D

15 5.0 0.40 D
25
Penyajian Dengan Gambar

Pie Chart of Varietas


C ategory
A
B
C
D

Scatterplot of Tinggi Pohon (m) vs Diameter Pohon (m)

5.0

4.5
Tinggi Pohon (m)

4.0

3.5

3.0

2.5

2.0
0.15 0.20 0.25 0.30 0.35 0.40
Diameter Pohon (m)

26
Chart of Varietas

3
Count

0
A B C D
Varietas

Dotplot of Tinggi Pohon (m)

2.4 2.8 3.2 3.6 4.0 4.4 4.8


Tinggi Pohon (m)

27
Penyajian Dengan Stem-Leaf

28
29
Penyajian Dengan Stem-Leaf
Stem-and-Leaf Display: Tinggi Pohon (m), Diameter Pohon (m)

Stem-and-leaf of Tinggi Pohon (m) N = 15, Leaf Unit = 0.10

2 2
2 589
3 24
3 568
4 022
4 68
5 0

Stem-and-leaf of Diameter Pohon (m) N = 15, Leaf Unit = 0.010

1 58
2 012
2 58
3 0
3 5789
4 001

30
Example: Hudson Auto Repair

 Sample of Parts Cost for 50 Tune-ups

91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73

31
5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9
a stem
a leaf

32
33
Boxplot of Tinggi Pohon (m), Diameter Pohon (m)

3
Data

0
Tinggi Pohon (m) Diameter Pohon (m)

34
Beberapa ukuran pemusatan, yaitu:

1. Modus: Nilai pengamatan yang paling sering muncul


2. Median: Pengamatan yang ditengah-tengah dari data
terurut
3. Quartil: Nilai-nilai yang membagi data terurut menjadi 4
bagian yang sama
4. Mean: merupakan pusat massa (centroid) sehingga
simpangan kiri dan simpangan kanan sama besar

35
Beberapa ukuran penyebaran, yaitu:

1. Range: besarnya penyebaran data dari data


terkecil sampai data terbesar

2. Interquartile Range: besarnya penyebaran data


yang diukur mulai quartile satu sampai quartile tiga
atau besarnya penyebaran data dari 50%
pengamatan di tengah

3. Ragam: merupakan rata-rata jarak kuadrat setiap


titik pengataman terhadap nilai rata-rata (mean)

36
 Quartiles divide the sorted data into quarters.
Hence, for the first quartile (Q1) 25% of the data is
below it and 75% above it

 The second quartile (Q2) has 50% of the data


below it and 50% above it. This is also the
median.

 Finally, 75% of the observations are below Q3


while 25% are above

37
Q1 Q3

38
 Rata-rata (Mean)
◦ Populasi:
N

x i
 i 1
N
n


◦ Sampel:
xi
x i 1
n
39
 Ragam (Variance)
N
◦ Populasi :
 i
x 
i 1
 2

2 
N

n
◦ Sampel:

2
 x
i 1
i  x  2

s 
n1

40
 Simpangan baku (standard deviation)

◦ Merupakan akar dari ragam yaitu:


  simpangan baku populasi atau
 s simpangan baku sampel

41
 Standar Deviasi = Simpangan Baku
(standard deviation)
N
◦ Populasi :
 i
x 
i 1
 2

  2 
N

n
◦ Sampel:

2
 x
i 1
i  x  2

s s 
n1

42
 Wilayah (Range):
W=Xmax-Xmin

Antar Kuartil (Interquartile


 Jarak
range)
JAK=Q3-Q1

43
Contoh: Data hasil pengamatan jumlah sumbangan
perorangan (dalam Rp 1000,-) adalah 9, 10, 5, 9, 9, 7,
8, 6, 10 dan 11
 Nilai yang yang terjadi dengan frekuensi paling tinggi
(modus) = Rp 9.000,-

Contoh: Data hasil pengamatan frekuensi mahasiswa


nonton film per bulan: 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1 dan 4

 Dalam kasus ini terdapat 2 modus, yaitu 2 dan 4


(sebaran demikian dikatakan bimodus)

44
Contoh: Hasil pengamatan (telah diurutkan): 0, 1,
2, 3, 5, 5, dan 6

 Amatan yang ditengah (median) = 3

Contoh: Hasil pengamatan (setelah dirutkan): 1, 2,


3 dan 4

 Amatan yang ditengah (median) = (2+3)/2 = 2,5

45
 For example, suppose you want to find
the median for the following set of
data:74, 66, 69, 68, 73, 70

 First we arrange the data in an ordered


array: 66, 68, 69, 70, 73, 74

 Since there is an even number of data,


the average of the middle two numbers
(i.e. 69 and 70) is the median
(139/2=69,5)

46
 Generally the median provides a better
measure of location than the mean when
there are extremely large or small
observations (i.e., when the data are
skewed to the right or to the left

◦ If the median is less than the mean, the


data set is skewed to the right

◦ If the median is greater than the mean,


the data is skewed to the left

47
The median is
less than the
mean

The median is
greater than the
mean

48
Contoh: Data hasil pengamatan (setelah diurutkan)
adalah: 48, 49, 57, 61, 79, 80, 80, 81, 83 dan 90

 Q1=57
 Q2=79,5  Q2 tidak lain adalah median
 Q3=81

 Jangkauan antar kuartil (JAK)=Q3-Q1 = 81-57 = 24

49
Sample 1 97 98 99 100 101 102 103

Sample 2 49 50 51 100 149 150 151

Sample 3 100 200 250 100 197 198 199

50
IQR (Interquartile range) for sample 1:

 The median (Q2) is the 4th largest observation which is


100
 There are three data points below our median (97, 98,
99)
 The median (Q1) of these values is 98
 There are three data points above our median (101,
102, 103)
 The median (Q3) of these values is 102

 Hence, our IQR (JAK/Jangkauan Antar Kuartil) is Q3-Q1


= 102-98=4

51
Contoh: Data hasil  Rata-rata sampel,
pengamatan (setelah n

diurutkan) adalah: x i

48, 49, 57, 61, 79, x i 1


n
80, 80, 81, 83 dan
90 = 708/10 = 70,8

Hitung juga:
 Wilayah (Range),
- Varian
= 90 – 48 = 42
- Standar deviasi
(simpangan baku)
52
 Varian sampel,
n No. Xi X-bar (Xi-X-bar) (Xi-X-bar)^2
 xi  x 
2

1 48 70,8 -22,8 519,84


s2  i 1
n 1 2 49 70,8 -21,8 475,24
3 57 70,8 -13,8 190,44

= 2.140/(10-1)= 238 4
5
61
79
70,8
70,8
-9,8
8,2
96,04
67,24
6 80 70,8 9,2 84,64

 Standar Devisasi 7 80 70,8 9,2 84,64

(simpangan baku),
8 81 70,8 10,2 104,04
9 83 70,8 12,2 148,84

s = akar dari ragam 10 90 70,8 19,2 368,64

= 15,43
Rata-rata 70,8
Jumlah 708 2.140

53
 The Empirical Rule is applicable for approximately
mound-shaped distributions and relates X and s as
follows: (figures are “rule of thumb”)

 67% of all values within x s


 95% of all values within x  2s
 99% of all values within x  3s

 Values outside this latter range are often considered


unusual.

54
Distribusi Kemungkinan

Distribusi Normal

  2    2
Batas bawah tingkat kepercayaan 95% Batas atas tingkat kepercayaan 95%

Interval kepercayaan 95%

55
 Memberi informasi visual tentang lokasi, pencaran,
kemenjuluran, dan informasi tentang ekor sebaran
contoh

Q3
(atau JAK)
IQR

(Median)
Q2
Q1

56
1,5.IQR IQR
3,0.IQR
1,5.IQR 3,0.IQR

Extrem
Outlier Minor Lower
(pencilan) outlier adjacent Q1 Me- Q3 Upper Minor Extrem
value dian adjacent outlier Outlier
value (pencilan)

57
50 Days of Photocopier Usage

Day Usage Day Usage Day Usage


---------------------------------------------------------------------------------------------------------------------------------------------

1 500 18 360 35 150


2 420 19 310 36 140
3 440 20 320 37 130
4 480 21 290 38 150
5 450 22 290 39 130
6 460 23 270 40 110
7 450 24 250 41 90
8 420 25 240 42 80
9 410 26 250 43 90
10 405 27 250 44 70
11 380 28 230 45 20
12 360 29 240 46 50
13 360 30 220 47 40
14 370 31 190 48 20
15 350 32 150 49 30
16 320 33 170 50 30
17 350 34 120
58
Most commonly called boxplots.
(Remarks: L=Lower, U=Upper O=outlier, P=Point, IQR=Inter Quartile Range)

 Consist of a “five-number summary” and four “outlier points”


 min, Q1, Q2, Q3, max
 Inner LOP = Q1-1.5(IQR) Inner UOP = Q3+1.5(IQR)
 Outer LOP = Q1-3(IQR) Outer UOP = Q3+3(IQR)

59
For above Example:
 min = 20; max = 500; Q1 = 127.5; Q2 = 250 Q3 = 362.5
 IQR= 362.5-127.5=235

 Inner LOP = 127.5 - 1.5(235) = -225 copies (N/A)


 Outer LOP= 127.5 - 3.0(235) = -577.5 copies (N/A)
 Inner UOP = 362.5 + 1.5(235) = 715 copies
 Outer UOP= 362.5 + 3.0(235) = 1,067.5 copies

 NO OUTLIERS BY THESE MEASURES!

60
1. Dari hasil pengukuran ini: 0.0, 0.8, 1.0, 1.2, 1.3, 1.3, 1.4,
2.4, dan 4.6

 Tentukan median, modus, mean, varian, simpangan baku,


jangkauan kuartil
 Buat diagram stem-leaf
 Buat diagram box-plot (diagram kotak garis), dan jelaskan
bentuk sebarannya terutama dalam kaitan dengan
pencilannya (outlier)

2. Buat diagram box-plot data berikut: 12, 14, 10,


17, 23 dan 4. Jelaskan, apakah ada data yang
minor outlier atau ekstrem outlier!

61
Data Pengamatan Tanaman
Latihan 3
Diameter
 Buatlah diagram blox-plot Obs
Tinggi Pohon
(m)
Pohon
(m) Varietas

untuk tinggi pohon 1 3.5 0.25 A

2 4.0 0.40 A
 Tentukan apakah ada
3 2.8 0.20 B
data yang termasuk 4 3.2 0.21 C

kategori minor outlier? 5 3.6 0.30 C

6 4.2 0.35 C
 Tentukan apakah ada
7 2.9 0.22 B
data yang termasuk 8 2.5 0.18 B

kategori ekstrem outlier? 9 3.8 0.38 A

10 4.6 0.41 A

Boxplot of Tinggi Pohon (m), Diameter Pohon (m) 11 2.2 0.15 A


5

12 3.4 0.28 D
4

3 13 4.2 0.37 D
Data

2
14 4.8 0.39 D
1
15 5.0 0.40 D
0
Tinggi Pohon (m) Diameter Pohon (m)

62
Data Pengamatan Tanaman
Diameter Pohon
Obs Tinggi Pohon (m) (m) Varietas
1 3,5 0,25 A
2 4,0 0,40 A
3 2,8 0,20 B
4 3,2 0,21 C
5 3,6 0,30 C
6 4,2 0,35 C
7 2,9 0,22 B
8 2,5 0,18 B
9 3,8 0,38 A
10 4,6 0,41 A
11 2,2 0,15 A
12 3,4 0,28 D
13 4,2 0,37 D
14 4,8 0,39 D
15 5,0 0,40 D
Ukuran Pemusatan: Modus 0,40
Median 0,30
Mean (Rata-rata)
Ukuran Penyebaran: Min.
Max.
Range
q1
q2
q3
JAK atau IQR
Varian (Ragam)
Standar Deviasi
63
Data Pengamatan Tanaman
Diameter Pohon

Obs Tinggi Pohon (m) (m)


3,5 0,25
4,0 0,40
2,8 0,20
3,2 0,21
3,6 0,30
4,2 0,35
2,9 0,22
2,5 0,18
3,8 0,38
4,6 0,41
2,2 0,15
3,4 0,28
4,2 0,37
4,8 0,39
5,0 0,40

Ukuran Pemusatan: Modus 0,40


Median 0,30
Mean (Rata-rata)
Ukuran Penyebaran: Min.
Max.
Range
q1
q2
q3
JAK atau IQR
Varian (Ragam)
Standar Deviasi

64
1. Koopmans, L.H. 1987. Introduction to
Contemporary Statistical Methods 2nd ed.
Duxbury, Press. Boston.

STATISTICS:
Quantitative & Graphical Analysis

DEPARTMENT OF STATISTICS
REDGEMAN@UIDAHO.EDU OFFICE: +1-208-885-4410

DR. RICK EDGEMAN, PROFESSOR & CHAIR – SIX SIGMA BLACK BELT

65
1,5.IQR IQR
3,0.IQR
1,5.IQR 3,0.IQR

Extrem
Outlier Minor Lower
(pencilan) outlier adjacent Q1 Me- Q3 Upper Minor Extrem
value dian adjacent outlier Outlier
value (pencilan)

66

Anda mungkin juga menyukai