Anda di halaman 1dari 55

1 Pendahuluan


Definisi Statistik

Parameter dan Variabel

Sampel dan Populasi

Deskriptif dan Inferensi

Aplikasi Statistik dalam Ilmu Teknik

ARIEF L.N – GD UNDIP


Probabilitas
• Harga angka yang menunjukan seberapa besar
kemungkinan bahwa suatu peristiwa akan
terjadi
• Probabilitas yang rendah menunjukan
kemungkinan sangat kecil bahwa peristiwa itu
akan terjadi.
• E.g. Peramal cuaca meramalkan kurang dari
10% kemungkinan akan terjadi hujan.
Mengapa kamu mau di
Tenang aja, dia barusan operasi sama dokter Tukul,
mengoperasi 9 pasien khan track recordnya
dan semuanya meninggal menunjukan 9 dari 10
jadi aku aman pasiennya meninggal saat
dioperasi sama dia
Probabilitas yang kurang tepat
• ….. dari 10 murid SMU di Yogyakarta pernah
melakukan hubungan seksual (LKIR, 2000)
• 2 dari 3 pria Jakarta pernah selingkuh (Jakarta
Jakarta, 90-an)
• 7 dari 9 wanita menggunakan pembalut wanita
Charm (Iklan TV, 2006)

Sama-sama bombastis dengan akibat yang berbeda


“Shampo Sleeky”.
9 dari 10 wanita
memakainya
Sejarah
• Kata statistics berasal dari bahasa Latin statisticum
collegium (council of state) dan dari bahasa Italia
statista (statesman or politician)
• Di Jerman, Gottfried Achenwall (1749),
digunakan untuk menganalisa data tentang hal-hal
yang berhubungan dengan negara
• Di Inggris, Sir John Sinclair, untuk mendata sesuatu
yang akan digunakan pemerintah misal: sensus
penduduk, menyediakan informasi tentang populasi
Definisi

STATISTIK
Bagian dari matematika yang mempelajari
tentang cara mengumpulkan, mengklasifikasikan,
meringkas, menyajikan, menginterpretasikan, dan
menganalisa data untuk mendukung pengambilan
kesimpulan yang valid
Penggunaan Statistik (2 Kategori)

Descriptive Statistics 
Inferential Statistics
 Collect  Predict and forecast
 Organize values of population
 Summarize parameters
 Display  Test hypotheses about
 values of population
Analyze
parameters
 Make decisions
Parameter
Bilangan yang menggambarkan karakteristik dari
suatu populasi

Contoh 5:
Seandainya dari pengukuran tinggi badan seluruh
(populasi) mahasiswa Teknik Mesin diperoleh
nilai rata-rata tinggi badan adalah 165 cm,
maka 165 adalah sebuah parameter.
Variabel
Suatu simbol (lambang) yang dapat bernilai
berapapun dari sekumpulan nilai yang telah
dijelaskan terlebih dahulu.

2 jenis variabel:

Qualitative - 
Quantitative -
Categorical or Measurable or
Nominal: Countable:
 Color  Temperatures
 Gender  Number of childs
 Nationality  Number of points scored
on a 100 point exam
Diskrit vs Kontinyu
Variabel kontinyu : variabel yang secara teoritis
bisa bernilai berapapun di antara dua nilai yang
diketahui. Sedangkan yang tidak bisa disebut
variabel diskrit
Contoh 7:
Variabel N yang menyatakan jumlah anak dalam sebuah
keluarga adalah variabel diskrit, karena hanya bisa
bernilai 0, 1, 2, 3, 4, 5, 6.
Variabel r yang menyatakan radius sebuah ban mobil
adalah sebuah variabel kontinyu, karena bisa bernilai
(dalam cm): 50; 50,2; 50,3; dst, tergantung dari tingkat
keakuratan pengukurannya
Diskrit vs Kontinyu
Data kontinyu:
data yang bisa digambarkan dengan suatu
variabel kontinyu
Data diskrit:
data yang bisa digambarkan dengan variabel
diskrit
Secara umum, data kontinyu diperoleh dari suatu
pengukuran (measurement) sedangkan data
diskrit diperoleh dari pencacahan
(enumeration/counting)
Skala Pengukuran
• Nominal Scale - groups or classes
Gender
• Ordinal Scale - order matters
Ranks
• Interval Scale - difference or distance
matters – has arbitrary zero value.
Temperatures (Fahrenheit)
• Ratio Scale - Ratio matters – has a natural
zero value.
Salaries
Sampel dan Populasi

Population (N) Sample (n)


Sampel dan Populasi
POPULASI
Kumpulan dari keseluruhan
pengukuran, objek atau
individu yang sedang
dikaji.

Penelitian tentang profil fisik


penduduk Amerika, populasi
yang diteliti antara lain
populasi tinggi dan populasi
berat badan dari penduduk
Population (N) Amerika Sample (n)
Sampel dan Populasi
SAMPEL
Sebagian atau subset
(himpunan bagian) dari
suatu populasi.

Untuk memudahkan penelitian


tentang profil fisik penduduk
Amerika, digunakan sampel
tinggi dan populasi berat
badan, masing-masing 100
orang Population (N)
dari tiap negara bagian. Sample (n)
Pemilihan sampel
1. Judgment sample
Pemilihan didasarkan kepada pendapat satu
orang atau lebih yang cukup kompeten
untuk mengidentifikasi hal-hal pada sampel
yang memberikan karakteristik populasi
Pemilihan sampel
2. Probability sample
a. simple random sample (sistem acak)
b. systematic sample (diurutkan, dan ditentukan
satu nomor sebagai titik awal sampling)
c. stratified sample (dibagi dalam kelompok yang
relatif homogen)
d. cluster sample (dibagi dalam kelompok
berdasarkan area atau cluster)
Statistik Deskriptif/Deduktif
Tahapan statistik yang meliputi kegiatan
mengumpulkan, mengklasifikasikan,
meringkas, menginterpretasikan dan
menyajikan data dari suatu kelompok
yang terbatas, tanpa menganalisis dan
menarik kesimpulan yang bisa berlaku
bagi kelompok yang lebih luas.
Statistik Inferential/Induktif
Proses pengambilan kesimpulan mengenai
parameter populasi berdasarkan
informasi yang diperoleh dari sampel.

Karena pengambilan kesimpulan dengan


cara ini tidaklah mutlak kepastiannya,
maka kata “probabilitas” sering
digunakan dalam menyatakan
kesimpulannya, yang dinyatakan dalam
“derajat kepercayaan” (confidence level)
Nilai pada populasi
yang dikaji Proses inferensi
Nilai pada sampel
yang dipilih

.
Pemilihan Sampel

Parameter Perkiraan mengenai Statistik


(tidak diketahui) parameter populasi (diketahui)

“A statistic is a numerical descriptive measure computed from sample data”


Metode yang digunakan dalam
inferential statistics

• ESTIMASI: sampel digunakan untuk


mengestimasi suatu parameter dan dibuatlah
suatu confidence interval tentang estimasi
tersebut
• Hypothesis testing: untuk menentukan apakah
data tersebut mempunyai alasan yang kuat
untuk ditolak atau diterima.
Parametrik vs Non-Parametrik
• Metode parametrik: metode yang digunakan
untuk mendapatkan nilai-nilai dari parameter
seperti mean, varians dsb dengan menggunakan
data dari sampel.
• Metode non parametrik: metode yang khususnya
digunakan jika ukuran sampel terlalu kecil
sehingga distribusi sampling dari statistik tidak
mendekati distribusi normal dan ketika bentuk
distribusi populasi asal sampel tersebut tidak
dapat diasumsikan.
Aplikasi statistik dalam bidang teknik

a. Pencegahan kegagalan dalam suatu design


mesin/proses
Mencegah terjadinya failure dengan
membuat elemen2 secara memadai
Failure terjadi jika suatu beban melebihi
daya tahan material terhadap beban
tersebut.
Contoh a:

Seorang perancang elemen mesin akan


menggunakan baja jenis SAE 4340 yang
menurut standar memiliki teg mak 100.000
psi.
Perancang harus menyadari bahwa dalam
prakteknya baja yang dipakai tidak akan
mempunyai kekuatan teg. 100.000 psi.
Contoh a:
Teg. Maks. Berkisar 85.000 – 115.000 psi.
Kekuatan yang pasti dari elemen mesin itu tidak
akan bisa diketahui tanpa melakukan destructive
test terhadap elemen tersebut.
Jadi teg maks dari bahan
tersebut adalah sesuatu yang
belum pasti (uncertain) dan
dalam hal ini statistik diterapkan
untuk mengetahui probabilitas /
kemungkinan bahan tsb
memiliki teg dalam kisaran nilai
yang ditentukan
Contoh a:
Ukuran/dimensi elemen mesin itu juga memiliki
ketidakpastian.
Jika spesifikasi ukurannya 1,25+0,05cm, maka
elemen2 mesin yang berukuran antara 1,2 sampai 1,3
cm dapat digunakan.

Ketidakpastian ukuran ini


sudah pasti akan
mempengaruhi pula
ketidakpastian kekuatan
elemen mesin tsb.
Contoh a:
Banyak situasi pembebanan sesungguhnya
menunjukkan penyimpangan yang cukup besar, mis.
tidak ada yang bisa dengan tepat memperkirakan
beban kejut yang ditanggung oleh sebuah pegas
suspensi sebuah mobil karena guncangan di jalan.

Statistik dapat
menggambarkan situasi
seperti tsb secara kuantitatif
berupa nilai rata-rata dan
dispersi atau penyebaran di
sekitar nilai rata-rata tsb.
Aplikasi statistik dalam bidang teknik

Analisis eksperimen teknik


Penerapan statistik dalam menentukan
ketidakpastian data yang diukur, merencanakan
eksperimen dengan jumlah data yang signifikan
dan memadai namun tetap dengan tenaga dan
biaya yang sekecil-kecilnya dan menguji hipotesa
secara rasional.
Ketidak pastian hasil suatu eksperimen akibat
ketidak akuratan dalam pengukuran dibedakan
menjadi: kesalahan sistematik dan kesalahan acak.
Aplikasi statistik dalam bidang teknik

Kesalahan sistematik akan terus berulang terjadi


apabila pengukuran diulang kembali. Kesalahan
ini bisa dihilangkan dengan cara mengkalibrasi
instrumen pengukur dengan sebuah standar
yang lebih akurat.
Kesalahan acak lebih menunjukkan nilai yang
tersebar.
Summary Measures: Population Parameters
Sample Statistics


Measures of Central 
Measures of Variability
Tendency  Range
Median  Interquartile range
Mode  Variance
Mean  Standard Deviation


Other summary
measures:
 Skewness
 Kurtosis
Measures of Central Tendency
or Location

Median  Middle value when


sorted in order of
magnitude
 50th percentile

Mode  Most frequently-


occurring value

Mean  Average
Measures of Variability or Dispersion


Range
 Difference between maximum and minimum values

Interquartile Range
 Difference between third and first quartile (Q3 - Q1)

Variance
 Average*of the squared deviations from the mean

Standard Deviation
 Square root of the variance

Definitions of population variance and sample variance differ slightly.
Example - Range and Interquartile Range (Data from
Example 1)
Sorted
Sales Sales Rank Range
9 6 1 Minimum Maximum - Minimum =
6 9 2
12 10 3 24 - 6 = 18
10 12 4
13 13 5
15 14 6 First Quartile Q1 = 13 + (.25)(1) = 13.25
16 14 7
14 15 8
14 16 9 Interquartile Range
16 16 10
17 16 11 Q3 - Q1 =
16 17 12 18.75 - 13.25 = 5.5
24 17 13
21 18 14
22 18 15
18 19 16 Third Quartile Q3 = 18+ (.75)(1) = 18.75
19 20 17
18 21 18
20 22 19
17 24 20 Maximum
Variance and Standard Deviation
Population Variance Sample Variance
n
N

å(x - m) 2 å(x - x) 2

s = i =1
2

s 2 = i=1
N
(n - 1)
( x) ( )
2 2
N n
å åx
N n
i =1
åx - 2 i =1 åx - 2

= i=1 N =
i =1
n
N (n - 1)
s= s 2

s= s
2
Calculation of Sample Variance
x xx (x  x) 2 x 2
n

 (x  x)
2
378.55
6 -9.85 97.0225 36 s 
2 i 1

9 -6.85 46.9225 81 n  1 (20  1)
10 -5.85 34.2225 100
12 -3.85 14.8225 144 378.55
13 -2.85 8.1225 169
  19.923684
19
14 -1.85 3.4225 196 2
14 -1.85 3.4225 196  n x
15 -0.85 0.7225 225 n  i 1 
x 
2
16 0.15 0.0225 256
16 0.15 0.0225 256 
i 1 n
16 0.15 0.0225 256 n  1
17 1.15 1.3225 289
17 1.15 1.3225 289 317 100489
2

18 2.15 4.6225 324


5403  5403 
 20  20
18 2.15 4.6225 324
19 3.15 9.9225 361 20  1 19
20 4.15 17.2225 400
5403  5024.45 378.55
21 5.15 26.5225 441    19.923684
22 6.15 37.8225 484 19 19
24 8.15 66.4225 576
s  s  19.923684  4.46
2

317 0 378.5500 5403


Group Data and the Histogram

Dividing data into groups or classes or
intervals

Groups should be:
Mutually exclusive
• Not overlapping - every observation is assigned to
only one group
Exhaustive
• Every observation is assigned to a group
Equal-width (if possible)
• First or last group may be open-ended
Frequency Distribution

Table with two columns listing:
 Each and every group or class or interval of values
 Associated frequency of each group
• Number of observations assigned to each group
• Sum of frequencies is number of observations
– N for population
– n for sample

Class midpoint is the middle value of a group or
class or interval

Relative frequency is the percentage of total
observations in each class
 Sum of relative frequencies = 1
Example 2: Frequency Distribution
xx f(x)
f(x) f(x)/n
f(x)/n
SpendingClass
Spending Class($)
($) Frequency
Frequency RelativeFrequency
Relative Frequency
(numberof
(number ofcustomers)
customers)

00totoless
lessthan
than100
100 30
30 0.163
0.163
100totoless
100 lessthan
than200
200 38
38 0.207
0.207
200totoless
200 lessthan
than300
300 50
50 0.272
0.272
300totoless
300 lessthan
than400
400 31
31 0.168
0.168
400totoless
400 lessthan
than500
500 22
22 0.120
0.120
500totoless
500 lessthan
than600
600 13
13 0.070
0.070

184
184 1.000
1.000

• Example of relative frequency: 30/184 = 0.163


• Sum of relative frequencies = 1
Cumulative Frequency Distribution
xx F(x)
F(x) F(x)/n
F(x)/n
SpendingClass
Spending Class($)
($) Cumulative
Cumulative Cumulative
Cumulative
Frequency
Frequency Relative
Relative
Frequency
Frequency

00totoless
lessthan
than100
100 30
30 0.163
0.163
100totoless
100 lessthan
than200
200 68
68 0.370
0.370
200totoless
200 lessthan
than300
300 118
118 0.641
0.641
300totoless
300 lessthan
than400
400 149
149 0.810
0.810
400totoless
400 lessthan
than500
500 171
171 0.929
0.929
500totoless
500 lessthan
than600
600 184
184 1.000
1.000

Thecumulative
The cumulativefrequency
frequencyof ofeach
eachgroup
groupisisthe
thesum
sumof
ofthe
the
frequenciesof
frequencies ofthat
thatand
andall
allpreceding
precedinggroups.
groups.
Histogram


A histogram is a chart made of bars of
different heights.
Widths and locations of bars correspond to
widths and locations of data groupings
Heights of bars correspond to frequencies or
relative frequencies of data groupings
Histogram Example
Frequency Histogram
Histogram Example
Relative Frequency Histogram
Skewness and Kurtosis

Skewness
– Measure of asymmetry of a frequency distribution
• Skewed to left
• Symmetric or unskewed
• Skewed to right

Kurtosis
– Measure of flatness or peakedness of a frequency
distribution
• Platykurtic (relatively flat)
• Mesokurtic (normal)
• Leptokurtic (relatively peaked)
Skewness
Skewed to left
Skewness
Symmetric
Skewness
Skewed to right
Kurtosis
Platykurtic - flat distribution
Kurtosis
Mesokurtic - not too flat and not too peaked
Kurtosis
Leptokurtic - peaked distribution
Methods of Displaying Data

Pie Charts
 Categories represented as percentages of total

Bar Graphs
 Heights of rectangles represent group frequencies

Frequency Polygons
 Height of line represents frequency

Ogives
 Height of line represents cumulative frequency

Time Plots
 Represents values over time
Pie Chart
Bar Chart
Fig. 1-11 Airline Operating Expenses and Revenues

12
Average Revenues

10
Average Expenses

American Continental Delta Northwest Southwest United USAir


A i r li n e
Frequency Polygon and Ogive

Relative Frequency Polygon Ogive

Cumulative Relative Frequency


0.3 1.0
Relative Frequency

0.2

0.5

0.1

0.0 0.0

0 10 20 30 40 50 0 10 20 30 40 50
Sales Sales

Anda mungkin juga menyukai