Pengantar
STATISTIKA DESKRIPTIF
ARIF RAHMAN
2
Industrial Engineering
..is concerned with the design, improvement, and installation of
integrated systems of men, materials, information, energy,
and equipments. It draws upon specialized knowledge and
skill in the mathematical, physical and social sciences
together with the principles and methods of engineering
analysis and design to specify, predict and evaluate the result
to be obtained from such systems
3
Engineering
Specify
Social Sciences Predict
Evaluate
Optimal
Result
Design
Integrated
Systems
Improvement Installation
4
Cybernetics,
Wireless Technology,
Nanotechnology,
Biotechnology
Revolusi Industri
Apakah ???
Internet of Things Cloud Technology
Big Data
9
Apakah ???
11
Apakah ???
Apakah ???
13
Tujuan Instruksional
Pada matakuliah ini:
1)Mahasiswa belajar tentang pemilihan sampel dalam observasi
atau eksperimen;
2)Mahasiswa belajar tentang statistika deskriptif dalam ukuran
numerik, format tabulasi dan grafis.
17
Referensi
Walpole, RE, Myers, RH, & Myers, SL, Probability and Statistics for Engineers
and Scientists, Prentice Hall
Hines, WW, Montgomery, DC, Goldsman, DM, & Borror, CM, Probability and
Statistics in Engineering, John Wiley & Sons
Montgomery, DC, & Runger, GC, Applied Statistics and Probability for
Engineers, John Wiley & Sons
Ross, SM, Introduction to Probability and Statistics for Engineers and
Scientists, Academic Press
Weiss, NA. Introductory Statistics, Addison-Wesley
Bluman, AG, Elementary Statistics: A Steb by Step Approach, McGraw-Hill
Arnab, R. Survey Sampling Theory and Applications, Academic Press
Scheaffer, RL, Mendenhall III, W, Ott, RL, & Gerow, K. Elementary Survey
Sampling, Cengage Learning
20
Referensi
21
LALU, darimanakah
kita akan MEMULAI
???
Faculty Group of
Laboratory of Quality Engineering&
Statistics & Reliability Engineering
Quality Engineering
29
Science Technology
Discovery Invention
Research Research
36
37
Apakah Statistika?
Terkait dengan data dan pengolahannya.
Alat bantu problem solving
Memiliki banyak alat dan metode, yang berbasis
matematika.
Bukan tongkat sihir dan bukan ramuan sihir
Kekeliruan dalam pengumpulan data dan/atau
penggunaan statistika dapat menghasilkan sampah
Membantu dalam menarik kesimpulan dalam deductive
reasoning dan inductive reasoning
38
Statistika Deskriptif
39
Statistika
STATISTIKA
40
Statistika
Statistika adalah cabang ilmu matematika yang
mempelajari metode ilmiah untuk mengumpulkan,
mengorganisasi, merangkum, menyederhanakan,
menyajikan, menginterpretasikan, menganalisa dan
mensintesa data (numerik atau nonnumerik) untuk
menghasilkan informasi dan/atau kesimpulan, yang
membantu dalam penyelesaian masalah dan/atau
pengambilan keputusan.
41
Statistika
Mengumpulkan data
Statistika
Probabilitas
given model, predict data
Model
Probabilitas Data
Observasi
Cabang Statistika
Statistika
Statistika Deskriptif
Cabang statistika yang mengorganisasi, merangkum,
menyederhanakan, menyajikan dan
menginterpretasikan data dalam ukuran numerik atau
tabulasi atau grafis yang memudahkan pemeriksaan
dengan cermat (perusal) untuk menghasilkan
informasi dan/atau kesimpulan.
Menunjukkan fitur dasar data ilmiah (scientific data)
dalam format yang teratur (manageable form) dan
ringkasan yang lebih sederhana (simpler summary).
45
Statistika Inferensia
Cabang statistika yang menganalisa atau mensintesa
data untuk menggeneralisasi sampel terhadap
populasi, mengestimasi parameter, menguji hipotesa,
menilai relasi, dan membuat prediksi untuk
menghasilkan informasi dan/atau kesimpulan.
Terdapat banyak alat bantu statistika (statistical
tools) yang dapat dipergunakan untuk menginferensi
populasi atau sistem yang menjadi sumber asal data
sampel
46
Sistem
Sistem merupakan suatu kesatuan
(dengan struktur tertentu) yang
terdiri dari sekumpulan elemen-
elemen (entitas atau subsistem)
yang saling berinteraksi (selaras
atau bertolak belakang,
bergabung atau terurai) secara
simultan dan terpadu (dengan
mekanisme tertentu) untuk
mewujudkan tujuan tertentu
dengan mendapatkan masukan
dan menghasilkan keluaran pada
lingkungan di luar batasan sistem
48
Sistem
49
System of Interest
System of Interest (SoI) adalah
sistem yang relevan dengan
lingkup studi fokus perhatian
peneliti.
Wider system or meta system
or super system adalah sistem
yang lebih luas di mana system
of interest menjadi bagian dari
sistem tersebut.
Narrower system or subsystem
adalah sistem yang lebih kecil
dan menjadi bagian dari system
of interest.
50
Populasi
Populasi atau semesta (universe) adalah set
lengkap observasi yang menjadi perhatian peneliti.
Populasi adalah grup keseluruhan unsur yang
menjadi fokus studi.
Populasi adalah total keanggotaan dari semua
elemen sistem yang relevan dengan lingkup batasan
permasalahan.
51
Populasi
Populasi (population) adalah himpunan semua objek,
percobaan, pengamatan, data, keluaran, atau nilai
yang memiliki kesamaan kondisi umum (common
state) dalam rentang (range) tertentu (finite atau
infinite) dengan parameter identik sesuai dengan
batasan permasalahan yang menjadi fokus studi
peneliti.
52
Sampel
Sampel (sample) adalah sejumlah observasi yang
diambil dari populasi
Sampel adalah beberapa unsur yang menjadi bagian
dari populasi
Sampel adalah sebagian anggota dari populasi
53
Sampel
Sampel diambil dari populasi yang sama.
Saat penarikan sampel, setiap anggota populasi
mempunyai peluang yang sama terpilih sebagai
sampel.
Sebaran sampel mengikuti pola distribusi populasi.
Sampel dapat merepresentasikan populasi.
54
SAMPLING
INFERENSI
Parameter : Statistik :
N (banyaknya anggota populasi), n (banyaknya anggota sampel),
μ (rata-rata populasi), ͞x (rata-rata sampel),
σ (simpangan baku populasi), s (simpangan baku sampel),
π (proporsi populasi) p (proporsi sampel)
55
Statistik
Statistik adalah sekumpulan data, angka atau bukan
angka, yang dimiliki sampel yang diperoleh melalui
observasi atau eksperimen yang terorganisasi dalam
daftar / tabel, atau terilustrasi dalam grafik / peta /
diagram, atau terrangkum dalam ukuran numerik.
Statistik adalah ukuran numerik yang merangkum
informasi dari sekumpulan data dari sampel untuk
merepresentasikan nilai tertentu.
57
Tipe Data
60
Data
Data adalah fakta mentah yang diperoleh langsung
dari proses pengumpulan, yang perlu diolah lebih
lanjut untuk menghasilkan informasi yang memiliki
makna spesifik bagi pihak yang berkepentingan.
Data adalah bentuk jamak dari datum.
Datum adalah satu unit fakta mentah yang diperoleh
dari proses pengumpulan, misalnya hasil pengukuran
dalam observasi atau eksperimen.
61
Tipe Data
Kuantitatif dan Kualitatif
Parametrik dan Nonparametrik
Nominal, Ordinal, Interval dan Rasio
Diskrit dan Kontinyu
Serentak dan Deret waktu
Tunggal dan Berkelompok
Tunggal dan Jamak
62
Tipe Data
Data Kuantitatif atau Numerical, data yang diperoleh dari
pencacahan, penghitungan, pengukuran atau penilaian dalam
format angka atau bilangan yang dapat diperbandingkan
Biner (0 atau 1) data logik (true/false), data tanggapan (yes/no,
accept/decline), data kegagalan (sukses/gagal, baik/rusak)
Bilangan Bulat Bil asli (1,2,...), Bil cacah (0,1,2)
Bilangan Nyata
...
63
Tipe Data
...
Data Kualitatif atau Categorical, data yang tidak bernilai
numerik.
Dikotomi
Pelabelan atau simbol
Klasifikasi atau stratifikasi
Penilaian verbal
64
Tipe Data
Data Parametrik, data kuantitatif yang mempunyai
sebaran variabel acak mengikuti pola distribusi
probabilitas dengan parameter tertentu (independent
and identically distributed random variables)
Data Nonparametrik, data yang tidak mempunyai
distribusi probabilitas (distribution-free) atau tiada
pengetahuan (sulit diperkirakan) mengenai distribusi
probabilitas populasinya
65
Tipe Data
Data Nominal, data yang hanya berupa simbol
(meski berupa angka) untuk membedakan nilainya
tanpa menunjukkan tingkatan
A=B;A≠B
Contoh: jenis kelamin, warna kulit, ras, suku bangsa,
agama, bentuk rambut
...
66
Tipe Data
67
Tipe Data
Data Ordinal, data yang mempunyai nilai untuk
menunjukkan tingkatan, namun tanpa skala yang
baku dan jelas antar tingkatan.
A>B;A<B
Contoh : Kelompok usia (bayi, anak-anak, remaja,
dewasa, manula), Tingkat pendidikan, Status
ekonomi, Tingkat kepentingan
...
68
Tipe Data
69
Tipe Data
Data Interval, data yang mempunyai nilai untuk
menunjukkan tingkatan dengan skala tertentu sesuai
intervalnya. Nilai nol hanya untuk menunjukkan titik
acuan (baseline).
A–B=C–D
Contoh : Temperatur, tingkat keasaman
...
70
Tipe Data
71
Tipe Data
Data Rasio, data yang mempunyai nilai untuk
menunjukkan tingkatan dengan skala indikasi rasio
perbandingan. Nilai nol menunjukkan titik asal ( origin)
yang bernilai kosong (null).
A = k.B
Contoh : Tinggi badan, Berat badan, Banyaknya orang,
dll
72
Tipe Data
73
Tipe Data
Data Diskrit, data yang nilainya tertentu (certain), jelas
(distinct), terpisah gap (separate), dan dapat tersusun di
daftar (listed) yang berada dalam interval tertentu,
meskipun bisa dengan batas tak hingga (misalnya: x = 1,
2, 3, ...).
Biasanya data hasil pencacahan atau penghitungan,
dalam angka bilangan cacah (whole numbers), misalnya
banyaknya orang. Meskipun ada pula data yang
menunjukkan ukuran spesifik, misalnya ukuran sepatu,
ukuran kemeja, ukuran celana.
74
Tipe Data
Data Kontinyu, data yang nilainya tersebar (any value at
any point), tersambung tiada gap (continuum), dan sulit
tersusun di daftar (cannot be listed) yang berada dalam
interval tertentu, meskipun bisa dengan batas tak hingga
(misalnya: x > 0).
Biasanya adalah data hasil pengukuran, dalam angka
bilangan nyata (real numbers), misalnya panjang meja,
volume cairan. Meskipun dapat pula dibulatkan, data
pengukuran yang lebih teliti juga masih mungkin
diperoleh, misalnya 2,5 cm ≈ 2,482468... cm.
75
Tipe Data
76
Tipe Data
Pengukuran Pengukuran
Data Diskrit Data Kontinyu
77
Tipe Data
Data serentak (cross sectional) adalah data yang
diperoleh dari observasi pada waktu yang sama atau
dalam jeda waktu yang tidak signifikan, karena
diasumsikan data tidak sensitif terhadap pergerakan
waktu.
Data deret waktu (time series) adalah data yang
diperoleh dari observasi dengan mempertimbangkan
pergerakan waktu, dan biasanya disertai dugaan
bahwa data dipengaruhi oleh waktu.
78
Tipe Data
Data tunggal (ungrouped data) adalah data mentah
yang belum terorganisasi dalam kelompok atau grup.
Data berkelompok (grouped data) adalah data yang
terorganisasi dalam kelompok atau grup.
Klaster (clustered data). Pengelompokan data berdasarkan kategori dari variabel
lain (yang terikat dengan data), sehingga data dalam satu klaster masih
heterogen, dan antar klaster bisa serupa atau beririsan.
Kategori (categorical data). Pengelompokan data berdasarkan kategori nominal
dari data itu sendiri, sehingga data dalam satu klaster sudah homogen, dan antar
klaster berbeda dan tidak beririsan.
Strata (stratified data). Pengelompokan data berdasarkan stratum atau kelas
berjenjang dari data mulai kelas terkecil hingga terbesar.
79
Tipe Data
80
Tipe Data
Pengendalian
Kualitas (Klaster)
Statistik
Data Berkelompok
Eksperimen satu faktor
dan Regresi Linier
(Kategori atau
Strata)
81
Tipe Data
Data tunggal (univariate data) adalah data yang
hanya merepresentasikan satu variabel.
Data jamak (multivariate data) adalah data yang
merepresentasikan pasangan atau himpunan dari
dua atau lebih variabel secara simultan dengan
mempertimbangkan hubungan antar variabelnya.
82
Tipe Data
ID A1 B1 A2 C1 B2 B3 A3 C2 B4 C3 B5 C4 A4 A5 A6 C5 B6 C6 C7 C8
Klaster A B A C B B A C B C B C A A A C B C C C
Warna H H C C B B H H M M H C B M C B M B C H
Intensitas S T T S S T T G S T T G T G S G S T G T
Masing-masing baris adalah data univariate Gabungan 2 atau lebih baris adalah data multivariate
Tipe Data
Plot data univariate
Pembulatan
Pembulatan terkadang dilakukan pada data sesuai dengan
tingkat presisi yang diharapkan.
Secara umum pembulatan dilakukan ke bilangan terdekat.
Angka > 5 dibulatkan ke atas dan angka < 5 dibulatkan ke
bawah.
Secara pesimistik, angka dibulatkan ke atas.
Secara optimistik, angka dibulatkan ke bawah.
Pembulatan terkadang perlu memperhatikan bahwa jumlah
total data hasil pembulatan tidak berubah dari jumlah total
data sebelumnya
88
Pembulatan
Fakta Pembulatan Pembulatan
Pengukuran Umum Berimbang
4,525 5 4
7,573 8 8
6,375 6 6
5,624 6 6
4,852 5 5
6,051 6 6
35 36 35
89
Pengumpulan Data
90
Pengumpulan Data
91
Ketelitian Pengukuran
Akurasi (accuracy), kesesuaian hasil pengukuran
terhadap nilai obyek sesungguhnya (bias kecil)
Presisi (precision), tingkat skala ketelitian pengukuran dari
alat pengukur, atau ketersebaran yang relatif mengumpul
(variansi atau deviasi kecil)
Keandalan (reliability), konsistensi kemampuan alat ukur
untuk mengukur obyek tanpa terpengaruh waktu atau lainnya
Kesahihan (validity), ketepatan hasil pengukuran yang
bebas dari kesalahan alat ukur, pengukur dan obyek ukur
94
Ketelitian Pengukuran
95
Ketelitian Pengukuran
Tidak presisi, akibat besarnya random error
menyebabkan deviasi yang besar, beresiko
pada galat tipe 2.
Tidak akurat, akibat besarnya systematic
error menyebabkan bias yang besar,
beresiko pada galat tipe 1.
Akurat dan presisi, bias dan deviasi kecil,
membutuhkan sampel sedikit.
96
Elemen Pengukuran
97
Elemen Pengukuran
Obyek yang diukur (measured objects), terutama
pada besaran yang dimiliki atau mewakilinya.
Orang yang mengukur (measuring operator)
Alat ukur (measuring instruments or devices),
termasuk skala dan satuannya.
Metode pengukuran (measurement methods)
Lingkungan saat pengukuran (environment), yang
mungkin mempengaruhi pengukuran
98
Kesalahan Pengukuran
Random error : kesalahan tak terkendali antar
pengukuran, karena faktor keacakan dari objek ukur,
operator, alat ukur, lingkungan atau noise lainnya.
Systematic error : kesalahan yang berulang dan
membiaskan hasil, karena kegagalan operator atau
alat ukur, kesalahan prosedur, pengaruh lingkungan
Illegitimate error : kesalahan insidental dan
menghasilkan outlier, karena keteledoran, keliru
kalkulasi, atau kesalahan lainnya
99
Kesalahan Pengukuran
100
Kesalahan Pengukuran
Unusual value (outlier), data yang sangat jauh dari
kumpulan data utama, karena illegitimate error
pengukuran atau mungkin sampel berasal dari
populasi lain (terdapat faktor yang berbeda).
Missing value, data relevan yang kurang atau tidak
lengkap, karena kealpaan pengukuran atau
pencatatannya, atau sebaran sampel kurang baik.
Bias, pergeseran data dari nilai yang sebenarnya,
karena systematic error pengukuran.
101
102
Sumber Data
Subyek observasi, yaitu pihak-pihak yang melakukan
pengukuran atau penghitungan.
Obyek observasi, yaitu elemen sistem yang akan
diobservasi.
Responden, yaitu pihak-pihak yang mengenal dan
berkepentingan dengan obyek observasi.
Hasil observasi, yaitu laporan observasi baik fakta
mentah atau yang telah diolah
105
Penanganan atas
Kesalahan pada Data
109
Penanganan Umum
Membuang data yang salah.
Memperbaiki faktor penyebab kesalahan.
Melakukan pengukuran ulang dengan dua (atau
lebih) sistem pengukuran (ada elemen yang berbeda)
Menggantikan dengan pengukuran pada sampel baru
dengan mengendalikan kondisi yang sama.
Menambahkan sampel baru.
110
Penanganan Bias
Jika karena alat ukur mengalami degradasi atau
deteriorasi, maka reset atau atur ulang alat ukur
(mungkin juga reparasi atau penggantian), kalibrasi
alat ukur dan lakukan pengukuran ulang.
Jika karena kelelahan, maka beristirahat yang cukup
sebelum melakukan pengukuran berikutnya.
Jika karena pengaruh lingkungan (misalnya suhu dan
tekanan udara, lokasi dan elevasi geografis, atau
faktor lainnya), maka lakukan konversi.
111
Penanganan Outlier
Jika terbukti dari populasi lain, buang data tersebut.
Jika diakibatkan oleh faktor khusus yang insidental
(misalnya ada kejutan atau lonjakan arus listrik abnormal,
ada impuritas, dan lainnya), buang data tersebut.
Jika diakibatkan oleh faktor umum (keacakan), maka
Jika membutuhkan informasi mengenai sebaran data,
pertahankan data tersebut, dan tambah pengukuran baru
Jika hanya membutuhkan informasi pemusatan data, gunakan
trimmed mean atau truncated mean.
112