Anda di halaman 1dari 19

Eksplorasi Data & Penyarian

Informasi

Disampaikan pada: Eka N Kencana


Sociometric Study Group
Kuliah Statistika – Pertemuan III Program Studi Matematika
di Program Studi Teknologi Pangan Trisna Darmayanti
Fakultas Teknologi Pertanian – UNUD Program Studi Teknologi Pangan

22 September 2021 Universitas Udayana


Sampling
Techniques The Big Picture

Populasi Sampel

Inference
Methods
Tipe Populasi
Populasi, berdasarkan jumlah anggotanya bisa dibedakan menjadi 2 tipe:
1. Finite Population, populasi yang jumlah anggotanya terhingga dan bisa
dihitung. Penelitian yang proses pengumpulan data dilakukan melalui kegiatan
survey, populasi yang menjadi fokus kajian umumnya populasi yang bertipe
adalah finite population;

2. Infinite Population: populasi yang jumlah anggotanya tak terhingga dan tidak
bisa dihitung. Penelitian yang proses pengumpulan data dilakukan melalui
percobaan (lapangan atau laboratorium), populasi yang menjadi fokus kajian
umumnya populasi yang bertipe adalah infinite population.
Alasan-alasan Melakukan Sampling
Terdapat sejumlah alasan dilakukan sampling:
1. Penghematan biaya: pengamatan yang dilakukan pada anggota sampel, juga
disebut survei; membutuhkan biaya yang jauh lebih kecil bila dibandingkan
dengan pengamatan yang dilakukan pada anggota populasi, yang disebut sensus.
Sebagai misal, Sensus Penduduk Indonesia dilakukan setiap 10 tahun sekali;

2. Keakurasian: seringkali hasil yang diperoleh dengan mengamati ∀ anggota


sampel memiliki tingkat akurasi yang lebih baik dibandingkan hasil dari sensus.
Mengutip W. E. Demming, ‘Sampling possesses the possibility of better
interviewing (testing), more thorough investigation of missing, wrong, or sus-
picious information, better supervision, and better processing than is possible
with complete coverage’;
Alasan-alasan Melakukan Sampling
Terdapat sejumlah alasan dilakukan sampling:
3. Kecepatan: mengetahui persepsi dari generasi muda di Provinsi Bali tentang
keengganan mereka melanjutkan usaha tani keluarga, data terkumpul akan lebih
cepat bila instrumen penelitian didistribusikan kepada n generasi muda di setiap
kabupaten/kota dibandingkan didistribusikan kepada N populasi generasi muda di
Bali dengan N ≫ n;

4. Ketersediaan anggota populasi: untuk memeriksa daya tahan dari ban


kendaraan bermotor yang dihasilkan Goodyear, hanya sebagian ban pada
masing-masing lot yang diperiksa.
Kriteria Sampel yang ‘Baik’
Sebuah sampel selain merupakan representasi populasi, juga harus
memenuhi dua kriteria berikut:

# yang
1. Akurasi: kriteria ini berkaitan dengan seberapa besar bias statistik (θ)
dihitung dari ∀ amatan pada sampel terhadap nilai parameter populasi (θ). Pada
umumnya bias dihitung dari galat sampel (sampling error) yang dinyatakan
sebagai ϵ = | θ# − θ |;

2. Presisi: kriteria ini berhubungan dengan simpangan baku (standard deviation)


dari θ# atau sθ̂ . Semakin kecil nilai sθ̂ , tingkat presisi statistik yang diperoleh dari
sampel semakin baik.
Ukuran Pemusatan dan Penyebaran Data
Secara umum, statistik dan parameter populasi bisa dilihat dari 2
kriteria, yaitu:

1. Ukuran Pemusatan: kriteria ini berkaitan ‘pusat lokasi’ dari observasi yang
dilakukan. Terdapat 3 jenis ukuran pemusatan yang lazim digunakan, yaitu (a)
mean (nilai rataan); (b) median, nilai yang ‘membagi’ observasi yang telah
diurutkan sedemikian hingga setengahnya lebih kecil dari median dan
setengahnya lebih besar dari median; dan (c) modus, observasi yang
frekuensinya terbesar.

2. Ukuran Penyebaran: kriteria ini berhubungan dengan ‘rentangan data’.


Terdapat 4 jenis ukuran penyebaran data, yaitu: (a) varians, biasa disimbulkan
sebagai s2 atau 𝜎 ! ; (b) simpangan baku, akar dua dari varians; (c) range, selisih dari
nilai maksimum dengan nilai minimum; dan (d) interquartile range (IQR) dihitung
sebagai nilai persentil ke-75 – nilai persentil ke-25 pada observasi yang telah terurut.
Data Karakteristik Keripik Singkong
Karakteristik Kripik Singkong, disitasi dari Alkarkhi & Alqaraghuli (2019, p. 8),
ditunjukkan pada tabel berikut. Terdapat 12 karakteristik yang diamati/diukur pada 7
merek (T1, …, T7) dengan pengukuran diulang 3 kali untuk setiap merek.

Variabel Deskripsi Variabel Deskripsi


Brand Merek Keripik Singkong (T1, …, T7) Peroxide Oksidasi lemak (PV)
Repl Ulangan (1, 2, 3) p-Anisidin Nilai p–Anisidin (p-AV)
Fat Kadar lemak (%) Acid Nilai keasaman (mg KOH/g)
Moisture Kadar air (%) TBA Thiobarbituric acid (mg MAD/kg)
L Indeks kecerahan SAF Asam lemak jenuh (%)
A Indeks warna kemerahan MUFA Asam lemak tak jenuh tunggal (%)
B Indeks warna kekuningan PUFA Asam lemak tak jenuh ganda (%)
Data Karakteristik Keripik Singkong
Statistik Fat Moisture L A B Peroxide
Ukuran Pemusatan
Mean 22.72 3.76 66.95 22.14 77.04 8.20
Median 20.67 3.58 72.85 14.64 77.16 8.64
Ukuran Penyebaran
Varians 21.80 1.25 389.86 203.36 676.89 26.89
Simpangan Baku 4.67 1.12 19.74 14.26 26.02 5.19
Minimum 17.47 2.27 23.76 11.44 40.73 2.65
Maksimum 30.01 5.39 82.34 44.28 114.57 17.05
Range 12.54 3.13 58.58 32.84 73.84 14.40
Kuartil I (Q1) 19.38 3.00 68.65 12.46 62.01 3.79
Kuartil III (Q3) 26.06 4.54 76.22 29.85 91.40 10.75
IQR 6.67 1.53 7.57 17.40 29.39 6.96
Data Karakteristik Keripik Singkong
Statistik Anisidine Acid TBA SAF MUFA PUFA
Ukuran Pemusatan
Mean 8.00 32.61 50.73 35.90 9.70 8.00
Median 4.38 27.03 50.93 37.91 9.84 4.38
Ukuran Penyebaran
Varians 48.60 860.43 1.41 23.19 0.41 48.60
Simpangan Baku 6.97 29.33 1.19 4.82 0.64 6.97
Minimum 3.11 4.73 49.04 27.82 8.51 3.11
Maksimum 22.98 80.23 52.25 39.91 10.48 22.98
Range 19.87 75.50 3.21 12.09 1.97 19.87
Kuartil I (Q1) 4.17 7.74 49.87 33.96 9.54 4.17
Kuartil III (Q3) 8.59 50.42 51.58 38.88 10.00 8.59
IQR 4.41 42.68 1.71 4.92 0.47 4.41
Visualisasi Data: Univariate
Visualisasi Data: Bivariate
Data Konsumsi Bahan Bakar
Tabel berikut menunjukkan 5 data pertama dan 5 data terakhir. Data lengkap bisa
dilihat pada file Car Data.xlsx. Perhatikan skala pengukuran dari Cyl, Trans,
Gear, dan Box!

Merek Kendaraan MPG Cyl DISP HP AR Weight Qsec Engine Trans Gear Carb
Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
… … … … … … … … … … … …
Lotus Europa 30.4 4 95.1 113 3.77 1.513 16.90 1 1 5 2
Ford Pantera L 15.8 8 351.0 264 4.22 3.170 14.50 0 1 5 4
Ferrari Dino 19.7 6 145.0 175 3.62 2.770 15.50 0 1 5 6
Maserati Bora 15.0 8 301.0 335 3.54 3.570 14.60 0 1 5 8
Volvo 142E 21.4 4 121.0 109 4.11 2.780 18.60 1 1 4 2
Data Konsumsi Bahan Bakar
Ringkasan data untuk variable yang diukur pada skala Interval dan Rasio!

Statistik MPG DISP HP AR Weight Qsec


Ukuran Pemusatan
Mean 20.09 230.7 147 3.60 3.22 17.85
Median 19.20 196.3 123 3.70 3.33 17.71
Modus 21.00 275.8 110 3.92 3.44 17.02
Ukuran Penyebaran
Varians 36.32 15360.8 4701 0.29 0.96 3.19
Simpangan Baku 6.03 123.9 69 0.53 0.98 1.79
Minimum 10.40 71.1 52 2.76 1.51 14.50
Maksimum 33.90 472.0 335 4.93 5.42 22.90
Range 23.50 400.9 283 2.17 3.91 8.40
IQR 7.38 205.2 84 0.84 1.03 2.01
Visualisasi Data: Univariate
Visualisasi Data: Univariate
Visualisasi Data: Bivariate
Visualisasi Data: Bivariate
Visualisasi Data: Bivariate

Anda mungkin juga menyukai