Lecture Notes: Probability Theory and Applied Statistics

LECTURE NOTES
Probability Theory and Applied Statistics

Week 4
Fundamental of Sampling
Distributions & Data Descriptions
LEARNING OUTCOMES
1. Peserta memahami penggunaan teori Probabilitas, Konsep, dan Metode Statistik untuk
memecahkan permasalahan teknik industri dalam kehidupan sehari-hari.
2. Mampu menerapkan dan menganalisis data menggunakan perangkat lunak pengolahan data
statistik.
OUTLINE MATERI :
Data Summary & Display
Visual Diagram for Data Description
Point Estimation, General Concepts & Methods
Sampling Distributions and Central Limit Theorem
Types of Sampling
Application with Minitab
Probability Theory and Applied Statistics – R2

ISI MATERI
I. Data Summary, Display dan Visualisasi Data
Statistika adalah ilmu tentang data. Aspek penting ketika mengolah sebuah data adalah
mengatur dan merangkum data dengan cara yang tepat sehingga dapat memberikan
makna pada data tersebut. Visualisasi data yang baik juga dapat digunakan untuk
menyajikan informasi terkait data agar dapat dengan mudah dimengerti oleh orang lain.
Selain itu, rangkuman dan visualisasi data dapat membantu analis data untuk
menginterpretasi dan melakukan analisis selanjutnya. Aspek dalam ilmu statistik ini
disebut juga sebagai statistik deskriptif.
Ringkasan dan tampilan data yang disusun dengan baik sangat penting untuk pemikiran
statistik yang baik, karena dengan demikian, insinyur dapat lebih focus pada fitur-fitur
penting dari data atau memberikan wawasan tentangnya jenis model yang harus
digunakan dalam memecahkan masalah. Penggunaan perangkat lunak statistic telah
menjadi sebuah alat penting dalam penyajian dan analisis data.
II. Ukuran Statistik, Parameter, dan Statistik
Ukuran statistik adalah bilangan yang diperoleh dari sekumpulan data statistic melalui proses
sritmatik tertentu. Dalam analisis data, ukuran statistik ini mengisyaratkan gejala spesifik,
misalnya Gejala Letak Pusat Pengelompokkan Data, Gejala Penyebaran/Variasi/ Keseragaman
Data, atau gejala lainnya yang dikandung oleh data yang sedang dianalisis. Apabila ukuran statistik
ini diperolehnya atas dasar perhitungan yang menyeluruh (complete enumeration) atau sensus,
maka namanya parameter, sedangkan jika diperolehnya atas dasar perhitungan terhadap data
statistik yang ada dalam sampel, ukuran statistik ini disebut statistik.
1.1 Central Measure Tendency
Ukuran ini mengisyaratkan letak pemusatan pengelompokkan data. Oleh karena itu ukuran-ukuran
statistik ini disebut juga Ukuran Letak (Measures of Location).
1. Rata-Rata Hitung (Average atau Mean)
Terdapat dua rata-rata hitung yaitu rata-rata hitung untuk populasi yang berukuran N dan rata-rata
hitung untuk sampel berukuran n. Jika yang dicari adalah rata-rata hitung untuk populasi, maka
dapat diperoleh dengan menggunakan rumus:

Rumus yang dipergunakan untuk menghitung rata-rata dari data bergolong adalah:
Adapun yang menjadi sifat dan penggunaan rata-rata hitung adalah:
a. Nilai numerik rata-rata hitung ditentukan secara ketat oleh bilangan-bilangan yang
menyusunnya.
b. Nilai numerik rata-rata hitung adalah unik.
c. Nilai Numerik rata-rata hitung sangat dipengaruhi oleh nilai ekstrim.
d. Rata-rata hitung hanya boleh dihitung (valid sebagai ukuran gejala pusat) untuk variabel
yang memenuhi tingkat pengukuran sekurang-kurangnya interval,
e. Apabila dalam urutan data yang dihadapi terdapat bilangan ekstrim, tidak disarankan untuk
menggunakan rata-rata hitung sebagai ukuran gejala pusat, sebab bisa memberikan
kesimpukan yang keliru.
f. Tidak disarankan untuk mengambil kesimpulan yang hanya didasarkan kepada rata-rata
hitung.
2. Median
Median merupakan suatu harga yang merupakan titik tengah dari keseluruhan harga pada suatu
satuan data. Oleh karena itu terdapat 50% data yang berada di bawah atau sama dengan nilai
tersebut dan terdapat 50% lagi data yang berada di atas atau sama dengan data tersebut. Untuk
menghitung Median dari data bergolong, dipergunakan rumus:

Adapun yang menjadi sifat-sifat dari penggunaan median adalah sebagai berikut:
1) Nilai numerik median tidak ditentukan secara ketat oleh bilangan-bilangan yang
menyusunnya. Oleh karena itu, jika dalam rentetan bilangan ada yang berubah nilai
numeriknya, median belum tentu berubah.
2) Median tidak dipengaruhi oleh nilai ekstrim, dan nilai median adalah unik.
3) Median boleh dihitung (valid sebagai ukuran gejala pusat) untuk variabel yang memenuhi
skala pengukuran sekurang-kurangnya ordinal.
Apabila dalam rentetan bilangan terdapat nilai ekstrim, disarankan untuk menggunakan median
sebagai pengganti rata-rata hitung.
3. Modus
Modus didefinisikan sebagai bilangan yang paling banyak muncul atau bilangan yang frekuensi
kemunculannya paling besar dari sutau satuan data. Modus tidak selalu dengan mudah diperoleh.
Hal ini akan terjadi jika dihadapkan pada suatu harga yang mempunyai frekuensi kemunculan yang
sama dengan yang lainnya. Untuk menghitung modus pada data bergolong dipergunakan rumus:
b = batas kelas interval dengan frekuensi terbanyak
p = panjang kelas interval
b1 = frekuensi pada kelas modus dikurangi frekwensi kelas terdekat sebelumnya
b2 = frkuensi kelas modus dikurangi frekuensi kelas interval berikutnya.
Adapun yang menjadi sifat-sifat dan penggunaan modus adalah sebagai berikut:

a) Nilai numerik modus tidak unik (dalam sebuah rentetan data bisa terdapat lebih dari sebuah
modus).
b) Modus digunakan sebagai ukuran gejala pusat untuk variabel dengan tingkat pengukuran
sekurang-kurangnya nominal.
Dari sifat-sifat penggunaan ukuran gejala pusat berdasarkan skala pengukuran, maka dapat
digambArkan secara sederhana seperti pada tabel 2.1. di bawah ini

2. Ukuran Dispersi atau Ukuran Variasi
Selain ukuran gejala pusat, terdapat ukuran lain yaitu ukuran dispersi atau ukuran vasiasi yang
mengisyaratkan keseragaman data. Nilai numerik ukuran ini tidak pernah negatif (selalu positif).
Apabila nilai ukuran ini diperoleh sama dengan nol (0), hal ini menunjukkan bahwa data yang kita
miliki keadaannya seragam sempurna (tidak ada variasi, atau semua bilangan nilai numeriknya
sama). Oleh karena itu makin jauh nilai numerik ukuran ini dari nol (0), makin tidak seragam
keadaan data tersebut. Terdapat bebeapa ukuran variasi yang biasa digunakan, yang juga akan
diuraikan di sini, adalah; rentang (range), varians (variance), simpangan baku (standar deviation),
koefisien variasi (koeficient of variation), rentang antar kuartil (interquartiles ranges), dan indeks
dispersi (index of dispersion).
1. Rentang (Range)
Rentang pada suatu satuan data adalah selisih terbesar dan terkecil dari suatu satuan data tersebut.
Contoh 8. IQ lima orang anggota keluarga adalah; 108, 112, 127, 118, dan 113. Tentukan
rentangnya!
Jawab: Rentang dari 5 IQ tersebut adalah 127 – 108 = 19.
2. Varians (variance)
Rumus yang dipergunakan untuk menghitung varians, jika data berasal dari populasi
adalah:
Sedangkan varians yang dihitung berdasarkan sampel dihitung dengan rumus:

3. Simpangan Baku (Standar Deviation)
Simpangan baku didefinisikan sebagai akar dari Varians. Oleh karena itu rumus simpangan baku
untuk populasi adalah:
Rumus simpangan baku untuk sampel adalah:
Varians dan simpangan bau hanya boleh digunakan sebagai alat pembanding keseragaman data,
apabila data yang dibandingkan keseragamannya itu berasal dari variabel yang sama dengan
satuan pengukuran (unit of measurement) yang sama pula.
Varians dan Simpangan Baku hanya valid digunakan sebagai ukuran variasi untuk variabel yang
memenuhi tingkat pengukuran sekurang-kurangnya interval.
4. Indeks Dispersi atau Indeks Variasi Kualitatif (Index of Dispersion or Index of

Qualitative Variation)
Untuk mengukur keseragaman (variasi) data yang mempunyai tingkat pengukuran nominal,
digunakan Indeks dispersi dengan rumus:
Nilai numerik ID terbatas: 0 ≤ ID ≥ 1
ID = 0 menunjukkan bahwa data seragam sempurna. Keadaan ini terjadi apabila semua frekuensi
terdapat pada satu kategri dan kategori lainnya frekuensinya sama dengan nol (0). ID=1
mengisyaratkan variasi maksimal. Fenomenon ini terjadi jika frekuensi terbagi rata untuk semua
kategori.

Contoh:
Hasil penelitian Mahasiswa di Desa X tentang jenis pekerjaan penduduk disajikan dalam data sebagai
berikut:
Untuk menghitung Indeks Dispersi diperlukan data:
Jika dijadikan persen, maka ID = 92,6356637%, dibulatkan ID = 92,6%.
5. Ukuran Kemiringan
Ukuran statistik ini mengisyaratkan keadaan bentuk kurva distribusi data nilai-nilai sebuah
variabel, apakah Simetri atau Miring (kurvanya landai ke kiri atau ke kanan). Salah satu rumus
yang menyatakan kurva distribusi data adalah koefisien kemiringan yang didasarkan kepada
kuartil.

KK > 0; kurva miring positif (kurva landai ke kanan)
KK = 0; kurva simetri
KK < 0; kurva miring negatif
III. Visual Diagram for Data Description
Terdapat beberapa jenis visualisasi diagram yang dapat digunakan untuk

menggambarkan data yang tersedia. Beberapa contoh diagram adalah sebagai berikut:
a. Stem and Leaf Diagram
Diagram batang dan daun ini dapat digunakan untuk visualisasi data dengan
jumlah data yang sangat besar. Adapun cara menggambarkan diagram batang dan
daun, adalah dengan:
(1) Bagilah setiap bilangan xi menjadi dua bagian: batang, terdiri dari satu atau
lebih bilangan yang merupakan digit terdepan, dan pada kolom daun
merupakan terdiri dari digit sisanya.
(2) Cantumkan nilai batang dalam kolom vertikal.
(3) Hitung frekuensi setiap pengamatan pada kolom paling kanan, di sebelah
kanan kolom ‘daun’
(4) Tuliskan satuan batang dan daun pada diagram tersebut.
Berikut ini adalah contoh diagram batang dan daun.

b. Histogram dan Frequency Distribution
Distribusi frekuensi merupakan ringkasan data yang lebih ringkas dibandingkan

diagram batang dan daun. Dalam membangun sebuah diagram distribusi
frekuensi, kita harus membagi jangkauan data menjadi interval-interval, yang
pada umumnya disebut sebagai interval kelas, sel, atau bin. Jika memungkinkan,
kelas tersebut harus memiliki lebar yang sama secara berurutan untuk
meningkatkan informasi visual dalam distribusi frekuensi.
Beberapa perhitungan harus digunakan memilih jumlah wadah sehingga tampilan

tersebut dapat dikembangkan. Jumlah kelas tergantung pada jumlah pengamatan
dan besarnya sebaran atau sebaran data. Sebuah grafik frekuensi distribusi yang
menggunakan terlalu sedikit atau terlalu banyak bin tidak akan informatif.

Pada umumnya, pembagian kelas untuk menggambarkan data yang tersedia harus
berada diantara 5 dan 20 bin atau kelas agar dapat merepresentasikan seluruh data
n. Cara menghitung jumlah kelas yang tepat adalah dengan melakukan
perhitungan akar dari jumlah pengamatan. Misalnya, data berjumlah 80, maka
jumlah kelas yang sebaiknya dibuat adalah √80 ≈ 9; maka jumlah kelas atau
bin yang dapat merepresentasikan seluruh 80 data tersebut adalah sekitar 8 hingga
9 kelas. Berikut ini adalah contoh diagram histogram.
c. Box Plots
Tampilan batang dan daun serta histogram memberikan kesan visual umum
tentang suatu data. Namun, besaran numerik seperti x atau s hanya memberikan
informasi tentang satu fitur saja. Box Plot merupakan tampilan grafis dari
sekumpulan data yang juga menggambarkan beberapa hal penting seperti titik
Tengah dari sebaran data, penyimpangan dari simetri, dan identifikasi
pengamatan yang tidak biasa atau outlier.
Box Plot sering disebut juga sebagai box-and-whisker plots, menampilkan tiga
kuartil yaitu data minimum dan maksimum digambarkan pada kotak persegi
panjang, disejajarkan secara horizontal atau vertikal.
Kotak tersebut melingkupi rentang interkuartil dengan tepi kiri (atau bawah) pada
kuartil pertama, q1, dan tepi kanan (atau atas) pada kuartil ketiga, q3. Sebuah
garis ditarik melalui kotak di kuartil kedua (yaitu persentil ke-50 atau median), q2
= x. Sedangkan sebuah garis ditarik memanjang pada setiap ujung kotak tersebut
mulai dari data terkecil dalam rentang 1,5 interkuartil dari kuartil pertama dan

pada Kumis atau whisker bagian atas adalah dari kuartil ketiga ditarik garis
hingga ke titik data terbesar dalam rentang 1,5 interkuartil dari kuartil ketiga.
Jika masih ada data yang lebih jauh dari garis dan kotak tersebut, maka data
tersebut kita sebut sebagai data outlier atau dikenal dengan istilah pencilan.
Berikut ini adalah contoh gambar dari Box Plot atau Box and Whisker Plot
Diagram:
d. Time Sequence Plots
Tampilan grafis yang telah kita bahas sejauh ini seperti histogram, plot batang dan
daun, dan box plot adalah metode visual yang sangat berguna untuk menunjukkan
variabilitas data. Namun, tidak menggambarkan waktu yang juga merupakan faktor
penting yang berkontribusi terhadap variabilitas data. Deret waktu atau urutan
waktu adalah kumpulan data yang di dalamnya terdapat catatan pengamatan sesuai
urutan terjadinya. Plot deret waktu adalah grafik yang pada Sumbu vertikal
menunjukkan nilai variabel yang diamati (katakanlah, x) dan sumbu horizontal
menunjukkan waktu (yang bisa berupa menit, hari, tahun, dll.). Ketika pengukuran
diplot sebagai deret waktu, kita dapat melihat tren, siklus, atau fitur umum lainnya
dari data yang tidak dapat dilihat dengan cara lain. Berikut ini adalah contoh time
sequence plots.

e. Scatter diagrams
Sebuah Diagram pencar dibuat dengan memplot setiap pasangan observasi

dengan satu pengukuran pada pasangan tersebut pada sumbu vertikal grafik dan
pengukuran lainnya berpasangan pada sumbu horizontal.

Gambar diatas merupakan diagram pencar untuk menggambarkan kualitas wine
berdasarkan variabel deskriptif warna. Terlihat pada grafik tersebut ada hubungan
yang jelas antara kedua variabel tersebut dengan wine yang lebih intens warna
umumnya memiliki peringkat kualitas lebih tinggi. Dengan demikian, scatter plot
atau diagram sebar juga dapat kita gunakan sebagai alat eksplorasi yang sangat
baik dan bisa sangat berguna dalam mengidentifikasi potensi hubungan antara dua
variabel.
f. Probability Plots
Bagaimana kita mengetahui apakah distribusi probabilitas tertentu merupakan

model data yang masuk akal? Terkadang ini menjadi pertanyaan penting karena
sebagai seorang analis, kita perlu menyajikan data statistik tersebut.
Pada bab-bab selanjutnya, kita akan membahas mengenai beberapa uji statistic
yang didasarkan pada asumsi bahwa sebaran data populasi bersifat spesifik
mengikuti distribusi peluang tertentu, sebagai contoh kita bisa melakukan uji
statistic parametrik jika data berdistribusi normal. Oleh karena itu, kita perlu

melakukan verifikasi asumsi untuk memastikan bahwa data yang tersedia benar
memiliki probabilitas distribusi tertentu.
Beberapa tampilan visual yang kita gunakan sebelumnya, seperti histogram, dapat
memberikan wawasan tentang bentuk distribusi yang mendasarinya. Namun,
histogram biasanya bukan merupakan indikator yang dapat diandalkan, terutama
jika jumlah sampelnya sangat besar. Histogram dapat digunakan untuk visualisasi
data dengan sampel berukuran kecil hingga sedang.
Dengan melakukan visualisasi data probability plot grafik, kita dapat mengetahui
apakah data sampel sesuai dengan distribusi yang dihipotesiskan berdasarkan
pemeriksaan visual subjektif terhadap data. Prosedur umumnya sangat sederhana
dan dapat dilakukan dengan cepat. Plot probabilitas biasanya menggunakan sumbu
khusus dengan skalak spesifik untuk distribusi yang dihipotesiskan.
Untuk membuat plot probabilitas, Adapun tahapannya sebagai berikut:
i. Data sampel diurutkan mulai dari yang terkecil hingga terbesar.
ii. Kemudian dilakukan perhitungan terhadap frekuensi kumulatif

pengamatannya.
iii. Untuk setiap pengamatan dan frekuensinya digambarkan seperti grafik berikut
ini

IV. Point Estimation and Sampling Distribution
Metode statistik digunakan untuk mengambil keputusan dan menggambar kesimpulan

tentang populasi. Aspek statistik ini adalah umumnya disebut statistic inferensial.
Teknik-teknik ini memanfaatkan informasi dalam sampel untuk menarik kesimpulan.
Bab ini memulai studi kita tentang metode statistik yang digunakan dalam pengambilan
keputusan. Statistika inferensial dapat dibagi menjadi dua bidang utama, yaitu
parameter estimasi dan pengujian hipotesis. Sebagai contoh dari masalah estimasi
parameter, misalkan seorang insinyur sedang menganalisis kekuatan tarik suatu
komponen yang digunakan pada rangka udara sebuah pesawat. Ini adalah bagian
penting dalam penilaian integritas struktural keseluruhan pesawat. Variabilitas dalam
pengukuran komponen dapat terjadi karena perbedaan dalam batch bahan baku yang
digunakan untuk membuat komponen, proses manufaktur, dan pengukuran prosedur
(misalnya), sehingga insinyur ingin memperkirakannya kekuatan rata-rata populasi
komponen. Dalam praktek, insinyur akan menggunakan data sampel untuk menghitung
rata-rata populasi yang sebenarnya. Angka tersebut disebut juga perkiraan titik atau
point estimation.
Distribusi probabilitas suatu statistik disebut juga sebagai distribusi sampling. Jika kita
mengambil sampel dari populasi yang distribusi probabilitasnya tidak diketahui, maka
distribusi sampling mean sampel akan tetap mendekati normal dengan mean μ dan
varians σ2 / n jika ukuran sampel n besar sampai tak hingga.
Permasalahan estimasi ini umumnya terjadi pada rekayasa Teknik, seringkali insinyur
harus melakukan perhitungan estimasi untuk:

1. Rerata dan variansi dari suatu populasi
2. Proporsi p pada kelas tertentu di sebuah populasi
3. Perbedaan dari rerata dua populasi
4. Perbedaan dari proporsi pada dua populasi
V. Sampling Distributions dan Central Limit Theorem
Statistika inferensial berkaitan dengan pengambilan keputusan tentang suatu populasi

berdasarkan informasi yang tersedia pada sampel acak populasi tersebut. Asumsi pada
sampel acak sangatlah penting. Jika sampelnya tidak acak dan didasarkan pada
penilaian tertentu atau memiliki kelemahan dalam hal lain, metode statistik tidak akan
berhasil dan akan menghasilkan keputusan yang salah. Tujuan utama pengambilan
sampel acak adalah untuk memperoleh informasi tentang hal yang tidak diketahui
langsung dari parameter populasi. Sebuah probability distribution pada statistic sering
disebut juga sebagai sampling distribution.
Jika kita mengambil sampel dari populasi yang distribusi peluangnya tidak diketahui,
maka distribusi pengambilan sampel dari mean sampel akan tetap mendekati normal
dengan mean μ dan variansi σ2 / n jika ukuran sampel n besar. Hal ini merupakan salah
satu teorema paling berguna dalam statistik, disebut central limit theorem atau dapat
disebut juga teorema limit pusat. Berikut ini merupakan ilustrasi singkat mengenai
teorema tersebut.

Jika distribusi yang mendasarinya simetris dan tidak modal (tidak terlalu jauh dari
normal), batas Tengah teorema ini akan berlaku untuk nilai n yang kecil, katakanlah 4
atau 5. Jika populasi sampel sangat tidak normal, sampel yang lebih besar akan
diperlukan. Pada umumnya, jika n > 30, teorema limit pusat hampir selalu berlaku dan
pengecualian terhadap pedoman ini relatif jarang terjadi.
VI. Types of Sampling
Pada statistic, terdapat dua jenis metode sampling, yaitu probability sampling dan non-
probability sampling.
Metode pengambilan sampel probabilitas menggunakan beberapa bentuk pemilihan

acak. Dalam metode ini, semua individu yang memenuhi syarat mempunyai
kesempatan untuk memilih sampel dari keseluruhan ruang sampel. Metode ini lebih
memakan waktu dan mahal dibandingkan metode non-probability sampling. Manfaat
menggunakan sampling probabilitas adalah menjamin sampel yang seharusnya
mewakili populasi.
6.1 Jenis Pengambilan Sampel Probabilitas
Metode Pengambilan Sampel Probabilitas selanjutnya diklasifikasikan ke dalam

beberapa jenis, seperti pengambilan sampel acak sederhana, pengambilan sampel
sistematik, pengambilan sampel bertingkat, dan pengambilan sampel berkerumun.
1. Simple Random Sampling (Sampling Acak Sederhana)
Dalam teknik pengambilan sampel acak sederhana, setiap item dalam populasi
mempunyai peluang yang sama dan berpeluang besar untuk terpilih menjadi sampel.
Karena pemilihan item sepenuhnya bergantung pada peluang, metode ini dikenal
sebagai “Metode Pemilihan Peluang”. Karena ukuran sampelnya besar dan itemnya
dipilih secara acak, maka hal ini disebut dengan “Representative Sampling”.

Contoh:
Misalkan kita ingin memilih sampel acak sederhana sebanyak 200 siswa dari sebuah
sekolah. Di sini, kita dapat menetapkan nomor untuk setiap siswa di database sekolah
dari 1 hingga 500 dan menggunakan generator nomor acak untuk memilih sampel
sebanyak 200 nomor
2. Systematic Sampling (Pengambilan Sampel Sistematis)
Dalam metode pengambilan sampel sistematis, item dipilih dari populasi sasaran
dengan memilih titik pemilihan acak dan memilih metode lain setelah interval sampel
tetap. Ini dihitung dengan membagi jumlah total populasi dengan jumlah populasi yang
diinginkan.
Contoh:
Misalkan nama 300 siswa suatu sekolah diurutkan dalam urutan abjad terbalik. Untuk
memilih sampel dalam metode sampling sistematis, kita harus memilih sekitar 15 siswa
dengan memilih nomor awal secara acak, katakanlah 5. Dari nomor 5 dan seterusnya,
akan dipilih setiap orang ke-15 dari daftar yang diurutkan. Akhirnya, kita bisa
mendapatkan sampel dari beberapa siswa.
3. Stratified Sampling (Pengambilan Sampel Berstrata)
Dalam metode pengambilan sampel bertingkat, total populasi dibagi menjadi

kelompok-kelompok yang lebih kecil untuk menyelesaikan proses pengambilan
sampel. Kelompok kecil terbentuk berdasarkan beberapa karakteristik dalam populasi.
Setelah memisahkan populasi menjadi kelompok yang lebih kecil, ahli statistik
memilih sampel secara acak.
Misalnya ada tiga tas (A, B dan C) yang masing-masing berisi bola berbeda. Kantong
A berisi 50 bola, kantong B berisi 100 bola, dan kantong C berisi 200 bola. Kita harus
memilih sampel bola dari setiap kantong secara proporsional. Misalkan 5 bola dari
kantong A, 10 bola dari kantong B, dan 20 bola dari kantong C.
4. Clustered Sampling (Pengambilan Sampel Berkelompok/Kluster)
Dalam metode clustered sampling, klaster atau sekelompok orang dibentuk dari
kumpulan populasi. Kelompok tersebut memiliki karakteristik penting yang serupa.
Selain itu, mereka juga mempunyai peluang yang sama untuk menjadi bagian dari
sampel. Metode ini menggunakan simple random sampling untuk cluster populasi.
Contoh:

Sebuah lembaga pendidikan memiliki sepuluh cabang di seluruh negeri dengan jumlah
siswa yang hampir sama. Jika kami ingin mengumpulkan beberapa data mengenai
fasilitas dan hal lainnya, kami tidak dapat melakukan perjalanan ke setiap unit untuk
mengumpulkan data yang diperlukan. Oleh karena itu, kita dapat menggunakan
pengambilan sampel acak untuk memilih tiga atau empat cabang sebagai cluster.
Keempat metode ini dapat dipahami secara lebih baik dengan bantuan gambar di bawah
ini. Gambar tersebut berisi berbagai contoh bagaimana sampel akan diambil dari
populasi dengan menggunakan teknik yang berbeda-beda.
6.2 Teknik Sampling Non-Probability
Metode non-probability sampling adalah teknik di mana peneliti memilih sampel

berdasarkan penilaian subjektif dan bukan pemilihan acak. Dalam metode ini, tidak
semua anggota populasi mempunyai kesempatan untuk berpartisipasi dalam
penelitian.
Jenis Pengambilan Sampel Non-Probabilitas
Metode pengambilan sampel non-probabilitas selanjutnya diklasifikasikan ke

dalam beberapa jenis, seperti pengambilan sampel praktis, pengambilan sampel

berturut-turut, pengambilan sampel kuota, pengambilan sampel penilaian,
pengambilan sampel bola salju.
1. Convenience Sampling
Dalam metode convenience sampling, sampel dipilih langsung dari populasi karena
sampel tersebut tersedia bagi peneliti. Sampelnya mudah untuk dipilih, dan peneliti
tidak memilih sampel yang menguraikan seluruh populasi.
Contoh:
Dalam meneliti layanan dukungan pelanggan di wilayah tertentu, kami meminta

beberapa pelanggan Anda untuk mengisi survei mengenai produk setelah
pembelian. Ini adalah cara mudah untuk mengumpulkan data. Namun, karena kami
hanya mensurvei pelanggan yang menggunakan produk yang sama. Pada saat yang
sama, sampel tersebut tidak mewakili seluruh pelanggan di wilayah tersebut.
2. Consecutive Sampling (Pengambilan Sampel Berturut-turut)
Pengambilan sampel berturut-turut mirip dengan pengambilan sampel praktis

dengan sedikit variasi. Peneliti memilih satu orang atau sekelompok orang untuk
dijadikan sampel. Kemudian peneliti melakukan penelitian selama jangka waktu
tertentu untuk menganalisis hasilnya dan berpindah ke kelompok lain jika
diperlukan.
3. Quota Sampling (Pengambilan Sampel Kuota)
Dalam metode kuota sampling, peneliti membentuk sampel yang melibatkan

individu-individu untuk mewakili populasi berdasarkan sifat atau kualitas tertentu.
Peneliti memilih subset sampel yang menghasilkan kumpulan data berguna yang
menggeneralisasi seluruh populasi.
4. Purposive or Judgemental Sampling (Pengambilan Sampel yang Objektif

atau Menghakimi)
Dalam purposive sampling, sampel dipilih hanya berdasarkan pengetahuan peneliti.

Karena pengetahuan mereka berperan penting dalam pembuatan sampel, terdapat
peluang untuk memperoleh jawaban yang sangat akurat dengan kesalahan marjinal
yang minimal. Ini juga dikenal sebagai pengambilan sampel yang menghakimi atau
pengambilan sampel otoritatif.
5. Snowball Sampling (Pengambilan Sampel Bola Salju)

Pengambilan sampel bola salju juga dikenal sebagai teknik pengambilan sampel
rujukan berantai. Dalam metode ini, sampel mempunyai ciri-ciri yang sulit
ditemukan. Jadi, setiap anggota populasi yang teridentifikasi diminta mencari unit
sampling lainnya. Unit sampel tersebut juga berasal dari populasi sasaran yang
sama.
6.3 Pengambilan sampel probabilitas vs Metode Pengambilan Sampel Non-

probabilitas
Tabel di bawah ini menunjukkan beberapa perbedaan antara metode pengambilan

sampel probabilitas dan metode pengambilan sampel non-probabilitas.
Probability Sampling Methods Non-probability Sampling Methods
Probability sampling adalah teknik

Metode non-probability sampling
pengambilan sampel dimana sampel
adalah suatu teknik di mana peneliti
yang diambil dari populasi yang lebih
memilih sampel berdasarkan penilaian
besar dipilih berdasarkan teori
subjektif, sebaiknya pemilihan acak.
probabilitas.
Dikenal sebagai metode pengambilan Disebut metode pengambilan sampel

sampel acak non-acak.
Digunakan untuk penelitian yang Digunakan untuk penelitian yang

konklusif. bersifat eksploratif.
Membutuhkan waktu yang lama untuk Cara mudah untuk mengumpulkan

mendapatkan datanya. data dengan cepat.
Ada hipotesis yang mendasari dalam

pengambilan sampel probabilitas
Hipotesis kemudian diturunkan
sebelum penelitian dimulai. Selain itu,
dengan melakukan penelitian dalam
tujuan metode ini adalah untuk
kasus non-probability sampling.
memvalidasi hipotesis yang
ditentukan.

KESIMPULAN
Statistik adalah sebuah teknik penyajian dan peringkasan data sehingga menjadi informasi yang
mudah dipahami. Penyajian data dapat dilakukan melalui Tabel, Gambar (histogram, plot, stem-
leaf, box-plot). Peringkasan data dinyatakan dalam dua ukuran yaitu Pemusatan (Median, Modus,
Kuartil, Mean, dll). Penyebaran (Range, Interquartile Range, Ragam) .
Tujuan Mendeskripsikan data :
• Mengetahui karakteristik data sesederhana mungkin tetapi memiliki pengertian yang dapat
menjelaskan data secara keseluruhan
• Data Numerik memiliki pusat dan keragaman: Ukuran pemusatan, Ukuran penyebaran.

DAFTAR PUSTAKA
1. Montgomery, D.C. and Runger, G.C., 2018, Applied Statistics and Probability for Engineer,
7th Ed, John Wiley and Sons, New York.
2. Walpole, R. E., Myers, R. H., and Myers, S. L, Keying E. Ye, 2011, Probability and Statistics
for Engineers and Scientists (9th Edition), Prentice-Hall International, New Jersey
3. Montgomery, D.C., Runger, G.C., Hubele, 2009, Engineering Statistics, John Wiley and Sons,
New York
4. Hayter, Anthony.J, (2012), Probabilty and Statistics for Engineers and Scientiest 4th edition,
Cengage Learning
5. Setiawan, N, 2005, Statistika NonParametrik untuk Penelitian Sosial Ekonomi Peternakan,

Lecture Notes: Probability Theory and Applied Statistics

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Lecture Notes: Probability Theory and Applied Statistics

Diunggah oleh

Hak Cipta:

Format Tersedia

LECTURE NOTES

Probability Theory and Applied Statistics

Data Summary & Display

Visual Diagram for Data Description

Point Estimation, General Concepts & Methods

Sampling Distributions and Central Limit Theorem

Application with Minitab

Probability Theory and Applied Statistics – R2

II. Ukuran Statistik, Parameter, dan Statistik

1.1 Central Measure Tendency

1. Rata-Rata Hitung (Average atau Mean)

Probability Theory and Applied Statistics – R2

Adapun yang menjadi sifat dan penggunaan rata-rata hitung adalah:

b. Nilai numerik rata-rata hitung adalah unik.

c. Nilai Numerik rata-rata hitung sangat dipengaruhi oleh nilai ekstrim.

Probability Theory and Applied Statistics – R2

b = batas kelas interval dengan frekuensi terbanyak

p = panjang kelas interval

b1 = frekuensi pada kelas modus dikurangi frekwensi kelas terdekat sebelumnya

b2 = frkuensi kelas modus dikurangi frekuensi kelas interval berikutnya.

Probability Theory and Applied Statistics – R2

Probability Theory and Applied Statistics – R2

Jawab: Rentang dari 5 IQ tersebut adalah 127 – 108 = 19.

Sedangkan varians yang dihitung berdasarkan sampel dihitung dengan rumus:

Probability Theory and Applied Statistics – R2

Rumus simpangan baku untuk sampel adalah:

4. Indeks Dispersi atau Indeks Variasi Kualitatif (Index of Dispersion or Index of

Nilai numerik ID terbatas: 0 ≤ ID ≥ 1

Probability Theory and Applied Statistics – R2

Untuk menghitung Indeks Dispersi diperlukan data:

Jika dijadikan persen, maka ID = 92,6356637%, dibulatkan ID = 92,6%.

Probability Theory and Applied Statistics – R2

KK < 0; kurva miring negatif

III. Visual Diagram for Data Description

Terdapat beberapa jenis visualisasi diagram yang dapat digunakan untuk

a. Stem and Leaf Diagram

(2) Cantumkan nilai batang dalam kolom vertikal.

(4) Tuliskan satuan batang dan daun pada diagram tersebut.

Berikut ini adalah contoh diagram batang dan daun.

Probability Theory and Applied Statistics – R2

Distribusi frekuensi merupakan ringkasan data yang lebih ringkas dibandingkan

Beberapa perhitungan harus digunakan memilih jumlah wadah sehingga tampilan

Probability Theory and Applied Statistics – R2

Probability Theory and Applied Statistics – R2

d. Time Sequence Plots

Probability Theory and Applied Statistics – R2

Sebuah Diagram pencar dibuat dengan memplot setiap pasangan observasi

Probability Theory and Applied Statistics – R2

Bagaimana kita mengetahui apakah distribusi probabilitas tertentu merupakan

Probability Theory and Applied Statistics – R2

Untuk membuat plot probabilitas, Adapun tahapannya sebagai berikut:

i. Data sampel diurutkan mulai dari yang terkecil hingga terbesar.

ii. Kemudian dilakukan perhitungan terhadap frekuensi kumulatif

Probability Theory and Applied Statistics – R2

Metode statistik digunakan untuk mengambil keputusan dan menggambar kesimpulan

Probability Theory and Applied Statistics – R2

2. Proporsi p pada kelas tertentu di sebuah populasi

3. Perbedaan dari rerata dua populasi

4. Perbedaan dari proporsi pada dua populasi

V. Sampling Distributions dan Central Limit Theorem

Statistika inferensial berkaitan dengan pengambilan keputusan tentang suatu populasi

Probability Theory and Applied Statistics – R2

VI. Types of Sampling