PARAMETRIK
STATISTIK
INFERENSIAL
NON PARAMETRIK
STATISTIK DESKRIPTIF DAN INFERENSIAL
• Statistika (statistics) dapat dikelompokkan menjadi 2 jenis, yaitu statistika
deskriptif dan statistika induktif (inferensia/inferential)
• Statistika induktif digunakan untuk memperoleh informasi mengenai suatu
populasi berdasarkan informasi yang diperoleh dari sampel.
• Jika data berasal dari seluruh elemen dari populasi, kita akan memperoleh
informasi yang sesungguhnya (parameter)
• Jika melakukan penarikan sampel (mengumpulkan data sebagian elemen dari
populasi) maka kita akan memperoleh data perkiraan/pendugaan/ disebut
statistik/statistic (tanpa s).
• Jadi statistik merupakan penduga untuk parameter
STATISTIK
• Deskriptif: Menggambarkan atau menganalisa suatu data hasil penelitian
tanpa membuat kesimpulan atau generalisasi terhadap keseluruhan
populasi, kegiatan: menyajikan data dan meringkas data
• Inferensial: Membahas cara menganalisis data serta mengambil
kesimpulan (berkaitan dengan estimasi parameter dan pengujian
hipothesis)
• Parametris: Untuk menganalisis data interval dan rasio yang memiliki
suatu distribusi, analisis dengan Uji-t, ANOVA, Regresi dsb Cth: “Berapa
menit rata-rata waktu layanan pelanggan di Loket Stasiun Madiun?”.
Variabel waktu layanan pelanggan dapat diukur dalam menit.
• Nonparametris: Menganalisis data ordinal dan nominal dari populasi yang
tidak memerlukan pembuatan asumsi tentang bentuk distribusi, sehingga
tidak memerlukan asumsi.
ALUR LANGKAH-LANGKAH PEMILIHAN METODE
STATISTIK
• Kegiatan a s.d. c merupakan
statistika deskriptif, yang berkaitan
dengna pengumpulan, pengolahan
dan penyajian data
• Kegiatan d & e merupakan statistika
inferensial yaitu menyimpulkan dan
menarik kesimpulan
PERTANYAAN
• Dari hasil quick count pilkada DKI diperoleh dari sampel
400 TPS dari 13.000 TPS DKI, mendapat hasil yang
berbeda-beda, mengapa ini terjadi?
• Dari hasil produksi Ban Radial didapat hasil dari 120
sampel ban yang dijadikan percobaan didapat bahwa rata-
rata umur pemakaian ban tersebut adalah 36500 km.
Angka ini digunakan untuk memperkirakan rata-rata masa
layan bagi produk ban tersebut.
POPULASI DAN SAMPEL
• Populasi: kumpulan dari keseluruhan pengukuran (orang,
benda, dsb) atau observasi yang menjadi objek penelitian,
tidak terbatas pada sekelompok tertentu, tetapi mengacu
pada seluruh ukuran. Pengamatan/survey terhadap
populasi disebut sensus.
• Sampel: sebagian dari populasi yang menjadi perhatian
dan dapat mewakili seluruh populasi, kegiatannya
dinamakan sampling.
• Parameter adalah bilangan/angka yang menggambarkan
karakteristik suatu populasi.
POPULASI DAN SAMPEL
POPULASI DAN SAMPEL
• Alasan Memilih sampel: Biaya, waktu, ketelitian, sifat
merusak
• Perbedaan populasi dan sampel
e = persen kelonggaran ketidaktelitian karena kesalahan pengambilan sampel
yang masih dapat ditolerir atau diinginkan, misalnya 10%.
• Ket:
s = Jumlah sample
N = Jumlah populasi
λ2 = Chi Kuadrat, dengan dk = 1, taraf kesalahan
1%, 5% dan 10%
d = 0,05
P = Q = 0,5
e = persen kelonggaran ketidaktelitian karena kesalahan pengambilan sampel
yang masih dapat ditolerir atau diinginkan, misalnya 10%.
• Keterangan:
n = ukuran sampel N = ukuran populasi
e = persen kelonggaran ketidaktelitian karena kesalahan pengambilan
sampel yang masih dapat ditolerir atau diinginkan, misalnya dengan
batas kesalahan 5% berarti akurat s.d. 95%
• Contoh : Sebuah perusahaan memiliki 1000 karyawan dan akan dilakukan
survei dengan mengambil sampel. Berapa sampel yang dibutuhkan apabila
batas toleransi kesalahan 5%,
• Jawab: n = 286 Orang
PENARIKAN SAMPEL ACAK SEDERHANA
• Cara paling mudah untuk pemilihan sampel adalah dengan
penarikan sampel acak sederhana (simple random sample) dimana
setiap anggota populasi memiliki kemungkinan yang sama untuk
dipilih
• Cara untuk memilih sampel acak dari suatu populasi dapat dengan
menggunakan random number
APLIKASI EXCEL UNTUK MEMILIH SAMPEL RANDOM
• Untuk jumlah sampel besar, dapat memilih sampel dengan menggunaan ms excel
• Dari Nilai 19 orang taruna berikut, ambil 9 nilai secara random.
• Jawab:
• Pada Cell C2, ketik: =RAND()
• Copy cell C2 ke D3 s.d. D20
• Pada Cell C1/Title klik Data > Filter
• Pada Cell C1 klik Sort Smallest to
Largest, ambil 9 nilai yang paling
atas
POPULASI TERBATAS DAN TAK TERBATAS
• Populasi terbatas misalnya seluruh taruna di API Madiun, seluruh
karyawan API Madiun, Seluruh siswa SMA di Madiun, Seluruh Petak
sawah di madiun, Seluruh petani di Madiun
• Populasi tak terbatas biasanya dihubungkan dengan suatu proses,
Cth: proses produksi dari waktu ke waktu, proses penjualan, proses
pelemparan mata uang, dsb
• Populasi dianggap tak terbatas apabila proses yang terjadi dapat
dilakukan secara terus-menerus sampai proses tersebut dihentikan.
Sebagian dari proses dianggap sebagai sampel acak random
SAMPEL ACAK SEDERHANA (POPULASI TERBATAS)
• Sehingga 5C3 = 10
• Kemungkinan hasil: x1,x2,x3 | x1, x2,x4 |x1, x2, x5 | x1, x3, x5 | x1,
x3, x4 | x1, x2, x3 | x2, x3, x4 | x2, x3, x5 | x2, x4, x5 | x3, x4, x5
SAMPEL ACAK SEDERHANA (POPULASI TAK TERBATAS)
• Jika data seluruh karyawan tidak tersedia, biaya yang dibutuhkan akan lebih kecil
jika menggunakan sampel 30 karyawan untuk memprediksi parameter dari
populasi, pengambilan sampel untuk 30 karyawan menghasilkan table berikut:
DISTRIBUSI SAMPLING
• Jika percobaan tersebut dilakukan sebanyak 500 kali, akan
menghasilkan nilai rata-rata yang berbeda-beda, sebagai berikut:
DISTRIBUSI DISTRIBUSI SAMPLING
• Dibuat ke dalam Tabel distribusi Frekuensi dan histogram data
sebagai berikut:
• Rumus ini dapat digunakan jika populasi tak terbatas atau populasi
terbatas tetapi ukuran sampel lebih kecil dari 5% dari populasi
• adalah standar error dari mean atau standar deviasi dari
sebuah estimasi tunggal, nilai ini digunakan untuk menunjukkan
seberapa jauh rata2 sampel dari rata2 populasi
• Standar error untuk contoh di atas adalah
BENTUK DISTRIBUSI SAMPLING 𝑿
• Bentuk distribusi sampel terbagi menjadi 2
• Populasi yang berdistribusi normal, biasanya diasumsikan
bahwa populasi memiliki distribusi normal atau mendekati
normal, dengan ukuran sampling yang berbeda-beda 𝑥
berdistribusi normal
• Populasi yang berdistribusi tidak normal, jika populasi
tidak berdistribusi normal digunakan central limit
theorem, untuk mengidentifikasi distribusi sampel
• Distribusi sampel 𝑥 cenderung semakin normal dengan
bertambahnya ukuran sampel
CENTRAL LIMIT THEOREM BEBERAPA POPULASI
• Para ahli statistik meneliti
bahwa dalam banyak
penerapan, distribusi sampling 𝑥
cenderung menjadi normal jika
ukuran sampelnya sebesar 30
DISTRBUSI SAMPLING 𝑿
• Jika manager mengatakan bahwa rata2 sampel bisa diterima jika
jaraknya dari rata2 populasi adalah 500, seberapa besar
kemungkinannya?
• Rata2 populasi = 51800, berapa probabilitas bahwa rata-rata sampel
berada pada selang 51300 dan 52300
• Ingat kembali bahwa kurva berdistribusi normal, sehingga bisa
menggunakan table z,
• Jika jumlah sampel ditambah menjadi 100 orang, kurva menjadi seperti berikut:
Jadi, dengan menambah jumlah sampel,
Semakin besar robabilitas bahwa
𝑥 berada pada rentang tersebut,
dari 50.34% menjadi 78.88%
DISTRIBUSI PENARIKAN SAMPEL UNTUK PROPORSI (𝑷)
• Nilai harapan (Expected Value) dari proporsi sampel (p) jika dirata-
ratakan akan sama dengan proporsi populasi