PROBABILITAS &
STATISTIKA
PENGANTAR STATISTIKA
DAN ANALISIS DATA
01
FAKULTAS TEKNIK TEKNIK ELEKTRO 2A3142SP Said Attamimi, Ir., MT
Lukman Medriavin Silalahi ST.,MT
Abstract Kompetensi
Diharapkan setelah mengikuti Setelah membaca modul ini,
perkuliahan ini mahasiswa mampu mahasiswa diharapkan mampu:
memahami dan menerapkan konsep- 1. Ketepatan menghitung dan
konsep yang meliputi: Pengertian menyelesaikan soal nilai rata-
statistik, populasi dan sampel,
menentukan nilai rata, median , rata, median , modus dan
modus dan deviasi standar serta deviasi standar serta koefisien
koefisien variasi. Aturan dasar variasi.
peluang, menghitung peluang dan 2. Ketepatan menghitung dan
memahami permutasi dan kombinasi. menyelesaikan soal peluang
Nilai harapan dan varians dari dan memahami permutasi dan
variabel acak diskrit, menghitung kombinasi
peluang dengan menggunakan
distribusi Binomial maupun Poisson.
Kurva peluang kontinu & fungsi
kerapatan peluang, menyelesaikan
permasalahan dengan pendekatan
distribusi normal.
BAB I
PENGANTAR STATISTIKA DAN
ANALISIS DATA
1.1. PENDAHULUAN
Dimulai pada 1980an dan berlanjut hingga abad ke-21, sejumlah besar perhatian
telah difokuskan pada peningkatan kualitas di industri Amerika. Banyak yang telah
dikatakan dan ditulis tentang "keajaiban industri Jepang”, yang dimulai pada pertengahan
abad ke20. Orang Jepang dapat berhasil di mana kita dan negara lain telah gagal - yaitu,
menciptakan suasana yang memungkinkan produksi produk berkualitas tinggi. Banyak
keberhasilan orang Jepang telah dikaitkan dengan penggunaan metode statistik dan
pemikiran statistik di antara personel manajemen.
A. Penggunaan Data Ilmiah
Penggunaan metode statistik di bidang manufaktur, pengembangan produk
makanan, perangkat lunak komputer, sumber energi, obat-obatan, dan banyak bidang
lainnya melibatkan pengumpulan informasi atau data ilmiah. Tentunya pengumpulan data
bukanlah hal baru. Itu telah dilakukan selama lebih dari seribu tahun. Data telah
dikumpulkan, diringkas, dilaporkan, dan disimpan untuk dibaca dengan teliti. Akan tetapi,
terdapat perbedaan yang mencolok antara kumpulan informasi ilmiah dan statistik
inferensial (sesuatu yang dapat disimpulkan - KBBI). Yang terakhir inilah yang telah
mendapat perhatian yang semestinya dalam beberapa dekade terakhir. Keturunan statistik
inferensial telah menjadi “kotak peralatan” besar metode statistik yang digunakan oleh
praktisi statistik. Metode statistik ini dirancang untuk memberikan kontribusi pada proses
membuat penilaian ilmiah dalam menghadapi ketidakpastian dan variasi. Kepadatan produk
bahan tertentu dari proses pembuatan tidak selalu sama. Memang, jika proses yang terlibat
adalah proses batch daripada kontinu, tidak hanya akan ada variasi dalam kepadatan
material di antara batch yang keluar dari jalur (variasi batch ke batch), tetapi juga variasi
dalam batch. Metode statistik digunakan untuk menganalisis data dari proses seperti ini
untuk mendapatkan pemahaman yang lebih tentang di mana dalam proses perubahan
dapat dilakukan untuk meningkatkan kualitas proses. Dalam proses ini, kualitas dapat
didefinisikan dengan baik dalam kaitannya dengan kedekatan dengan nilai kepadatan target
selaras dengan bagian waktu disaat kriteria kedekatan ini terpenuhi. Seorang insinyur
Ada ukuran lain dari tendensi sentral yang dibahas secara rinci bahasan perkulian
selanjutnya. Salah satu ukuran penting adalah median sampel. Tujuan median sampel
adalah untuk mencerminkan tendensi sentral sampel sedemikian rupa sehingga tidak
dipengaruhi oleh nilai ekstrim atau pencilan.
Definisi 1.2: Diketahui bahwa observasi dalam sampel adalah x1, x2,. . . , xn, disusun dalam urutan
kenaikan besarnya, median sampel adalah
Catatan: Odd=Ganjil
Even=Genap
Sebagai contoh, misalkan kumpulan data adalah sebagai berikut: 1.7, 2.2, 3.9, 3.11,
dan 14.7. Rata-mean/rata-rata sampel dan median adalah,
Jelas ada perbedaan konsep antara mean dan median. Mungkin menarik bagi kita
dengan latar belakang teknik bahwa rata-rata sampel adalah pusat data dalam sampel.
Dalam arti tertentu, ini adalah titik di mana titik tumpu dapat ditempatkan untuk
menyeimbangkan sistem "bobot" yang merupakan lokasi data individu. Hal ini ditunjukkan
pada Gambar 1.4 berkaitan dengan sampel dengan-nitrogen.
Gambar 1.4 Rata-rata sampel sebagai sentroid dari bobot batang dengan-nitrogen
Dalam perkuliahan selanjutnya, dasar penghitungan x́ adalah perkiraan rata-rata
populasi. Seperti yang kita dapati sebelumnya, tujuan dari kesimpulan statistik adalah untuk
menarik kesimpulan tentang karakteristik atau parameter populasi dan estimasi adalah fitur
yang sangat penting dari inferensi statistik.
Median dan mean bisa sangat berbeda satu sama lain. Perhatikan, bagaimanapun,
bahwa dalam kasus data berat batang, nilai rata-rata sampel untuk tanpa nitrogen sangat
mirip dengan nilai median.
Ada beberapa metode lain untuk mengukur pusat lokasi data dalam sampel. Namun,
kita tidak akan membahasnya saat ini. Sebagian besar, alternatif mean sampel dirancang
untuk menghasilkan nilai yang mewakili kompromi antara mean dan median. Meskipun, kita
jarang menggunakan tindakan lain seperti ini. Akan tetapi, ada baiknya membahas satu
kelas penduga, yaitu kelas sarana yang dipangkas. Rata-rata yang dipotong dihitung
dengan "memotong" persentase tertentu dari kumpulan nilai terbesar dan terkecil. Misalnya,
rata-rata pemangkasan 10% ditemukan dengan menghilangkan 10% terbesar dan 10%
terkecil dan menghitung rata-rata dari nilai yang tersisa. Misalnya, untuk data berat batang,
kita akan menghilangkan yang terbesar dan terkecil karena ukuran sampel adalah 10 untuk
setiap sampel. Jadi untuk kelompok tanpa nitrogen diberikan rata-rata pemangkasan 10%.
Perhatikan bahwa dalam kasus ini, seperti yang diharapkan, mean yang dipotong
mendekati mean dan median untuk sampel individu. Rata-rata yang dipangkas, tentu saja,
lebih tidak sensitif terhadap pencilan daripada rata-rata sampel tetapi tidak sekensensitif
median. Di sisi lain, pendekatan rata-rata yang dipangkas menggunakan lebih banyak
informasi daripada median sampel. Perhatikan bahwa median sampel, memang, kasus
khusus dari rata-rata yang dipotong di mana semua data sampel dihilangkan terlepas dari
satu atau dua pengamatan di tengah.
1.4. UKURAN VARIABILITAS
Variabilitas sampel memainkan peran penting dalam analisis data. Variabilitas
proses dan produk adalah fakta kehidupan dalam sistem teknik dan ilmiah: Pengendalian
atau pengurangan variabilitas proses sering kali menjadi sumber kesulitan utama. Semakin
banyak insinyur dan manajer proses mempelajari bahwa kualitas produk dan, sebagai
hasilnya, keuntungan yang diperoleh dari produk manufaktur sangat banyak merupakan
fungsi dari variabilitas proses. Akibatnya, sebagian besar pada bahasan lanjutan statistikan
membahas analisis data dan prosedur pemodelan di mana variabilitas sampel memainkan
peran utama. Bahkan dalam masalah analisis data kecil, keberhasilan metode statistik
tertentu mungkin bergantung pada besarnya variabilitas di antara pengamatan dalam
sampel. Pengukuran lokasi dalam sampel tidak memberikan ringkasan yang tepat tentang
sifat kumpulan data. Misalnya, dalam Contoh 1.2 kita tidak dapat menyimpulkan bahwa
penggunaan nitrogen meningkatkan pertumbuhan tanpa memperhitungkan variabilitas
sampel.
Sementara rincian analisis dari jenis kumpulan data ini berada pada bahasan
Hipotesis, harus jelas dari Gambar 1.1 bahwa variabilitas di antara pengamatan tanpa
nitrogen dan variabilitas di antara pengamatan nitrogen tentu saja memiliki beberapa
konsekuensi. Nyatanya, tampak bahwa variabilitas dalam sampel nitrogen lebih besar
daripada sampel tanpa nitrogen. Mungkin ada sesuatu tentang pemasukan nitrogen yang
tidak hanya meningkatkan tinggi batang ( x́ dari 0,565 gram dibandingkan dengan x́ dari
0,399 gram untuk sampel tanpa nitrogen) tetapi juga meningkatkan variabilitas dalam tinggi
Simpangan baku sampel, dilambangkan dengan s, adalah akar kuadrat positif dari
s2, yaitu,
Harus jelas bagi kita bahwa deviasi standar sampel sebenarnya adalah ukuran
variabilitas. Variabilitas yang besar dalam satu set data menghasilkan nilai ( x−x́ )2 yang
relatif besar dan dengan demikian varian sampel yang besar. Besaran n−1 sering disebut
degree of freedom (derajat kebebasan) yang diasosiasikan dengan estimasi varians. Dalam
contoh sederhana ini, derajat kebebasan menggambarkan jumlah informasi independen
Jenis masalah yang dihadapi para ilmuwan dan insinyur yang berurusan dengan
data biner tidak banyak berbeda dengan yang terlihat di mana pengukuran berkelanjutan
menjadi perhatian. Namun, teknik yang berbeda digunakan karena sifat statistik dari
proporsi sampel sangat berbeda dari mean sampel yang dihasilkan dari rata-rata yang
diambil dari populasi berkelanjutan. Perhatikan contoh data di Latihan 1.6 di halaman 13.
Masalah statistik yang mendasari ilustrasi ini berfokus pada apakah intervensi, katakanlah,
peningkatan suhu pengeringan, akan mengubah kekuatan tarik rata-rata populasi yang
terkait dengan proses karet silikon. Di sisi lain, di area kendali mutu, misalkan sebuah pabrik
ban mobil melaporkan bahwa pengiriman 5.000 ban yang dipilih secara acak dari proses
menghasilkan 100 di antaranya menunjukkan cacat. Di sini proporsi sampelnya adalah
100/5000 = 0,02. Setelah perubahan dalam proses yang dirancang untuk mengurangi noda,
sampel kedua diambil 5000 dan 90 ban rusak. Proporsi sampel telah dikurangi menjadi
Lima spesimen kain diproduksi untuk masing-masing dari empat persentase kapas.
Dalam hal ini, baik model eksperimen maupun jenis analisis yang digunakan harus
mempertimbangkan tujuan eksperimen dan masukan penting dari ilmuwan tekstil. Beberapa
grafik sederhana dapat menjelaskan perbedaan yang jelas antara sampel. Lihat Gambar
1.5; rata-rata sampel dan variabilitas digambarkan dengan baik dalam plot pencar. Satu
tujuan yang mungkin dari percobaan ini adalah untuk menentukan persentase kapas mana
yang benar-benar berbeda dari yang lain. Dengan kata lain, seperti dalam kasus data
nitrogen/tanpa nitrogen, untuk persentase kapas manakah terdapat perbedaan yang jelas
antara populasi atau, lebih khusus lagi, antara rata-rata populasi? Dalam kasus ini, mungkin
model yang masuk akal adalah bahwa setiap sampel berasal dari distribusi normal. Di sini
tujuannya sangat mirip dengan data nitrogen/tanpa nitrogen kecuali bahwa lebih banyak
sampel yang terlibat. Formalisme analisis melibatkan gagasan pengujian hipotesis yang
dibahas dalam perkuliahan akhir. Secara kebetulan, formalitas ini mungkin tidak diperlukan
dalam kaitannya dengan plot diagnostik. Tetapi apakah ini menjelaskan tujuan sebenarnya
dari eksperimen dan karenanya merupakan pendekatan yang tepat untuk analisis data?
Kemungkinan bahwa ilmuwan mengantisipasi keberadaan kekuatan tarik rata-rata populasi
maksimum dalam kisaran konsentrasi kapas dalam percobaan. Di sini analisis data harus
berkisar pada jenis model yang berbeda, model yang mendalilkan jenis struktur yang
menghubungkan kekuatan tarik rata-rata populasi dengan konsentrasi kapas. Dengan kata
lain, model dapat ditulis
dimana μt,c adalah populasi rata-rata kekuatan tarik, yang bervariasi dengan jumlah
kapas dalam produk C. Implikasi dari model ini adalah bahwa untuk tingkat kapas tetap, ada
populasi pengukuran kekuatan tarik dan rata-rata populasi adalah μt,c. Jenis model ini, yang
Plot batang dan daun pada Tabel 1.5 hanya berisi empat batang dan akibatnya tidak
memberikan gambaran yang memadai tentang sebarannya. Untuk mengatasi masalah ini,
kita perlu menambah jumlah batang di petak kita. Salah satu cara sederhana untuk
melakukannya adalah dengan menulis setiap nilai batang dua kali dan kemudian mencatat
daun 0, 1, 2, 3, dan 4 yang berlawanan dengan nilai batang yang sesuai di mana ia muncul
pertama kali, dan daun 5, 6, 7, 8, dan 9 berlawanan dengan nilai batang yang sama ini di
mana ia muncul untuk kedua kalinya. Petak batang dan daun yang dimodifikasi ini
diilustrasikan pada Tabel 1.6, di mana batang yang berhubungan dengan daun 0 sampai 4
diberi kode dengan simbol ⋆ dan batang yang berhubungan dengan daun 5 sampai 9 diberi
simbol ·.
Dalam masalah apa pun, kita harus memutuskan nilai batang yang sesuai.
Plot batang dan daun merupakan cara yang efektif untuk meringkas data. Cara lain
adalah melalui penggunaan distribusi frekuensi, di mana data, yang dikelompokkan ke
dalam kelas atau interval yang berbeda, dapat dibuat dengan menghitung daun yang ada di
setiap batang dan mencatat bahwa setiap batang menentukan interval kelas. Pada Tabel
1.5, batang 1 dengan 2 daun mendefinisikan interval 1.0–1.9 yang berisi 2 pengamatan;
batang 2 dengan 5 daun menentukan interval 2.0–2.9 yang berisi 5 pengamatan; batang 3
dengan 25 daun menentukan interval 3,0–3,9 dengan 25 pengamatan; dan batang 4
dengan 8 daun mendefinisikan interval 4,0–4,9 yang berisi 8 pengamatan. Untuk plot
batang dan daun ganda pada Tabel 1.6, batang menentukan tujuh kelas dengan interval
∑ Xj
j=1 (a)
4
∑ ( X j −a )
j=1
(b)
5
∑ f k . Xk
k =1
(c)
4
∑ ( Y j−3 )2
j=1
(d)