com
CBAB HAIUTLINE
3.1 DESKRIPSI VARIASI 3.5 BEBERAPA PENDEKATAN YANG BERMANFAAT
67
68 bagian 3 ■ Kualitas Proses Pemodelan
pada karakteristik ini tersedia. Umumnya, sampel hanyalah bagian dari data yang diambil dari beberapa
populasi atau proses yang lebih besar. Tujuan kedua adalah untuk memperkenalkandistribusi probabilitas
dan menunjukkan bagaimana mereka menyediakan alat untuk pemodelan atau menggambarkan karakteristik
kualitas suatu proses.
Setelah mempelajari bab ini dengan cermat, Anda seharusnya dapat melakukan hal berikut:
1. Membangun dan menafsirkan tampilan data visual, termasuk plot batang dan daun,
histogram, dan plot kotak
2. Hitung dan tafsirkan rata-rata sampel, varians sampel, simpangan baku
sampel, dan rentang sampel
3. Jelaskan konsep variabel acak dan distribusi probabilitas
4. Memahami dan menafsirkan mean, varians, dan standar deviasi
dari distribusi probabilitas
5. Tentukan probabilitas dari distribusi probabilitas
6. Memahami asumsi untuk masing-masing distribusi probabilitas diskrit
disajikan
7. Pahami asumsi untuk masing-masing distribusi probabilitas kontinu yang
disajikan
8. Pilih distribusi probabilitas yang sesuai untuk digunakan dalam aplikasi tertentu
Ada beberapa metode grafis yang sangat berguna untuk meringkas dan menyajikan data.
Salah satu teknik grafis yang paling berguna adalahtampilan batang dan daun.
Misalkan data diwakili oleh x1, x2, . . . ,xn dan bahwa setiap nomor xSaya terdiri
minimal dua digit. Untuk membuat plot batang dan daun, kami membagi setiap angkaxSaya
menjadi dua bagian: batang, yang terdiri dari satu atau lebih digit utama; dan daun, terdiri
dari digit yang tersisa. Misalnya, jika data terdiri dari persen informasi cacat antara 0 dan 100
pada banyak wafer semikonduktor, maka kita dapat membagi nilai 76 menjadi batang 7 dan
daun 6. Secara umum, kita harus memilih batang yang relatif sedikit dibandingkan dengan
jumlah pengamatan. Biasanya yang terbaik adalah memilih antara 5 dan 20 batang. Setelah
satu set batang telah dipilih, mereka terdaftar di sepanjang margin kiri tampilan, dan di
samping setiap batang semua daun yang sesuai dengan nilai data yang diamati terdaftar
dalam urutan di mana mereka ditemui dalam kumpulan data.
Versi plot batang-dan-daun yang diproduksi oleh Minitab kadang-kadang disebut an
memesan plot batang dan daun, karena daun disusun berdasarkan besarnya. Versi ini
E XAMPLE 3.1 Klaim Asuransi Kesehatan
Data pada Tabel 3.1 memberikan contoh waktu siklus dalam hari untuk memproses dan membayar klaim asuransi kesehatan karyawan dalam jumlah besar
perusahaan. Buatlah plot batang dan daun untuk data tersebut.
S solusi
Untuk membuat plot batang dan daun, kita dapat memilih nilai
1, 2, 3, 4, dan 5 sebagai batang. Namun, ini akan menghasilkan batang untuk batang yang lebih besar. Untuk batang tengah, angka
semua 40 nilai data yang dipadatkan menjadi hanya lima batang, dalam tanda kurung menunjukkan jumlah pengamatan yang termasuk
jumlah minimum yang biasanya disarankan. Alternatifnya adalah dalam batang tersebut. Pemeriksaan plot mengungkapkan bahwa
dengan membagi setiap batang menjadi bagian bawah dan bagian distribusi jumlah hari untuk memproses dan membayar klaim asuransi
atas, dengan daun 0–4 ditempatkan di bagian bawah batang dan kesehatan karyawan memiliki bentuk yang kurang lebih simetris, dengan
puncak tunggal. Tampilan batang dan daun memungkinkan kita untuk
daun 5–9 ditempatkan di bagian atas. Angka
dengan cepat menentukan beberapa fitur penting dari data yang tidak
3.1 adalah plot batang-dan-daun yang dihasilkan oleh Minitab, dan terlihat jelas dari tabel data. Misalnya, Gambar 3.1 memberikan kesan
menggunakan strategi pemisahan batang. Kolom di sebelah kiri batang memberikan visual bentuk, sebaran atau variabilitas, dan tendensi sentral atau tengah
penghitungan kumulatif dari jumlah pengamatan yang berada pada atau di bawah data (yang mendekati 35).
batang tersebut untuk batang yang lebih kecil, dan pada atau di atasnya
■ TABEL 3 . 1
Waktu Siklus dalam Hari untuk Membayar Klaim Asuransi Kesehatan
Karyawan Tampilan Batang dan Daun: Hari
Mengeklaim hari Mengeklaim hari Mengeklaim hari Mengeklaim hari
Batang-dan-daun Hari
1 48 11 35 21 37 31 16 N = 40
2 41 12 34 22 43 32 22 Satuan Daun = 1.0
3 677
22234
1
3 35 13 36 23 17 33 33 8
4 36 14 42 24 26 34 30 13 2 555666677
66778
6 16 36 26 27
2 3
(8) 1233
00012334
5 37 15 43 25 28
36 35 24 56678
26
19 6
23
3
10
7 36 17 56 27 45 37 22 6 4
8 46 18 32 28 33 38 4 30 1 5
1
9 35 19 46 29 22 39 31
5
10 47 20
30 27 17 ■ GAMBAR 3 . 1Plot batang-dan-kiri
30 untuk data klaim asuransi kesehatan.
40
tampilan membuatnya sangat mudah ditemukan persentil dari datanya. Umumnya 100kpersentil adalah
nilai sedemikian rupa sehingga setidaknya 100 k% dari nilai data berada pada atau di bawah nilai ini dan
setidaknya 100 (1 k)% dari nilai data berada pada atau di atas nilai ini. NSpersentil kelima puluh
distribusi data disebut contoh median x. NS
median dapat dianggap sebagai nilai data yang secara tepat membagi sampel menjadi dua, dengan setengah
dari pengamatan lebih kecil dari median dan setengahnya lebih besar.
Jika n, jumlah pengamatan, ganjil, mencari median itu mudah. Pertama, urutkan pengamat-
vations dalam urutan menaik (atau peringkat data dari pengamatan terkecil ke pengamatan terbesar).
Maka median akan menjadi pengamatan pada posisi rangking [(n - 1)/2 + 1] pada daftar ini. Jikan genap,
median adalah rata-rata dari (n/2)st dan (n/ 2 + 1) pengamatan peringkat pertama. Karena dalam contoh
kitan = 40 adalah bilangan genap, median adalah rata-rata dari dua pengamatan dengan rank 20 dan 21,
atau
33 + 34 = 33.5
x= 2
65
55
45
hari 35
25
NS persentil kesepuluh adalah pengamatan dengan rank (0,1)(40) + 0,5 = 4,5 (pertengahan antara
pengamatan keempat dan kelima), atau (22 + 22)/2 = 22. kuartil pertama adalah pengamatan
dengan rank (0,25)(40) + 0,5 = 10,5 (pertengahan antara pengamatan kesepuluh dan kesebelas)
atau (26 + 27)/2 = 26,5, dan kuartil ketiga adalah observasi dengan rank (0,75)(40) + 0,5 =
30.5 (pertengahan antara pengamatan ketiga puluh dan ketiga puluh satu), atau (37 + 41) = 39.
Kuartil pertama dan ketiga kadang-kadang dilambangkan dengan simbol Q1 dan Q3, dan
jarak interkuartil IQR = Q3 Q1 kadang-kadang digunakan sebagai ukuran variabilitas.
Untuk data klaim asuransi, range interkuartilnya adalah IQR = Q3 Q1 = 39 26,5 = 12,5.
Akhirnya, meskipun tampilan batang-dan-daun adalah cara yang sangat baik untuk secara visual
menunjukkan variabilitas data, itu tidak mengambil urutan waktu dari pengamatan yang diperhitungkan.
Waktu seringkali merupakan faktor yang sangat penting yang berkontribusi terhadap variabilitas dalam masalah
peningkatan kualitas. Kita bisa, tentu saja, hanya memplot nilai data versus waktu; grafik seperti itu disebutplot
deret waktu atau menjalankan grafik.
Misalkan waktu siklus untuk memproses dan membayar klaim asuransi kesehatan karyawan pada
Tabel 3.1 ditampilkan dalam urutan waktu. Gambar 3.2 menunjukkan plot deret waktu dari data. Kami
menggunakan Minitab untuk membuat plot ini (disebut apetak marginal) dan meminta plot titik data
yang akan dibangun di kamu-batas sumbu. Tampilan ini dengan jelas menunjukkan bahwa waktu
merupakan sumber variabilitas yang penting dalam proses ini. Lebih khusus lagi, waktu siklus
pemrosesan untuk 20 klaim pertama secara substansial lebih lama daripada waktu siklus untuk 20 klaim
terakhir. Sesuatu mungkin telah berubah dalam proses (atau sengaja diubah oleh personel operasi) yang
bertanggung jawab atas peningkatan waktu siklus yang terlihat. Kemudian dalam buku ini kami secara
resmi memperkenalkan peta kendali sebagai teknik grafis untuk memantau proses seperti ini, dan untuk
menghasilkan sinyal berbasis statistik ketika terjadi perubahan proses.
3.1.2 Histogramnya
A histogram adalah ringkasan data yang lebih ringkas daripada plot batang dan daun. Untuk membangun histogram
untuk data kontinu, kita harus membagi rentang data ke dalam interval, yang biasanya disebutinterval kelas, sel, atau
tempat sampah. Jika memungkinkan, tempat sampah harus memiliki lebar yang sama untuk meningkatkan informasi
visual dalam histogram. Beberapa pertimbangan harus digunakan dalam memilih jumlah tempat sampah sehingga
tampilan yang masuk akal dapat dikembangkan. Jumlah bin tergantung pada jumlah pengamatan dan jumlah hamburan
atau dispersi dalam data. Histogram yang menggunakan terlalu sedikit atau terlalu banyak tempat sampah tidak akan
informatif. Kami biasanya menemukan bahwa antara 5 dan 20 tempat sampah memuaskan dalam banyak kasus dan
jumlah tempat sampah akan meningkat dengan
n. Memilih jumlah bin yang kira-kira sama dengan akar kuadrat dari jumlah pengamatan
sering kali berhasil dalam praktiknya.1
1Tidak ada kesepakatan universal tentang cara memilih jumlah bin untuk histogram. Beberapa teks statistik dasar-
buku menyarankan menggunakan aturan Sturges, yang menetapkan jumlah tempat sampah H = 1 + log2n, di mana n adalah ukuran sampel.
Ada banyak variasi aturan Sturges. Paket perangkat lunak komputer menggunakan banyak algoritma yang berbeda untuk menentukan
jumlah dan lebar tempat sampah, dan beberapa di antaranya mungkin tidak didasarkan pada aturan Sturges.
Setelah jumlah bin dan batas bawah dan atas setiap bin telah ditentukan, data
diurutkan ke dalam bin dan dilakukan penghitungan jumlah pengamatan di setiap bin.
Untuk menyusun histogram, gunakan sumbu horizontal untuk mewakili skala
pengukuran data dan skala vertikal untuk mewakili hitungan, ataufrekuensi.
Kadang-kadang frekuensi di setiap bin dibagi dengan jumlah total pengamatan (n), dan kemudian
skala vertikal histogram mewakili frekuensi relatif. Persegi panjang digambar di atas setiap
nampan, dan tinggi setiap persegi panjang sebanding dengan frekuensi (atau frekuensi relatif).
Kebanyakan paket statistik membangun histogram.
■ TABEL 3 . 2
Ketebalan Lapisan (Å) pada Wafer
Semikonduktor
438 450 487 451 452 441 444 461 432 471
413 450 430 437 465 444 471 453 431 458
444 450 446 444 466 458 471 452 455 445
468 459 450 453 473 454 458 438 447 463
445 466 456 434 471 437 459 445 454 423
472 470 433 454 464 443 449 435 435 451
474 457 455 448 478 465 462 454 425 440
454 441 459 435 446 435 460 428 449 442
455 450 423 432 459 444 445 454 449 441
449 445 455 441 464 457 437 434 452 439
S solusi
Karena kumpulan data berisi 100 pengamatan dan
2100 = 10, kami menduga bahwa sekitar 10 bin akan memberikan histogram 30
yang memuaskan. Kami membangun histogram menggunakan opsi Minitab
yang memungkinkan pengguna untuk menentukan jumlah tempat sampah.
20
Frekuensi
Sebagian besar paket komputer memiliki pengaturan default untuk jumlah tempat sampah.
Gambar 3.4 adalah histogram Minitab yang diperoleh dengan pengaturan default, yang mengarah ke
histogram dengan 15 bin. Histogram bisa relatif sensitif terhadap pilihan jumlah dan lebar tempat
sampah. Untuk kumpulan data kecil, tampilan histogram dapat berubah secara dramatis jika jumlah dan/
atau lebar tempat sampah berubah. Untuk alasan ini, kami lebih suka menganggap histogram sebagai
teknik yang paling cocok untukkumpulan data yang lebih besar berisi, katakanlah, 75 hingga 100 atau
lebih pengamatan. Karena jumlah pengamatan pada ketebalan lapisan cukup besar (n = 100), pilihan
15 100
10
Frekuensi
Frekuensi
50
0 0
410 420 430 440 450 460 470 480 490 410 420 430 440 450 460 470 480 490
Ketebalan logam Ketebalan logam
jumlah bin tidak terlalu penting, dan histogram pada Gambar 3.3 dan 3.4 menyampaikan
informasi yang sangat mirip.
Perhatikan bahwa dengan berpindah dari data asli atau plot batang-dan-daun ke
histogram, kita kehilangan beberapa informasi karena pengamatan asli tidak disimpan di
layar. Namun, kehilangan informasi ini biasanya kecil dibandingkan dengan keringkasan dan
kemudahan interpretasi histogram, terutama dalam sampel besar.
Histogram selalu lebih mudah untuk diinterpretasikan jika tempat sampah memiliki lebar yang sama. Jika tempat
sampah memiliki lebar yang tidak sama, biasanya menggambar persegi panjang yang luasnya (berlawanan dengan
ketinggian) sebanding dengan jumlah pengamatan di tempat sampah.
Gambar 3.5 menunjukkan variasi histogram yang tersedia di Minitab (mis plot frekuensi
kumulatif). Dalam plot ini, tinggi setiap batang mewakili jumlah pengamatan yang kurang dari
atau sama dengan batas atas bin. Frekuensi kumulatif seringkali sangat berguna dalam
interpretasi data. Sebagai contoh, kita dapat membaca langsung dari Gambar 3.5 bahwa sekitar 75
dari 100 wafer memiliki ketebalan lapisan logam kurang dari 460Å.
Distribusi frekuensi dan histogram juga dapat digunakan dengan data kualitatif, kategorikal,
atau hitung (diskrit). Di beberapa aplikasi, akan ada pengurutan kategori secara alami (seperti
mahasiswa baru, mahasiswa tahun kedua, junior, dan senior), sedangkan di lain urutan kategori
akan arbitrer (seperti pria dan wanita). Saat menggunakan data kategorikal, batang harus
digambar agar memiliki lebar yang sama.
Untuk membangun histogram untuk data diskrit atau hitung, pertama-tama tentukan
frekuensi (atau frekuensi relatif) untuk setiap nilai x. Masing-masingx nilai sesuai dengan bin.
Histogram digambar dengan memplot frekuensi (atau frekuensi relatif) pada skala vertikal dan nilai
x pada skala horizontal. Kemudian di atas setiap nilaix, gambarlah persegi panjang yang tingginya
adalah frekuensi (atau frekuensi relatif) yang sesuai dengan nilai tersebut.
Dicat
6 1 5 7 8 6 0 2 4 2
5 2 4 4 1 4 1 7 2 3
4 3 3 3 6 3 2 3 4 5
5 2 3 4 4 4 2 3 5 7
5 4 5 5 4 5 3 3 3 12
S solusi
histogram cacat. Perhatikan bahwa jumlah cacat adalah variabel diskrit. Dari histogram atau data tabulasi kita dapat menentukan
10
Frekuensi
50 5
dan
Proporsi tudung dengan antara 0 dan
2 cacat = 11 = 0,22
0
0 5 10
50 Cacat
n
Σ xSaya
x = x1 + x2 +L+ xnn
n = Saya=1 (3.1)
Perhatikan bahwa rata-rata sampel x hanyalah mean aritmatika dari n pengamatan. Rata-rata
sampel untuk data ketebalan logam pada Tabel 3.2 adalah
100
Σ xSaya
45.001 = 450.01AHai
x = Saya =1 = 100
1 00
Lihat Gambar 3.3 dan perhatikan bahwa rata-rata sampel adalah titik di mana histogram benar-
benar "seimbang." Dengan demikian, rata-rata sampel mewakili pusat massa data sampel.
Variabilitas dalam data sampel diukur dengan varians sampel:
n
Σ (x Saya - x)2 S2 = Saya=1 n -1
(3.2)
Perhatikan bahwa varians sampel hanyalah jumlah deviasi kuadrat dari setiap pengamatan
dari rata-rata sampel x, dibagi dengan ukuran sampel dikurangi 1. Jika tidak ada variasi
kemampuan dalam sampel, maka setiap pengamatan sampel xSaya = x, dan varians sampel S2 = 0.
Umumnya, semakin besar varians sampel S2 adalah, semakin besar variabilitas dalam data sampel.
Satuan varians sampel S2 adalah kuadrat dari unit asli data. Ini sering tidak nyaman
dan canggung untuk ditafsirkan, jadi kami biasanya lebih suka menggunakan akar kuadrat
dari S2, disebut standar deviasi sampel S, sebagai ukuran variabilitas.
Berikut ini
n
Σ (x Saya - x)2
S = Saya=1 n -1 (3.3)
Keuntungan utama deviasi standar sampel adalah dinyatakan dalam satuan pengukuran
asli. Untuk data ketebalan logam, kami menemukan bahwa
H2ai
S2 = 180.2928A
dan
Hai
S = 13.43A
Untuk lebih mudah melihat bagaimana standar deviasi menggambarkan variabilitas, pertimbangkan keduanya:
sampel yang ditampilkan di sini:
Contoh 1 Contoh 2
x1 = 1
x1 = 1
x2 = 3
x2 = 5
x3 = 5
x3 = 9
x=3
x=5
Jelas, sampel 2 memiliki variabilitas yang lebih besar daripada sampel 1. Hal ini tercermin dalam standar
deviasi, dimana untuk sampel 1 adalah
3
Σ (x Saya - x)2
(1− 3)2 + (3 3)2 + (5 3)2
S = Saya=1 = = 4=2
2 2
Σ3 (x S-
(1 -5)2 + (5 5)2 + 9 5(2 - )2 = 16 = 4
S = Saya=1
axy a2
2) =
Dengan demikian, variabilitas yang lebih besar dalam sampel 2 dicerminkan oleh standar deviasi yang lebih besar. Sekarang
Contoh 3
x1 = 101
x2 = 103
x3 = 105
x = 103
Perhatikan bahwa sampel 3 diperoleh dari sampel 1 dengan menambahkan 100 pada setiap
pengamatan. Simpangan baku untuk sampel ketiga ini adalahS = 2, yang identik dengan standar
deviasi sampel 1. Membandingkan dua sampel, kita melihat bahwa kedua sampel memiliki
variabilitas identik atau menyebar tentang rata-rata, dan inilah mengapa mereka memiliki standar
deviasi yang sama. Ini mengarah ke poin penting:Standar deviasi tidak mencerminkan
besarnya data sampel, hanya sebaran tentang rata-rata.
Kalkulator genggam sering digunakan untuk menghitung rata-rata sampel dan simpangan baku.
Perhatikan bahwa persamaan 3.2 dan 3.3 tidak terlalu efisien secara komputasi, karena setiap angka
harus dimasukkan ke dalam kalkulator dua kali. Rumus yang lebih efisien adalah
⎛ n ⎞2
n
⎜⎝ Σ xSaya ⎟
n Dalam menggunakan persamaan 3.4, setiap angka hanya perlu dimasukkan satu kali, asalkan
Σ Saya=1xSaya dann
Saya=1x2Saya dapat secara bersamaan terakumulasi dalam kalkulator. Banyak murah
kalkulator genggam melakukan fungsi ini dan menyediakan perhitungan otomatis dari x dan S.
(lanjutan)
76 bagian 3 ■ Kualitas Proses Pemodelan
S solusi
Plot kotak ditunjukkan pada Gambar 3.7. Perhatikan bahwa 120.35 120.6 120.9
median sampel berada di tengah-tengah antara pengamatan
berurutan peringkat keenam dan ketujuh, atau (120,5 + 120.1 121.3
120,7)/2 = 120,6, dan kuartilnya adalah Q1 = 120,35 dan Q3 =
120,9. Plot kotak menunjukkan bahwa distribusi diameter
■ GAMBAR 3 . 7 Plot kotak untuk sayap pesawat
lubang tidak persis simetris di sekitar nilai pusat, karena data diameter lubang leading edge pada Tabel 3.4.
kumis kiri dan kanan serta kotak kiri dan kanan di sekitar
median tidak sama panjang.
Plot kotak sangat berguna dalam perbandingan grafis di antara kumpulan data, karena
memiliki dampak visual dan mudah dipahami. Misalnya, Gambar 3.8 menunjukkan plot kotak
komparatif untuk indeks kualitas manufaktur pada produk di tiga pabrik. Pemeriksaan tampilan
ini mengungkapkan bahwa ada terlalu banyak variabilitas di pabrik 2, dan bahwa pabrik 2 dan 3
perlu meningkatkan kinerja indeks kualitasnya.
3.1.5Distribusi Probabilitas
Histogram (atau plot batang dan daun, atau plot kotak) digunakan untuk menggambarkan Sampel data. ASampel
adalah kumpulan pengukuran yang dipilih dari beberapa sumber yang lebih besar atau populasi.
Misalnya, pengukuran ketebalan lapisan pada Tabel 3.2 diperoleh dari sampel wafer yang dipilih
dari proses pembuatan. Populasi dalam contoh ini adalah kumpulan semua ketebalan lapisan
yang dihasilkan oleh proses tersebut. Dengan menggunakan metode statistik, kami mungkin
dapat menganalisis data ketebalan lapisan sampel dan menarik kesimpulan tertentu tentang
proses pembuatan wafer.
A distribusi kemungkinan adalah model matematika yang menghubungkan nilai variabel
dengan probabilitas kemunculan nilai tersebut dalam populasi. Dengan kata lain, kita mungkin
memvisualisasikan ketebalan lapisan sebagaivariabel acak karena mengambil nilai yang
berbeda dalam populasi menurut beberapa mekanisme acak, dan kemudian distribusi probabilitas
ketebalan lapisan menggambarkan kemungkinan terjadinya nilai ketebalan lapisan dalam
populasi. Ada dua jenis distribusi probabilitas.
120
110
100
indeks kualitas
90
80
70
1 2 3
Tanaman
P(x3)
P(x2)
P(x4)
P(x5)
P(x1)
x1x2x3 x4x5 x AB x
(A) (B)
■ GAMBAR 3 . 9 Distribusi probabilitas. (A) Kasus diskrit. (B) Kasus terus menerus.
Definisi
Contoh distribusi probabilitas diskrit dan kontinu ditunjukkan pada Gambar 3.9A
dan 3.9B, masing-masing. Kemunculan distribusi diskrit adalah munculnya serangkaian “paku”
vertikal, dengan tinggi setiap paku sebanding dengan probabilitas. Kami menulis kemungkinan-
bahwa variabel acak x mengambil nilai tertentu xSaya sebagai
Tampilan distribusi kontinu adalah kurva mulus, dengan luas di bawah kurva sama dengan
probabilitas, sehingga probabilitas bahwa x terletak pada interval dari A ke B ditulis sebagai
P{A ≤ x ≤ B} =B FA (x)dx
Σ⎜ ⎟
=⎛25⎞
1
(0,01)x(0,99 )25 x
x=0 x
⎝ ⎠
25!
= (0,99)25(0,01)0 + 25! (0,99)24 (0,01)1
0!25! 1!24!
= 0,7778 + 0,1964 = 0,9742
F (x) = 1
15.5 ≤ x ≤17.0
1.5
_1
_
utdistribusi seragam, dan ditunjukkan secara grafis pada Gambar 3.10. Perhatikan bahwa area di15
bawah fungsiF (x) sesuai dengan peluang, sehingga peluang tas berisi kurang dari 16,0
x
15.5 16.0 16,5 17.0
16.0 15.5
= = = 0,3333
1.5 15.5 1.5
Dalam Bagian 3.2 dan 3.3 kami menyajikan beberapa distribusi diskrit dan kontinu yang berguna.
NS berarti M dari distribusi probabilitas adalah ukuran dari tendensi sentral dalam
distribusi, atau lokasi. Rata-rata didefinisikan sebagai
Untuk kasus variabel acak diskrit dengan tepat n nilai kemungkinan yang sama [yaitu, P(xSaya) = 1/n],
maka persamaan 3.5b direduksi menjadi
n
Σ xSaya
μ= Saya=1
n
Perhatikan kesamaan ekspresi terakhir ini dengan rata-rata sampel x didefinisikan dalam persamaan 3.1.
Mean adalah titik di mana distribusi tepat "seimbang" (lihat Gambar 3.11). Jadi, artinya
μ medianμ Mode μ Mode
(A) (B) (C)
■ GAMBAR 3 . 11 Maksud dari sebuah distribusi.
σ=2
σ =4
μ = 10 μ = 20 μ = 10
hanyalah pusat massa dari distribusi probabilitas. Catatan dari Gambar 3.11B bahwa rata-rata
belum tentu persentil kelima puluh dari distribusi (yang merupakan median), dan dari Gambar
3.11c bahwa itu belum tentu merupakan nilai variabel yang paling mungkin (yang disebut mode).
Rata-rata hanya menentukanlokasi dari distribusi, seperti yang ditunjukkan pada Gambar 3.12.
Penyebaran, penyebaran, atau variabilitas dalam distribusi dinyatakan oleh perbedaan S2. NS
definisi varians adalah
ketika variabel acak diskrit dengan n nilai kemungkinan yang sama, maka persamaan 3.6b menjadi
n
Σ (xS-ayμa)2
σ 2 = Saya=1
n
dan kami mengamati bahwa dalam kasus ini varians adalah jarak kuadrat rata-rata setiap anggota
populasi dari rata-rata. Perhatikan kesamaan dengan varians sampelS2, didefinisikan dalam persamaan
3.2. JikaS2 = 0, tidak ada variabilitas dalam populasi. Ketika variabilitas meningkat, varians
S2 meningkat. Varians dinyatakan dalam kuadrat unit variabel asli. Misalnya, jika
kita mengukur tegangan, satuan variansnya adalah (volt) 2. Jadi, biasanya bekerja
dengan akar kuadrat dari varians, yang disebutsimpangan baku S. Berikut ini
n
Σ (x Saya - μ)2
σ = σ 2 = Saya=1 n (3.7)
Standar deviasi adalah ukuran penyebaran atau hamburan dalam populasi yang dinyatakan dalam
satuan aslinya. Dua distribusi dengan mean yang sama tetapi standar deviasi yang berbeda ditunjukkan
pada Gambar 3.13.
3.2 Distribusi Diskrit Penting
Beberapa distribusi probabilitas diskrit sering muncul dalam pengendalian kualitas statistik.
Pada bagian ini, kita membahas distribusi hipergeometrik, distribusi binomial, distribusi
Poisson, dan distribusi binomial dan geometrik negatif.
Definisi
NS distribusi probabilitas hipergeometrik adalah
⎛ D⎞⎛ n - D⎞
⎜⎟⎜ ⎟
P(x) = ⎝ x ⎠⎝ n - x ⎠
x = 0,1,2, . . . , min(n,D) (3.8)
⎛⎜ n⎞
⎝ ⎟n⎠
Rata-rata dan varians dari distribusi tersebut adalah
μ = nD (3.9)
n
dan
σ 2 = nD ⎛1− D⎞⎛ n - n⎞ (3.10)
n ⎝n⎠⎝ n -1⎠
⎛ A⎞ A!
=
⎝ B⎠ B!(ab)!
⎛ 5⎞⎛95⎞ ⎛5⎞⎛95⎞
⎝⎜ ⎟0⎜⎠⎟⎝⎜1⎟0⎜ ⎠⎟ ⎝1 ⎠⎝ 9 ⎠
= ⎛ 100⎞ +⎛ 100⎞ = 0.92314
⎜ ⎟ ⎜ ⎟
⎝ 10 ⎠ ⎝ 10 ⎠
Dalam Bab 15, kami menunjukkan bagaimana model probabilitas seperti ini dapat digunakan untuk merancang prosedur
sampling akseptasi.
Beberapa program komputer dapat melakukan perhitungan ini. Tampilan di bawah ini adalah
output dari Minitab untuk menghitung probabilitas hipergeometrik kumulatif dengann = 100,
D = 5 (perhatikan bahwa Minitab menggunakan simbol M dari pada D dan n = 10). Minitab juga akan
menghitung probabilitas individu untuk setiap nilaix.
Definisi
NS distribusi binomial dengan parameter n ≥ 0 dan 0 < P < 1 adalah
x P(X = x) x P(X = x)
0 0.205891 6 0.001939
1 0.343152 7 0,000277
2 0.266896 8 0,000031
3 0.128505 9 0,000003
4 0,042835 10 0,000000
5 0,010471
Minitab digunakan untuk melakukan perhitungan ini. Perhatikan bahwa untuk semua nilai darix yang terletak antara 10 ≤
x ≤ 15 peluang menemukan x “keberhasilan" dalam 15 percobaan adalah nol.
Beberapa distribusi binomial ditunjukkan secara grafis pada Gambar 3.14. Bentuk dari contoh-
contoh tersebut adalah tipikal dari semua distribusi binomial. Untuk tetapn, distribusi menjadi lebih
simetris sebagai P meningkat dari 0 menjadi 0,5 atau menurun dari 1 menjadi 0,5. Untuk tetapP,
distribusi menjadi lebih simetris sebagai n meningkat.
Variabel acak yang sering muncul dalam pengendalian kualitas statistik adalah
x
P=
(3.14)
n
di mana x memiliki distribusi binomial dengan parameter n dan P. Sering P adalah rasio jumlah
yang diamati dari item yang cacat atau tidak sesuai dalam sampel (x) dengan ukuran sampel (n),
0.4 0,3
n = 15, P = 0.1 n = 10, P = 0,25
n = 15, P = 0,5 0,25 n = 20, P = 0,25
0,3 n = 15, P = 0.9 n = 40, P = 0,25
0.2
0.2
P(x)
F (x)
0,15
0.1
0.1
0,05
0 0
0 3 6 9 12 15 0 5 10 20 25 30
x x
(A) Distribusi binomial untuk nilai yang
berbeda (B) Distribusi binomial untuk nilai yang berbeda
dari P dengan n = 15. dari n dengan P = 0,25.
P(1− P)
σP=
n
Definisi
NS distribusi racun adalah
e-λ xλ x!
P(x) = x = 0,1, . . . (3.15)
dimana parameternya aku > 0 berarti dan perbedaan dari distribusi Poisson adalah
μ =λ (3.16)
dan
σ 2= λ (3.17)
Perhatikan bahwa mean dan varians dari distribusi Poisson keduanya sama dengan
parameter l.
Aplikasi khas dari distribusi Poisson dalam pengendalian kualitas adalah sebagai model
jumlah cacat atau ketidaksesuaian yang terjadi pada suatu unit produk. Faktanya, setiap fenomena
acak yang terjadi pada basis per satuan (atau per satuan luas, per satuan volume, per satuan
waktu, dll.) sering kali didekati dengan baik oleh distribusi Poisson. Sebagai contoh, misalkan
jumlah cacat ikatan kawat per unit yang terjadi pada perangkat semikonduktor berdistribusi
Poisson dengan parameter4a. kMuaka probabilitas bahwa perangkat semikonduktor yang dipilih secara
acak
akan mengandung dua atau lebih sedikit cacat ikatan kawat adalah
2 e4 x
P{x ≤ 2} = = 0,018316 0,073263 0,146525 0,238104
4
x=0 x!
Minitab dapat melakukan perhitungan ini. Menggunakan distribusi Poisson dengan mean = 4
menghasilkan:
x P(X = x)
0 0,018316
1 0,073263
2 0.146525
Beberapa distribusi Poisson ditunjukkan pada Gambar 3.15. Perhatikan bahwa distribusinya adalah
miring; yaitu, ia memiliki ekor panjang ke kanan. Sebagai parameteraku menjadi lebih besar, distribusi
Poisson menjadi simetris dalam penampilan.
Distribusi Poisson dapat diturunkan sebagai bentuk pembatas dari distribusi binomial.
Artinya, dalam distribusi binomial dengan parametern dan P, jika kita membiarkan n mendekati
tak terhingga dan P mendekati nol sedemikian rupa sehingga np = aku adalah konstanta, maka
hasil distribusi Poisson. Dimungkinkan juga untuk menurunkan distribusi Poisson menggunakan
argumen probabilitas murni. [Untuk informasi lebih lanjut tentang distribusi Poisson, lihat
Hines, Montgomery, Goldsman, dan Borror (2004); Montgomery dan Runger (2011); dan materi
teks tambahan.]
0.2
λ =4
λ =8
0.16 λ = 12
λ = 16
0.12
P(x)
0,08
0,04
0
0 10
20 30 40
x
■ GAMBAR 3 . 15Distribusi probabilitas Poisson untuk nilai-nilai yang dipilih dari l.
Definisi
NS distribusi binomial negatif adalah
di mana R ≥ 1 adalah bilangan bulat. NSberarti dan perbedaan dari distribusi binomial negatif
bution adalah
μ=R (3.19)
P
dan
σ 2 = R(1− P) (3.20)
P2
masing-masing.
Distribusi binomial negatif, seperti distribusi Poisson, terkadang berguna sebagai model
statistik yang mendasari untuk berbagai jenis data "hitungan", seperti terjadinya ketidaksesuaian
dalam unit produk (lihat Bagian 7.3.1). Ada dualitas penting antara distribusi binomial dan
distribusi binomial negatif. Dalam distribusi binomial, kami menetapkan ukuran sampel (jumlah
percobaan Bernoulli) dan mengamati jumlah keberhasilan; dalam distribusi binomial negatif, kami
menetapkan jumlah keberhasilan dan mengamati ukuran sampel (jumlah percobaan Bernoulli)
yang diperlukan untuk mencapainya. Konsep ini sangat penting dalam berbagai macam masalah
sampling. Distribusi binomial negatif disebut jugaDistribusi Pascal (setelah Blaise Pascal,
matematikawan dan fisikawan Prancis abad ke-17. Ada variasi binomial negatif untuk nilai riil dari
aku yang disebut distribusi Polya.
Kasus khusus yang berguna dari distribusi binomial negatif adalah jika R = 1, dalam hal ini kita
punya distribusi geometris. Ini adalah distribusi jumlah percobaan Bernoulli sampai pertama
kesuksesan. Distribusi geometriknya adalah
1 1P
μ= dan σ 2=
P P2
masing-masing. Karena barisan percobaan Bernoulli bersifat independen, maka penghitungan jumlah
percobaan sampai keberhasilan berikutnya dapat dimulai dari mana saja tanpa mengubah distribusi
probabilitas. Misalnya, kita sedang memeriksa serangkaian catatan medis mencari informasi yang hilang.
Jika, misalnya, 100 catatan telah diperiksa, probabilitas bahwa kesalahan pertama terjadi pada catatan
nomor 105 hanyalah probabilitas bahwa lima catatan berikutnya adalah GGGGB, di mana G
menunjukkan baik dan B menunjukkan kesalahan. Jika peluang menemukan rekor buruk adalah 0,05,
peluang menemukan rekor buruk pada rekaman kelima yang diperiksa adalah
P5x = 56 = (0,95)4(0,05) = 0,0407. Ini identik dengan probabilitas bahwa catatan buruk
pertama terjadi pada catatan 5. Ini disebutkurangnya properti memori dari distribusi
geometrik. Properti ini menyiratkan bahwa sistem yang dimodelkan tidak gagal karena aus
karena kelelahan atau akumulasi stres.
Variabel acak binomial negatif dapat didefinisikan sebagai jumlah variabel acak geometris.
Artinya, jumlah dariR variabel acak geometris masing-masing dengan parameter P adalah variabel
acak binomial negatif dengan parameter P dan R.
Definisi
NS distribusi normal adalah
1 ⎛ x-μ 2⎞
F (x) = 1e-2 ⎝ σ ⎠
< x <∞ (3.21)
σ 2π
Rata-rata dari distribusi normal adalah m (−q < saya < Q) dan variannya adalah
S2 > 0.
Distribusi normal sering digunakan sehingga kita sering menggunakan notasi khusus,
x - n(MS 2), untuk menyiratkan bahwa x terdistribusi normal dengan mean M dan varians S 2. Tampilan
visual dari distribusi normal adalah simetris, unimodal atauberbentuk lonceng kurva dan ditunjukkan
pada Gambar 3.16.
Ada interpretasi sederhana dari standar deviasi S dari distribusi normal, yang diilustrasikan
pada Gambar 3.17. Perhatikan bahwa 68,26% dari nilai populasi berada di antara batas yang
ditentukan oleh mean plus dan minus satu standar deviasi (M ± 1S ); 95,46% dari nilai berada di
antara batas yang ditentukan oleh rata-rata plus dan minus dua standar deviasi
(M ± 2S ); dan 99,73% dari nilai populasi berada dalam batas yang ditentukan oleh mean
F (x)
μ - 3σ μ - 2σ μ - 1σ μ μ + 1σ μ + 2σ μ + 3σ
σ 2
68,26%
95,46%
x
μ 99,73%
plus dan minus tiga standar deviasi (M ± 3S). Dengan demikian, standar deviasi mengukur jarak
pada skala horizontal yang terkait dengan batas penahanan 68,26%, 95,46%, dan 99,73%.
Merupakan praktik umum untuk membulatkan persentase ini menjadi 68%, 95%, dan 99,7%.
NS distribusi normal kumulatif didefinisikan sebagai probabilitas bahwa acak normal
variabel x kurang dari atau sama dengan beberapa nilai A, atau
1
1 -⎛
2
x- μ⎞
{ x ≤ A} = F( a) = ∫A- ∞ e 2⎝ σ ⎠ dx (3.22)
σ 2π
Integral ini tidak dapat dievaluasi dalam bentuk tertutup. Namun, dengan menggunakan perubahan variabel
x-μ (3.23)
z=
σ
S solusi
Peluang yang diinginkan adalah
σ =2
P{x ≤ 35}
Untuk mengevaluasi probabilitas ini dari tabel normal standar, kami
membakukan titik 35 dan menemukan 0,0062
35 40⎫ x
P{x ≤ 35} = P⎧⎨ z ≤ =
⎩ 2 ⎭ 35 40
S solusi
Distribusi normal yang sesuai ditunjukkan pada Gambar 3.19.
Perhatikan bahwa σ = 0,0005
(LSL) (USL)
= 0,9192 0,0000
■ GAMBAR 3 . 19 Distribusi diameter poros,
= 0,9192 Contoh 3.8.
S solusi
Dari pernyataan masalah, kita memilikiDari Lampiran Tabel II, kami memiliki P5z ≤ 1.6456 = 0,95, jadi
atau atau
Distribusi normal memiliki banyak sifat yang berguna. Salah satunya adalah relatif terhadaplinier
kombinasi variabel acak terdistribusi normal dan independen. Jika x1, x2 . . . ,xn
adalah variabel acak terdistribusi normal dan independen dengan rata-rata M1, M2, . . . ,Mn dan
varians S2 1, S2 , . . . ,S2n, masing-masing, maka distribusi kombinasi linier
kamu = A1x1 + A2x2 +L+ Anxn
dan varians
σ k2a=mAu21σ1 2 + 2
2 2 2 +L+
seb ua h n2 n (3.28)
di mana A1, A2, . . . ,An adalah konstanta.
A σ 2
Definisi
Teorema Limit Pusat Jika x1, x2, . . . ,xn adalah variabel acak independen dengan mean MSaya dan varians S2Saya , dan jika kamu = x1 + x2 + . . . +
n
kamu - Σ μSaya
Saya=1
n
Σ σ Saya
2
Saya=1
pendekatan menjadi memuaskan. Secara umum, jikaxSaya terdistribusi secara identik, dan distribusi
masing-masing xSaya tidak menyimpang secara radikal dari normal, maka teorema limit pusat
bekerja cukup baik untuk n ≥ 3 atau 4. Kondisi ini sering dijumpai dalam masalah rekayasa kualitas.
⎡ ln(A) -θ ⎤ ⎡ ln(A) -θ ⎤
= P⎢z ≤ ω ⎦=
⎣ ⎣ ω ⎦
⎥ standar. Oleh karena itu, Lampiran Tabel II
untuk x > 0, dimana z adalah peubah acak normal
dapat digunakan untuk menentukan probabilitas. Juga,F (x) = 0, untuk x ≤ 0. Variabel acak
lognormal selalu nonnegatif.
Distribusi lognormal didefinisikan sebagai berikut:
Definisi
Membiarkan w memiliki rata-rata distribusi normal kamu dan varians 2; kemudianx = exp(w) adalah
variabel acak lognormal, dan distribusi lognormalnya adalah
1 ⎡ (ln(x) -θ)2 ⎤
F (x) = xω 2π exp⎢- ⎥0<x <∞ (3.29)
⎣⎢ 2ω2 ⎦⎥
Rata-rata dan varian dari x adalah
μ = eθ +ω2 2
dan σ =2 e 2θ +ω 2
(e -1)
ω2 (3.30)
Parameter dari distribusi lognormal adalah kamu dan 2, tetapi diperlukan kehati-hatian untuk
menafsirkan bahwa ini adalah rata-rata dan varians dari variabel acak normal w. Rata-rata dan varian dari
x adalah fungsi dari parameter ini ditunjukkan dalam persamaan 3.30. Gambar 3.20
mengilustrasikan distribusi lognormal untuk nilai parameter yang dipilih.
Masa pakai produk yang menurun seiring waktu sering dimodelkan oleh variabel acak
lognormal. Misalnya, ini adalah distribusi umum untuk masa pakai laser semikonduktor.
Distribusi kontinu lainnya juga dapat digunakan dalam jenis aplikasi ini. Namun, karena
distribusi lognormal diturunkan dari fungsi eksponensial sederhana dari variabel acak
normal, maka probabilitasnya mudah dipahami dan dievaluasi.
1
0.9
0.8 ω2 = 0,25
ω2 = 1
0,7 ω2 = 2.25
0.6
0,5
F (x)
0.4
0,3
0.2
0.1
0
– 0.1
0 1 2 3
4 5 6
x
S solusi
=
1− 0,5710 = 0,4290 μ = eθ +ω 2 2 = exp(6 + 0,72) = 828,82 jam
Definisi
NS distribusi eksponensial adalah
di mana aku > 0 adalah konstanta. NSberarti dan perbedaan dari distribusi eksponensial
adalah
μ=1
(3.32)
λ
dan
σ2= 1 (3.33)
λ2
masing-masing.
F(A) = P{x ≤ A}
= ∫0A e-tdt
= 1− e-a A≥0 (3.34)
0.2
λ = 0.2(μ = 5)
λ = 0.1(μ = 10)
0.16 λ = 0,0667( μ = 15)
0.12
F (x)
F(A)
0,08
0,04
0
0
20 40 60 80 100 0
x A
Hasil ini berlaku terlepas dari nilai aku; yaitu, probabilitas bahwa nilai variabel acak
eksponensial akan lebih kecil dari rata-ratanya adalah 0,63212. Hal ini tentu saja terjadi
karena distribusinya tidak simetris.
Ada hubungan penting antara distribusi eksponensial dan distribusi Poisson. Jika kita
menganggap distribusi Poisson sebagai model jumlah kemunculan beberapa peristiwa dalam
interval (0,T], maka dari persamaan 3.15 diperoleh
e-t (t)x
P(x) =
x!
Sekarang x = 0 menyiratkan bahwa tidak ada kejadian dari peristiwa di (0, T], dan
P5x = 06 = P(0) = elT. Kita mungkin berpikirP(0) sebagai probabilitas bahwa interval ke kejadian
pertama lebih besar dari T, atau
di mana kamu adalah variabel acak yang menunjukkan interval ke kejadian pertama. Sejak
sebagai distribusi interval ke kejadian pertama. Kami mengakui persamaan 3.35 sebagai distribusi
eksponensial dengan parameterl. Oleh karena itu, kita melihat bahwa jika jumlah kemunculan
suatu peristiwa memiliki distribusi Poisson dengan parameter aku, maka distribusi interval
di antara kejadian eksponensial dengan parameter l.
Distribusi eksponensial memiliki kurang ingatan Properti. Untuk mengilustrasikannya, misalkan
variabel acak eksponensialx digunakan untuk memodelkan waktu terjadinya suatu peristiwa.
Pertimbangkan dua titik waktu T1 dan T2 > T1. Maka peluang terjadinya peristiwa tersebut pada waktu
yang kurang dariT1 + T2 tapi lebih besar dari waktu T2 hanyalah peluang terjadinya peristiwa pada
waktu kurang dari T1. Ini adalah kekurangan yang sama dari properti memori yang kita amati sebelumnya untuk
distribusi geometrik. Distribusi eksponensial adalah satu-satunya distribusi kontinu yang
memiliki properti ini.
dengan parameter bentuk R > 0 dan parameter skala aku > 0 berarti dan perbedaan
dari distribusi gamma adalah
μ=R (3.37)
λ
dan
σ2= R (3.38)
λ2
masing-masing.3
Beberapa distribusi gamma ditunjukkan pada Gambar 3.23. Perhatikan bahwa jikaR = 1, distribusi
gamma direduksi menjadi distribusi eksponensial dengan parameter aku (Bagian 3.3.3). Distribusi
gamma dapat mengambil banyak bentuk yang berbeda, tergantung pada nilai yang dipilih untukR dan l.
Ini membuatnya berguna sebagai model untuk berbagai variabel acak kontinu.
Jika parameternya R adalah bilangan bulat, maka distribusi gamma adalah jumlah dari R distribusi
eksponensial yang terdistribusi secara independen dan identik, masing-masing dengan parameter l. Artinya, jika
x1, x2, . . . ,xR eksponensial dengan parameter aku dan mandiri, maka
kamu = x1 + x2 +L+ xR
didistribusikan sebagai gamma dengan parameter R dan l. Ada beberapa aplikasi penting
hasil ini.
1 R = 1, λ = 1
R = 2, λ = 1
0.8 R = 3, λ = 1
0.6
F (x)
0.4
0.2
0
0 2 4 6
x
8 10 12 ■ GAMBAR 3 . 23 distribusi gamma
untuk nilai yang dipilih atau R dan aku = 1.
dalam penyebut persamaan 3.36 adalah fungsi gamma, yang didefinisikan sebagai (R) = QxR1e0xdx, R > 0. Jika R
3 (R)
adalah bilangan bulat positif, maka ≠1R2 = 1R - 12!
Perhatikan sistem yang ditunjukkan pada Gambar 3.24. Ini disebut sistem redundan siaga, karena saat komponen 1 hidup, komponen 2 mati, dan ketika komponen 1 gagal, saklar
Komponen 2
R = 2 dan aku = 104. Jadi, waktu rata-rata untuk kegagalan adalah
m = R/l = 2/104 = 2 × 104 H.
Komponen 1
Mengalihkan
R1
(a) k
F(A) = 1− Σ e-a
k=0 k! (3.40)
Akibatnya, distribusi gamma kumulatif dapat dievaluasi sebagai jumlah dari R Istilah Poisson dengan
parameter akuA. Hasil ini tidak terlalu mengejutkan, jika kita menganggap distribusi Poisson sebagai
model jumlah kemunculan suatu peristiwa dalam interval tetap, dan distribusi gamma sebagai model
porsi interval yang diperlukan untuk mendapatkan jumlah kejadian tertentu. .
Definisi
NS Distribusi Weibull adalah
x β1 p⎢⎡⎛ ⎞ ⎤ x β ⎥
F (x) = ⎛β
θ⎞ ⎝ θ ⎠ mantan x≥0 (3.41)
⎢⎣ ⎝ ⎠ θ ⎦⎥
di mana q > 0 adalah parameter skala dan b > 0 adalah parameter bentuk. NS berarti
dan perbedaan dari distribusi Weibull adalah
μ = θ Γ ⎛⎜1+ ⎟1 ⎞ (3.42)
⎝β ⎠
dan
2⎡ ⎛ 2 ⎞⎧ ⎛ 1 ⎞⎫ ⎤2
σ 2= θ ⎢ Γ ⎜ 1+ ⎟ - ⎨1+
Γ⎜ ⎟⎬ ⎥ (3.43)
⎣ ⎝β ⎠ ⎩ ⎝β ⎠ ⎭ ⎥
⎦
masing-masing.
5
β = 12_ , θ = 1
β = 1, θ = 1
β = 2, θ = 1
4 β = 4, θ = 1
3
F (x)
0
0 ■ GAMBAR 3 . 25 Weibull di-
2 3 kontribusi untuk nilai yang dipilih dari
4 parameter bentuk dan parameter skala q = 1.
1
x
Distribusi Weibull sangat fleksibel, dan dengan pemilihan parameter yang tepat Q dan B,
distribusi dapat mengasumsikan berbagai bentuk. Beberapa distribusi Weibull ditunjukkan pada Gambar
3.25 untukq = 1 dan b = 1/2, 1, 2, dan 4. Perhatikan bahwa ketika b = 1, distribusi Weibull direduksi
menjadi distribusi eksponensial dengan rata-rata 1/Q. Distribusi kumulatif Weibull adalah
F(A) = 1−
⎡ Aβ (3.44)
exp
⎤ θ
⎢⎢⎣⎛ ⎝⎞ ⎠ ⎥ ⎦
⎥
Distribusi Weibull telah digunakan secara luas dalam rekayasa keandalan sebagai model
waktu kegagalan untuk komponen dan sistem listrik dan mekanik. Contoh situasi di mana
distribusi Weibull telah digunakan termasuk perangkat elektronik seperti elemen memori,
komponen mekanis seperti bantalan, dan elemen struktural di pesawat terbang dan mobil.4
S solusi
S solusi
(lanjutan)
99
95
90
Persentase [100(J - 0,5)/n]
80
70
60
50
40
30
20
10
5
1
85.2 86.2 87.2 88.2 89.2 90.2 91.2
■ GAMBAR 3 . 26 Probabilitas normal
x( J ) plot data angka oktan jalan.
Plot probabilitas normal juga dapat dibangun di atas kertas grafik biasa dengan memplot
nilai normal standar zJ melawan x( J), di mana nilai normal standar memenuhi
J - 0,5
= P(Z ≤ z J ) =(z J )
n
Misalnya, jika ( J - 0,5)/n = 0,05, (zJ) = 0,05 menyiratkan bahwa zJ =1.64. Sebagai ilustrasi, perhatikan
data dari contoh sebelumnya. Dalam tabel berikut kami menunjukkan standar normal
skor di kolom terakhir.
Gambar 3.27 menyajikan plot dari zJ melawan x( J). Plot probabilitas normal ini setara
seperti pada Gambar 3.26. Kita dapat memperoleh perkiraan mean dan standar deviasi
langsung dari plot probabilitas normal. Mean diperkirakan sebagai persentil kelima puluh. Dari Gambar
3.25, kami akan memperkirakan angka oktan jalan rata-rata sebagai 88.2. Standar deviasi sebanding
dengan kemiringan garis lurus pada plot, dan satu standar deviasi adalah perbedaan antara persentil
kedelapan puluh empat dan kelima puluh. Pada Gambar 3.26, persentil kedelapan puluh empat adalah
sekitar 90, dan perkiraan simpangan bakunya adalah 90 88,2 = 1,8.
Aplikasi yang sangat penting dari plot probabilitas normal adalah dalam verifikasi asumsi
ketika menggunakan prosedur inferensi statistik yang membutuhkan asumsi normalitas
tion. Ini akan diilustrasikan selanjutnya.
3.30
J x( J) ( J - 0,5)/10 zJ
1.64
1 86.0 0,05 – 1.64
0,67 2 87.0 0,15 – 1.04
3 87.2 0,25 – 0,67
0
zJ
30 30 60 63 70 79 87
90 101 102 115 118 119 119
120 125 140 145 172 182
183 191 222 244 291 511
Dari “Distribusi Lognormal untuk Pemodelan Data Kualitas Ketika Mean Mendekati Nol,”
Jurnal Teknologi Kualitas, 1990, hlm. 105–110.
99
99
95
90 95
80 90
70 80
Persentase
60 70
Persentase
50 60
40 50
30 40
20 30
10 20
5 10
5
1
1
0 100 200 300
400 500 100 1000
Kontaminasi aluminium (ppm) Kontaminasi aluminium (ppm)
(A) (B)
99
95 99
90
80
70 98
60 97
50
40
Persentase
30 95
Persentase
20
90
10
5 80
3 70
60
2 50
1 30
10
10 100
1000 0 100 200 300 400 500 600
Kontaminasi aluminium (ppm)
Kontaminasi aluminium (ppm)
(C)
(D)
■ GAMBAR 3 . 28Plot probabilitas data kontaminasi aluminium pada Tabel 3.5. (A) Biasa.
(B) Lognormal. (C) Weibull. (D ) Eksponensial.
menekuk menjauh dari garis lurus; Ini merupakan indikasi bahwa distribusi normal bukanlah
model yang baik untuk data. Gambar 3.28B adalah plot probabilitas lognormal dari data. Data
jatuh lebih dekat ke garis lurus di plot ini, terutama pengamatan di bagian ekor, menunjukkan
bahwa distribusi lognormal lebih mungkin untuk memberikan model yang masuk akal untuk
data daripada distribusi normal.
Akhirnya, Gambar 3.28C dan 3.28D adalah Weibull dan plot probabilitas eksponensial untuk
data. Pengamatan di plot ini tidak terlalu dekat dengan garis lurus, menunjukkan bahwa baik
Weibull maupun eksponensial adalah model yang sangat baik untuk data. Oleh karena itu,
berdasarkan empat plot probabilitas yang telah kami buat, distribusi lognormal tampaknya
menjadi pilihan yang paling tepat sebagai model untuk data kontaminasi aluminium.
⎜ ⎛ ⎟5⎞⎛195⎞
⎜ ⎟
⎝ 0 ⎠⎝ 10 ⎠
P(0) = = 0,7717
⎛ 200⎞
⎟
⎝⎜ 10 ⎠
Perhatikan bahwa sejak t/T = 10/200 = 0,05 relatif kecil, kita bisa menggunakan pendekatan binomial
dengan P = T/T = 5/200 = 0,025 dan n = 10 untuk menghitung
5
P(0) =⎛ ⎞ (0,025)0(0,975)10 = 0,7763
⎝ 0⎠
dengan aku
np konstan. Ini menyiratkan bahwa, untuk kecilP dan besar n, distribusi Poisson dengan
aku np dapat digunakan untuk mendekati distribusi binomial. Perkiraannya biasanya bagus
untuk ukuran besarn dan jika P < 0.1. Semakin besar nilain dan semakin kecil nilai P, semakin
baik aproksimasinya.
n
P{x = A} =⎛ ⎞ PA(1− P)n-A
⎝ A⎠
1 -
1
[(A-np) np(1− P) ]
2
= 2
2np(1− P)
Karena distribusi binomial bersifat diskrit dan distribusi normal kontinu, maka biasanya
digunakan koreksi kontinuitas dalam aproksimasi, sehingga
⎛ ⎛ 1 1
np ⎞ A+ A - - np ⎞
P{x = A} ≅ Φ ⎜ 2 ⎟ 2 ⎟
⎟-Φ⎜
⎜ n P) ⎜
P(1− ⎟ ⎜ np(1− P ) ⎟
⎠ ⎝ ⎠
di mana £ menunjukkan fungsi distribusi kumulatif normal standar. Jenis lain dari masalah-
pernyataan kemampuan dievaluasi dengan cara yang sama, seperti:
⎛ 1
B + np ⎞ ⎛ 1
A - - 2np ⎞
P {a ≤ x ≤ B }≅ ⎜ Φ ⎜ 2 - Φ⎜⎜ ⎟
⎟ ⎟
nP(1− P) ⎜ np(1− P ) ⎟
⎝ ⎠
Pendekatan normal ke binomial diketahui memuaskan untuk P sekitar 1/2 dan n > 10. Untuk
nilai lain dari P, nilai yang lebih besar n diperlukan. Secara umum, pendekatan tidak cukup
untukP < 1/(n + 1) atau P > n//n + 1), atau untuk nilai-nilai variabel acak di luar interval enam
standar deviasi yang lebarnya berpusat di sekitar rata-rata (yaitu, interval
np ± 32(np(1 P)).
Kita juga dapat menggunakan pendekatan normal untuk variabel P = x/n-itu adalah,
acak fraksi sampel yang cacat pada Bagian 3.2.2. Variabel acak P kurang lebih tidak-
terdistribusi mally dengan mean P dan varians P(1 P)/n, yang seperti itu
⎛ v-P ⎞ ⎛
P {u ≤ P ≤ v} ≅ Φ⎜ - Φ⎜
kamu - P ⎞
⎟
⎝ P(1- P) n⎠ ⎝ P(1− P) n ⎟
⎠
Karena normal akan berfungsi sebagai pendekatan ke binomial, dan karena distribusi binomial
dan Poisson berhubungan erat, tampaknya logis bahwa normal dapat berfungsi untuk mendekati
Poisson. Ini memang kasusnya, dan jika maksudnyaaku distribusi Poisson besar — katakanlah,
setidaknya 15 — maka distribusi normal dengan m = l dan S2 = aku merupakan pendekatan yang
memuaskan.
102 bagian 3 ■ Kualitas Proses Pemodelan
_ n_ < 0.1
n
P < 0.1
( Semakin kecil P dan
lebih besar n lebih baik)
( P>
( Membiarkan P' = 1 – P. Semakin
n lebih baik (
np > 10 P 0.9
0.1 ≤ P ≤ 0.9
λ >_ 15 (Semakin besar semakin baik)
menyajikan komp-
secara acak dari proses, diukur, 127 124 121 118
hensive beranotasi dan hasilnya adalah sebagai
125 123 136 131
solusi untuk berikut (dalam ons cairan): 16,05,
bernomor ganjil 16.03, 16.02, 16.04, 16.05, 16.01, 131 120 140 125
latihan termasuk 16.02, 16.02, 16.03, 16.01, 16.00, 124 119 137 133
di Jawaban untuk
16.07
Latihan yang Dipilih 129 128 125 141
(a) Hitung rata-rata sampel.
bagian di 121 133 124 125
belakang buku ini.
(b) Hitung simpangan baku
sampel. 142 137 128 140
3.2. Diameter lubang dari delapan bantalan yang dipilih secara 151 124 129 131
acak ditunjukkan di sini (dalam mm): 50,001, 50,002, 160 142 130 129
49.998, 50.006, 50.005, 49.996, 50.003, 50.004
125 123 122 126
(a) Hitung rata-rata sampel.
(b) Hitung simpangan baku sampel. 3.8. Waktu kegagalan dalam jam dari komponen
3.3. Waktu pelayanan dalam menit dari masuk sampai keluar elektronik yang dikenai uji umur dipercepat
untuk sepuluh pasien yang mencari perawatan di unit ditunjukkan pada Tabel 3E.1. Untuk mempercepat
gawat darurat rumah sakit adalah 21, 136, 185, 156, 3, uji kegagalan, unit diuji pada suhu tinggi (baca ke
16, bawah, lalu ke seberang).
48, 28, 100, dan 12. Hitung mean dan standar deviasi (a) Hitung rata-rata sampel dan simpangan
pelayanan waktu.
3.4. The Really Cool Clothing Company menjual produknya melalui
baku.
proses pemesanan melalui telepon. Karena bisnisnya bagus,
(b) Membangun histogram.
perusahaan tertarik untuk mempelajari cara agen penjualan
(c) Buatlah plot batang dan daun.
berinteraksi dengan pelanggan mereka. Panggilan dipilih dan
(d) Tentukan median sampel dan kuartil bawah dan
direkam secara acak, kemudian ditinjau dengan agen penjualan
kuartil atas.
untuk mengidentifikasi cara agar layanan yang lebih baik dapat
3.9.Data yang ditunjukkan pada Tabel 3E.2 adalah pembacaan
diberikan atau bahwa pelanggan dapat diarahkan ke item lain
hasil proses kimia pada hari-hari berturut-turut (baca ke
yang serupa dengan yang mereka rencanakan untuk dibeli yang
bawah, lalu ke seberang). Buat histogram untuk data ini.
mungkin juga menarik bagi mereka. Waktu penanganan
panggilan (lama) dalam menit untuk 20 panggilan pelanggan ■ TA BLE 3 E . 2
yang dipilih secara acak yang ditangani oleh agen penjualan Hasil Proses
yang sama adalah sebagai berikut: 6, 26, 8, 2, 6, 3, 10, 14, 4,
5, 3, 17, 9, 8, 9, 5, 3, 28, 21, dan 4. Hitung mean dan 94.1 87.3 94.1 92.4 84.6 85.4
standar 93.2 84.1 92.1 90.6 83.6 86.6
deviasi dari waktu penanganan panggilan.
90.6 90.1 96.4 89.1 85.4 91.7
3.5. Sembilan pengukuran berikut adalah suhu tungku yang (b) Hitung simpangan baku sampel.
direkam pada batch berturut-turut dalam proses
91.4 95.2 88.2 88.8 89.7 87,5
manufaktur semikonduktor (satuan adalah ° F): 953, 88.2 86.1 86.4 86.4 87.6 84.2
955, 948, 951, 957, 949, 954, 950, 959 86.1 94.3 85.0 85.1 85.1 85.1
(a) Hitung rata-rata sampel. 95.1 93.2 84.9 84.0 89.6 90.5
(b) Hitung simpangan baku sampel.
90.0 86.7 87.3 93.7 90.0 95.6
3.6. Pertimbangkan data suhu tungku di Latihan 3.5.
(a) Carilah median sampel dari data ini. 92.4 83.0 89.6 87.7 90.1 88.3
(b) Berapa besar kenaikan suhu terbesar 87.3 95.3 90.3 90.6 94.3 84.1
tanpa mengubah median sampel? 86.6 94.1 93.1 89,4 97.3 83.7
91.2 97.8 94.6 88.6 96.8 82.9
3.7. Kekuatan luluh tabung melingkar dengan tutup ujung
86.1 93.1 96.3 84.1 94.4 87.3
diukur. Hasil pertama (dalam kN) adalah sebagai berikut:
96, 90.4 86.4 94.7 82.6 96.1 86.4
102, 104, 108, 126, 128, 150, 156
(a) Hitung rata-rata sampel.
89.1 87.6
91.1
83.1
98.0
84.5
■ TA BLE 3 E . 3 ■ TA BLE 3 E . 4
Viskositas Siklus Kegagalan Kupon Tes
(b) Hitung probabilitas yang diinginkan dalam (a) menggunakan otomatis memperbaiki dirinya sendiri. JikaT menunjukkan
3.50. Seorang inspektur sedang mencari las yang tidak normal dengan rata-rata 5000 foot-candle ujung dan
sesuai dalam pipa bensin antara Phoenix dan simpangan baku 50 foot-candle ujung. Temukan batas
Tucson. Probabilitas bahwa setiap las tertentu akan spesifikasi yang lebih rendah sehingga hanya 0,5% bohlam tidak
rusak adalah 0,01. Inspektur bertekad untuk terus akan melebihi batas ini.
bekerja sampai menemukan tiga las yang rusak. 3.57. Spesifikasi pada komponen elektronik dalam
sistem
Jika lasan terletak 100 kaki terpisah, berapa
akuisisi target adalah bahwa umurnya harus antara
probabilitas bahwa inspektur harus berjalan 5.000
5000 dan 10.000 jam. Kehidupan berdistribusi normal
kaki? Berapa probabilitas bahwa inspektur harus
dengan rata-rata 7500 jam. Pabrikan menyadari harga
berjalan lebih dari 5000 kaki?
$10 per unit yang diproduksi; namun, unit yang rusak
3.51. Kekuatan tarik bagian logam terdistribusi normal
harus diganti dengan biaya $5 kepada pabrikan. Dua
dengan rata-rata 40 pon dan standar deviasi 5 pon.
proses manufaktur yang berbeda dapat digunakan,
Jika 50.000 bagian diproduksi, berapa banyak yang
keduanya memiliki umur rata-rata yang sama. Namun,
Anda harapkan gagal memenuhi batas spesifikasi
standar deviasi umur untuk proses 1 adalah 1000 jam,
minimum kekuatan tarik 35 pon? Berapa banyak
sedangkan untuk proses 2 hanya 500 jam. Biaya
yang akan memiliki kekuatan tarik lebih dari 48 pon?
produksi untuk proses 2 dua kali lipat dari biaya
3.52. Tegangan keluaran catu daya terdistribusi
normal untuk proses 1. Berapa nilai biaya produksi yang
dengan rata-rata 5 V dan simpangan baku akan menentukan pemilihan antara proses 1 dan 2?
0,02V. Jika spesifikasi tegangan bawah dan atas
berturut-turut adalah 4,95 V dan 5,05 V, berapa 3.58. Karakteristik kualitas suatu produk berdistribusi
peluang bahwa catu daya yang dipilih secara acak normal dengan rata-rata M dan simpangan baku s =
akan sesuai dengan spesifikasi tegangan? 1. Spesifikasi pada karakteristik adalah 6 ≤ x ≤ 8.
3.53. Lanjutan Latihan 3.52. Pertimbangkan kembali Unit yang termasuk dalam spesifikasi kualitas ini
proses pembuatan catu daya di Latihan karakteristik menghasilkan keuntungan sebesar C0. Namun, jika
3.52. Misalkan kita ingin meningkatkan proses. x < 6, keuntungannya adalahC1, sedangkan jika x > 8, keuntungannya adalah
Dapatkah menggeser rata-rata mengurangi jumlah unit - C2. Carilah nilai dariM yang memaksimalkan keuntungan yang
yang tidak sesuai yang diproduksi? Berapa banyak diharapkan.
variabilitas proses perlu dikurangi agar semua kecuali 3.59.Turunkan mean dan varians dari distribusi
satu dari 1000 unit sesuai dengan spesifikasi? binomial.
3.60.Turunkan mean dan varians dari distribusi
3.54. Jika x terdistribusi normal dengan mean M dan
Poisson.
simpangan baku s = 4, dan mengingat bahwa
3.61.Turunkan mean dan varians dari distribusi
probabilitas bahwa x kurang dari 32 adalah 0,0228,
tentukan nilai M.
eksponensial.
3.55. Masa pakai baterai otomotif terdistribusi
3.62.Turunkan mean dan varians dari distribusi
normal geometrik.
dengan rata-rata 900 hari dan simpangan baku