Anda di halaman 1dari 47

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

3 Kualitas Proses Pemodelan

CBAB HAIUTLINE
3.1 DESKRIPSI VARIASI 3.5 BEBERAPA PENDEKATAN YANG BERMANFAAT

3.1.1 Plot Batang-dan-Daun 3.5.1 Pendekatan Binomial ke


Hipergeometrik
3.1.2 Histogram
3.1.3 Ringkasan Numerik Data Plot 3.5.2 Pendekatan Poisson ke
Binomial
3.1.4 Kotak
3.5.3 Pendekatan Normal ke
3.1.5 Distribusi Probabilitas
Binomial
3.2 DISKRET PENTING
3.5.4 Komentar di
DISTRIBUSI
Perkiraan
3.2.1 Hipergeometrik
Distribusi Materi Tambahan untuk Bab 3
3.2.2 Distribusi Binomial
S3.1 Acak Independen
3.2.3 Distribusi Poisson Variabel
3.2.4 Distribusi Binomial dan S3.2 Perkembangan Distribusi
Geometris Negatif Poisson
3.3 PENTING TERUS S3.3 Mean dan Varians dari
DISTRIBUSI Distribusi Normal
3.3.1 Distribusi Normal Distribus i S3.4 Lebih lanjut tentang
3.3.2 Lognormal Distribusi Distribusi Lognormal
3.3.3 Eksponensial Distribusi Gamma S3.5 Lebih lanjut tentang
3.3.4 Distribusi Gamma
3.3.5 Plot PROBABILITAS S3.6 Tingkat Kegagalan untuk
3.4 Distribusi Weibull Distribusi Eksponensial
3.4.1 Plot Probabilitas Normal S3.7 Tingkat Kegagalan untuk
Distribusi Weibull
3.4.2 Plot Probabilitas Lainnya

Materi tambahan ada di Situs web buku teks, www.wiley.com/college/montgomery.

CBAB HAIVERSI DAN LPENGHASILAN HAITUJUAN


Buku teks ini adalah tentang penggunaan metodologi statistik dalam pengendalian kualitas dan peningkatan. Bab
ini memiliki dua tujuan. Pertama, kami menunjukkan bagaimana alat sederhana statistik deskriptif dapat
digunakan untuk mengekspresikan variasi secara kuantitatif dalam karakteristik kualitas ketika aSampel dari data

67
68 bagian 3 ■ Kualitas Proses Pemodelan

pada karakteristik ini tersedia. Umumnya, sampel hanyalah bagian dari data yang diambil dari beberapa
populasi atau proses yang lebih besar. Tujuan kedua adalah untuk memperkenalkandistribusi probabilitas
dan menunjukkan bagaimana mereka menyediakan alat untuk pemodelan atau menggambarkan karakteristik
kualitas suatu proses.
Setelah mempelajari bab ini dengan cermat, Anda seharusnya dapat melakukan hal berikut:

1. Membangun dan menafsirkan tampilan data visual, termasuk plot batang dan daun,
histogram, dan plot kotak
2. Hitung dan tafsirkan rata-rata sampel, varians sampel, simpangan baku
sampel, dan rentang sampel
3. Jelaskan konsep variabel acak dan distribusi probabilitas
4. Memahami dan menafsirkan mean, varians, dan standar deviasi
dari distribusi probabilitas
5. Tentukan probabilitas dari distribusi probabilitas
6. Memahami asumsi untuk masing-masing distribusi probabilitas diskrit
disajikan
7. Pahami asumsi untuk masing-masing distribusi probabilitas kontinu yang
disajikan
8. Pilih distribusi probabilitas yang sesuai untuk digunakan dalam aplikasi tertentu

9.Gunakan plot probabilitas


10. Gunakan aproksimasi untuk beberapa distribusi hipergeometrik dan binomial

3.1 Menjelaskan Variasi

3.1.1 Plot Batang-dan-Daun


Tidak ada dua unit produk yang dihasilkan oleh suatu proses yang identik. Beberapavariasi tidak bisa
dihindari. Sebagai contoh, isi bersih sekaleng minuman ringan sedikit berbeda dari kaleng ke kaleng, dan
tegangan keluaran catu daya tidak persis sama dari satu unit ke unit berikutnya. Demikian pula, tidak ada
dua aktivitas layanan yang identik. Akan ada perbedaan kinerja dari pelanggan ke pelanggan, dan
variabilitas dalam karakteristik penting yang penting bagi pelanggan dari waktu ke waktu.Statistik
adalah ilmu menganalisis data dan menarik kesimpulan, dengan mempertimbangkan variasi data.

Ada beberapa metode grafis yang sangat berguna untuk meringkas dan menyajikan data.
Salah satu teknik grafis yang paling berguna adalahtampilan batang dan daun.
Misalkan data diwakili oleh x1, x2, . . . ,xn dan bahwa setiap nomor xSaya terdiri
minimal dua digit. Untuk membuat plot batang dan daun, kami membagi setiap angkaxSaya
menjadi dua bagian: batang, yang terdiri dari satu atau lebih digit utama; dan daun, terdiri
dari digit yang tersisa. Misalnya, jika data terdiri dari persen informasi cacat antara 0 dan 100
pada banyak wafer semikonduktor, maka kita dapat membagi nilai 76 menjadi batang 7 dan
daun 6. Secara umum, kita harus memilih batang yang relatif sedikit dibandingkan dengan
jumlah pengamatan. Biasanya yang terbaik adalah memilih antara 5 dan 20 batang. Setelah
satu set batang telah dipilih, mereka terdaftar di sepanjang margin kiri tampilan, dan di
samping setiap batang semua daun yang sesuai dengan nilai data yang diamati terdaftar
dalam urutan di mana mereka ditemui dalam kumpulan data.
Versi plot batang-dan-daun yang diproduksi oleh Minitab kadang-kadang disebut an
memesan plot batang dan daun, karena daun disusun berdasarkan besarnya. Versi ini
E XAMPLE 3.1 Klaim Asuransi Kesehatan
Data pada Tabel 3.1 memberikan contoh waktu siklus dalam hari untuk memproses dan membayar klaim asuransi kesehatan karyawan dalam jumlah besar
perusahaan. Buatlah plot batang dan daun untuk data tersebut.

S solusi

Untuk membuat plot batang dan daun, kita dapat memilih nilai
1, 2, 3, 4, dan 5 sebagai batang. Namun, ini akan menghasilkan batang untuk batang yang lebih besar. Untuk batang tengah, angka

semua 40 nilai data yang dipadatkan menjadi hanya lima batang, dalam tanda kurung menunjukkan jumlah pengamatan yang termasuk

jumlah minimum yang biasanya disarankan. Alternatifnya adalah dalam batang tersebut. Pemeriksaan plot mengungkapkan bahwa

dengan membagi setiap batang menjadi bagian bawah dan bagian distribusi jumlah hari untuk memproses dan membayar klaim asuransi

atas, dengan daun 0–4 ditempatkan di bagian bawah batang dan kesehatan karyawan memiliki bentuk yang kurang lebih simetris, dengan
puncak tunggal. Tampilan batang dan daun memungkinkan kita untuk
daun 5–9 ditempatkan di bagian atas. Angka
dengan cepat menentukan beberapa fitur penting dari data yang tidak
3.1 adalah plot batang-dan-daun yang dihasilkan oleh Minitab, dan terlihat jelas dari tabel data. Misalnya, Gambar 3.1 memberikan kesan
menggunakan strategi pemisahan batang. Kolom di sebelah kiri batang memberikan visual bentuk, sebaran atau variabilitas, dan tendensi sentral atau tengah
penghitungan kumulatif dari jumlah pengamatan yang berada pada atau di bawah data (yang mendekati 35).
batang tersebut untuk batang yang lebih kecil, dan pada atau di atasnya

■ TABEL 3 . 1
Waktu Siklus dalam Hari untuk Membayar Klaim Asuransi Kesehatan
Karyawan Tampilan Batang dan Daun: Hari
Mengeklaim hari Mengeklaim hari Mengeklaim hari Mengeklaim hari
Batang-dan-daun Hari
1 48 11 35 21 37 31 16 N = 40
2 41 12 34 22 43 32 22 Satuan Daun = 1.0
3 677
22234
1
3 35 13 36 23 17 33 33 8
4 36 14 42 24 26 34 30 13 2 555666677
66778
6 16 36 26 27
2 3
(8) 1233
00012334
5 37 15 43 25 28
36 35 24 56678
26
19 6
23
3
10
7 36 17 56 27 45 37 22 6 4
8 46 18 32 28 33 38 4 30 1 5

1
9 35 19 46 29 22 39 31
5

10 47 20
30 27 17 ■ GAMBAR 3 . 1Plot batang-dan-kiri
30 untuk data klaim asuransi kesehatan.
40

tampilan membuatnya sangat mudah ditemukan persentil dari datanya. Umumnya 100kpersentil adalah
nilai sedemikian rupa sehingga setidaknya 100 k% dari nilai data berada pada atau di bawah nilai ini dan
setidaknya 100 (1 k)% dari nilai data berada pada atau di atas nilai ini. NSpersentil kelima puluh
distribusi data disebut contoh median x. NS
median dapat dianggap sebagai nilai data yang secara tepat membagi sampel menjadi dua, dengan setengah
dari pengamatan lebih kecil dari median dan setengahnya lebih besar.
Jika n, jumlah pengamatan, ganjil, mencari median itu mudah. Pertama, urutkan pengamat-
vations dalam urutan menaik (atau peringkat data dari pengamatan terkecil ke pengamatan terbesar).
Maka median akan menjadi pengamatan pada posisi rangking [(n - 1)/2 + 1] pada daftar ini. Jikan genap,
median adalah rata-rata dari (n/2)st dan (n/ 2 + 1) pengamatan peringkat pertama. Karena dalam contoh
kitan = 40 adalah bilangan genap, median adalah rata-rata dari dua pengamatan dengan rank 20 dan 21,
atau

33 + 34 = 33.5
x= 2
65

55

45

hari 35

25

15 ■ GAMBAR 3 . 2 Serangkaian waktu


10 20 30 40 plot data jaminan kesehatan pada
0
Waktu Tabel 3.1.

NS persentil kesepuluh adalah pengamatan dengan rank (0,1)(40) + 0,5 = 4,5 (pertengahan antara
pengamatan keempat dan kelima), atau (22 + 22)/2 = 22. kuartil pertama adalah pengamatan
dengan rank (0,25)(40) + 0,5 = 10,5 (pertengahan antara pengamatan kesepuluh dan kesebelas)
atau (26 + 27)/2 = 26,5, dan kuartil ketiga adalah observasi dengan rank (0,75)(40) + 0,5 =
30.5 (pertengahan antara pengamatan ketiga puluh dan ketiga puluh satu), atau (37 + 41) = 39.
Kuartil pertama dan ketiga kadang-kadang dilambangkan dengan simbol Q1 dan Q3, dan
jarak interkuartil IQR = Q3 Q1 kadang-kadang digunakan sebagai ukuran variabilitas.
Untuk data klaim asuransi, range interkuartilnya adalah IQR = Q3 Q1 = 39 26,5 = 12,5.
Akhirnya, meskipun tampilan batang-dan-daun adalah cara yang sangat baik untuk secara visual
menunjukkan variabilitas data, itu tidak mengambil urutan waktu dari pengamatan yang diperhitungkan.
Waktu seringkali merupakan faktor yang sangat penting yang berkontribusi terhadap variabilitas dalam masalah
peningkatan kualitas. Kita bisa, tentu saja, hanya memplot nilai data versus waktu; grafik seperti itu disebutplot
deret waktu atau menjalankan grafik.
Misalkan waktu siklus untuk memproses dan membayar klaim asuransi kesehatan karyawan pada
Tabel 3.1 ditampilkan dalam urutan waktu. Gambar 3.2 menunjukkan plot deret waktu dari data. Kami
menggunakan Minitab untuk membuat plot ini (disebut apetak marginal) dan meminta plot titik data
yang akan dibangun di kamu-batas sumbu. Tampilan ini dengan jelas menunjukkan bahwa waktu
merupakan sumber variabilitas yang penting dalam proses ini. Lebih khusus lagi, waktu siklus
pemrosesan untuk 20 klaim pertama secara substansial lebih lama daripada waktu siklus untuk 20 klaim
terakhir. Sesuatu mungkin telah berubah dalam proses (atau sengaja diubah oleh personel operasi) yang
bertanggung jawab atas peningkatan waktu siklus yang terlihat. Kemudian dalam buku ini kami secara
resmi memperkenalkan peta kendali sebagai teknik grafis untuk memantau proses seperti ini, dan untuk
menghasilkan sinyal berbasis statistik ketika terjadi perubahan proses.

3.1.2 Histogramnya
A histogram adalah ringkasan data yang lebih ringkas daripada plot batang dan daun. Untuk membangun histogram
untuk data kontinu, kita harus membagi rentang data ke dalam interval, yang biasanya disebutinterval kelas, sel, atau
tempat sampah. Jika memungkinkan, tempat sampah harus memiliki lebar yang sama untuk meningkatkan informasi
visual dalam histogram. Beberapa pertimbangan harus digunakan dalam memilih jumlah tempat sampah sehingga
tampilan yang masuk akal dapat dikembangkan. Jumlah bin tergantung pada jumlah pengamatan dan jumlah hamburan
atau dispersi dalam data. Histogram yang menggunakan terlalu sedikit atau terlalu banyak tempat sampah tidak akan
informatif. Kami biasanya menemukan bahwa antara 5 dan 20 tempat sampah memuaskan dalam banyak kasus dan
jumlah tempat sampah akan meningkat dengan
n. Memilih jumlah bin yang kira-kira sama dengan akar kuadrat dari jumlah pengamatan
sering kali berhasil dalam praktiknya.1

1Tidak ada kesepakatan universal tentang cara memilih jumlah bin untuk histogram. Beberapa teks statistik dasar-
buku menyarankan menggunakan aturan Sturges, yang menetapkan jumlah tempat sampah H = 1 + log2n, di mana n adalah ukuran sampel.
Ada banyak variasi aturan Sturges. Paket perangkat lunak komputer menggunakan banyak algoritma yang berbeda untuk menentukan
jumlah dan lebar tempat sampah, dan beberapa di antaranya mungkin tidak didasarkan pada aturan Sturges.
Setelah jumlah bin dan batas bawah dan atas setiap bin telah ditentukan, data
diurutkan ke dalam bin dan dilakukan penghitungan jumlah pengamatan di setiap bin.
Untuk menyusun histogram, gunakan sumbu horizontal untuk mewakili skala
pengukuran data dan skala vertikal untuk mewakili hitungan, ataufrekuensi.
Kadang-kadang frekuensi di setiap bin dibagi dengan jumlah total pengamatan (n), dan kemudian
skala vertikal histogram mewakili frekuensi relatif. Persegi panjang digambar di atas setiap
nampan, dan tinggi setiap persegi panjang sebanding dengan frekuensi (atau frekuensi relatif).
Kebanyakan paket statistik membangun histogram.

E XAMPLE 3.2 Ketebalan Logam dalam Wafer Silikon


Tabel 3.2 menyajikan ketebalan lapisan logam pada 100
wafer silikon yang dihasilkan dari deposisi uap kimia (CVD)
proses di pabrik semikonduktor. Buat histogram
untuk data ini.

■ TABEL 3 . 2
Ketebalan Lapisan (Å) pada Wafer
Semikonduktor

438 450 487 451 452 441 444 461 432 471
413 450 430 437 465 444 471 453 431 458
444 450 446 444 466 458 471 452 455 445
468 459 450 453 473 454 458 438 447 463
445 466 456 434 471 437 459 445 454 423
472 470 433 454 464 443 449 435 435 451
474 457 455 448 478 465 462 454 425 440
454 441 459 435 446 435 460 428 449 442
455 450 423 432 459 444 445 454 449 441
449 445 455 441 464 457 437 434 452 439

S solusi
Karena kumpulan data berisi 100 pengamatan dan
2100 = 10, kami menduga bahwa sekitar 10 bin akan memberikan histogram 30
yang memuaskan. Kami membangun histogram menggunakan opsi Minitab
yang memungkinkan pengguna untuk menentukan jumlah tempat sampah.
20
Frekuensi

Histogram Minitab yang dihasilkan ditunjukkan pada Gambar


3.3. Perhatikan bahwa titik tengah nampan pertama adalah
415Å, dan histogram hanya memiliki delapan nampan yang 10
berisi frekuensi bukan nol. Histogram, seperti plot batang dan
daun, memberikan kesan visual tentang bentuk distribusi
0
pengukuran, serta beberapa informasi tentang variabilitas 405 415 425 435 445 455 465 475 485 495
yang melekat pada data. Perhatikan distribusi data ketebalan Ketebalan logam
logam yang cukup simetris atau berbentuk lonceng.
■ GAMBAR 3 . 3Histogram minitab untuk
data ketebalan lapisan logam pada Tabel 3.2.

Sebagian besar paket komputer memiliki pengaturan default untuk jumlah tempat sampah.
Gambar 3.4 adalah histogram Minitab yang diperoleh dengan pengaturan default, yang mengarah ke
histogram dengan 15 bin. Histogram bisa relatif sensitif terhadap pilihan jumlah dan lebar tempat
sampah. Untuk kumpulan data kecil, tampilan histogram dapat berubah secara dramatis jika jumlah dan/
atau lebar tempat sampah berubah. Untuk alasan ini, kami lebih suka menganggap histogram sebagai
teknik yang paling cocok untukkumpulan data yang lebih besar berisi, katakanlah, 75 hingga 100 atau
lebih pengamatan. Karena jumlah pengamatan pada ketebalan lapisan cukup besar (n = 100), pilihan
15 100

10

Frekuensi

Frekuensi
50

0 0
410 420 430 440 450 460 470 480 490 410 420 430 440 450 460 470 480 490
Ketebalan logam Ketebalan logam

■ GAMBAR 3 . 4Histogram minitab ■ GAMBAR 3 . 5Frekuensi kumulatif


plot data ketebalan logam dari Minitab.
dengan
15 bin untuk data ketebalan lapisan logam.

jumlah bin tidak terlalu penting, dan histogram pada Gambar 3.3 dan 3.4 menyampaikan
informasi yang sangat mirip.
Perhatikan bahwa dengan berpindah dari data asli atau plot batang-dan-daun ke
histogram, kita kehilangan beberapa informasi karena pengamatan asli tidak disimpan di
layar. Namun, kehilangan informasi ini biasanya kecil dibandingkan dengan keringkasan dan
kemudahan interpretasi histogram, terutama dalam sampel besar.
Histogram selalu lebih mudah untuk diinterpretasikan jika tempat sampah memiliki lebar yang sama. Jika tempat
sampah memiliki lebar yang tidak sama, biasanya menggambar persegi panjang yang luasnya (berlawanan dengan
ketinggian) sebanding dengan jumlah pengamatan di tempat sampah.
Gambar 3.5 menunjukkan variasi histogram yang tersedia di Minitab (mis plot frekuensi
kumulatif). Dalam plot ini, tinggi setiap batang mewakili jumlah pengamatan yang kurang dari
atau sama dengan batas atas bin. Frekuensi kumulatif seringkali sangat berguna dalam
interpretasi data. Sebagai contoh, kita dapat membaca langsung dari Gambar 3.5 bahwa sekitar 75
dari 100 wafer memiliki ketebalan lapisan logam kurang dari 460Å.
Distribusi frekuensi dan histogram juga dapat digunakan dengan data kualitatif, kategorikal,
atau hitung (diskrit). Di beberapa aplikasi, akan ada pengurutan kategori secara alami (seperti
mahasiswa baru, mahasiswa tahun kedua, junior, dan senior), sedangkan di lain urutan kategori
akan arbitrer (seperti pria dan wanita). Saat menggunakan data kategorikal, batang harus
digambar agar memiliki lebar yang sama.
Untuk membangun histogram untuk data diskrit atau hitung, pertama-tama tentukan
frekuensi (atau frekuensi relatif) untuk setiap nilai x. Masing-masingx nilai sesuai dengan bin.
Histogram digambar dengan memplot frekuensi (atau frekuensi relatif) pada skala vertikal dan nilai
x pada skala horizontal. Kemudian di atas setiap nilaix, gambarlah persegi panjang yang tingginya
adalah frekuensi (atau frekuensi relatif) yang sesuai dengan nilai tersebut.

E XAMPLE 3.3 Cacat pada Kap Mobil


menyajikan jumlah cacat permukaan akhir pada cat primer yang ditemukan dengan inspeksi yang dilukis
visual kap mobildengan proses lukisan eksperimental baru.
3.3 Buat histogram untuk data ini.
ermukaan Finish pada Hood Mobil yang

Dicat

6 1 5 7 8 6 0 2 4 2
5 2 4 4 1 4 1 7 2 3
4 3 3 3 6 3 2 3 4 5
5 2 3 4 4 4 2 3 5 7
5 4 5 5 4 5 3 3 3 12
S solusi
histogram cacat. Perhatikan bahwa jumlah cacat adalah variabel diskrit. Dari histogram atau data tabulasi kita dapat menentukan
10

Proporsi tudung dengan setidaknya 3 cacat = 39 = 0,78

Frekuensi
50 5
dan
Proporsi tudung dengan antara 0 dan
2 cacat = 11 = 0,22
0
0 5 10
50 Cacat

GAMBAR 3 . 6 Histogram bilangan


Proporsi ini adalah contoh frekuensi relatif.
cacat pada kap mobil yang dicat (Tabel 3.3).

3.1.3Ringkasan Numerik Data


Plot batang dan daun dan histogram memberikan tampilan visual dari tiga sifat data sampel:
bentuk distribusi data, tendensi sentral dalam data, dan sebaran atau variabilitas dalam
data. Hal ini juga membantu untuk menggunakan ukuran numerik tendensi sentral dan
pencar.
Seandainya x1, x2, . . . ,xn adalah pengamatan dalam sampel. Sarana yang paling penting-
Tendensi sentral yang pasti dalam sampel adalah rata-rata sampel,

n
Σ xSaya

x = x1 + x2 +L+ xnn
n = Saya=1 (3.1)

Perhatikan bahwa rata-rata sampel x hanyalah mean aritmatika dari n pengamatan. Rata-rata
sampel untuk data ketebalan logam pada Tabel 3.2 adalah
100
Σ xSaya
45.001 = 450.01AHai
x = Saya =1 = 100
1 00

Lihat Gambar 3.3 dan perhatikan bahwa rata-rata sampel adalah titik di mana histogram benar-
benar "seimbang." Dengan demikian, rata-rata sampel mewakili pusat massa data sampel.
Variabilitas dalam data sampel diukur dengan varians sampel:

n
Σ (x Saya - x)2 S2 = Saya=1 n -1
(3.2)
Perhatikan bahwa varians sampel hanyalah jumlah deviasi kuadrat dari setiap pengamatan
dari rata-rata sampel x, dibagi dengan ukuran sampel dikurangi 1. Jika tidak ada variasi
kemampuan dalam sampel, maka setiap pengamatan sampel xSaya = x, dan varians sampel S2 = 0.
Umumnya, semakin besar varians sampel S2 adalah, semakin besar variabilitas dalam data sampel.
Satuan varians sampel S2 adalah kuadrat dari unit asli data. Ini sering tidak nyaman
dan canggung untuk ditafsirkan, jadi kami biasanya lebih suka menggunakan akar kuadrat
dari S2, disebut standar deviasi sampel S, sebagai ukuran variabilitas.
Berikut ini

n
Σ (x Saya - x)2

S = Saya=1 n -1 (3.3)

Keuntungan utama deviasi standar sampel adalah dinyatakan dalam satuan pengukuran
asli. Untuk data ketebalan logam, kami menemukan bahwa
H2ai
S2 = 180.2928A
dan
Hai
S = 13.43A

Untuk lebih mudah melihat bagaimana standar deviasi menggambarkan variabilitas, pertimbangkan keduanya:
sampel yang ditampilkan di sini:

Contoh 1 Contoh 2

x1 = 1
x1 = 1
x2 = 3
x2 = 5
x3 = 5
x3 = 9
x=3
x=5

Jelas, sampel 2 memiliki variabilitas yang lebih besar daripada sampel 1. Hal ini tercermin dalam standar
deviasi, dimana untuk sampel 1 adalah

3
Σ (x Saya - x)2
(1− 3)2 + (3 3)2 + (5 3)2
S = Saya=1 = = 4=2
2 2

dan untuk sampel 2 adalah

Σ3 (x S-
(1 -5)2 + (5 5)2 + 9 5(2 - )2 = 16 = 4
S = Saya=1
axy a2
2) =

Dengan demikian, variabilitas yang lebih besar dalam sampel 2 dicerminkan oleh standar deviasi yang lebih besar. Sekarang

pertimbangkan sampel ketiga, katakan

Contoh 3
x1 = 101
x2 = 103
x3 = 105
x = 103
Perhatikan bahwa sampel 3 diperoleh dari sampel 1 dengan menambahkan 100 pada setiap
pengamatan. Simpangan baku untuk sampel ketiga ini adalahS = 2, yang identik dengan standar
deviasi sampel 1. Membandingkan dua sampel, kita melihat bahwa kedua sampel memiliki
variabilitas identik atau menyebar tentang rata-rata, dan inilah mengapa mereka memiliki standar
deviasi yang sama. Ini mengarah ke poin penting:Standar deviasi tidak mencerminkan
besarnya data sampel, hanya sebaran tentang rata-rata.
Kalkulator genggam sering digunakan untuk menghitung rata-rata sampel dan simpangan baku.
Perhatikan bahwa persamaan 3.2 dan 3.3 tidak terlalu efisien secara komputasi, karena setiap angka
harus dimasukkan ke dalam kalkulator dua kali. Rumus yang lebih efisien adalah

⎛ n ⎞2
n
⎜⎝ Σ xSaya ⎟

Σ xS2a-ya Saya=1 ⎠ (3.4)


n
S = Saya=1
n -1

n Dalam menggunakan persamaan 3.4, setiap angka hanya perlu dimasukkan satu kali, asalkan
Σ Saya=1xSaya dann
Saya=1x2Saya dapat secara bersamaan terakumulasi dalam kalkulator. Banyak murah
kalkulator genggam melakukan fungsi ini dan menyediakan perhitungan otomatis dari x dan S.

3.1.4 Plot Kotak


Tampilan batang dan daun dan histogram memberikan kesan visual tentang kumpulan data,
sedangkan rata-rata sampel dan simpangan baku memberikan informasi kuantitatif tentang
fitur spesifik data. NSpetak kotak adalah tampilan grafis yang secara bersamaan menampilkan
beberapa fitur penting dari data, seperti lokasi atau tendensi sentral, penyebaran atau variabilitas,
penyimpangan dari simetri, dan identifikasi pengamatan yang terletak sangat jauh dari sebagian
besar data (pengamatan ini sering disebut " outlier”).
Plot kotak menampilkan tiga kuartil, minimum, dan maksimum data pada kotak persegi
panjang, disejajarkan baik secara horizontal maupun vertikal. Kotak melingkupi jangkauan
interkuartil dengan garis kiri (atau bawah) pada kuartil pertama Q1 dan garis kanan (atau atas)
pada kuartil ketiga Q3. Sebuah garis ditarik melalui kotak di kuartil kedua (yang merupakan
persentil kelima puluh atau median) Q2 =x. Sebuah garis di kedua ujung meluas ke nilai-nilai
ekstrim. Garis-garis ini biasanya disebutcambang. Beberapa penulis menyebut plot kotak sebagai
plot kotak dan kumis. Dalam beberapa program komputer, paling banyak kumis hanya berjarak
1,5 (Q3 Q1) dari ujung kotak, dan pengamatan di luar batas ini ditandai sebagai potensi outlier.
Variasi dari prosedur dasar ini disebut apetak kotak yang dimodifikasi.

E XAMPLE 3.4 Diameter lubang


Data pada Tabel 3.4 adalah diameter (dalam mm) lubang dalam ■ TABEL 3 . 4
kelompok 12 rusuk tepi depan sayap untuk pesawat angkut komersial.
Diameter Lubang (dalam mm) di Sayap
Membangun dan menafsirkan plot kotak dari data tersebut.
Leading Edge Ribs

120.5 120.4 120.7


120.9 120.2 121.1
120.3 120.1 120.9
121.3 120.5 120.8

(lanjutan)
76 bagian 3 ■ Kualitas Proses Pemodelan

S solusi
Plot kotak ditunjukkan pada Gambar 3.7. Perhatikan bahwa 120.35 120.6 120.9
median sampel berada di tengah-tengah antara pengamatan
berurutan peringkat keenam dan ketujuh, atau (120,5 + 120.1 121.3
120,7)/2 = 120,6, dan kuartilnya adalah Q1 = 120,35 dan Q3 =
120,9. Plot kotak menunjukkan bahwa distribusi diameter
■ GAMBAR 3 . 7 Plot kotak untuk sayap pesawat
lubang tidak persis simetris di sekitar nilai pusat, karena data diameter lubang leading edge pada Tabel 3.4.
kumis kiri dan kanan serta kotak kiri dan kanan di sekitar
median tidak sama panjang.

Plot kotak sangat berguna dalam perbandingan grafis di antara kumpulan data, karena
memiliki dampak visual dan mudah dipahami. Misalnya, Gambar 3.8 menunjukkan plot kotak
komparatif untuk indeks kualitas manufaktur pada produk di tiga pabrik. Pemeriksaan tampilan
ini mengungkapkan bahwa ada terlalu banyak variabilitas di pabrik 2, dan bahwa pabrik 2 dan 3
perlu meningkatkan kinerja indeks kualitasnya.

3.1.5Distribusi Probabilitas
Histogram (atau plot batang dan daun, atau plot kotak) digunakan untuk menggambarkan Sampel data. ASampel
adalah kumpulan pengukuran yang dipilih dari beberapa sumber yang lebih besar atau populasi.
Misalnya, pengukuran ketebalan lapisan pada Tabel 3.2 diperoleh dari sampel wafer yang dipilih
dari proses pembuatan. Populasi dalam contoh ini adalah kumpulan semua ketebalan lapisan
yang dihasilkan oleh proses tersebut. Dengan menggunakan metode statistik, kami mungkin
dapat menganalisis data ketebalan lapisan sampel dan menarik kesimpulan tertentu tentang
proses pembuatan wafer.
A distribusi kemungkinan adalah model matematika yang menghubungkan nilai variabel
dengan probabilitas kemunculan nilai tersebut dalam populasi. Dengan kata lain, kita mungkin
memvisualisasikan ketebalan lapisan sebagaivariabel acak karena mengambil nilai yang
berbeda dalam populasi menurut beberapa mekanisme acak, dan kemudian distribusi probabilitas
ketebalan lapisan menggambarkan kemungkinan terjadinya nilai ketebalan lapisan dalam
populasi. Ada dua jenis distribusi probabilitas.

120

110

100
indeks kualitas

90

80

70
1 2 3
Tanaman

■ GAMBAR 3 . 8 Plot kotak komparatif dari a


indeks kualitas untuk produk yang dihasilkan di tiga pabrik.
P(xSaya) F (x)

P(x3)

P(x2)
P(x4)

P(x5)
P(x1)

x1x2x3 x4x5 x AB x

(A) (B)
■ GAMBAR 3 . 9 Distribusi probabilitas. (A) Kasus diskrit. (B) Kasus terus menerus.

Definisi

1. Distribusi berkelanjutan. Ketika variabel yang diukur dinyatakan dalam


skala kontinu, distribusi probabilitasnya disebut a distribusi terus menerus.
Distribusi probabilitas ketebalan lapisan logam terus menerus.

2. Distribusi diskrit. Ketika parameter yang diukur hanya dapat mengambil


nilai- nilai tertentu, seperti bilangan bulat 0, 1, 2, . . . , distribusi probabilitas
disebut distribusi diskrit. Misalnya, distribusi jumlah ketidaksesuaian atau
cacat pada papan sirkuit tercetak akan menjadi distribusi diskrit.

Contoh distribusi probabilitas diskrit dan kontinu ditunjukkan pada Gambar 3.9A
dan 3.9B, masing-masing. Kemunculan distribusi diskrit adalah munculnya serangkaian “paku”
vertikal, dengan tinggi setiap paku sebanding dengan probabilitas. Kami menulis kemungkinan-
bahwa variabel acak x mengambil nilai tertentu xSaya sebagai

P{x = xSaya} = P(xSaya )

Tampilan distribusi kontinu adalah kurva mulus, dengan luas di bawah kurva sama dengan
probabilitas, sehingga probabilitas bahwa x terletak pada interval dari A ke B ditulis sebagai

P{A ≤ x ≤ B} =B FA (x)dx

E XAMPLE 3.5 Distribusi Diskrit


variabel
onduktor per hari. Rata-rata, 1% dari chip ini tidak sesuai dengan spesifikasi. Setiap jam, seorang inspektur memilih sampelacak yang
acak dari mewakili
25 chip jumlah chip setiap
dan mengklasifikasikan yangchip
tidak sesuai
dalam sampel
ah dalam sampel, maka distribusi probabilitas x adalah
⎛ 25⎞ -x
P(x) =(0, 01)x (0,99)25 x = 0,1,2,K,25
⎝ x⎠
(lanjutan)
h diskrit distribusi, karena jumlah ketidaksesuaian yang diamati adalah x = 0, 1, 2, . . . , 25, dan disebutdistribusi binomial. Kita dapat menghitung
P(x ≤1) = P(x = 0) + P(x = 1)
gian yang tidak sesuai dalam sampel sebagai:
= P (0 ) + P (1 )

Σ⎜ ⎟
=⎛25⎞
1
(0,01)x(0,99 )25 x
x=0 x
⎝ ⎠
25!
= (0,99)25(0,01)0 + 25! (0,99)24 (0,01)1
0!25! 1!24!
= 0,7778 + 0,1964 = 0,9742

E XAMPEL 3.6 Distribusi Berkelanjutan


ya x adalah variabel acak yang mewakili isi sebenarnya dalam ons sekantong 1 pon biji kopi.F (x)
peluang darix diasumsikan

F (x) = 1
15.5 ≤ x ≤17.0
1.5
_1
_
utdistribusi seragam, dan ditunjukkan secara grafis pada Gambar 3.10. Perhatikan bahwa area di15
bawah fungsiF (x) sesuai dengan peluang, sehingga peluang tas berisi kurang dari 16,0

x
15.5 16.0 16,5 17.0

■ GAMBAR 3 . 10Distribusi seragam-


tion untuk Contoh 3.6.
1
P{x ≤16.0} =16.10 5F.5(x)dx = ∫16.105.5 1.5 dx
x 16.0

16.0 15.5
= = = 0,3333
1.5 15.5 1.5

Ini mengikuti secara intuitif dari pemeriksaan Gambar 3.9.

Dalam Bagian 3.2 dan 3.3 kami menyajikan beberapa distribusi diskrit dan kontinu yang berguna.
NS berarti M dari distribusi probabilitas adalah ukuran dari tendensi sentral dalam
distribusi, atau lokasi. Rata-rata didefinisikan sebagai

⎧ ∫∞ xf (x) dx, x kontinu (3.5a)


⎪ -∞
μ= ∞ (3.5b)
Σ xSaya P(xSaya ), x diskrit
⎩ Saya=1

Untuk kasus variabel acak diskrit dengan tepat n nilai kemungkinan yang sama [yaitu, P(xSaya) = 1/n],
maka persamaan 3.5b direduksi menjadi

n
Σ xSaya

μ= Saya=1

n
Perhatikan kesamaan ekspresi terakhir ini dengan rata-rata sampel x didefinisikan dalam persamaan 3.1.
Mean adalah titik di mana distribusi tepat "seimbang" (lihat Gambar 3.11). Jadi, artinya
μ medianμ Mode μ Mode
(A) (B) (C)
■ GAMBAR 3 . 11 Maksud dari sebuah distribusi.

σ=2

σ =4
μ = 10 μ = 20 μ = 10

■ GAMBAR 3 . 12 Dua distribusi probabilitas ■ GAMBAR 3 . 13Dua distribusi probabilitas


tion dengan cara yang berbeda. dengan rata-rata yang sama tetapi simpangan baku yang berbeda.

hanyalah pusat massa dari distribusi probabilitas. Catatan dari Gambar 3.11B bahwa rata-rata
belum tentu persentil kelima puluh dari distribusi (yang merupakan median), dan dari Gambar
3.11c bahwa itu belum tentu merupakan nilai variabel yang paling mungkin (yang disebut mode).
Rata-rata hanya menentukanlokasi dari distribusi, seperti yang ditunjukkan pada Gambar 3.12.

Penyebaran, penyebaran, atau variabilitas dalam distribusi dinyatakan oleh perbedaan S2. NS
definisi varians adalah

⎧∫∞ (x - μ)2 F (x)dx, x kontinu (3.6a)


⎪ -∞
σ (3.6b)
2 = ⎨ ∞Σ (xSaya - μ)2 P(xSaya ), x diskrit
⎪⎩ Saya=1

ketika variabel acak diskrit dengan n nilai kemungkinan yang sama, maka persamaan 3.6b menjadi

n
Σ (xS-ayμa)2
σ 2 = Saya=1
n
dan kami mengamati bahwa dalam kasus ini varians adalah jarak kuadrat rata-rata setiap anggota
populasi dari rata-rata. Perhatikan kesamaan dengan varians sampelS2, didefinisikan dalam persamaan
3.2. JikaS2 = 0, tidak ada variabilitas dalam populasi. Ketika variabilitas meningkat, varians
S2 meningkat. Varians dinyatakan dalam kuadrat unit variabel asli. Misalnya, jika
kita mengukur tegangan, satuan variansnya adalah (volt) 2. Jadi, biasanya bekerja
dengan akar kuadrat dari varians, yang disebutsimpangan baku S. Berikut ini

n
Σ (x Saya - μ)2
σ = σ 2 = Saya=1 n (3.7)

Standar deviasi adalah ukuran penyebaran atau hamburan dalam populasi yang dinyatakan dalam
satuan aslinya. Dua distribusi dengan mean yang sama tetapi standar deviasi yang berbeda ditunjukkan
pada Gambar 3.13.
3.2 Distribusi Diskrit Penting
Beberapa distribusi probabilitas diskrit sering muncul dalam pengendalian kualitas statistik.
Pada bagian ini, kita membahas distribusi hipergeometrik, distribusi binomial, distribusi
Poisson, dan distribusi binomial dan geometrik negatif.

3.2.1 Distribusi Hipergeometrik


Misalkan ada populasi berhingga yang terdiri dari n item. Beberapa nomor—katakanlah,
D(D ≤ n)—dari item-item ini termasuk dalam kelas yang diminati. Sebuah sampel acak darin item
dipilih dari populasi tanpa penggantian, dan jumlah item dalam sampel yang termasuk dalam
kelas minat—katakanlah, x—diamati. Kemudianx adalah variabel acak hipergeometrik dengan
distribusi probabilitas didefinisikan sebagai berikut.

Definisi
NS distribusi probabilitas hipergeometrik adalah
⎛ D⎞⎛ n - D⎞
⎜⎟⎜ ⎟
P(x) = ⎝ x ⎠⎝ n - x ⎠
x = 0,1,2, . . . , min(n,D) (3.8)
⎛⎜ n⎞
⎝ ⎟n⎠
Rata-rata dan varians dari distribusi tersebut adalah

μ = nD (3.9)
n
dan
σ 2 = nD ⎛1− D⎞⎛ n - n⎞ (3.10)
n ⎝n⎠⎝ n -1⎠

Dalam definisi di atas, besaran

⎛ A⎞ A!
=
⎝ B⎠ B!(ab)!

adalah jumlah kombinasi dari A barang diambil B pada suatu waktu.


Distribusi hipergeometrik adalah model probabilitas yang tepat untuk memilih
sampel acak dari n item tanpa penggantian dari banyak n item yang D tidak sesuai atau
cacat.
Dengan sampel acak, yang kami maksud adalah sampel yang telah dipilih sedemikian rupa
sehingga semua sampel yang mungkin memiliki peluang yang sama untuk dipilih. Dalam
aplikasi ini,x biasanya mewakili jumlah item yang tidak sesuai yang ditemukan dalam
sampel. Misalnya, suatu lot berisi 100 item, 5 di antaranya tidak memenuhi persyaratan. Jika
10 item dipilih secara acak tanpa pengembalian, maka peluang menemukan satu atau lebih
item yang tidak sesuai dalam sampel adalah
3.2 Distribusi Diskrit Penting 81

P{x ≤1} = P{x = 0} + P{x = 1}

⎛ 5⎞⎛95⎞ ⎛5⎞⎛95⎞
⎝⎜ ⎟0⎜⎠⎟⎝⎜1⎟0⎜ ⎠⎟ ⎝1 ⎠⎝ 9 ⎠
= ⎛ 100⎞ +⎛ 100⎞ = 0.92314
⎜ ⎟ ⎜ ⎟
⎝ 10 ⎠ ⎝ 10 ⎠

Dalam Bab 15, kami menunjukkan bagaimana model probabilitas seperti ini dapat digunakan untuk merancang prosedur
sampling akseptasi.
Beberapa program komputer dapat melakukan perhitungan ini. Tampilan di bawah ini adalah
output dari Minitab untuk menghitung probabilitas hipergeometrik kumulatif dengann = 100,
D = 5 (perhatikan bahwa Minitab menggunakan simbol M dari pada D dan n = 10). Minitab juga akan
menghitung probabilitas individu untuk setiap nilaix.

Fungsi Distribusi Kumulatif


Hipergeometrik dengan N = 100, M = 5, dan n = 10

x P(X < = x) x P(X < = x)


0 0,58375 6 1.000.000
1 0.92314 7 1.000.000
2 0.99336 8 1.000.000
3 0,99975 9 1.000.000
4 1.000.000 10 1.000.000
5 1.000.000

3.2.2 Distribusi Binomial


Pertimbangkan proses yang terdiri dari urutan n percobaan independen. Dengan uji coba independen, yang
kami maksud adalah bahwa hasil dari setiap uji coba tidak bergantung dengan cara apa pun pada hasil uji coba
sebelumnya. Ketika hasil dari setiap percobaan adalah "berhasil" atau "gagal", percobaan itu disebutpercobaan
Bernoulli. Jika probabilitas "sukses" pada percobaan apa pun—katakanlah, P— adalah konstan, maka jumlah
"berhasil" x di dalam n Percobaan Bernoulli memiliki distribusi binomial dengan para-
meter n dan P, didefinisikan sebagai berikut:

Definisi
NS distribusi binomial dengan parameter n ≥ 0 dan 0 < P < 1 adalah

P(x) =⎛ ⎞ n Px (1− P)n-x


x = 0,1, . . . ,n (3.11)
⎝ x⎠

Rata-rata dan varians dari distribusi binomial adalah


μ = np (3.12)
dan
σ 2 = np(1− P)
(3.13)
Distribusi binomial sering digunakan dalam rekayasa kualitas. Ini adalah model
probabilitas yang tepat untuk pengambilan sampel dari populasi yang sangat besar, di mana
P mewakili fraksi item yang cacat atau tidak sesuai dalam populasi. Dalam aplikasi ini,x
biasanya mewakili jumlah item yang tidak sesuai yang ditemukan dalam sampel acak n item.
Misalnya, jikaP = 0,10 dan n = 15, maka peluang mendapatkan x item yang tidak sesuai
dihitung dari persamaan 3.11 sebagai berikut:

Fungsi Kepadatan Probabilitas


Binomial dengan n = 15 dan p = 0,1

x P(X = x) x P(X = x)
0 0.205891 6 0.001939
1 0.343152 7 0,000277
2 0.266896 8 0,000031
3 0.128505 9 0,000003
4 0,042835 10 0,000000
5 0,010471

Minitab digunakan untuk melakukan perhitungan ini. Perhatikan bahwa untuk semua nilai darix yang terletak antara 10 ≤
x ≤ 15 peluang menemukan x “keberhasilan" dalam 15 percobaan adalah nol.
Beberapa distribusi binomial ditunjukkan secara grafis pada Gambar 3.14. Bentuk dari contoh-
contoh tersebut adalah tipikal dari semua distribusi binomial. Untuk tetapn, distribusi menjadi lebih
simetris sebagai P meningkat dari 0 menjadi 0,5 atau menurun dari 1 menjadi 0,5. Untuk tetapP,
distribusi menjadi lebih simetris sebagai n meningkat.
Variabel acak yang sering muncul dalam pengendalian kualitas statistik adalah

x
P=
(3.14)
n

di mana x memiliki distribusi binomial dengan parameter n dan P. Sering P adalah rasio jumlah
yang diamati dari item yang cacat atau tidak sesuai dalam sampel (x) dengan ukuran sampel (n),

0.4 0,3
n = 15, P = 0.1 n = 10, P = 0,25
n = 15, P = 0,5 0,25 n = 20, P = 0,25
0,3 n = 15, P = 0.9 n = 40, P = 0,25
0.2

0.2
P(x)
F (x)

0,15

0.1
0.1
0,05

0 0
0 3 6 9 12 15 0 5 10 20 25 30
x x
(A) Distribusi binomial untuk nilai yang
berbeda (B) Distribusi binomial untuk nilai yang berbeda
dari P dengan n = 15. dari n dengan P = 0,25.

■ GAMBAR 3 . 14Distribusi binomial untuk nilai yang dipilih dari n dan P.


dan ini biasanya disebut pecahan sampel rusak atau pecahan sampel tidak sesuai. Simbol
“ ” digunakan untuk menunjukkan bahwa P adalah perkiraan dari nilai yang benar dan tidak diketahui

dari parameter binomial P. Distribusi probabilitas dari P diperoleh dari bino-


mial, sejak
x
P{P ≤ A} = P⎧ ≤ A=⎫ ⎛n ⎞ ( n-x
p{ ≤ tid}ak [tid]ak
x ⎜ ⎟ Px 1− P )
⎨ =Σ
⎩n ⎭ x=0 ⎝ x⎠
di mana [tidak] menunjukkan bilangan bulat terbesar yang kurang dari atau sama dengan tidak Sangat mudah untuk menunjukkan bahwa

meanPdaadri alah P dan bahwa varians dari P adalah

P(1− P)
σP=
n

3.2.3 Distribusi Poisson


Distribusi diskrit yang berguna dalam pengendalian kualitas statistik adalah distribusi Poisson, yang didefinisikan
sebagai berikut:

Definisi
NS distribusi racun adalah

e-λ xλ x!
P(x) = x = 0,1, . . . (3.15)

dimana parameternya aku > 0 berarti dan perbedaan dari distribusi Poisson adalah

μ =λ (3.16)

dan

σ 2= λ (3.17)

Perhatikan bahwa mean dan varians dari distribusi Poisson keduanya sama dengan
parameter l.
Aplikasi khas dari distribusi Poisson dalam pengendalian kualitas adalah sebagai model
jumlah cacat atau ketidaksesuaian yang terjadi pada suatu unit produk. Faktanya, setiap fenomena
acak yang terjadi pada basis per satuan (atau per satuan luas, per satuan volume, per satuan
waktu, dll.) sering kali didekati dengan baik oleh distribusi Poisson. Sebagai contoh, misalkan
jumlah cacat ikatan kawat per unit yang terjadi pada perangkat semikonduktor berdistribusi
Poisson dengan parameter4a. kMuaka probabilitas bahwa perangkat semikonduktor yang dipilih secara
acak
akan mengandung dua atau lebih sedikit cacat ikatan kawat adalah

2 e4 x
P{x ≤ 2} = = 0,018316 0,073263 0,146525 0,238104
4
x=0 x!
Minitab dapat melakukan perhitungan ini. Menggunakan distribusi Poisson dengan mean = 4
menghasilkan:

Fungsi Kepadatan Probabilitas


Poisson dengan mean = 4

x P(X = x)
0 0,018316
1 0,073263
2 0.146525

Beberapa distribusi Poisson ditunjukkan pada Gambar 3.15. Perhatikan bahwa distribusinya adalah
miring; yaitu, ia memiliki ekor panjang ke kanan. Sebagai parameteraku menjadi lebih besar, distribusi
Poisson menjadi simetris dalam penampilan.
Distribusi Poisson dapat diturunkan sebagai bentuk pembatas dari distribusi binomial.
Artinya, dalam distribusi binomial dengan parametern dan P, jika kita membiarkan n mendekati
tak terhingga dan P mendekati nol sedemikian rupa sehingga np = aku adalah konstanta, maka
hasil distribusi Poisson. Dimungkinkan juga untuk menurunkan distribusi Poisson menggunakan
argumen probabilitas murni. [Untuk informasi lebih lanjut tentang distribusi Poisson, lihat
Hines, Montgomery, Goldsman, dan Borror (2004); Montgomery dan Runger (2011); dan materi
teks tambahan.]

3.2.4 Distribusi Binomial dan Geometris Negatif


Distribusi binomial negatif, seperti distribusi binomial, memiliki dasar dalam percobaan Bernoulli.
Pertimbangkan urutan percobaan independen, masing-masing dengan probabilitas keberhasilanP, dan biarkan x
menunjukkan percobaan di mana R keberhasilan itu terjadi. Kemudianx adalah variabel acak binomial negatif
mampu dengan distribusi probabilitas yang didefinisikan sebagai berikut.

0.2
λ =4
λ =8
0.16 λ = 12
λ = 16

0.12
P(x)

0,08

0,04

0
0 10
20 30 40
x
■ GAMBAR 3 . 15Distribusi probabilitas Poisson untuk nilai-nilai yang dipilih dari l.
Definisi
NS distribusi binomial negatif adalah

P(x) = ⎛ x -1⎞ PR (1− P)x-R


⎝ R -1⎠⎟ x = R, R +1, R + 2, . . . (3.18)

di mana R ≥ 1 adalah bilangan bulat. NSberarti dan perbedaan dari distribusi binomial negatif
bution adalah

μ=R (3.19)
P

dan
σ 2 = R(1− P) (3.20)
P2

masing-masing.

Distribusi binomial negatif, seperti distribusi Poisson, terkadang berguna sebagai model
statistik yang mendasari untuk berbagai jenis data "hitungan", seperti terjadinya ketidaksesuaian
dalam unit produk (lihat Bagian 7.3.1). Ada dualitas penting antara distribusi binomial dan
distribusi binomial negatif. Dalam distribusi binomial, kami menetapkan ukuran sampel (jumlah
percobaan Bernoulli) dan mengamati jumlah keberhasilan; dalam distribusi binomial negatif, kami
menetapkan jumlah keberhasilan dan mengamati ukuran sampel (jumlah percobaan Bernoulli)
yang diperlukan untuk mencapainya. Konsep ini sangat penting dalam berbagai macam masalah
sampling. Distribusi binomial negatif disebut jugaDistribusi Pascal (setelah Blaise Pascal,
matematikawan dan fisikawan Prancis abad ke-17. Ada variasi binomial negatif untuk nilai riil dari
aku yang disebut distribusi Polya.
Kasus khusus yang berguna dari distribusi binomial negatif adalah jika R = 1, dalam hal ini kita
punya distribusi geometris. Ini adalah distribusi jumlah percobaan Bernoulli sampai pertama
kesuksesan. Distribusi geometriknya adalah

P(x) = (1 P)x -1P, x = 1, 2,...


Rata-rata dan varians dari distribusi geometri adalah

1 1P
μ= dan σ 2=
P P2
masing-masing. Karena barisan percobaan Bernoulli bersifat independen, maka penghitungan jumlah
percobaan sampai keberhasilan berikutnya dapat dimulai dari mana saja tanpa mengubah distribusi
probabilitas. Misalnya, kita sedang memeriksa serangkaian catatan medis mencari informasi yang hilang.
Jika, misalnya, 100 catatan telah diperiksa, probabilitas bahwa kesalahan pertama terjadi pada catatan
nomor 105 hanyalah probabilitas bahwa lima catatan berikutnya adalah GGGGB, di mana G
menunjukkan baik dan B menunjukkan kesalahan. Jika peluang menemukan rekor buruk adalah 0,05,
peluang menemukan rekor buruk pada rekaman kelima yang diperiksa adalah
P5x = 56 = (0,95)4(0,05) = 0,0407. Ini identik dengan probabilitas bahwa catatan buruk
pertama terjadi pada catatan 5. Ini disebutkurangnya properti memori dari distribusi
geometrik. Properti ini menyiratkan bahwa sistem yang dimodelkan tidak gagal karena aus
karena kelelahan atau akumulasi stres.
Variabel acak binomial negatif dapat didefinisikan sebagai jumlah variabel acak geometris.
Artinya, jumlah dariR variabel acak geometris masing-masing dengan parameter P adalah variabel
acak binomial negatif dengan parameter P dan R.

3.3 Distribusi Kontinu Penting


Pada bagian ini kita membahas beberapa distribusi kontinu yang penting dalam
pengendalian kualitas statistik. Ini termasuk distribusi normal, distribusi lognormal,
distribusi eksponensial, distribusi gamma, dan distribusi Weibull.

3.3.1 Distribusi Normal


Distribusi normal mungkin merupakan distribusi yang paling penting baik dalam teori
maupun aplikasi statistik. Jikax adalah variabel acak normal, maka distribusi probabilitas dari
x didefinisikan sebagai berikut:

Definisi
NS distribusi normal adalah

1 ⎛ x-μ 2⎞
F (x) = 1e-2 ⎝ σ ⎠
< x <∞ (3.21)
σ 2π
Rata-rata dari distribusi normal adalah m (−q < saya < Q) dan variannya adalah
S2 > 0.

Distribusi normal sering digunakan sehingga kita sering menggunakan notasi khusus,
x - n(MS 2), untuk menyiratkan bahwa x terdistribusi normal dengan mean M dan varians S 2. Tampilan
visual dari distribusi normal adalah simetris, unimodal atauberbentuk lonceng kurva dan ditunjukkan
pada Gambar 3.16.
Ada interpretasi sederhana dari standar deviasi S dari distribusi normal, yang diilustrasikan
pada Gambar 3.17. Perhatikan bahwa 68,26% dari nilai populasi berada di antara batas yang
ditentukan oleh mean plus dan minus satu standar deviasi (M ± 1S ); 95,46% dari nilai berada di
antara batas yang ditentukan oleh rata-rata plus dan minus dua standar deviasi
(M ± 2S ); dan 99,73% dari nilai populasi berada dalam batas yang ditentukan oleh mean

F (x)

μ - 3σ μ - 2σ μ - 1σ μ μ + 1σ μ + 2σ μ + 3σ

σ 2

68,26%

95,46%
x
μ 99,73%

■ GAMBAR 3 . 16 Distribusi normal. ■ GAMBAR 3 . 17Daerah di bawah distribusi normal.


3.3 Distribusi Kontinu Penting 87

plus dan minus tiga standar deviasi (M ± 3S). Dengan demikian, standar deviasi mengukur jarak
pada skala horizontal yang terkait dengan batas penahanan 68,26%, 95,46%, dan 99,73%.
Merupakan praktik umum untuk membulatkan persentase ini menjadi 68%, 95%, dan 99,7%.
NS distribusi normal kumulatif didefinisikan sebagai probabilitas bahwa acak normal
variabel x kurang dari atau sama dengan beberapa nilai A, atau

1
1 -⎛
2
x- μ⎞

{ x ≤ A} = F( a) = ∫A- ∞ e 2⎝ σ ⎠ dx (3.22)
σ 2π
Integral ini tidak dapat dievaluasi dalam bentuk tertutup. Namun, dengan menggunakan perubahan variabel

x-μ (3.23)
z=
σ

evaluasi dapat dibuat independen dari M dan S2. Itu adalah,


A - a -⎫ μ ⎛ ⎞
P{x ≤ A} = P⎧⎨ z ≤ Φ
⎬≡
⎩ σ ⎭ ⎝ σ ⎠

di mana ( ) adalah fungsi distribusi kumulatif dari distribusi normal standar


(rata-rata = 0, standar deviasi = 1). Tabel distribusi normal standar kumulatif disajikan
pada Tabel Lampiran II. Transformasi (3.23) biasanya disebutstandardisasi,
karena mengubah a n(MS2) variabel acak menjadi n(0, 1) variabel acak.

E XAMPEL 3.7 Kekuatan Tarik Kertas


Waktu untuk menyelesaikan keluhan pelanggan merupakan karakteristik
kualitas yang penting bagi banyak organisasi. Misalkan kali ini dalam
berarti m = 40 jam dan simpangan baku s = 2 jam
dilambangkan x ~ n(40, 22). Berapa probabilitas bahwa keluhan
organisasi keuangan, katakanlah,x—terdistribusi normal dengan
pelanggan akan diselesaikan dalam waktu kurang dari 35 jam?

S solusi
Peluang yang diinginkan adalah
σ =2
P{x ≤ 35}
Untuk mengevaluasi probabilitas ini dari tabel normal standar, kami
membakukan titik 35 dan menemukan 0,0062
35 40⎫ x
P{x ≤ 35} = P⎧⎨ z ≤ =
⎩ 2 ⎭ 35 40

P{z ≤ -2.5} =(2,5) = 0,0062


Akibatnya, probabilitas yang diinginkan adalah
σ =1
P{x ≥ 35} = 0,0062

Gambar 3.18 menunjukkan probabilitas yang ditabulasikan untuk kedua 0,0062


n(40, 22) dan distribusi normal standar. Perhatikan bahwa area yang
z
diarsir di sebelah kiri 35 jam pada Gambar 3.18 mewakili fraksi keluhan
– 2.5 0
pelanggan yang diselesaikan dalam waktu kurang dari atau sama
dengan 35 jam. ■ GAMBAR 3 . 18Perhitungan P5x ≤ 356 di dalam
Contoh 3.7.
Selain tabel lampiran, banyak program komputer dapat menghitung probabilitas normal.
Minitab memiliki kemampuan ini.
Lampiran Tabel II hanya memberikan probabilitas di sebelah kiri nilai positif dari z. Kita
perlu menggunakan sifat simetri dari distribusi normal untuk mengevaluasi probabilitas. Secara
khusus, perhatikan bahwa

P{x ≥ A} = 1− P{x ≤ A} (3.24)


P{x ≤ -A} = P{x ≤ A} (3.25)
dan
P{x ≥ -A} = P{x ≤ A} (3.26)
Akan sangat membantu dalam pemecahan masalah untuk menggambar grafik distribusi, seperti pada Gambar 3.18.

E XAMPLE 3.8 Diameter poros


Diameter poros logam yang digunakan dalam unit disk-drive terdistribusi
secara normal dengan rata-rata 0,2508 inci dan simpangan baku
ditetapkan sebagai 0.2500 ± 0,0015 in. Berapa fraksi poros pro-
dihasilkan sesuai dengan spesifikasi?
0,0005 in. Spesifikasi pada poros telah ditetapkan

S solusi
Distribusi normal yang sesuai ditunjukkan pada Gambar 3.19.
Perhatikan bahwa σ = 0,0005

P{0.2485 ≤ x ≤ 0,2515} = P{x ≤ 0,2515} - P{x ≤ 0.2485}

= ⎛ 0,2515 0,2508⎞ ⎛ - Φ 0.2485 0.2508 0,2515


0.2485
0. 2508⎞
⎝ 0,0005 ⎠ ⎝ 0,0005 ⎠ Lebih rendah Atas
spesifikasi spesifikasi
= (1.40) -Φ(4.60) membatasi membatasi

(LSL) (USL)
= 0,9192 0,0000
■ GAMBAR 3 . 19 Distribusi diameter poros,
= 0,9192 Contoh 3.8.

Dengan demikian, kami mengharapkan hasil proses kira-kira


batas spesifikasi atas. Misalkan kita bisabaru-baru ini
91,92%; yaitu, sekitar 91,92% dari poros yang diproduksi sesuai
dengan spesifikasi.
proses manufaktur, mungkin dengan menyesuaikan mesin,
Perhatikan bahwa hampir semua poros yang tidak sesuai terlalu sehingga rata-rata proses sama persis dengan nilai nominal
0.2500. Lalu kita punya
besar, karena rata-rata proses terletak sangat dekat dengan

P{0.2485 ≤ x ≤ 0,2515} = P{x ≤ 0,2515} - P{x ≤ 0.2485}

= ⎛ 0.2515 0.2500 0⎞ .-2Φ4⎛85 0.2500 ⎞


⎝ 0,0005 ⎠ ⎝ 0,0005 ⎠
= (3,00) -Φ(3.00)
= 0,99865− 0,00135
= 0,9973

Dengan memperbarui proses, kami telah meningkatkan hasil


proses menjadi sekitar 99,73%.
E XAMPLE 3.9 Penggunaan Lain dari Tabel Normal Standar
variabel
Kadang-kadang, alih-alih menemukan probabilitas yang terkait dengan nilai acak
tertentu dariyang menghasilkan
variabel probabilitas
acak normal, kita tertentu.
perlu melakukan yang Misalkanx ~ n(10, 9). Carilah nilai darix-m
sebaliknya—menemukan nilai tertentu dari variabel acak normal.

S solusi

Dari pernyataan masalah, kita memilikiDari Lampiran Tabel II, kami memiliki P5z ≤ 1.6456 = 0,95, jadi

P{x > A} = P ⎨⎧ z > A -10⎫= 0,05 A -10 = 1.645


⎩ 3 ⎭ 3

atau atau

P⎧⎨ z ≤ A -10⎫=A = 10 + 3(1.645) = 14.935


0,95
⎩ 3 ⎭

Distribusi normal memiliki banyak sifat yang berguna. Salah satunya adalah relatif terhadaplinier
kombinasi variabel acak terdistribusi normal dan independen. Jika x1, x2 . . . ,xn
adalah variabel acak terdistribusi normal dan independen dengan rata-rata M1, M2, . . . ,Mn dan
varians S2 1, S2 , . . . ,S2n, masing-masing, maka distribusi kombinasi linier
kamu = A1x1 + A2x2 +L+ Anxn

normal dengan mean


μkamu = A1μ1 + A2μ2 +L+ Anμn (3.27)

dan varians
σ k2a=mAu21σ1 2 + 2
2 2 2 +L+
seb ua h n2 n (3.28)
di mana A1, A2, . . . ,An adalah konstanta.
A σ 2

Teorema Limit Pusat. Distribusi normal sering diasumsikan sebagai


model probabilitas yang sesuai untuk variabel acak. Nanti, kita akan membahas bagaimana
memeriksa validitas asumsi ini; namun, teorema limit pusat seringkali merupakan pembenaran
dari perkiraan normalitas.

Definisi
Teorema Limit Pusat Jika x1, x2, . . . ,xn adalah variabel acak independen dengan mean MSaya dan varians S2Saya , dan jika kamu = x1 + x2 + . . . +
n
kamu - Σ μSaya
Saya=1

n
Σ σ Saya
2
Saya=1

mendekati n(0, 1) distribusi sebagai n mendekati tak terhingga.


Teorema limit pusat menyatakan bahwa jumlah dari n variabel acak yang didistribusikan
secara independen mendekati normal, terlepas dari distribusi variabel individu. Perkiraan
meningkat sebagain meningkat. Dalam banyak kasus, aproksimasi akan baik untuk small
n-mengatakan, n < 10—sementara dalam beberapa kasus kami mungkin membutuhkan sangat besar n-mengatakan, n > 100—untuk

pendekatan menjadi memuaskan. Secara umum, jikaxSaya terdistribusi secara identik, dan distribusi
masing-masing xSaya tidak menyimpang secara radikal dari normal, maka teorema limit pusat
bekerja cukup baik untuk n ≥ 3 atau 4. Kondisi ini sering dijumpai dalam masalah rekayasa kualitas.

3.3.2 Distribusi Lognormal


Variabel dalam suatu sistem terkadang mengikuti hubungan eksponensial, katakanlah x = exp(w).
Jika eksponenw adalah variabel acak, maka x = exp(w) adalah variabel acak dan distribusi
x menarik. Kasus khusus yang penting terjadi ketikaw memiliki distribusi normal.
Dalam hal ini, distribusix disebut distribusi lognormal. Nama mengikuti dari
transformasi ln (x) = w. Yaitu, logaritma natural dari x terdistribusi normal.
Probabilitas untuk x diperoleh dari transformasi menjadi w, tapi kita perlu mengenali
bahwa kisaran x adalah (0, Q). Seandainya w terdistribusi normal dengan mean Q dan
varians 2; maka fungsi distribusi kumulatif untukx adalah

F(A) = P[x ≤ A] = P[exp(w) ≤ A] = P[w ≤ ln(A)]

⎡ ln(A) -θ ⎤ ⎡ ln(A) -θ ⎤
= P⎢z ≤ ω ⎦=
⎣ ⎣ ω ⎦
⎥ standar. Oleh karena itu, Lampiran Tabel II
untuk x > 0, dimana z adalah peubah acak normal
dapat digunakan untuk menentukan probabilitas. Juga,F (x) = 0, untuk x ≤ 0. Variabel acak
lognormal selalu nonnegatif.
Distribusi lognormal didefinisikan sebagai berikut:

Definisi
Membiarkan w memiliki rata-rata distribusi normal kamu dan varians 2; kemudianx = exp(w) adalah
variabel acak lognormal, dan distribusi lognormalnya adalah

1 ⎡ (ln(x) -θ)2 ⎤
F (x) = xω 2π exp⎢- ⎥0<x <∞ (3.29)
⎣⎢ 2ω2 ⎦⎥
Rata-rata dan varian dari x adalah
μ = eθ +ω2 2
dan σ =2 e 2θ +ω 2
(e -1)
ω2 (3.30)

Parameter dari distribusi lognormal adalah kamu dan 2, tetapi diperlukan kehati-hatian untuk
menafsirkan bahwa ini adalah rata-rata dan varians dari variabel acak normal w. Rata-rata dan varian dari
x adalah fungsi dari parameter ini ditunjukkan dalam persamaan 3.30. Gambar 3.20
mengilustrasikan distribusi lognormal untuk nilai parameter yang dipilih.
Masa pakai produk yang menurun seiring waktu sering dimodelkan oleh variabel acak
lognormal. Misalnya, ini adalah distribusi umum untuk masa pakai laser semikonduktor.
Distribusi kontinu lainnya juga dapat digunakan dalam jenis aplikasi ini. Namun, karena
distribusi lognormal diturunkan dari fungsi eksponensial sederhana dari variabel acak
normal, maka probabilitasnya mudah dipahami dan dievaluasi.
1
0.9
0.8 ω2 = 0,25
ω2 = 1
0,7 ω2 = 2.25
0.6
0,5

F (x)
0.4
0,3
0.2
0.1
0

– 0.1
0 1 2 3
4 5 6
x

■ GAMBAR 3 . 20 Fungsi kepadatan probabilitas lognormal


dengan q = 0 untuk nilai yang dipilih dari w2.

E XAMPLE 3.10 Seumur Hidup Laser Medis


Masa pakai laser medis yang digunakan dalam bedah mata memiliki
distribusi lognormal dengan: q = 6 dan w = 1,2 jam Berapa
probabilitas bahwa masa pakai melebihi 500 jam?

S solusi

Dari fungsi distribusi kumulatif untuk variabel


acak lognormal Dari Lampiran Tabel II, 1 (A) = 0,99 ketika A
=2.33. Karena itu,

(x > 500) = 1− P[exp(w) ≤ 500] = 1− P[w ≤ ln(500)] ln(A) -


6
= 2.33 dan A = exp(3.204) = 24,63 jam
1.2
⎛ ln(500) - 6⎞
= = 1−Φ(0.1788)
⎝ 1.2 ⎠ Tentukan rata-rata dan simpangan baku seumur hidup. Sekarang,

=
1− 0,5710 = 0,4290 μ = eθ +ω 2 2 = exp(6 + 0,72) = 828,82 jam

Berapa masa pakai yang dilampaui oleh 99% laser? Sekarang


σ 2 = e2θ +ω 2 ( 1 ) = exp(12 +1.44)[exp(1.44) -1]
pertanyaannya adalah untuk menentukanA seperti yang P(x > A) = 0,99.
ω2
Karena itu, e
= 2.212, 419.85
P(x > A) = P[exp(w) > A] = P[w >
jadi simpangan baku seumur hidup adalah 1487,42 jam.
ln(A)]
⎛ ln(A) - 6⎞ Perhatikan bahwa simpangan baku seumur hidup relatif besar
= 0,99
⎝ 1.2 ⎠ terhadap rata-rata.
1−Φ=
3.3.3 Distribusi Eksponensial
Distribusi probabilitas dari variabel acak eksponensial didefinisikan sebagai berikut:

Definisi
NS distribusi eksponensial adalah

F (x) = λe-x x≥0 (3.31)

di mana aku > 0 adalah konstanta. NSberarti dan perbedaan dari distribusi eksponensial
adalah

μ=1
(3.32)
λ
dan

σ2= 1 (3.33)
λ2
masing-masing.

Beberapa distribusi eksponensial ditunjukkan pada Gambar 3.21.


Distribusi eksponensial kumulatif adalah

F(A) = P{x ≤ A}

= ∫0A e-tdt
= 1− e-a A≥0 (3.34)

Gambar 3.22 mengilustrasikan fungsi distribusi kumulatif eksponensial.


Distribusi eksponensial banyak digunakan dalam bidang rekayasa keandalan sebagai
model waktu untuk kegagalan suatu komponen atau sistem. Dalam aplikasi ini, parameteraku
disebut tingkat kegagalan dari sistem, dan rata-rata distribusi 1/aku disebut

0.2
λ = 0.2(μ = 5)
λ = 0.1(μ = 10)
0.16 λ = 0,0667( μ = 15)

0.12
F (x)

F(A)

0,08

0,04

0
0
20 40 60 80 100 0
x A

■ GAMBAR 3 . 21 Distribusi eksponensial untuk dipilih ■ GAMBAR 3 . 22 Akumulatif


nilai-nilai dari l. fungsi distribusi eksponensial.
berarti waktu untuk gagal.2 Misalnya, komponen elektronik dalam sistem radar udara memiliki
masa manfaat yang dijelaskan oleh distribusi eksponensial dengan tingkat kegagalan 104/H; itu
adalah,aku = 104. Waktu rata-rata untuk kegagalan untuk komponen ini adalah 1/aku = 104 =
10.000 jam Jika kita ingin menentukan probabilitas bahwa komponen ini akan gagal sebelum umur
yang diharapkan, kita akan mengevaluasi
1
P⎧⎨ x ≤ ⎫ = ∫1 λ λe-tdt = 1− e1 = 0,63212
0
⎩ λ⎭

Hasil ini berlaku terlepas dari nilai aku; yaitu, probabilitas bahwa nilai variabel acak
eksponensial akan lebih kecil dari rata-ratanya adalah 0,63212. Hal ini tentu saja terjadi
karena distribusinya tidak simetris.
Ada hubungan penting antara distribusi eksponensial dan distribusi Poisson. Jika kita
menganggap distribusi Poisson sebagai model jumlah kemunculan beberapa peristiwa dalam
interval (0,T], maka dari persamaan 3.15 diperoleh

e-t (t)x
P(x) =
x!
Sekarang x = 0 menyiratkan bahwa tidak ada kejadian dari peristiwa di (0, T], dan
P5x = 06 = P(0) = elT. Kita mungkin berpikirP(0) sebagai probabilitas bahwa interval ke kejadian
pertama lebih besar dari T, atau

P{kamu > T} = P(0) = e-t

di mana kamu adalah variabel acak yang menunjukkan interval ke kejadian pertama. Sejak

(T) = P{kamu ≤ T} = 1− e-t

dan menggunakan fakta bahwa F (kamu) = dF(kamu)/dy, kita punya

F (kamu) = λe-y (3.35)

sebagai distribusi interval ke kejadian pertama. Kami mengakui persamaan 3.35 sebagai distribusi
eksponensial dengan parameterl. Oleh karena itu, kita melihat bahwa jika jumlah kemunculan
suatu peristiwa memiliki distribusi Poisson dengan parameter aku, maka distribusi interval
di antara kejadian eksponensial dengan parameter l.
Distribusi eksponensial memiliki kurang ingatan Properti. Untuk mengilustrasikannya, misalkan
variabel acak eksponensialx digunakan untuk memodelkan waktu terjadinya suatu peristiwa.
Pertimbangkan dua titik waktu T1 dan T2 > T1. Maka peluang terjadinya peristiwa tersebut pada waktu
yang kurang dariT1 + T2 tapi lebih besar dari waktu T2 hanyalah peluang terjadinya peristiwa pada
waktu kurang dari T1. Ini adalah kekurangan yang sama dari properti memori yang kita amati sebelumnya untuk
distribusi geometrik. Distribusi eksponensial adalah satu-satunya distribusi kontinu yang
memiliki properti ini.

3.3.4 Distribusi Gamma


Distribusi probabilitas variabel acak gamma didefinisikan sebagai berikut:

2Lihat materi teks tambahan untuk informasi lebih lanjut.


Definisi
NS distribusi gamma adalah

F (x) = λ (x)R1e-x x≥0 (3.36)


Γ(R)

dengan parameter bentuk R > 0 dan parameter skala aku > 0 berarti dan perbedaan
dari distribusi gamma adalah

μ=R (3.37)
λ
dan
σ2= R (3.38)
λ2
masing-masing.3

Beberapa distribusi gamma ditunjukkan pada Gambar 3.23. Perhatikan bahwa jikaR = 1, distribusi
gamma direduksi menjadi distribusi eksponensial dengan parameter aku (Bagian 3.3.3). Distribusi
gamma dapat mengambil banyak bentuk yang berbeda, tergantung pada nilai yang dipilih untukR dan l.
Ini membuatnya berguna sebagai model untuk berbagai variabel acak kontinu.
Jika parameternya R adalah bilangan bulat, maka distribusi gamma adalah jumlah dari R distribusi
eksponensial yang terdistribusi secara independen dan identik, masing-masing dengan parameter l. Artinya, jika
x1, x2, . . . ,xR eksponensial dengan parameter aku dan mandiri, maka

kamu = x1 + x2 +L+ xR

didistribusikan sebagai gamma dengan parameter R dan l. Ada beberapa aplikasi penting
hasil ini.

1 R = 1, λ = 1
R = 2, λ = 1
0.8 R = 3, λ = 1

0.6
F (x)

0.4

0.2

0
0 2 4 6
x
8 10 12 ■ GAMBAR 3 . 23 distribusi gamma
untuk nilai yang dipilih atau R dan aku = 1.

dalam penyebut persamaan 3.36 adalah fungsi gamma, yang didefinisikan sebagai (R) = QxR1e0xdx, R > 0. Jika R
3 (R)
adalah bilangan bulat positif, maka ≠1R2 = 1R - 12!
Perhatikan sistem yang ditunjukkan pada Gambar 3.24. Ini disebut sistem redundan siaga, karena saat komponen 1 hidup, komponen 2 mati, dan ketika komponen 1 gagal, saklar
Komponen 2
R = 2 dan aku = 104. Jadi, waktu rata-rata untuk kegagalan adalah
m = R/l = 2/104 = 2 × 104 H.

Komponen 1
Mengalihkan

Distribusi gamma kumulatif adalah


λ
F(A) = 1− ∫∞A Γ (R) t)R1e-tdt
( (3.39)

Jika R adalah bilangan bulat, maka persamaan 3.39 menjadi

R1
(a) k
F(A) = 1− Σ e-a
k=0 k! (3.40)

Akibatnya, distribusi gamma kumulatif dapat dievaluasi sebagai jumlah dari R Istilah Poisson dengan
parameter akuA. Hasil ini tidak terlalu mengejutkan, jika kita menganggap distribusi Poisson sebagai
model jumlah kemunculan suatu peristiwa dalam interval tetap, dan distribusi gamma sebagai model
porsi interval yang diperlukan untuk mendapatkan jumlah kejadian tertentu. .

3.3.5 Distribusi Weibull


Distribusi Weibull didefinisikan sebagai berikut:

Definisi
NS Distribusi Weibull adalah

x β1 p⎢⎡⎛ ⎞ ⎤ x β ⎥
F (x) = ⎛β
θ⎞ ⎝ θ ⎠ mantan x≥0 (3.41)
⎢⎣ ⎝ ⎠ θ ⎦⎥

di mana q > 0 adalah parameter skala dan b > 0 adalah parameter bentuk. NS berarti
dan perbedaan dari distribusi Weibull adalah

μ = θ Γ ⎛⎜1+ ⎟1 ⎞ (3.42)
⎝β ⎠
dan

2⎡ ⎛ 2 ⎞⎧ ⎛ 1 ⎞⎫ ⎤2
σ 2= θ ⎢ Γ ⎜ 1+ ⎟ - ⎨1+
Γ⎜ ⎟⎬ ⎥ (3.43)
⎣ ⎝β ⎠ ⎩ ⎝β ⎠ ⎭ ⎥

masing-masing.
5
β = 12_ , θ = 1
β = 1, θ = 1
β = 2, θ = 1
4 β = 4, θ = 1

3
F (x)

0
0 ■ GAMBAR 3 . 25 Weibull di-
2 3 kontribusi untuk nilai yang dipilih dari
4 parameter bentuk dan parameter skala q = 1.
1
x

Distribusi Weibull sangat fleksibel, dan dengan pemilihan parameter yang tepat Q dan B,
distribusi dapat mengasumsikan berbagai bentuk. Beberapa distribusi Weibull ditunjukkan pada Gambar
3.25 untukq = 1 dan b = 1/2, 1, 2, dan 4. Perhatikan bahwa ketika b = 1, distribusi Weibull direduksi
menjadi distribusi eksponensial dengan rata-rata 1/Q. Distribusi kumulatif Weibull adalah

F(A) = 1−
⎡ Aβ (3.44)
exp
⎤ θ
⎢⎢⎣⎛ ⎝⎞ ⎠ ⎥ ⎦

Distribusi Weibull telah digunakan secara luas dalam rekayasa keandalan sebagai model
waktu kegagalan untuk komponen dan sistem listrik dan mekanik. Contoh situasi di mana
distribusi Weibull telah digunakan termasuk perangkat elektronik seperti elemen memori,
komponen mekanis seperti bantalan, dan elemen struktural di pesawat terbang dan mobil.4

E XAMPLE 3.12 Saatnya Kegagalan untuk Komponen Elektronik


Waktu kegagalan untuk komponen elektronik yang digunakan dalam unit
tampilan panel datar dimodelkan secara memuaskan oleh distribusi Weibull.
kegagalan dan fraksi komponen yang diharapkan bertahan
lebih dari 20.000 jam.
bution dengan b = 12 dan q = 5000. Temukan waktu rata-rata untuk

S solusi

Waktu rata-rata untuk gagal adalah atau


⎛ ⎞
⎛ 1⎞ 1 ⎟ ⎡ ⎛ 20.000⎞ 21⎥⎤
μ = θΓ ⎜1+ ⎟ = 5000Γ⎜ 1+ 1− F(20.000) = exp⎢- ⎟
β ⎜ 1
⎝ ⎠ ⎟ ⎢ ⎜ ⎝ 5, 000 ⎠ ⎥
⎜ ⎟
⎝ ⎠
2 ⎢⎣ ⎥⎦
= 5000Γ(3) = 10.000 jam
= e2
Fraksi komponen yang diharapkan bertahan A = 20.000 = 0.1353
jam adalah
Artinya, semua kecuali sekitar 13,53% dari sub-rakitan akan gagal dengan
- F(A)
⎡ ⎛ 20.000 jam.
A⎞β⎤
= exp⎢-
⎝ ⎠θ⎥
⎣ ⎥⎦

4Lihat materi teks tambahan untuk informasi lebih lanjut.
3.4 Plot Probabilitas 97

3.4 Plot Probabilitas

3.4.1Plot Probabilitas Normal


Bagaimana kita tahu apakah distribusi probabilitas tertentu adalah model yang masuk akal untuk data?
Merencanakan probabilitas adalah metode grafis untuk menentukan apakah data sampel sesuai
dengan distribusi hipotesis berdasarkan pemeriksaan visual subjektif dari data. Prosedur umumnya
sangat sederhana dan dapat dilakukan dengan cepat. Plot probabilitas biasanya menggunakan kertas
grafik khusus, yang dikenal sebagaikertas probabilitas, yang telah dirancang untuk distribusi hipotesis.
Kertas probabilitas tersedia secara luas untuk distribusi normal, lognormal, Weibull, dan berbagai chi-
kuadrat dan gamma. Pada bagian ini kami mengilustrasikanplot probabilitas normal.
Bagian 3.4.2 membahas plot probabilitas untuk beberapa distribusi kontinu lainnya.
Untuk membangun plot probabilitas, pengamatan dalam sampel diurutkan pertama dari
terkecil hingga terbesar. Yaitu sampelx1, x2, . . . ,xn diatur sebagai x(1), x(2), . . . ,x(n), di mana
x(1) adalah pengamatan terkecil, x(2) adalah pengamatan terkecil kedua, dan seterusnya, dengan x(n)
terbesar. Pengamatan yang dipesanx( J) kemudian diplot terhadap frekuensi kumulatif yang
diamati ( J - 0,5)/n [atau 100 ( J - 0,5)/n] pada kertas probabilitas yang sesuai. Jika hipo-
distribusi esized cukup menggambarkan data, titik-titik yang diplot akan jatuh kira-kira
sepanjang garis lurus; jika titik-titik yang diplot menyimpang secara signifikan dan sistematis
dari garis lurus, model yang dihipotesiskan tidak sesuai. Biasanya penentuan plot data
sebagai garis lurus atau tidak bersifat subjektif. Prosedur tersebut diilustrasikan dalam
contoh berikut.

E XAMPLE 3.13 Plot Probabilitas Normal


Pengamatan bilangan oktan jalan 10 campuran bensin adalah
sebagai berikut : 88.9, 87.0, 90.0, 88.2, 87.2, 87.4, 87.8, 89.7,
cukup dimodelkan dengan distribusi normal. Apakah ini asumsi
yang masuk akal?
86,0, dan 89,6. Kami berhipotesis bahwa angka oktan adalah

S solusi

Untuk menggunakan plot probabilitas untuk menyelidiki hipotesis


ini, pertama-tama atur pengamatan dalam urutan menaik dan pasangan nilai x(J) dan ( J - 0.5)/10 sekarang diplot pada kertas
hitung frekuensi kumulatifnya ( J - 0.5)/10 seperti yang ditunjukkan probabilitas normal. Plot ini ditunjukkan pada Gambar 3.26. Paling
berikut ini meja. plot kertas probabilitas normal 100( J - 0,5)/n pada skala
vertikal kiri (dan beberapa juga memplot 100[1 ( J - 0,5)/n]
J ( J - 0,5)/10 pada skala vertikal kanan), dengan nilai variabel diplot pada
x( J)
skala horizontal. Sebuah garis lurus, dipilih secara subjektif

1 86.0 sebagai garis “paling sesuai”, telah ditarik melalui titik-titik


0,05
2 87.0 yang diplot. Dalam menggambar garis lurus, Anda harus
0,15 lebih dipengaruhi oleh titik-titik dekat tengah plot daripada
3 87.2
0,25 titik-titik ekstrem. Aturan praktis yang baik adalah
4 87.4
0.35 menggambar garis kira-kira antara titik persentil kedua
5 87.8
0,45 puluh lima dan tujuh puluh lima. Ini adalah bagaimana
6 88.2
0,55 garis pada Gambar 3.26 ditentukan. Dalam menilai
7 88.9
0,65 penyimpangan sistematis titik-titik dari garis lurus,
8 89.6 bayangkan sebuah pensil gemuk tergeletak di sepanjang
0,75
9 89.7 garis. Jika semua titik dicakup oleh pensil imajiner ini,
0,85
10 90.0 distribusi normal cukup menggambarkan data. Karena poin
0,95
pada Gambar 3.26 akan lulus tes pensil gemuk,

(lanjutan)
99

95
90
Persentase [100(J - 0,5)/n]

80
70
60
50
40
30
20
10
5

1
85.2 86.2 87.2 88.2 89.2 90.2 91.2
■ GAMBAR 3 . 26 Probabilitas normal
x( J ) plot data angka oktan jalan.

Plot probabilitas normal juga dapat dibangun di atas kertas grafik biasa dengan memplot
nilai normal standar zJ melawan x( J), di mana nilai normal standar memenuhi
J - 0,5
= P(Z ≤ z J ) =(z J )
n
Misalnya, jika ( J - 0,5)/n = 0,05, (zJ) = 0,05 menyiratkan bahwa zJ =1.64. Sebagai ilustrasi, perhatikan
data dari contoh sebelumnya. Dalam tabel berikut kami menunjukkan standar normal
skor di kolom terakhir.
Gambar 3.27 menyajikan plot dari zJ melawan x( J). Plot probabilitas normal ini setara
seperti pada Gambar 3.26. Kita dapat memperoleh perkiraan mean dan standar deviasi
langsung dari plot probabilitas normal. Mean diperkirakan sebagai persentil kelima puluh. Dari Gambar
3.25, kami akan memperkirakan angka oktan jalan rata-rata sebagai 88.2. Standar deviasi sebanding
dengan kemiringan garis lurus pada plot, dan satu standar deviasi adalah perbedaan antara persentil
kedelapan puluh empat dan kelima puluh. Pada Gambar 3.26, persentil kedelapan puluh empat adalah
sekitar 90, dan perkiraan simpangan bakunya adalah 90 88,2 = 1,8.
Aplikasi yang sangat penting dari plot probabilitas normal adalah dalam verifikasi asumsi
ketika menggunakan prosedur inferensi statistik yang membutuhkan asumsi normalitas
tion. Ini akan diilustrasikan selanjutnya.

3.30
J x( J) ( J - 0,5)/10 zJ
1.64
1 86.0 0,05 – 1.64
0,67 2 87.0 0,15 – 1.04
3 87.2 0,25 – 0,67
0
zJ

4 87.4 0.35 – 0,39

– 0,67 5 87.8 0,45 – 0,13


6 88.2 0,55 0.13
– 1.64 7 88.9 0,65 0.39
8 89.6 0,75 0,67
– 3.30
9 89.7 0,85 1.04
85.2 86.2 87.2 88.2 89.2 90.2 91.2 10 90.0 0,95 1.64
x(J)

■ GAMBAR 3 . 27 Plot probabilitas normal jalan


data angka oktan dengan skor standar.
■ TABEL 3 . 5
Kontaminasi Aluminium (ppm)

30 30 60 63 70 79 87
90 101 102 115 118 119 119
120 125 140 145 172 182
183 191 222 244 291 511
Dari “Distribusi Lognormal untuk Pemodelan Data Kualitas Ketika Mean Mendekati Nol,”
Jurnal Teknologi Kualitas, 1990, hlm. 105–110.

3.4.2 Plot Probabilitas Lainnya


Plot probabilitas sangat berguna dan sering kali merupakan teknik pertama yang digunakan ketika kita
perlu menentukan distribusi probabilitas mana yang mungkin memberikan model data yang masuk akal.
Dalam menggunakan plot probabilitas, biasanya distribusi dipilih dengan penilaian subjektif dari plot
probabilitas. Statistik yang lebih formalkecocokan tes juga dapat digunakan bersama dengan plot
probabilitas.
Untuk mengilustrasikan bagaimana plot probabilitas dapat berguna dalam menentukan distribusi yang
tepat untuk data, perhatikan data kontaminasi aluminium (ppm) dalam plastik yang ditunjukkan pada Tabel 3.5.
Gambar 3.28 menyajikan beberapa plot probabilitas dari data ini, yang dibangun menggunakan Minitab.
Gambar 3.28A adalah plot probabilitas normal. Perhatikan bagaimana data di bagian ekor plot

99
99
95
90 95
80 90
70 80
Persentase

60 70
Persentase

50 60
40 50
30 40
20 30
10 20
5 10
5
1
1
0 100 200 300
400 500 100 1000
Kontaminasi aluminium (ppm) Kontaminasi aluminium (ppm)

(A) (B)

99
95 99
90
80
70 98
60 97
50
40
Persentase

30 95
Persentase

20
90
10
5 80
3 70
60
2 50
1 30
10
10 100
1000 0 100 200 300 400 500 600
Kontaminasi aluminium (ppm)
Kontaminasi aluminium (ppm)
(C)
(D)

■ GAMBAR 3 . 28Plot probabilitas data kontaminasi aluminium pada Tabel 3.5. (A) Biasa.
(B) Lognormal. (C) Weibull. (D ) Eksponensial.
menekuk menjauh dari garis lurus; Ini merupakan indikasi bahwa distribusi normal bukanlah
model yang baik untuk data. Gambar 3.28B adalah plot probabilitas lognormal dari data. Data
jatuh lebih dekat ke garis lurus di plot ini, terutama pengamatan di bagian ekor, menunjukkan
bahwa distribusi lognormal lebih mungkin untuk memberikan model yang masuk akal untuk
data daripada distribusi normal.
Akhirnya, Gambar 3.28C dan 3.28D adalah Weibull dan plot probabilitas eksponensial untuk
data. Pengamatan di plot ini tidak terlalu dekat dengan garis lurus, menunjukkan bahwa baik
Weibull maupun eksponensial adalah model yang sangat baik untuk data. Oleh karena itu,
berdasarkan empat plot probabilitas yang telah kami buat, distribusi lognormal tampaknya
menjadi pilihan yang paling tepat sebagai model untuk data kontaminasi aluminium.

3.5 Beberapa Perkiraan Berguna


Dalam masalah kontrol kualitas tertentu, kadang-kadang berguna untuk memperkirakan satu
distribusi probabilitas dengan yang lain. Ini sangat membantu dalam situasi di mana distribusi asli
sulit untuk dimanipulasi secara analitis. Pada bagian ini, kami menyajikan tiga perkiraan tersebut:
(1) pendekatan binomial ke hipergeometrik, (2) pendekatan Poisson ke binomial,
dan (3) pendekatan normal ke binomial.

3.5.1 Pendekatan Binomial untuk Hipergeometrik


Perhatikan distribusi hipergeometrik pada persamaan 3.8. Jika rasiot/T (sering dipanggil
pecahan sampel) kecil—katakanlah, t/T ≤ 0.1—maka distribusi binomial dengan parameter
P = T/T dan n adalah pendekatan yang baik untuk hipergeometrik. Pendekatannya lebih baik untuk
nilai kecil darit/T.
Perkiraan ini berguna dalam desain rencana pengambilan sampel penerimaan. Ingatlah bahwa
distribusi hipergeometrik adalah model yang sesuai untuk jumlah item yang tidak sesuai yang diperoleh
dalam sampel acak darin item dari banyak ukuran yang terbatas N. Jadi, jika ukuran sampel n
kecil dibandingkan dengan ukuran lot n, pendekatan binomial dapat digunakan, yang biasanya
sangat menyederhanakan perhitungan.
Sebagai contoh, anggaplah sekelompok 200 aplikasi kredit mobil berisi 5 aplikasi
yang memiliki informasi pelanggan yang tidak lengkap. Itu bisa disebutaplikasi yang
tidak sesuai. Probabilitas bahwa sampel acak dari 10 aplikasi tidak akan berisi
aplikasi yang tidak sesuai adalah, dari persamaan 3.8,

⎜ ⎛ ⎟5⎞⎛195⎞
⎜ ⎟
⎝ 0 ⎠⎝ 10 ⎠
P(0) = = 0,7717
⎛ 200⎞

⎝⎜ 10 ⎠

Perhatikan bahwa sejak t/T = 10/200 = 0,05 relatif kecil, kita bisa menggunakan pendekatan binomial
dengan P = T/T = 5/200 = 0,025 dan n = 10 untuk menghitung

5
P(0) =⎛ ⎞ (0,025)0(0,975)10 = 0,7763
⎝ 0⎠

3.5.2 Pendekatan Poisson untuk Binomial


Telah dicatat dalam Bagian 3.2.3 bahwa distribusi Poisson dapat diperoleh sebagai bentuk pembatas dari
distribusi binomial untuk kasus di mana P mendekati nol dan n mendekati tak terhingga
3.5 Beberapa Perkiraan Berguna 101

dengan aku

np konstan. Ini menyiratkan bahwa, untuk kecilP dan besar n, distribusi Poisson dengan
aku np dapat digunakan untuk mendekati distribusi binomial. Perkiraannya biasanya bagus
untuk ukuran besarn dan jika P < 0.1. Semakin besar nilain dan semakin kecil nilai P, semakin
baik aproksimasinya.

3.5.3 Pendekatan Normal ke Binomial


Dalam Bagian 3.2.2 kita mendefinisikan distribusi binomial sebagai jumlah dari barisan n Percobaan Bernoulli,
masing-masing dengan kemungkinan sukses P. Jika banyaknya percobaan n besar, maka kita dapat
menggunakan teorema limit pusat untuk membenarkan distribusi normal dengan mean np dan varians np(1 P)
sebagai pendekatan ke binomial. Itu adalah,

n
P{x = A} =⎛ ⎞ PA(1− P)n-A
⎝ A⎠
1 -
1
[(A-np) np(1− P) ]
2

= 2
2np(1− P)

Karena distribusi binomial bersifat diskrit dan distribusi normal kontinu, maka biasanya
digunakan koreksi kontinuitas dalam aproksimasi, sehingga
⎛ ⎛ 1 1
np ⎞ A+ A - - np ⎞
P{x = A} ≅ Φ ⎜ 2 ⎟ 2 ⎟
⎟-Φ⎜
⎜ n P) ⎜
P(1− ⎟ ⎜ np(1− P ) ⎟
⎠ ⎝ ⎠
di mana £ menunjukkan fungsi distribusi kumulatif normal standar. Jenis lain dari masalah-
pernyataan kemampuan dievaluasi dengan cara yang sama, seperti:

⎛ 1
B + np ⎞ ⎛ 1
A - - 2np ⎞
P {a ≤ x ≤ B }≅ ⎜ Φ ⎜ 2 - Φ⎜⎜ ⎟
⎟ ⎟
nP(1− P) ⎜ np(1− P ) ⎟
⎝ ⎠

Pendekatan normal ke binomial diketahui memuaskan untuk P sekitar 1/2 dan n > 10. Untuk
nilai lain dari P, nilai yang lebih besar n diperlukan. Secara umum, pendekatan tidak cukup
untukP < 1/(n + 1) atau P > n//n + 1), atau untuk nilai-nilai variabel acak di luar interval enam
standar deviasi yang lebarnya berpusat di sekitar rata-rata (yaitu, interval
np ± 32(np(1 P)).
Kita juga dapat menggunakan pendekatan normal untuk variabel P = x/n-itu adalah,
acak fraksi sampel yang cacat pada Bagian 3.2.2. Variabel acak P kurang lebih tidak-
terdistribusi mally dengan mean P dan varians P(1 P)/n, yang seperti itu
⎛ v-P ⎞ ⎛
P {u ≤ P ≤ v} ≅ Φ⎜ - Φ⎜
kamu - P ⎞

⎝ P(1- P) n⎠ ⎝ P(1− P) n ⎟

Karena normal akan berfungsi sebagai pendekatan ke binomial, dan karena distribusi binomial
dan Poisson berhubungan erat, tampaknya logis bahwa normal dapat berfungsi untuk mendekati
Poisson. Ini memang kasusnya, dan jika maksudnyaaku distribusi Poisson besar — katakanlah,
setidaknya 15 — maka distribusi normal dengan m = l dan S2 = aku merupakan pendekatan yang
memuaskan.
102 bagian 3 ■ Kualitas Proses Pemodelan

_ n_ < 0.1
n

P < 0.1
( Semakin kecil P dan
lebih besar n lebih baik)
( P>
( Membiarkan P' = 1 – P. Semakin

kecilP' dan lebih besar

n lebih baik (
np > 10 P 0.9

0.1 ≤ P ≤ 0.9
λ >_ 15 (Semakin besar semakin baik)

■ GAMBAR 3 . 29Perkiraan distribusi probabilitas.

3.5.4Komentar tentang Perkiraan


Ringkasan pendekatan yang dibahas di atas disajikan pada Gambar 3.29. Dalam gambar ini,
H, B, P, dan n mewakili hipergeometrik, binomial, Poisson, dan distribusi normal, masing-masing.
Ketersediaan mikrokomputer modern yang tersebar luas, paket perangkat lunak statistik yang
baik, dan kalkulator genggam telah membuat ketergantungan pada perkiraan ini sebagian besar
tidak diperlukan, tetapi ada situasi di mana mereka berguna, terutama dalam penerapan grafik
kendali batas tiga sigma yang populer.

Istilah dan Konsep Penting


Perkiraan distribusi probabilitas
Persentil
Distribusi binomial
distribusi racun
Petak kotak
Populasi
teorema limit pusat
Distribusi probabilitas
Teorema batas kendali
Plot probabilitas
distribusi kontinu
Kuartil
Statistik deskriptif
Variabel acak
Distribusi diskrit
Jalankan grafik
Distribusi eksponensial
Sampel
Distribusi Gamma
Rata-rata sampel
Distribusi geometris
Standar deviasi
Histogram
sampel Varians
Distribusi probabilitas hipergeometrik
sampel Standar
Rentang interkuartil
deviasi
Distribusi lognormal
Statistik distribusi normal
Rata-rata distribusi
standar
Median
Tampilan batang dan daun
Distribusi Binomial Negatif
Plot deret waktu
Distribusi Normal
Plot peluang normal Distribusi seragam
Distribusi Pascal Varians dari suatu
distribusi Distribusi Weibull
Latihan

3.1. Isi botol deterjen cair sedang ■ TA BLE 3 E . 1


NS Murid
dianalisis. Dua belas botol, dipilih Waktu Kegagalan Komponen Elektronik
Panduan Sumber Daya

menyajikan komp-
secara acak dari proses, diukur, 127 124 121 118
hensive beranotasi dan hasilnya adalah sebagai
125 123 136 131
solusi untuk berikut (dalam ons cairan): 16,05,
bernomor ganjil 16.03, 16.02, 16.04, 16.05, 16.01, 131 120 140 125
latihan termasuk 16.02, 16.02, 16.03, 16.01, 16.00, 124 119 137 133
di Jawaban untuk
16.07
Latihan yang Dipilih 129 128 125 141
(a) Hitung rata-rata sampel.
bagian di 121 133 124 125
belakang buku ini.
(b) Hitung simpangan baku
sampel. 142 137 128 140
3.2. Diameter lubang dari delapan bantalan yang dipilih secara 151 124 129 131
acak ditunjukkan di sini (dalam mm): 50,001, 50,002, 160 142 130 129
49.998, 50.006, 50.005, 49.996, 50.003, 50.004
125 123 122 126
(a) Hitung rata-rata sampel.
(b) Hitung simpangan baku sampel. 3.8. Waktu kegagalan dalam jam dari komponen
3.3. Waktu pelayanan dalam menit dari masuk sampai keluar elektronik yang dikenai uji umur dipercepat
untuk sepuluh pasien yang mencari perawatan di unit ditunjukkan pada Tabel 3E.1. Untuk mempercepat
gawat darurat rumah sakit adalah 21, 136, 185, 156, 3, uji kegagalan, unit diuji pada suhu tinggi (baca ke
16, bawah, lalu ke seberang).
48, 28, 100, dan 12. Hitung mean dan standar deviasi (a) Hitung rata-rata sampel dan simpangan
pelayanan waktu.
3.4. The Really Cool Clothing Company menjual produknya melalui
baku.
proses pemesanan melalui telepon. Karena bisnisnya bagus,
(b) Membangun histogram.
perusahaan tertarik untuk mempelajari cara agen penjualan
(c) Buatlah plot batang dan daun.
berinteraksi dengan pelanggan mereka. Panggilan dipilih dan
(d) Tentukan median sampel dan kuartil bawah dan
direkam secara acak, kemudian ditinjau dengan agen penjualan
kuartil atas.
untuk mengidentifikasi cara agar layanan yang lebih baik dapat
3.9.Data yang ditunjukkan pada Tabel 3E.2 adalah pembacaan
diberikan atau bahwa pelanggan dapat diarahkan ke item lain
hasil proses kimia pada hari-hari berturut-turut (baca ke
yang serupa dengan yang mereka rencanakan untuk dibeli yang
bawah, lalu ke seberang). Buat histogram untuk data ini.
mungkin juga menarik bagi mereka. Waktu penanganan
panggilan (lama) dalam menit untuk 20 panggilan pelanggan ■ TA BLE 3 E . 2
yang dipilih secara acak yang ditangani oleh agen penjualan Hasil Proses
yang sama adalah sebagai berikut: 6, 26, 8, 2, 6, 3, 10, 14, 4,
5, 3, 17, 9, 8, 9, 5, 3, 28, 21, dan 4. Hitung mean dan 94.1 87.3 94.1 92.4 84.6 85.4
standar 93.2 84.1 92.1 90.6 83.6 86.6
deviasi dari waktu penanganan panggilan.
90.6 90.1 96.4 89.1 85.4 91.7
3.5. Sembilan pengukuran berikut adalah suhu tungku yang (b) Hitung simpangan baku sampel.
direkam pada batch berturut-turut dalam proses
91.4 95.2 88.2 88.8 89.7 87,5
manufaktur semikonduktor (satuan adalah ° F): 953, 88.2 86.1 86.4 86.4 87.6 84.2
955, 948, 951, 957, 949, 954, 950, 959 86.1 94.3 85.0 85.1 85.1 85.1
(a) Hitung rata-rata sampel. 95.1 93.2 84.9 84.0 89.6 90.5
(b) Hitung simpangan baku sampel.
90.0 86.7 87.3 93.7 90.0 95.6
3.6. Pertimbangkan data suhu tungku di Latihan 3.5.
(a) Carilah median sampel dari data ini. 92.4 83.0 89.6 87.7 90.1 88.3
(b) Berapa besar kenaikan suhu terbesar 87.3 95.3 90.3 90.6 94.3 84.1
tanpa mengubah median sampel? 86.6 94.1 93.1 89,4 97.3 83.7
91.2 97.8 94.6 88.6 96.8 82.9
3.7. Kekuatan luluh tabung melingkar dengan tutup ujung
86.1 93.1 96.3 84.1 94.4 87.3
diukur. Hasil pertama (dalam kN) adalah sebagai berikut:
96, 90.4 86.4 94.7 82.6 96.1 86.4
102, 104, 108, 126, 128, 150, 156
(a) Hitung rata-rata sampel.
89.1 87.6
91.1
83.1
98.0
84.5
■ TA BLE 3 E . 3 ■ TA BLE 3 E . 4
Viskositas Siklus Kegagalan Kupon Tes

13.3 14.9 15.8 16.0 8078 1891 13912 3407 6168


14.5 13.7 13.7 14.9 15504 1893 12551 6861 1334
15.3 15.2 15.1 13.6 9438 6227 2562 2074 6770
15.3 14.5 13.4 15.3 7971 17081 9245 19041 21997
14.3 15.3 14.1 14.3
14.8 15.6 14.8 15.6 3.14. Buatlah plot probabilitas normal dari data hasil proses
15.2 15.8 14.3 16.1 kimia pada Latihan 3.9. Apakah asumsi bahwa hasil
14.5 13.3 14.3 13.9 proses dimodelkan dengan baik oleh distribusi
14.6 14.1 16.4 15.2 normal tampak masuk akal?
3.15. Pertimbangkan data viskositas dalam Latihan 3.10. Buat plot
14.1 15.4 16.9 14.4 probabilitas normal, plot probabilitas lognormal,
14.3 15.2 14.2 14.0 dan plot probabilitas Weibull untuk data ini.
16.1 15.2 16.9 14.4 Berdasarkan plot, distribusi mana yang tampaknya
13.1 15.9 14.9 13.7 menjadi model terbaik untuk data viskositas?
3.16.Tabel 3E.4 berisi 20 pengamatan pada siklus kegagalan
15.5 16,5 15.2 13.8
kupon uji aluminium yang mengalami tegangan bolak-
12.6 14.8 14.4 15.6 balik berulang sebesar 15.000 psi pada 20 siklus per
14.6 15.1 15.2 14.5 detik. Buat plot probabilitas normal, plot probabilitas
14.3 17.0 14.6 12.8 lognormal, dan plot probabilitas Weibull untuk data
15.4 ini. Berdasarkan plot, distribusi manakah yang
14.9 16.4 16.1
tampaknya menjadi model terbaik untuk siklus menuju
15.2 14.8 14.2 16.6
kegagalan untuk bahan ini?
16.8 14.0 15.7 15.6 3.17. Karakteristik kualitas air yang penting adalah
konsentrasi bahan padat tersuspensi (dalam
Mengomentari bentuk histogram. Apakah itu ppm). Tabel 3E.5 berisi 40 pengukuran padatan
menyerupai salah satu distribusi yang telah kita tersuspensi untuk danau tertentu. Buat plot
bahas dalam bab ini? probabilitas normal, plot probabilitas
3.10. Sebuah artikel di Rekayasa Kualitas (Jil. 4, 1992, hlm. lognormal, dan plot probabilitas Weibull untuk
487–495) menyajikan data viskositas dari proses data ini.
kimia batch. Contoh data ini disajikan pada Tabel Berdasarkan plot, distribusi manakah yang
3E.3 (baca ke bawah, lalu ke seberang). merupakan model terbaik untuk
(a) Buatlah tampilan batang dan daun untuk konsentrasi padatan tersuspensi?
data viskositas. 3.18.Pertimbangkan waktu pelayanan rawat jalan pada Latihan
(b) Buatlah distribusi frekuensi dan histogram. 3.3. Buat plot probabilitas normal, plot probabilitas
(c) Ubah plot batang dan daun pada bagian (a) menjadi plot eksponensial, dan plot probabilitas Weibull untuk data
batang dan daun berurutan. Gunakan grafik ini untuk ini. Apakah salah satu dari distribusi ini tampak sebagai
membantu menemukan median dan kuartil atas dan
bawah dari data viskositas.
(d) Berapa persentil kesepuluh dan kesembilan puluh dari ■ TA BLE 3 E . 5
viskositas? Konsentrasi Padatan Tersuspensi (ppm)
3.11. Buatlah dan tafsirkan plot probabilitas normal
dari volume botol deterjen cair pada Latihan
3.1.
3.12. Bangun dan tafsirkan plot probabilitas normal
dari sembilan pengukuran suhu tungku
di Latihan 3.5.
3.13.Buatlah plot probabilitas normal dari data waktu kegagalan
pada Latihan 3.8. Apakah asumsi bahwa waktu
kegagalan untuk komponen ini dimodelkan dengan baik
oleh distribusi normal tampak masuk akal?

0,78 9.59 2.26 8.13 3.16


4.33 11.70 0,22 125,93 1.30
0,15 0,20 0,29 13.72 0,96
0,29 2.93 3.65 3.47 1.73
14.21 1.79 0,54 14.81 0.68
0,09 5.81 5.17 21.01 0,41
4.75 2.82 1.30 4,57 74,74
0,78 1.94 3.52 20.10 4.98
model probabilitas yang masuk akal untuk data? Berdasarkan x≤
plot tersebut, distribusi manakah yang paling tepat untuk Q. Carilah nilai yang sesuai dari
menggambarkan waktu pelayanan rawat jalan? k. Tentukan mean dan varians
3.19. Pertimbangkan waktu penanganan panggilan dalam dari x.
Latihan
3.4. Buat plot probabilitas normal, plot probabilitas
eksponensial, dan plot probabilitas gamma untuk data ini.
Apakah salah satu dari distribusi ini tampaknya menjadi
model probabilitas yang masuk akal untuk data?
Berdasarkan plot, distribusi manakah yang paling tepat
untuk menggambarkan waktu penanganan panggilan?

3.20. Pertimbangkan data viskositas dalam Latihan 3.10. Asumsikan


bahwa membaca ke bawah, lalu menyilang, memberikan data dalam
urutan
waktu. Membangun dan menafsirkan plot deret waktu.

3.21. Pertimbangkan kembali data hasil pada Latihan 3.9.


Buat plot deret waktu untuk data ini. Menafsirkan
plot.
3.22. Pertimbangkan konsentrasi padatan tersuspensi dari Latihan
3.17. Asumsikan bahwa membaca ke seberang, lalu ke bawah,
memberikan data dalam urutan waktu. Membangun dan
menafsirkan plot deret waktu.
3.23. Pertimbangkan data hasil proses kimia
dalam Latihan 3.9. Hitung rata-rata sampel
dan simpangan bakunya.
3.24. Pertimbangkan data hasil proses kimia dalam
Latihan
3.9. Buatlah plot batang dan daun untuk data
dan bandingkan dengan histogram dari Latihan
3.9. Tampilan mana yang memberikan lebih
banyak informasi tentang proses?
3.25. Buatlah plot kotak untuk data pada Latihan 3.1.
3.26. Buatlah plot kotak untuk data pada Latihan 3.2.
3.27. Misalkan dua dadu yang adil dilempar dan
variabel acak diamati — katakanlah, x—adalah
jumlah dari dua wajah ke atas. Jelaskan ruang
sampel dari percobaan ini, dan tentukan
distribusi probabilitas darix.
3.28. Temukan mean dan varians dari variabel acak
pada Latihan 3.27.
3.29.Rakitan mekatronik dikenai uji fungsional akhir.
Misalkan cacat terjadi secara acak
dalam rakitan ini, dan cacat itu terjadi
menurut distribusi Poisson dengan
parameter
aku = 0,02.
(a) Berapa probabilitas bahwa sebuah rakitan akan
memiliki tepat satu cacat?
(b) Berapa probabilitas bahwa suatu rakitan akan
memiliki satu atau lebih cacat?
(c) Misalkan Anda meningkatkan proses sehingga
tingkat terjadinya cacat dipotong setengah menjadi
aku = 0,01. Apa pengaruhnya terhadap kemungkinan
bahwa suatu rakitan akan memiliki satu atau lebih
cacat?
3.30. Distribusi peluang dari x adalah F1x2 = ke-x, 0 ≤
3.31. Variabel acak x mengambil nilai 1, 2, atau 3 dengan
probabilitas (1 + 3k)/3, (1 + 2k)/3, dan (0,5 + 5k)/3, masing-
masing.
(a) Carilah nilai yang sesuai dari k.
(b) Carilah mean dan varians dari x.
(c) Carilah fungsi distribusi kumulatif.
3.32. Distribusi probabilitas variabel acak diskrit x adalah P(x) = kr
x,0 < R < 1. Temukan nilai yang sesuai untuk k jika x = 0, 1,
....
3.33. Produsen kalkulator elektronik menawarkan garansi satu tahun. Jika
kalkulator gagal karena alasan apa pun selama periode ini, kalkulator akan
diganti. Waktu untuk kegagalan dimodelkan dengan baik oleh distribusi
probabilitas berikut:

F (x) = 0,125e0,125x x > 0

(a) Berapa persentase kalkulator yang akan gagal dalam


masa garansi?
(b) Biaya pembuatan kalkulator adalah $50, dan laba per penjualan
adalah $25. Apa pengaruh penggantian garansi terhadap
keuntungan?
3.34. Isi bersih dalam ons sup kalengan adalah variabel
acak dengan distribusi probabilitas

⎧ 4(x -11.75) 11.75 ≤ x ≤12.25


F (4x()12,75
= x) 12.25 ≤ x ≤12,75

Temukan probabilitas bahwa sebuah kaleng berisi kurang dari 12 ons
produk.
3.35. Sebuah proses produksi beroperasi dengan 1% output yang
tidak sesuai. Setiap jam sampel 25 unit produk diambil, dan
jumlah unit yang tidak sesuai dihitung. Jika satu atau lebih
unit yang tidak sesuai ditemukan, proses dihentikan dan
teknisi kontrol kualitas harus mencari penyebab produksi
yang tidak sesuai. Evaluasi kinerja aturan keputusan ini.
3.36. Lanjutan Latihan 3.35. Pertimbangkan aturan keputusan yang
dijelaskan dalam Latihan 3.35. Misalkan proses tiba-tiba memburuk
menjadi 4% output yang tidak sesuai. Berapa banyak sampel, rata-
rata, yang diperlukan untuk mendeteksi ini?
3.37. Sebuah sampel acak 50 unit diambil dari proses
produksi setiap setengah jam. Fraksi produk tidak sesuai yang
diproduksi adalah 0,02. Berapa probabilitas bahwaP ≤ 0,04 jika
pecahan yang tidak sesuai benar-benar 0,02?
3.38. Sampel 100 unit dipilih dari proses produksi yang 1% tidak
sesuai. Berapa probabilitas bahwaPn akan melebihi pecahan
sejati yang tidak sesuai dengan k simpangan baku, dimana k = 1,
2, dan 3?
3.39. Misalkan 10% dari populasi orang dewasa memiliki parameter kimia darah
yang konsisten dengan diagnosis
kondisi pra-diabetes. Dari empat peserta sukarelawan dalam (c) Misalkan ukuran lot adalah n = 150. Apakah
studi pemeriksaan kesehatan, berapa probabilitas bahwa salah pendekatan binomial akan memuaskan dalam
satu dari mereka adalah pra-diabetes? kasus ini?
3.40. Pasien yang tiba di klinik rawat jalan secara (d) Misalkan pembeli akan menolak lot dengan aturan
rutin keputusan menemukan satu atau lebih komponen
diskrining untuk tekanan darah tinggi. yang tidak sesuai dalam sampel ukuran
Asumsikan kondisi ini terjadi pada 15% populasi. n, dan ingin agar lot tersebut ditolak dengan probabilitas
(a) Berapa probabilitas bahwa pasien ketiga pada hari paling sedikit 0,95 jika lot tersebut mengandung lima atau
itu memiliki tekanan darah tinggi? lebih komponen yang tidak sesuai. Seberapa besar ukuran
(b) Berapa rata-rata jumlah pasien yang harus dilihat sampelnya?n menjadi?
untuk menemukan pasien pertama dengan 3.44. Banyak ukuran n = 30 berisi tiga unit yang tidak sesuai.
tekanan darah tinggi? Berapa probabilitas bahwa sampel dari lima unit yang
(c) Jika klinik biasanya melihat 50 pasien setiap hari, dipilih secara acak mengandung tepat satu unit yang
berapa probabilitas menemukan 10 pasien dengan tidak sesuai? Berapa probabilitas bahwa itu
tekanan darah tinggi? mengandung satu atau lebih ketidaksesuaian?
3.41. Pialang saham memiliki empat komputer yang digunakan 3.45. Sebuah buku teks memiliki 500 halaman di mana kesalahan
untuk melakukan perdagangan di Bursa Efek NewYork. ketik dapat terjadi. Misalkan ada tepat 10 kesalahan seperti itu
Probabilitas bahwa komputer gagal pada satu hari adalah yang terletak secara acak di halaman tersebut. Temukan
0,005. Kegagalan terjadi secara mandiri. Setiap komputer probabilitas bahwa pilihan acak 50 halaman tidak akan
yang gagal diperbaiki setelah bursa ditutup, sehingga mengandung kesalahan. Temukan probabilitas bahwa 50
setiap hari dapat dianggap sebagai percobaan independen. halaman yang
dipilih secara acak akan mengandung setidaknya dua kesalahan.
(a) Berapa probabilitas bahwa keempat komputer gagal 3.46. Cacat permukaan akhir pada alat listrik kecil terjadi secara
dalam satu hari? acak dengan tingkat cacat rata-rata 0,1 per unit. Temukan
(b) Berapa probabilitas bahwa setidaknya satu komputer probabilitas bahwa unit yang dipilih secara acak akan
gagal dalam sehari? mengandung setidaknya satu cacat permukaan akhir.
(c) Berapa rata-rata jumlah hari sampai 3.47. Botol kaca dibentuk dengan menuangkan gelas cair ke dalam
komputer tertentu gagal? cetakan. Gelas cair disiapkan dalam tungku yang dilapisi
3.42. Sistem komputer menggunakan kata sandi yang dengan batu bata tahan api. Saat bata api aus, potongan-
terdiri dari huruf kecil (a–z) dan bilangan bulat (0– potongan kecil bata dicampur ke dalam gelas cair dan akhirnya
9). Ada muncul sebagai cacat (disebut "batu") di dalam botol. Jika kita
10.000 pengguna dengan kata sandi unik. Seorang dapat mengasumsikan bahwa batu muncul secara acak dengan
peretas secara acak memilih (dengan pengganti) kata laju 0,00001 per botol, berapa probabilitas bahwa sebuah botol
sandi dalam upaya untuk membobol sistem. yang dipilih secara acak akan mengandung setidaknya satu
(a) Misalkan 8000 pengguna memiliki sandi enam cacat seperti itu?
karakter. Apa mean dan standar deviasi dari 3.48. Departemen penagihan sebuah perusahaan kartu kredit besar
jumlah upaya yang diperlukan sebelum peretas mencoba untuk mengontrol kesalahan (klerikal, transmisi
memilih kata sandi yang sah? data, dll.) pada tagihan pelanggan. Misalkan kesalahan
(b) Misalkan 2000 pengguna memiliki sandi tiga terjadi menurut distribusi Poisson dengan parameteraku =
karakter. Apa mean dan standar deviasi dari 0,01. Berapa probabilitas bahwa tagihan pelanggan yang
jumlah upaya yang diperlukan sebelum dipilih secara acak akan mengandung satu kesalahan?
peretas memilih kata sandi yang sah? 3.49. Sebuah proses produksi beroperasi di salah satu dari dua
3.43. Komponen elektronik untuk unit sinar-X medis keadaan: keadaan terkendali, di mana sebagian besar unit
diproduksi dalam banyak ukuran n = 25. Prosedur yang diproduksi sesuai dengan spesifikasi, dan keadaan
pengujian penerimaan digunakan oleh pembeli tidak terkendali, di mana sebagian besar unit yang
untuk melindungi lot yang mengandung terlalu diproduksi rusak. Proses akan bergeser dari keadaan in-
banyak komponen yang tidak sesuai. Prosedurnya control ke out-of-control secara acak. Setiap jam, teknisi
terdiri dari memilih lima komponen secara acak dari kontrol kualitas memeriksa proses, dan jika dalam keadaan
lot (tanpa penggantian) dan mengujinya. Jika tidak di luar kendali, teknisi mendeteksi ini dengan probabilitasP.
ada komponen yang tidak sesuai, lot diterima. Asumsikan bahwa ketika proses bergeser di luar kendali, ia
(a) Jika lot berisi dua komponen yang tidak melakukannya segera setelah pemeriksaan oleh inspektur,
sesuai, berapa probabilitas penerimaan lot? dan begitu pergeseran terjadi, proses tidak dapat secara

(b) Hitung probabilitas yang diinginkan dalam (a) menggunakan otomatis memperbaiki dirinya sendiri. JikaT menunjukkan

pendekatan binomial. Apakah perkiraan ini memuaskan? jumlah periode proses

Mengapa atau mengapa tidak?


tetap di luar kendali setelah pergeseran sebelum
35 hari. Berapa bagian dari baterai ini yang
deteksi, temukan distribusi probabilitas dari T.
diharapkan bertahan lebih dari 1000 hari?
Temukan jumlah rata-rata periode proses akan tetap
dalam keadaan tidak terkendali. 3.56. Sebuah bola lampu memiliki keluaran cahaya yang terdistribusi

3.50. Seorang inspektur sedang mencari las yang tidak normal dengan rata-rata 5000 foot-candle ujung dan

sesuai dalam pipa bensin antara Phoenix dan simpangan baku 50 foot-candle ujung. Temukan batas

Tucson. Probabilitas bahwa setiap las tertentu akan spesifikasi yang lebih rendah sehingga hanya 0,5% bohlam tidak

rusak adalah 0,01. Inspektur bertekad untuk terus akan melebihi batas ini.

bekerja sampai menemukan tiga las yang rusak. 3.57. Spesifikasi pada komponen elektronik dalam
sistem
Jika lasan terletak 100 kaki terpisah, berapa
akuisisi target adalah bahwa umurnya harus antara
probabilitas bahwa inspektur harus berjalan 5.000
5000 dan 10.000 jam. Kehidupan berdistribusi normal
kaki? Berapa probabilitas bahwa inspektur harus
dengan rata-rata 7500 jam. Pabrikan menyadari harga
berjalan lebih dari 5000 kaki?
$10 per unit yang diproduksi; namun, unit yang rusak
3.51. Kekuatan tarik bagian logam terdistribusi normal
harus diganti dengan biaya $5 kepada pabrikan. Dua
dengan rata-rata 40 pon dan standar deviasi 5 pon.
proses manufaktur yang berbeda dapat digunakan,
Jika 50.000 bagian diproduksi, berapa banyak yang
keduanya memiliki umur rata-rata yang sama. Namun,
Anda harapkan gagal memenuhi batas spesifikasi
standar deviasi umur untuk proses 1 adalah 1000 jam,
minimum kekuatan tarik 35 pon? Berapa banyak
sedangkan untuk proses 2 hanya 500 jam. Biaya
yang akan memiliki kekuatan tarik lebih dari 48 pon?
produksi untuk proses 2 dua kali lipat dari biaya
3.52. Tegangan keluaran catu daya terdistribusi
normal untuk proses 1. Berapa nilai biaya produksi yang
dengan rata-rata 5 V dan simpangan baku akan menentukan pemilihan antara proses 1 dan 2?
0,02V. Jika spesifikasi tegangan bawah dan atas
berturut-turut adalah 4,95 V dan 5,05 V, berapa 3.58. Karakteristik kualitas suatu produk berdistribusi
peluang bahwa catu daya yang dipilih secara acak normal dengan rata-rata M dan simpangan baku s =
akan sesuai dengan spesifikasi tegangan? 1. Spesifikasi pada karakteristik adalah 6 ≤ x ≤ 8.
3.53. Lanjutan Latihan 3.52. Pertimbangkan kembali Unit yang termasuk dalam spesifikasi kualitas ini
proses pembuatan catu daya di Latihan karakteristik menghasilkan keuntungan sebesar C0. Namun, jika

3.52. Misalkan kita ingin meningkatkan proses. x < 6, keuntungannya adalahC1, sedangkan jika x > 8, keuntungannya adalah

Dapatkah menggeser rata-rata mengurangi jumlah unit - C2. Carilah nilai dariM yang memaksimalkan keuntungan yang
yang tidak sesuai yang diproduksi? Berapa banyak diharapkan.

variabilitas proses perlu dikurangi agar semua kecuali 3.59.Turunkan mean dan varians dari distribusi
satu dari 1000 unit sesuai dengan spesifikasi? binomial.
3.60.Turunkan mean dan varians dari distribusi
3.54. Jika x terdistribusi normal dengan mean M dan
Poisson.
simpangan baku s = 4, dan mengingat bahwa
3.61.Turunkan mean dan varians dari distribusi
probabilitas bahwa x kurang dari 32 adalah 0,0228,
tentukan nilai M.
eksponensial.
3.55. Masa pakai baterai otomotif terdistribusi
3.62.Turunkan mean dan varians dari distribusi
normal geometrik.
dengan rata-rata 900 hari dan simpangan baku

Anda mungkin juga menyukai