1 Mendeskripsikan Variasi
3.1.1 Plot Batang dan Daun
Ada beberapa metode grafis yang sangat berguna untuk meringkas dan menyajikan data.
Salah satu teknik grafis yang paling berguna adalah tampilan stem-and-leaf.
Misalkan data diwakili oleh x1, x2,. . . , Xn dan bahwa setiap nomor xi terdiri
minimal dua digit. Untuk membangun plot batang-dan-daun, kita membagi setiap nomor xi
menjadi dua bagian: batang, terdiri dari satu atau lebih dari digit terbesar; dan daun, yang terdiri
dari digit yang tersisa. Misalnya, jika data terdiri dari persentase informasi yang rusak antara 0
dan 100 pada banyak wafer semikonduktor, maka kita dapat membagi nilai 76 ke dalam 7 batang
dan daun 6.
Untuk membangun plot batang-dan-daun, kita bisa memilih nilai 1, 2, 3, 4, dan 5 sebagai
batang. Namun, ini akan mengakibatkan semua 40 nilai data yang dipadatkan menjadi hanya
lima batang, Gambar 3.1 adalah plot batang-dan-daun yang dihasilkan oleh Minitab.
Akhirnya, meskipun tampilan stem-and-leaf adalah cara terbaik untuk visual menunjukkan
variabilitas dalam data, tidak mengambil urutan waktu pengamatan ke rekening. Waktu adalah
sering faktor yang sangat penting yang memberikan kontribusi untuk variabilitas masalah
peningkatan kualitas. Kita bisa, tentu saja, hanya plot nilai data terhadap waktu; Grafik seperti
ini disebut waktu seri plot atau grafik run.
Misalkan waktu siklus untuk memproses dan membayar klaim asuransi kesehatan
karyawan di Tabel 3.1 ditampilkan dalam urutan waktu. Gambar 3.2 menunjukkan plot time
series dari data. Kita digunakan Minitab untuk membangun plot ini (disebut plot marjinal) dan
meminta dot plot data yang akan dibangun di margin y-axis. Tampilan ini jelas menunjukkan
bahwa waktu adalah sumber penting dari variabilitas dalam proses ini. Lebih khusus, siklus
waktu proses untuk 20 klaim pertama adalah jauh lebih lama dari waktu siklus selama 20 klaim
terakhir. Sesuatu mungkin telah berubah dalam proses (atau telah sengaja diubah oleh personel
operasi) yang bertanggung jawab untuk perbaikan waktu siklus. Kemudian dalam buku ini kita
secara resmi memperkenalkan peta kendali sebagai teknik grafis untuk proses pemantauan
seperti ini, dan untuk menghasilkan sinyal statistik berdasarkan ketika perubahan proses terjadi.
3.1.2 Histogram
Histogram adalah ringkasan lebih kompak data dari plot batang-dan-daun. Untuk
membangun histogram untuk data kontinu, kita harus membagi berbagai data ke dalam interval,
yang biasanya disebut interval kelas, sel. Sebuah histogram yang menggunakan terlalu sedikit
atau terlalu banyak sampah tidak akan informatif. Biasanya antara 5 dan 20 interval yang
hasilnya memuaskan.
Tabel 3.2 menyajikan ketebalan lapisan logam pada 100 silikon wafer yang dihasilkan dari proses deposisi uap
kimia (CVD) di sebuah pabrik semikonduktor. Membangun histogram untuk data ini.
Karena data set berisi 100 observasi dan 100=10 diduga bahwa sekitar 10 tempat interval
akan memberikan histogram memuaskan. Histogram yang dihasilkan oleh Minitab ditunjukkan
pada Gambar. 3.3. Perhatikan bahwa titik tengah dari bin pertama adalah 415, dan bahwa
histogram hanya memiliki delapan interval yang berisi frekuensi nol
Lihat Gambar. 3.3 dan perhatikan bahwa sampel rata-rata adalah titik di mana histogram persis
"Balances." Dengan demikian, rata-rata sampel mewakili pusat massa dari data sampel.
Variabilitas dalam data sampel diukur dengan varians sampel,
Perhatikan bahwa varians sampel hanyalah jumlah deviasi kuadrat dari setiap pengamatan
dari rata-rata sampel x, dibagi dengan satu sampel ukuran dikurangi. Jika tidak ada variabilitas
dalam sampel, maka setiap pengamatan sampel xi = x, dan varians sampel s2 = 0. Umumnya,
semakin besar adalah varians sampel s2, semakin besar variabilitas dalam data sampel.
Unit dari s2 varians sampel adalah kuadrat dari unit asli data. Ini sering merepotkan dan
canggung untuk menafsirkan, dan jadi kita biasanya lebih suka menggunakan akar kuadrat dari
s2, disebut deviasi standar sampel s, sebagai ukuran variabilitas. Oleh karena itu
Keuntungan utama dari standar deviasi sampel adalah bahwa hal itu diungkapkan dalam bahasa
aslinya satuan pengukuran. Untuk data ketebalan logam, kita menemukan bahwa
2 2
s =180.2928
Dan
s=13.43
Kotak plot ditunjukkan pada Gambar. 3.7. Perhatikan bahwa median sampel adalah
setengah jalan antara rankordered keenam dan ketujuh observasi, atau (120,5 + 120,7) / 2 =
120,6, dan bahwa
kuartil adalah Q1 = 120,35 dan Q3 = 120,9. Kotak petak menunjukkan bahwa distribusi diameter
lubang tidak tepat simetris di sekitar nilai tengah, karena kiri dan kanan kumis dan kotak kiri dan
kanan sekitar median adalah tidak sama panjang.
Box plot sangat berguna dalam perbandingan grafis antara set data, karena memiliki dampak
visual dan mudah dimengerti. Misalnya, Gambar. 3.8 menunjukkan kotak komparatif
plot untuk indeks kualitas manufaktur pada produk di tiga pabrik manufaktur. Inspeksi
layar ini mengungkapkan bahwa ada terlalu banyak variabilitas di pabrik 2.
3.1.5 Distribusi Probabilitas
Histogram (atau stem-and-leaf plot, atau kotak plot) digunakan untuk menggambarkan data
sampel. Sebagai contoh, pengukuran ketebalan lapisan pada Tabel 3.2 diperoleh dari sampel
wafer dipilih dari proses manufaktur. Ada dua jenis distribusi probabilitas.
Definisi
1. Distribusi kontinyu. Ketika variabel yang diukur dinyatakan pada skala kontinyu, distribusi
probabilitas tersebut disebut distribusi kontinyu. Distribusi probabilitas dari ketebalan lapisan
logam kontinyu.
2. Distribusi Diskrit. Ketika parameter yang diukur hanya dapat mengambil tertentu nilai-nilai,
seperti bilangan bulat 0 , 1 , 2 , . . . , Distribusi probabilitas tersebut disebut distribusi diskrit.
Misalnya, distribusi jumlah ketidaksesuaian atau cacat pada papan sirkuit akan menjadi distribusi
diskrit.
Hipergeometrik Probabilitas
Misalkan ada populasi terbatas yang terdiri dari N item . Beberapa nomor katakanlah, D(D
N) -dari item ini termasuk kedalamnya . Sebuah sampel acak dari n item yang dipilih dari
populasi tanpa penggantian, dan jumlah item dalam sampel yang masuk - mengatakan, x -
diamati. Maka x adalah variabel acak hipergeometrik dengan distribusi probabilitas didefinisikan
sebagai berikut.
Definisi
Distribusi hipergeometrik probabilitas ialah:
p(x)=
( x )( nx )
D ND
Distribusi Poisson
Distribusi diskrit yang berguna dalam pengendalian kualitas statistik adalah distribusi Poisson,
didefinisikan sebagai berikut.
Definisi
Rumus:
x
e
p ( x )= x=0,1
x!
Dimana parameter 0. Maka rata-rata dan variansinya adalah:
2
= dan =
Distribusi normal kumulatif didefinisikan sebagai probabilitas bahwa variabel random normal x
lebih atau sama dengan suatu harga a, atau
Integral ini tidak dapat dihitunga dalam bentuk rumus. Tetapi dengan menggunakan perubahan
variabel
x
z=
Dengan (.) adalah fungsi distribusi kumulatif distribusi normal standar (mean = 0, deviasi
standar = 1). Tabel distribusi kumulatif normal standar diberikan dalam Tabel Lampiran II.
Transformasi (2-23) biasanya dinamakan standarisasi, sebab transformasi itu mengubah variabel
2
random N ( ; ) menjadi variabel random N (0 ; 1) .
Contoh 3.7
Daya rentang kertas yang digunakan untuk membuat kantong belanja merupakan ciri kualitas
penting. Diketahui bahwa daya x berdistribusi normal dengan mean = 40 pound/inc2.
Probablitas bahwa satu kantung yang dihasilkan dari kertas ini akan memenuhi atau melebihi
spesifikasi ini adalah P( x 35) . Perhatikan bahwa
Untuk menghitung probabilitas ini dari table normal standar, kita standarisasi titik 35 dan kita
peroleh
Gambar 3-18 menunjukkan probabilitas yang ditabelkan untuk distribusi N (40 ; 22 ) dan
2
distribusi normal standar. Perhatikan bahwa daerah yang bertitik dari 35 pound/inc kekiri dalam
Gambar 3-18 menunjukkan bagian yang rusak atau dibuang yang dihasilkan oleh proses
pembuatan kantong itu.
Teorema Limit Pusat. Distribusi normal kerap sekali dianggap sebagai model probabilitas yang
cocok untuk suatu variabel acak. Dalam banyak hal sulit untuk memeriksa keabsahan anggapan
ini; tetapi, teorema limit pusat kerap kali digunakan sebagai dasar untuk pembenaran pendekatan
normalitas.
Teorema Limit Pusat. Jika x1,x2, , xn variabel acak berdistribusi independen dengan mean
1 dan variansi 2 , dan apabila y=x 1+ x 2++ xn , maka distribusi
Untuk x > 0, yang mana z adalah variabel acak normal standar. Oleh karena itu, Lampiran Tabel
II dapat digunakan untuk menentukan probabilitas. Juga, f (x) = 0, untuk x 0 untuk variabel
acak lognormal selalu tidak negative.
Distribusi lognormal didefinisikan sebagai berikut.
Buat w memiliki distribusi normal, mean dan varians maka x = exp (w) adalah variabel acak
lognormal, dan distribusi lognormal adalah
Parameter dari distribusi lognormal dan perawatan diperlukan untuk menafsirkan bahwa ini
adalah mean dan varians dari variabel acak w normal. Mean dan varians dari x adalah fungsi dari
parameter ini ditunjukkan pada persamaan (3.30). Gambar 3.20 menggambarkan distribusi
lognormal untuk nilai-nilai parameter.
Masa produk yang mendegradasi dari waktu ke waktu sering dimodelkan oleh variabel acak
lognormal. Misalnya, ini adalah distribusi umum untuk seumur hidup laser semikonduktor.
distribusi kontinu lainnya juga dapat digunakan dalam jenis aplikasi. Namun, karena distribusi
lognormal berasal dari fungsi eksponensial sederhana dari variabel acak normal, mudah
dipahami dan mudah untuk mengevaluasi probabilitas.
3. Distribusi Eksponensial
Distribusi probabilitas variabel acak eksponensial adalah
Dengan suatu konstan. Grafik distribusi eksponensial ditunjukkan dalam Gambar 3.22. Mean dan
variansi distribusi eksponensial adalah masing-masing
Distribusi eksponensial digunakan secara luas dalam bidang teknik keandalan sebagai suatu
model tahan hidup suatu komponen atau system. Dalam penerapan ini, parameter dinamakan
tingkat kegagalan system itu, dan mean distribusi itu 1/ dinamakan mean tahan hidup. Sebagai
contoh, andaikan bahwa suatu komponen elektronik dalam suatu radar kapal terbang mempunyai
tahan hidup yang dilukiskan dengan distribusi eksponensial yang tingkat kegagalannya 10 -4 jam,
yakni = 10-4. Mean tahan hidup komponen ini adalah 1/ = 10 4 = 10.000 jam. Apabila kita ingin
menentukan probabilitas bahwa komponen ini akan gagal sebelum tahan hidup yang diharapkan,
kita hitung
Hasil ini berlaku berapa pun nilai ; yakni probabilitas bahwa nilai suatu variabel acak
eksponensial akan lebih kecil dari mean-nya adalah 0,63212. Tentu saja ini terjadi karena
distribusi itu tidak simetrik.
didistribusikan sebagai gamma dengan parameter r dan Ada sejumlah aplikasi penting dari hasil
ini.
Akibatnya, distribusi gamma kumulatif dapat dievaluasi sebagai jumlah dari r Poisson berdamai
dengan parameter Hasil ini tidak terlalu mengejutkan, jika kita mempertimbangkan distribusi
Poisson sebagai model dari jumlah kemunculan sebuah acara di interval tetap, dan gamma
distribusi sebagai model porsi interval yang diperlukan untuk mendapatkan jumlah tertentu
kejadian.
Distribusi Weibull sangat fleksibel, dan dengan pilihan yang tepat parameter dan distribusi dapat
mengasumsikan berbagai bentuk. Beberapa distribusi Weibull ditunjukkan pada Gambar. 3,25
untuk dan dan 4. Perhatikan bahwa ketika distribusi Weibull mengurangi distribusi eksponensial
dengan maksud Distribusi Weibull kumulatif
Distribusi Weibull telah digunakan secara luas dalam rekayasa keandalan sebagai model waktu
kegagalan untuk komponen listrik dan mekanik dan sistem. Contoh situasi di yang Weibull telah
digunakan termasuk perangkat elektronik seperti elemen memori, komponen mekanis seperti
bantalan, dan elemen struktur di pesawat dan mobil.
Sebuah aplikasi yang sangat penting dari probabilitas merencanakan normal adalah di verifikasi
asumsi bila menggunakan prosedur inferensi statistik yang memerlukan asumsi normalitas. Ini
akan diilustrasikan kemudian.
3.4.2 Plot Probabilitas Lainnya
Probabilitas plot sangat berguna dan sering teknik pertama digunakan ketika kita perlu
menentukan distribusi probabilitas kemungkinan untuk menyediakan model yang wajar untuk
data. Di menggunakan plot probabilitas, biasanya distribusi dipilih oleh penilaian subjektif dari
plot probabilitas. Lebih formal statistik kebaikan-of-fit tes juga dapat digunakan bersama dengan
probabilitas merencanakan.
Untuk menggambarkan bagaimana probabilitas plotting dapat berguna dalam menentukan
distribusi yang tepat untuk data, mempertimbangkan data pada kontaminasi aluminium (ppm)
dalam plastik ditampilkan di Tabel 3.5. Gambar 3.28 menyajikan beberapa plot probabilitas data
ini, dibangun menggunakan Minitab. Gambar 3.28a adalah plot probabilitas normal. Perhatikan
bagaimana data di ekor plot
Akhirnya, Gambar. 3.28c dan 3.28d adalah Weibull dan plot probabilitas eksponensial untuk
data.
Pengamatan di plot ini tidak sangat dekat dengan garis lurus, menunjukkan bahwa baik Weibull
maupun eksponensial adalah model yang sangat baik untuk data. Oleh karena itu, berdasarkan
pada empat plot probabilitas bahwa kita telah dibangun, distribusi lognormal tampaknya menjadi
yang paling sesuai pilihan sebagai model untuk data kontaminasi aluminium.
3.5 Beberapa Aproksimasi Berguna
3.5.1 The Binomial Approximation ke Hipergeometrik
Mempertimbangkan distribusi hipergeometrik dalam persamaan (3.8). Jika rasio n / N (sering
disebut fraksi sampling) kecil-katakanlah, n / N 0,1-maka distribusi binomial dengan parameter
p = D / N dan n adalah pendekatan yang baik untuk hipergeometrik tersebut. pendekatan yang
lebih baik untuk nilai-nilai kecil dari n / N.
pendekatan ini berguna dalam desain rencana penerimaan-sampel. Ingat bahwa distribusi
hipergeometrik adalah model yang sesuai untuk jumlah item yang tidak sesuai diperoleh dalam
sampel acak dari n item dari banyak ukuran terbatas N. Dengan demikian, jika ukuran sampel n
relatif kecil untuk ukuran lot N, pendekatan binomial dapat digunakan, yang biasanya
menyederhanakan perhitungan jauh.
Sebagai contoh, misalkan banyak produksi 200 unit mengandung 5 unit yang tidak memenuhi
spesifikasi. Probabilitas bahwa sampel acak dari 10 unit akan berisi item tidak sesuai, dari
persamaan (3.8),