A. Tidak Bias
Pertama disajikan cara menyatakan statistika acak dan target secara umum. Statistika acak (penduga) dinyatakan dengan huruf Yunani dengan tanda topi (^)
diatasnya atau tanda yang lain (~ atau = misalnya).
Pada gambar A untuk menduga nilai ᵅ dipakai ᵅ⃗ sebagai penduga hasilnya tidak bias
sedangkan pada gambar B untuk menduga nilai ᵅ ysng sama dipakai ⁻ᵅ yang dalam
jangka panjang bias . Nilai E (ᵅ) lebih besar dari ᵅ selisihnya disebut bias, dan penduga
disebut Over Estimate .
B.Varian Terkecil : Efisiensi dari penduga tidak bias
Sifat yang di inginkan selain tidak bias adalah juga distribusi frekuensi penduga kita hendaknya memiliki variasi yang kecil. Kedua hal ini bila digambarkan adalah
sebagai berikut
Apabila kita memiliki penduga tak bias yang lebih efisien dibanding semua penduga tak bias yang lain maka penduga diatas dinamakan penduga efisien
C. Rata – rata simpangan yang terkecil ; Efisien dari setiap penduga
bila kita mempunyai tiga ( misal ) penduga , , , seperti gambar dibawah ini :
Dimana adalah target kita ( nilai populasi yang diinginkan ) dan , i bisa kita ganti dengan sembarang angka positif , misal 1, 2, 3 dan sebagainya. ( - ) adalah nilai simpangan ( bias ).
Dikatakan diatas bahwa rumusan RSK menunjukkan pengukuran varian dan bias. Hal tersebut ditunjukan dengan
Perumusan RSK yang terakhir ini mencakup dua kriteria terdahulu, yaitu bias yang terkecil , dan varian terkecil. Bila kita punya dua atau lebih penduga yang memiliki varian yang sama, maka
penduga yang memiliki bias terkcil ( nol) adalah yang kita kehendaki. Sebaliknya bila kita memiliki dua atau lebih varian penduga tak biad atau nilainya sama maka penduga yang memiliki
varian terkecil yang kita pilih. Dengan memakai rumusan RSK dapat kita rumuskan definisi umum tentang efisiensi relatif untuk setiap dua penduga.
D. KONSISTEN
Dari gambar terlihat bahwa pada jumlah sampel 5 ( n = 5 ) penduga adalah bias dan memiliki varian yang terbesar. Dengan semakin besar jumlah sampel, bias
semakin kecil ( pada n = 200 bias sudah = 0 ) dan varian juga semakin kecil. Pada n ~ distribusi frekuensi akan terbentuk garis tegas lurus.
K.B. 2
Pendugaan Titik dan Pendugaan Rentang
Rumus yang untuk menduga suatu nilai, dimana nilai rentangnya besar sekali, sehingga dugaan kita pasti mencangkup nilai µ, maka dikatakan nilai rentang
dugaan kita benar 100%. Misal suatu cuplikan acak yang telah dilakukan secara benar, didapat distribusi frekuensi sebagai berikut:
Secara formal nilai dugaan rentang kita hitung dengan rumus:
Jadi, secara formal nilai dugaan rentag kita hitung dengan rumus:
Yang memiliki nilai rata-rata nol dan varian satu, dari table kurva normal kita tahu bahwa Z=1,96 yang menunjukkan setengah luas kurva normal sebesar 0,475. Jadi
bisa dituliskan,
Dengan sedikit melakukan pemindahan diperoleh:
Dasar keyakinan ini adalah kebenaran teori statistic, yang mana teori pendugaan statistic juga menyatakan; dalam jangka panjang , 95% dari nilai duga
rentang yang dibuat dengan cara yang sama adalah benar.
d. Sesudah secara nyata didapat sudah tercetak (ati) dan pendugaan rentang dengan rumus 4.2.4.c adalah betul atau salah sama sekai
e. Bila benar cuplikan diperbesar, distribusi penduga, misalnya akan lebih dapat mendekatu nilai
f. Bila diinginkan derajat kepercayaan yang lebih tinggi, 99% misalnya, maka didapat rentang yang lebih besar dan dugaan kita menjadi tidak menarik lagi.
B. PENGETRAPAN PENDUGA RENTANG
1. Pemakaian Distribusi t, bila tidak diketahui
Sampai saat ini kita selalu menganggap nilai diketahui. Secara praktis bila diketahui tentulah juga dapat diketahui, dan tak
perlulah kita membuat dugaan atas nilai .
Berikut ini kita akan membicarakan kasus di mana tidak diketahui, dan ahli statistik menginginkan menghitung nilai duga
rentang untuk . Untuk hal itu diperlukan penduga untuk nilai . Calon yang paling baik sebagai penduga adalah (simpangan
baku). Nilai ini selalu bisa dihitung Bersama-sama dengan dari data cuplikan. Dengan memasukkan ke dalam Rumus 4.2.4.a
Anda dapat membuat 95% derajat kepercayaan nilai duga rentang untuk k sebagai berikut:
Apabila sampel cukup besar (50 sampai dengan 100 tergantung seberapa persis nilai yang Anda inginkan) maka cuplikan ini
akan menghasilkan kesalahan duga rentang yang cukup mengganggu. Untuk mengatasinya apabila Anda, sebagai ahli statistik,
tetap menginginkan nilai duga rentang yang dihasilkan memiliki 95% derajat kepercayaan, maka nilai tersebut hendaklah
diperlebar/perbesar.
Pernyataan berikutnya, seberapa besar harus ditambahkan? Kita ulang lagi rumus baku untuk kurva normal.
Kedua rumus di atas pada dasarnya setara. Perbedaannya adalah rumus yang di atas memerlukan nilai
yang biasanya tidak diketahui, akan tetapi yang bawah, t hanya memerlukan yang selalu dapat dihitung
dari sampel.
Nilai distribusi t disajikan di bagian modul ini. Apabila dikasatmatakan maka perbedaan kedua
distribusi ini dapat disajikan dengan gambar sebagai berikut:
Distribusi t tidak ditabelkan berdasarkan besarnya cuplikan, melainkan berdasarkan nilai pembagi pada
rumus , yang diberi nama sebagai derajat kebebasan. Untuk mempermudah, di bawah ini disajikan
ulang rumus tersebut;
Sebagai contoh bila jumlah sampel, maka derajat kebebasannya . Bila diinginkan derajat kepercayaan
sebesar 95% maka dari tabel, akan didapat nilai t terbesar 2,262
Karena kurva distribusi t adalah simetri maka;
Pr(-2,62 < t < 2,262) = 95%
Dengan menggantikan t ke dalam rumus 4.2.4.b akan diperoleh
Setelah dilakukan sedikit perubahan letak maka diperoleh rumus pendugaan rentang sebagai berikut:
Yang berlaku untuk besar sampel 10, derajat kepercayaan 95%. Apabila besar sampel berubah, dan derajat
kepercayaan juga ingin di rubah, maka angka 2,262 haruslah diganti dengan nilai t yang bersesuaian.
Untuk memakai rumus di atas secara umum maka disajikan rumus ini:
Tentunya timbul pertanyaan kapan kita memakai distribusi t dan kapan kita pakai distribusi Z? Bila
diketahui maka pemakaian distribusi Z adalah sangat tepat. Apabila tidak diketahui maka distribusi t
hendaknya dipakai tanpa_memperhatikan jumlah sampel. Perlu diingat bahwa apabila jumlah sampel
cukup besar maka pemakaian kurva normal cukup akurat untuk mendekati nilai t. Jadi dalam praktek,
distribusi t hanya dipakai apabila tidak diketahui dan sampelnya kecil, dalam hal sampel besar, kurva
normal bisa dipakai.
2. Pendugaan Nilai Rentang untuk Beda Nilai Rata-rata Dua Populasi
Kadang-kadang kita ingin menghitung apakah beda nilai rata-rata dua populasi bermakna atau tidak. Untuk itu digunakan sebuah
variabel yaitu . Penduga titik yang baik untuk variabel di atas adalah beda rata-rata dari dua sampel untuk menghitung nilai duga
rentangnya, maka dalam rumus 4.2.4.c, diganti dan dengan diperoleh:
Rumus untuk nilai duga rentang dengan 95% derajat kepercayaan, cuplikan acak independent, tidak diketahui.
Rumus di atas menggunakan derajat kebebasan sebesar , yaitu derajat kebebasan total yang dipakai untuk menghitung , dan . Dalam
praktek sering dipakai derajat kebebasan atau salah satu yang terkecil.
Rumus di atas dipakai bila tidak diketahui dan nilainya berbeda. Apabila tidak diketahui tetapi kita percaya nilai keduanya sama maka
rumus berikut ini dapat dipakai:
Derajat kebebasan di sini . Untuk memakai rumus di atas, diperlukan perhitungan terlebih dahulu. Hal
ini dikerjakan dengan menggunakan rumus:
Di mana ( atau ) merupakan nilai observasi dari cuplikan yang pertama (atau ke-2). menunjukkan
anggota cuplikan dari sampel pertama demikian pula .
C. Pengetrapan Pendugaan rentang untuk proporsi populasi
Penyajian suatu data bisa dalam bentuk rata rata, median, mode, beda, rata rata dan bisa juga proporsi, tergantung
tujuan analisis yang dikehendaki.
Apabila diinginkan menduga (rentang) nilai proporsi populasi π dengan proporsi cuplikan P, maka
rumus diatas bisa dipakai dengan mengganti simbol simbol
Masih terdapat cara lain untuk menghitung nilai duga rentang populasi. (π) yang dapat dipakai untuk cuplikan
kecil, sedang dan besar. Metode ini memakai gambar 6.9 sebagai dasar Pendugaan.