Matematika Keuangan
BAB III
ESTIMASI PARAMETER
Estimasi adalah pendugaan, yaitu menduga nilai sesuatu dengan dasar nilai sampel.
Penggunaan nilai sampel untuk mewakili nilai populasi ini disebabkan karena
jumlah populasinya terlalu banyak, atau karena alasan lain sehingga harus
dilakukan penyampelan (sampling). Estimasi dibagi menjadi dua: (1) pendugaan
titik (point estimation); dan (2) pendugaan interval (interval estimation).
Perusahaan ban memproduksi ban jenis baru untuk memperpanjang usia pakai
dibandingkan dengan ban produksi mereka saat ini. Sebelum dilempar ke pasaran,
perusahaan memilih 120 dari ban baru ini dan dites. Hasil tes usia pakai sampel ban
baru ini, yang rata-rata memiliki usia 36,500 mil, digunakan untuk mewakili usia
pakai populasi ban baru yang akan dilempar ke pasaran.
Contoh di atas menunjukkan bahwa hasil dari sampel hanya memberikan estimasi
terhadap karakteristik dari populasi. Ini berarti bahwa nilai rata-rata usia pakai
sampel tidak persis sama dengan nilai rata-rata usia pakai populasi. Namun
demikian, dengan metode penyampelan yang benar maka hasil pengujian sampel
akan memberikan estimasi yang ”baik” terhadap karakter dari populasi. Akan
tetapi, seberapa bagus hasil uji sampel ini bisa diharapkan dapat mewakili karakter
populasi? Metode-metode statistik digunakan untuk menjawab pertanyaan tersebut.
Kasus:
= rata-rata populasi
Statistik Inferensi 36
3. Distribusi Sampling. Sebuah perusahaan ingin memetakan manajer yang
berjumlah 2.500. Diasumsikan bahwa pendataan telah dilakukan terhadap
seluruh manajer berupa gaji tahunan dan training yang pernah diterima.
Rata-rata populasi: μ
x i
31.800
2.500
x μ
2
Jika dari 2.500 manajer ada 1.500 yang sudah mengambil training, maka
proporsi manajer yang sudah mengambil training adalah π = 1.500/2.500 = 0,6.
Rata-rata sampel: x
x i
954.420
31.814
30 30
x x
2
19
p 0,63
30
_
Prosedur di atas kita sebut dengan pendugaan titik. Dengan demikian, x (rata-
rata sampel) adalah penduga titik untuk rata-rata populasi μ, s adalah penduga
titik untuk deviasi standar populasi σ, p adalah penduga titik untuk proporsi
_
populasi π. Nilai aktual dari x , s, dan p disebut dengan taksiran titik (point
estimate). Dengan demikian maka USD31.814 adalah taksiran titik untuk μ,
USD3.347,72 adalah taksiran titik untuk σ dan 0,63 adalah taksiran titik untuk
p.
Jika diambil 30 sampel lainnya secara acak dan didapatkan hasil sebagai
berikut.
Ini menunjukkan bahwa sekalipun jumlah sampel tetap sama, namun nilai
parameter statistik sampel akan berbeda karena komposisi sampel yang terpilih
secara acak pada pemilihan yang pertama mungkin akan berbeda dengan
pemilihan yang kedua.
Statistik Inferensi 38
sampel x, atau nilai rata-rata dari semua rata-rata sampel yang mungkin serta μ
adalah nilai rata-rata populasi, maka: E(x) = μ
Jika:
Maka nilai deviasi standar dapat dihitung dengan formula sebagai berikut:
Persamaan yang kedua digunakan jika jumlah populasi infinite, atau populasi
adalah infinite dan jumlah sampel lebih kecil dari atau sama dengan 5% dari
jumlah populasi, sehingga n/N ≤ 0,05.
Jika jumlah rata-rata sampel adalah 30, maka n/N adalah 30/2500 = 0,012.
σ 4.000
Dengan demikian σ x 730,30
n 30
Pada materi pendugaan titik kita mengetahui bahwa nilai rata-rata sampel
( x ) memberi nilai estimasi terhadap nilai rata-rata populasi serta nilai proporsi
Statistik Inferensi 39
sampel memberi estimasi terhadap nilai proporsi populasi. Namun demikian, kita
tidak mengetahui ”seberapa tepat” nilai estimasi rata-rata sampel akan dapat
mewakili nilai rata-rata populasi, demikian juga nilai proporsinya. Pendugaan
interval adalah prosedur statistik yang memungkinkan kita untuk menentukan
”seberapa tepat” estimasi yang kita lakukan terhadap nilai rata-rata dan proporsi.
Jika diketahui bahwa deviasi standar populasinya adalah σ = 7,2 tahun, maka
x
x i
1.422
39,5
n 36
Dengan demikian maka taksiran titik untuk nilai rata-rata populasi adalah 39,5
tahun.
Kita tahu bahwa nilai di atas tidak sepenuhnya identik dengan nilai rata-rata
populasi, karena hanya merupakan pendekatan/estimasi saja. Salah satu cara untuk
mengetahui seberapa tepat/seberapa besar kesalahan (error) yang terjadi di antara
nilai rata-rata sampel dan nilai rata-rata populasi, maka dapat diketahui dari
Statistik Inferensi 40
besarnya kesalahan penyampelan (sampling error), yang dapat dihitung dengan
rumus sebagai berikut.
Kesalahan Penyampelan = | x - μ |
Dari konsep central limit theorem, dikatakan bahwa jika jumlah sampel
adalah relatif besar (n>30) maka distribusi sampel dapat didekati dengan
distribusi normal dengan nilai rata-rata adalah μ dan deviasi standar adalah σ x
= σ/(n1/2).
Gambar 3.1
Statistik Inferensi 41
dapat menggunakan tabel z untuk distribusi normal guna menentukan kesalahan
penyampelan.
Gambar 3.2
Kita juga melihat pada Gambar 3.2, bahwa kejadian ini hanya memiliki
peluang terjadi sebesar 1 – 0,95 = 0,05. Dengan kata lain: ”Peluang rata-rata
sampel memiliki error 2.35 tahun atau lebih kecil adalah 95%”
Selain nilai 95%, nilai 90% dan 99% sering digunakan sebagai acuan dalam
menentukan kesalahan penyampelan. Gambar 3.3 berikut menunjukkan 99% nilai
x berada pada ±2,575 σx = ±2,575 x 1,2 = 3,09, sehingga ”Peluang rata-rata sampel
memiliki error 3,09 tahun atau lebih kecil adalah 99%”
Statistik Inferensi 42
Gambar 3.3
Dengan cara yang sama diperoleh bahwa 90% nilai x berada pada ±1,645
σx = ±1,645 x 1,2 = ±1,97 tahun.
Statistik Inferensi 43
Gambar 3.4
Pada kasus penilaian peluang sebesar 0,99, maka α = 0,01 dan α/2 = 0,005
dan z0,005 akan memiliki nilai 0,005 luasan di ujung kurva normal di mana
berkorespondensi dengan nilai pada tabel z yaitu 2,575. Dari pernyataan tersebut di
atas kita dapat membuat postulasi umum yaitu:
“There is a 1-α probability that the value of a sample mean will provide a
sampling error of zα/2σx or less.”
Statistik Inferensi 44
Menghitung Taksiran Interval
Gambar 3.5
Pada gambar seperti yang disimbolkan dengan x1 nilai ini termasuk nilai
Dengan demikian semua rata-rata sampel yang berada di antara 2 garis lurus
pada Gambar 3.5 akan merupakan interval yang memasukkan nilai μ di dalamnya.
Karena 95% dari rata-rata sampel berada di daerah arsiran seperti pada Gambar 3.5,
maka 95% dari semua interval yang ada akan memasukkan nilai μ di dalamnya. Ini
berarti, kita 95% percaya (confident) bahwa interval yang dibuat dari x -2,35 hingga
x + 2,35 akan memasukkan nilai μ di dalamnya. Dalam terminologi statistik,
interval tersebut disebut dengan confidence interval. Tingkat kepercayaan akan hal
ini dikenal dengan confidence level, serta nilai 0,95 disebut dengan confidence
coefficient untuk taksiran interval.
Pada kasus di atas, maka 95% confidence interval akan berada pada selang
39,5 ± 2,35, atau dengan kata lain, 37,15 tahun dan 41,85 tahun adalah confidence
interval estimate dari populasi. Atau perusahaan asuransi dapat mengambil
kesimpulan bahwa pada tingkat kepercayaan 95%, rata-rata usia pemegang polis
adalah berada pada rentang antara 37,15 tahun hingga 41,85 tahun.
Dari contoh di atas terlihat bahwa taksiran titik dan informasi mengenai
peluang kesalahan penyampelan dapat digunakan untuk pendugaan interval dari
rata-rata populasi. Dengan pendugaan interval tersebut, kita mendapat gambaran
seberapa tepat estimasi yang diambil dari sampel dapat mewakili karakter dari
populasi. Jika confidence coefficient relatif besar dan rentang interval menjadi kecil
Statistik Inferensi 46
maka estimasi pada kondisi tersebut dapat digolongkan baik. Makin besar jumlah
sampel maka akan makin presis nilai estimasi yang dibuat.
x Z
2 n
Di mana (1-α) adalah confidence coefficient dan zα/2 adalah nilai z yang memberi
luasan kurva z sebesar α/2 pada ujung-ujung kurva probabilitas distribusi normal.
s
estimator x s x
n
Ada dua kondisi dalam menggunakan persamaan di atas: jika jumlah sampel besar
dan jika jumlah sampel kecil.
s
x Z
2 n
Di mana s adalah deviasi standar sampel.
Jika jumlah sampel kecil (<30) maka kita hanya bisa menghitung pendugaan
interval terhadap nilai rata-rata populasi jika dan hanya jika populasi terdistribusi
Statistik Inferensi 47
normal. Dengan demikian jika jumlah sampel kecil dan populasi terdistribusi
normal serta deviasi standar sampel s digunakan sebagai taksiran titik terhadap
deviasi standar populasi, maka evaluasi interval dari rata-rata populasi dapat
dilakukan dengan menggunakan distribusi t (t distribution).
Gambar 3.6.
Statistik Inferensi 48
Gambar 3.7.
s
x t
2 n
Di mana 1-α adalah confidence coefficient, tα/2 adalah nilai t yang
memberikan luasan α/2 di ujung kanan kurva distribusi t dengan n-1 degree of
freedom serta s adalah deviasi standar sampel.
Kasus:
52, 44, 55, 44, 45, 59, 50, 54, 62, 46, 54, 58, 60, 62, 63 (hari)
Statistik Inferensi 49
x i x
2
651,73
Deviasi standar sampel: s 6,82 hari
n 1 14
Dengan demikian taksiran titik nilai rata-rata populasi adalah 53,87 hari. Karena
deviasi standar populasi tidak diketahui, maka kita akan menggunakan nilai deviasi
standar sampel s sebagai taksiran titik deviasi standar populasi σ. Dengan jumlah
sampel yang kecil, dan diasumsikan bahwa populasi terdistribusi normal, maka
dengan menggunakan pendekatan distribusi t diperoleh degree of freedom adalah
n-1 = 15-1 = 14. Dengan tingkat kepercayaan 95% maka dari tabel t (14 DOF)
diperoleh tα/2 = t0,025 = 2,145. Dengan demikian:
s
x tα = 53,87
6,82
53,87 3,78
2 n 15
Dengan tingkat kepercayaan 95% maka nilai rata-rata populasi akan berada pada
rentang 50,09 hari hingga 57,65 hari.
Pada praktiknya, distribusi t tidak hanya digunakan untuk jumlah sampel besar saja,
untuk jumlah sampel yang kecil juga dapat digunakan. Selain itu, untuk populasi
yang terdistribusi bukan normal juga dapat menggunakan distribusi t untuk
pendekatannya.
3.3 Latihan
1. Produktivitas merupakan salah satu tujuan akhir yang ingin dicapai dari suatu
kegiatan ekonomi sehingga proses produksi berjalan secara efesien. Banyak
faktor yang mempengaruhi produktivitas karyawan. Tim Litbang BPK
menganggap bahwa tingkat kedisiplinan merupakan salah satu faktor yang
sangat menentukan tingkat produktivitas karyawan. Suatu riset dilakukan untuk
mengestimasi tingkat kedisiplinan karyawan dengan menggunakan proksi rata-
rata jam kerja perhari efektif yang dilakukan oleh karyawan. Dari sampel
sebanyak 20 karyawan BPK diperoleh data mengenai jam kerja perhari sebagai
berikut (jam kerja).
Statistik Inferensi 50
8.21 8.01 7.85 7.75 8.02 7.32 8.32 7.25 7.75 7.58
8.85 7.57 7.30 8.20 8.55 7.88 7.98 7.53 8.65 7.95
anda diminta untuk melakukan estimasi dari untuk ketiga analisis rasio
profitabilitas dengan menggunakan tingkat keyakinan 90%.
20,3 25,1 23,6 30,5 33,6 26,9 22,6 28,7 30,5 33,2
23,1 29,3 26,8 32,9 23,7 25,6 32,3 23,5 35,1 23,4
Statistik Inferensi 51