Anda di halaman 1dari 8

Pengenalan pada Statistik

Diterjemahkan bebas dari


”Introduction to Probability and Statistics
for Engineer and Scientists”
by Sheldon M. Ross

1 Pendahuluan
Pengumpulan data sebagai langkah awal dalam mempelejari sesuatu adalah
hal yang umum dan dapat diterima dikalangan akademisi saat ini. Statis-
tik adalah cara mempelajari sesuatu dari data. Statisitik bertumpu pada
pengumpulan data, penjelasan dan analisisnya yang akhirnya dipakai untuk
menarik sebuah kesimpulan.

2 Pengumpulan Data dan Statistik Deskripsi


Seringkali anlisis statistik dimulai dengan sejumlah data tertentu contoh
sederhana misalnya pemerintah secara rutin mengumpulkan dan mempubli-
kasikan data tahunan unutk keadaan cuaca, kejadian gempa bumi, produksi
kotor domestik, dan angka inflasi. Data ini dapat dijelaskan, dirangkum dan
dianalisa dengan statistik. Teori statistik bahkan dapat dipergunakan dalam
membangkit data dengan mempergunakan percobaan yang sesuai. Secara
sederhana, untuk membandingkan efektifitas dua metode pengajaran pem-
rograman komputer pada pemula, maka dapat dibentuk dua kelompok dan
menggunakan metode berbeda ini pada masing-masing kelompok. Kemudi-
an kedua kelompok ini diuji dan nilainya dibandingkan. Jika hasil uji ini
menunjukkan bahwa nilai pada salah satu kelompok jauh lebih besar dari
kelompok lain, maka cukup beralasan menyatakan bahwa metode pada ke-
lompok dengan nilai tinggi lebih baik dari metode yang lain.
Hal yang perlu diperhatikan dalam pengambilan kesimpulan dari data yang
diperoleh adalah cara pengelompokan siswa. Pengelompokan ini harus sea-
lami mungkin, misalnya pengelompokan tidak berdasar jenis kelamin, atau
dikelompokan siswa yang memang mempunyai kemampuan lebih dalam hal

1
programming. Artinya pengelompokan ini harus acak, sehingga kedua ke-
lompok tersebut berimbang.
Pada akhir percobaan, data yang dipeoleh harus dijelaskan. Seperti nilai
kedua kelompok tersebut harus dipresentasikan. Demikian pula dengan ni-
lai rata-rata setiap kelompok harus dipresentasikan. Bagian dari statistik
yang berhubungan dengan penjelasan dan perangkuman data disebut de-
ngan descriptive statistics atau statistik deskripsi. Statistik Deskripsi hanya
menampilkan rangkuman data seperti rerata, median, varian, keruncingan,
kesimetrian tanpa membuat kesimpulan dari data yang dianalisis.

3 Statistik Inferensial dan Model Probabiliti


Berdasarkan percobaan, penjelasan dan perangkuman data, kita diharapk-
an dapat menarik sebuah kesimpulan tentang metode belajar yang lebih
unggul. Bagian statistik yang berhubungan dengan penarikan kesimpulan
berdasarkan tingkat keyakinan atau kesalahan tertentu disebut dengan In-
ferential statistics statistik inferensial.
Untuk dapat mengambil kesimpulan dari data, maka kita harus memper-
hitungkan peluang dari sebuah kejadian. Sebagai contoh, nilai rata-rata
kelompok pertama sedikit lebih besar dari kelompok kedua. Apakah dapat
kita simpulkan bahwa peningkatan ini karena metode pengajaran yang di-
pergunakan? Atau Apakah mungkin bahwa metode pengajaran tidak mem-
pengaruhi peningkatan nilai tetapi nilai tinggi kelompok satu hanya pelu-
ang sebuah kejadian. Demikian pula, kemunculan 7 kali kepala pada 10 kali
lemparan koin, hal ini tidaklah berarti bahwa sebuah koin lebih cenderung
muncul kepala daripada ekor pada 10 kali lemparan diwaktu yang lain. Te-
tapi, kita bisa menyebutkan bahwa koin ini adalah koin biasa yang kebetulan
saat itu muncul 7 kali kepala dari 10 kali lemparan. (Disisi lain, jika koin
tersebut muncul kepala sebanyak 47 kali dari 50 kali lemparan, maka kita
dapat memastikan bahwa koin tersebut bukan koin biasa)
Untuk dapat menarik kesimpulan yang lojik dari data yang ada, umumnya
dibuat asumsi-asumsi tentang peluang untuk mendapatkan nilai data yagn
berbeda. Totaliti dari asumsi-asumi ini dirujuk sebagai model probabiliti
dari data.
Terkadang sifat alami data mengarah pada bentuk model probabiliti yang
diasumsikan. Sebagai contoh, Jika seorang Enjinir ingin memperoleh propo-
sionalitas chip komputer yang dibuat dengan metode yang baru akan rusak.
Seorang Enjinir mungkin membuat kelompok chip-chip dengan hasil data
adalah jumlah chip-chip yang rusak pada kelompok ini. Dengan asumsi

2
bahwa chip-chip ini dipilih secara acak, sangatlah beralasan untuk menga-
sumsikan bahwa setiap satu dari chip-chip ini mempunyai probabiliti rusak
sebesar p, dalam hal ini p adalah proporsi tak diketahui semua chip yang
diproduksi dengan metode baru akan rusak. Hasil data ini dapat dipakai
unutk menarik kesimpulan tentang p.
Pada situasi lain, tidak terdapat model probabiliti yang sesuai untuk sekum-
pulan data. Akan tetapi penjelasan dan presentasi data yang baik terkadang
memungkinkan kita untuk membuat model yang dapat diterima, yang ke-
mudian kita verifikasi dengan tambahan data.
Karena dasar dari statistik inferensi adalah formulasi model probabiliti un-
tuk menjelaskan data maka pengertian inferensi statistik memerlukan penge-
tahuan teori probabiliti. Dengan kata lain, inferensi statistik dimulai dengan
asumsi bahwa aspek penting dari fenomena yang dipelajari dapat dijelaskan
dengan terminologi statistik dan kemudian ditarik sebuah kesimpulan.

4 Populasi dan Sampel


Dalag Statistik total kumpulan element yang diobservasi untuk mempero-
leh sebuah informasi disebut dengan populasi. Terkadang populasi ini terlalu
besar untuk diuji. Misalnya, data semua penduduk pada sebuah negara ba-
gian tertentu, atau semua televisi yang diproduksi tahun lalu oleh sebuah
pabrik, atau seluruh peralatan rumah tangga yang dimiliki oleh sebuah ko-
munitas tertentu. Pada kasus seperti ini, populasi bisa dipelajari dengan
memilih dan menguji sub-group dari element tersebut. Sub-group dari po-
pulasi disebut dengan sebuah sampel.
Jika sampel harus menginformasikan total populasi maka sampel tersenut
harus mewakili populasi tersebut. Umpama kita ingin mempelajari dis-
tribusi umur masyarakat aygn pindah ke sebuah kota tertentu dan kita
memperoleh data umur 100 orang pertama yang memasuki perpustakaan
kita. Jika rata-rata umur dari 100 orang ini adalah 46.2, apakah kita boleh
menyimpulkan bahwa hal ini mewakili rata-rata umur keseluruhan populasi.
Mungkin tidak, kita dapat berargumentasi bahwa populasi yang dipilih pada
kasus ini tidak mewakili total populasi, karena secara umum yang banyak
mengunjungi perpustakaan lebih banyak para siswa muda dan penduduk
usia tua dibandingkan dengan penduduk usia kerja.
Pada situasi tertentu, seperti yang dicontohkan pada kasus perpustakaan,
harus diputuskan apakah sampel yang kita tentukan atau yang diberikan
mewakili seluruh populasi. Secara praktis, sampel yang diberikan umum-
nya tidak mewakili sampel kecuali kalau sampel tersebut dipilih secara acak.

3
Ini disebabkan karena pemilihan sampel tak acak sering menghasilkan nilai
data yang bertentangan satu dengan lainnya.
Meskipun terlihat bertentangan, kita umumnya mengambil sampel yang rep-
resentatif dengan memilih anggotanya secara acak tanpa pertimbangan awal
pemilihan sampel. Dengan kata lain, kita tidak perlu terlalu repot untuk
memilih sampel yang mengandung misalnya prosentase jenis kelamin yang
sama, prosentase yang sama untuk tiap profesi yang terdapat pada populasi.
Kita cukup membiarkannya sampai dengan diperoleh peluang dengan pro-
sentase yang benar. Jika sampel telah dipilihs ecara acak maka kita dapat
menggunakan inferensi statistik unutk menarik kesimpulan tentang seluruh
populasi dengan mempelajari elementdari sampel.

5 Sejarah Singkat Statistik


Pengumpulan data secara sistematik pada populasi dan ekonomi dimulai
Kota Venesia dan Fiorentina Italia pada Jaman Renaissance. Terminologi
statistics, diambil dari kata state yang dipergunakan untuk merujuk pada
kumpulan kenyataan sebuah keadaan. Ide pengumpulan data ini menyebar
dari italia ke negara lain di Eropa Barat. Bahkan, pada pertengahan perta-
ma abad 16, pemerintah eropa mengintruksikan gereja untuk mendaftarkan
kelahiran, pernikahan, dan kematian. Kondisi kesehatan masyarakat yang
buruk menjadi ketertarikan khusus untuk statistik tentang kematian.
Laju angka kematian yang tinggi di Eropa sebelum abad ke 19 disebabkan
karena epidemi penyakit, perang dan kelaparan. Diantara epidemi penyakit
ini, yang paling buruk adalah plagues atau penyakit pes. Dimulai dari tahun
1348, epidemi ini berlangsung secara rutin selama 400 tahun. Di tahun 1562,
sebagai usaha memperingatkan kerajaan untuk berpindah ke pinggiran, kota
London mulai mengumumkan daftar kematian mingguan. Pada daftar ini
awalnya memuat tempat kematian dan apakah kematian disebabkan oleh
penyakit pes atau tidak. Diawal tahun 1625 daftar ini memasukan penye-
bab kematian.
Pada tahun, seorang pedagang Inggris bernama John Graunt mempublika-
sikan sebuah buku dengan judul ”Natural and Political Observations Made
upon the Bills of Mortality”. Pada buku ini terdapat tabel seperti Tabel 1
terlihat jumlah kematian total di England dan jumlah kematian karena pes
untuk lima tahun epidemi Graunt menggunakan daftar London ini untuk
memperkirakan populasi penduduk kita. Secara sederhana untuk memper-
kirakan penduduk London pada tahun 1660, Graunt mensurvei jumlah peng-
huni rumah pada area tertentu di daerah London dan menemukan bahwa

4
Tabel 1: Total Kematian di England

Tahun Kematian Kematian karena Pes


1592 25.886 11.503
1593 17.844 10.662
1603 37.294 30.561
1625 51.758 35.417
1636 23.359 10.400

secara rata-rata terdapat 3 kematian setiap 88 penduduk. Atau secara ka-


sar dapat disebutkan terdapat satu kematian setiap 88/3 penduduk. Karena
tercatat 13.200 kematian di London pada tahun tersebut , maka diestimasi
jumlah penduduk London sekitar

13.200 x 88/3 = 387.200

Nilai ini dipergunakan oleh Graunt untuk memperkirakan jumlah penduduk


seluruh England. Hal ini dijadikan dasar oleh pemerintah dalam menentuk-
an jumlah laki-laki yang dijadikan angkatan bersenjata dan yang diwajibkan
bayar pajak.
Graunt juga menggunakan daftar kematian London ini - ditambah dengan
kemampuan menebak penyebab dan umur meninggal- untuk menyimpulkan
usia meninggal (Patut dicatat bahwa pada daftar ini hanya memuat penye-
bab dan tempat kematian, bukan umur sewaktu meninggal). Graunt meng-
gunakan informasi ini untuk membuat tabel yang memuat proporsionalitas
populasi dan kematian untuk berbagai usia.Tabel 2 adalah salah satu tabel
tingkat kematian dari Graunt. Pada tabel terlihat untuk 100 kelahiran, 36
orang meninggal sebelum usia 6 tahun, 24 meninggal antara umur 6 dan 15
tahun, dst.
Perkiraan Graunt ini sangat menarik bagi perusahaan yang menjual inves-
tasi tahunan yang memberikan pembayaran tahunan selama investor masih
hidup dan bukan asuransi jiwa.
Pekerjaan Graunt tentang tabel kematian ini menginspirasi pekerjaan
Edmund Halley pada tahun 1693 (Halley adalah penemu Komet yang akhir-
nya bernama Komet Halley dan yang bertanggungjawab pada publikasi Isa-
ac Newton yang terkenal yakni Principia Mathematica) dan menggunakan
daftar kematian ini untuk menghitung kemungkinan seseorang umur ter-
tentu akan hidup pada kelompok umur tertentu lainnya. Halley memberi

5
Tabel 2: Tabel Kematian dari John Graunt

Umur Angka kematian per 100


meninggal kelahiran
0-6 36
6-16 24
16-26 15
26-36 9
36-46 6
46-56 4
56-66 3
66-76 2
≥76 1
0-6 berarti umur dari 0 sampai 5 tahun

pengaruh dalam meyakinkan perusahaan asuransi bahwa premi asuransi hi-


dup seharusnya tergantung pada umur peserta asuransi.
Semenjak studi Graunt dan Halley, pengumpulan data meningkat disisa
abad ke 17 dan pada abad 18. Sebagai contoh Kota Paris mulai mengum-
pulkan angka kematian pada tahun 1667 dan pada tahun 1730 pencatatan
kematian merupakan hal yang sangat umum diseluruh Eropa.
Terminologi statistik yang diperguankan sampai abad ke 18 adalah sebu-
ah kependekan dari penjelasan sain dari sebuah keadaan, dan bertambah
menjadi identifikasi dengan sebuah nilai atau angka pada abad ke 19. Pada
tahun 1830 terminologi ini secara umum disinonimkan dengan ”numerical
science” (sain numerik atau ilmu angka). Perubahan arti ini disebabkan
oleh banyaknya ketersediaan pencatatan sensus dan tabulasi yang mulai di-
kumpulkan dan dipublikasikan secara sistematik oleh pemerintah di Eropa
Barat dan Amerika Serikat pada tahun 1800.
Sepanjang abad 19, meskipun teori probabiliti sudah dikembangkan oleh ma-
tematikawan seperti Jacob Bernoulli, Karl Friedrich Gauss, Pierre-Simon
Laplace, tetapi hampir tidak pernah ditemukan pada studi statistik. Hal
ini diebabkan karena kebanyakan statistikawan sosial pada saat itu mera-
sa cukup untuk membiarkan data berbicara untuk mereka. Secara khusus,
statistikawan pada saat itu tidak tertarik pada pangambilan asumsi secara
individual tetapi lebih berkonsentrasi pada komunitas secara keseluruhan.
Jadi mereka tidak berkonsentrasi pada sampling tetapi lebih mencoba untuk

6
memperoleh kondisi populasi secara keseluruhan. Dengan demikian inferen-
si probabilistik dari sampel ke populasi hampir tidak dikenal pada sosial
statistik di abad ke 19.
Tidak sampai akhir tahun 1800an statistik menjadi sesuatu yang berhubung-
an dengan pengambilan kesimpulan dari data numerik. Perkembangan ini
dimulai oleh Francis Galton dalam menganalisa data dengan menggunakan
apa yang saat ini disebut dengan analisis regresi dan korelasi dan banyak
mendapat motivasi dari pekerjaan Karl Pearson. Pearson, orang yang meng-
embangkan chi-square adalah direktur pertama dari Laboratorium Galton
yang didirikan oleh Francis Galton pada tahun 1904. Pada laboratorium ini
Pearson memulai program penelitian yang bertujuan untuk mengembangk-
an metode-metode baru menggunakan statistik dalam menginterpretasikan
sesuatu. Laboratoriumnya mengundang mahasiswa lanjut dari bidang sains
dan industri untuk belajar metode statistik yang kemudian dapat diapli-
kasikan pada bidangnya masing-masing. Salah satu peneliti tamu pertama
adalah W. S. Gosset dari bidang kimia yang yang mendedikasikan diri pa-
da Pearson dengan mempublikasikan pekerjaannya dengan nama pengarang
”Student”. (Gosset takut mempublikasikan atas namanya sendiri karena ta-
kut pemberi kerjanya, Guinness brewery, tidak senang jika mengetahui salah
seorang kimianya malakukan penelitian dibidang statistik). Gosset terkenal
dengan pengembangan t-test
Dua bidang paling penting dalam aplikasi statistik pada awal abad 20 ada-
lah populasi biologi dan pertanian. Ini karena ketertarikan Pearson dan
anggota laboratorium lainnya dan juga capaian yang sangat berharga dari
ilmuan Inggris yang bernama Ronald A. Fischer. Teori inferensi dikem-
bangkan oleh para pionir ini termasuk diantaranya putra Karl Pearson yang
bernama Egon dan statiskawan matematika kelahiran Polandia bernama
Jerzy Neyman, yang sudah terbiasa menyelesaikan problem kuantitatif dan
praktis. Sebagai hasilnya, setelah tahun pertama abad ke 20, penggunaan
statistik sebagai alat yang mampu memberikan solusi kuantitatif problem
bidang sain dan praktis berkembang sangat cepat. Lihat Tabel 3

Saat ini statistik ada dimana-mana. Statistik deskripsi menjadi ”featu-


re” pada berbagai surat kabar dan majalah. Inferensi statistik menjadi hal
yang tak terelakkan pada penelitian kesehatan masyarakat dan medik, bi-
dang rekayasa dan sain, pemasaran dan kualiti kontrol, edukasi dan berbagai
bidang riset agar diakui sebagi riset yang bersifat sain.

7
Tabel 3: Perubahan definisi statistik

Statistics has then for object that of presenting a faithful repressntation of a state
at a determined epoch. (Quatelet, 1849)
Statistics are the onoy tools by which an opening can be cut through the formidable
thicket of difficulties that bars the path of those who pursue the Science of man.
(Galton, 1889)
Statistics may be regarded (i) as the study of populations, (ii) as the study of
variation, and (iii) as the study of methods of the reduction of data. (Fisher, 1925)
Statistics is a scientific discipline concerned with collection, analysis, and
interpretation of data obtained from observation or experiment. The subject has a
coherent structure based on the theory of Probability and includes many different
procedures which contribute to research and development throughout the whole of
Science and Technology. (E. Pearson, 1936)
Statistics is the name for that science and art which deals with uncertain inferences
which uses numbers to find out something about nature and experience. (Weaver,
1952)
Statistics has become known in the 20th century as the mathematical tool for
analyzing experimental and observational data. (Porter, 1986)
Statistics is the art of learning from data. (this book, 2004)

Anda mungkin juga menyukai