1 Pendahuluan
Pengumpulan data sebagai langkah awal dalam mempelejari sesuatu adalah
hal yang umum dan dapat diterima dikalangan akademisi saat ini. Statis-
tik adalah cara mempelajari sesuatu dari data. Statisitik bertumpu pada
pengumpulan data, penjelasan dan analisisnya yang akhirnya dipakai untuk
menarik sebuah kesimpulan.
1
programming. Artinya pengelompokan ini harus acak, sehingga kedua ke-
lompok tersebut berimbang.
Pada akhir percobaan, data yang dipeoleh harus dijelaskan. Seperti nilai
kedua kelompok tersebut harus dipresentasikan. Demikian pula dengan ni-
lai rata-rata setiap kelompok harus dipresentasikan. Bagian dari statistik
yang berhubungan dengan penjelasan dan perangkuman data disebut de-
ngan descriptive statistics atau statistik deskripsi. Statistik Deskripsi hanya
menampilkan rangkuman data seperti rerata, median, varian, keruncingan,
kesimetrian tanpa membuat kesimpulan dari data yang dianalisis.
2
bahwa chip-chip ini dipilih secara acak, sangatlah beralasan untuk menga-
sumsikan bahwa setiap satu dari chip-chip ini mempunyai probabiliti rusak
sebesar p, dalam hal ini p adalah proporsi tak diketahui semua chip yang
diproduksi dengan metode baru akan rusak. Hasil data ini dapat dipakai
unutk menarik kesimpulan tentang p.
Pada situasi lain, tidak terdapat model probabiliti yang sesuai untuk sekum-
pulan data. Akan tetapi penjelasan dan presentasi data yang baik terkadang
memungkinkan kita untuk membuat model yang dapat diterima, yang ke-
mudian kita verifikasi dengan tambahan data.
Karena dasar dari statistik inferensi adalah formulasi model probabiliti un-
tuk menjelaskan data maka pengertian inferensi statistik memerlukan penge-
tahuan teori probabiliti. Dengan kata lain, inferensi statistik dimulai dengan
asumsi bahwa aspek penting dari fenomena yang dipelajari dapat dijelaskan
dengan terminologi statistik dan kemudian ditarik sebuah kesimpulan.
3
Ini disebabkan karena pemilihan sampel tak acak sering menghasilkan nilai
data yang bertentangan satu dengan lainnya.
Meskipun terlihat bertentangan, kita umumnya mengambil sampel yang rep-
resentatif dengan memilih anggotanya secara acak tanpa pertimbangan awal
pemilihan sampel. Dengan kata lain, kita tidak perlu terlalu repot untuk
memilih sampel yang mengandung misalnya prosentase jenis kelamin yang
sama, prosentase yang sama untuk tiap profesi yang terdapat pada populasi.
Kita cukup membiarkannya sampai dengan diperoleh peluang dengan pro-
sentase yang benar. Jika sampel telah dipilihs ecara acak maka kita dapat
menggunakan inferensi statistik unutk menarik kesimpulan tentang seluruh
populasi dengan mempelajari elementdari sampel.
4
Tabel 1: Total Kematian di England
5
Tabel 2: Tabel Kematian dari John Graunt
6
memperoleh kondisi populasi secara keseluruhan. Dengan demikian inferen-
si probabilistik dari sampel ke populasi hampir tidak dikenal pada sosial
statistik di abad ke 19.
Tidak sampai akhir tahun 1800an statistik menjadi sesuatu yang berhubung-
an dengan pengambilan kesimpulan dari data numerik. Perkembangan ini
dimulai oleh Francis Galton dalam menganalisa data dengan menggunakan
apa yang saat ini disebut dengan analisis regresi dan korelasi dan banyak
mendapat motivasi dari pekerjaan Karl Pearson. Pearson, orang yang meng-
embangkan chi-square adalah direktur pertama dari Laboratorium Galton
yang didirikan oleh Francis Galton pada tahun 1904. Pada laboratorium ini
Pearson memulai program penelitian yang bertujuan untuk mengembangk-
an metode-metode baru menggunakan statistik dalam menginterpretasikan
sesuatu. Laboratoriumnya mengundang mahasiswa lanjut dari bidang sains
dan industri untuk belajar metode statistik yang kemudian dapat diapli-
kasikan pada bidangnya masing-masing. Salah satu peneliti tamu pertama
adalah W. S. Gosset dari bidang kimia yang yang mendedikasikan diri pa-
da Pearson dengan mempublikasikan pekerjaannya dengan nama pengarang
”Student”. (Gosset takut mempublikasikan atas namanya sendiri karena ta-
kut pemberi kerjanya, Guinness brewery, tidak senang jika mengetahui salah
seorang kimianya malakukan penelitian dibidang statistik). Gosset terkenal
dengan pengembangan t-test
Dua bidang paling penting dalam aplikasi statistik pada awal abad 20 ada-
lah populasi biologi dan pertanian. Ini karena ketertarikan Pearson dan
anggota laboratorium lainnya dan juga capaian yang sangat berharga dari
ilmuan Inggris yang bernama Ronald A. Fischer. Teori inferensi dikem-
bangkan oleh para pionir ini termasuk diantaranya putra Karl Pearson yang
bernama Egon dan statiskawan matematika kelahiran Polandia bernama
Jerzy Neyman, yang sudah terbiasa menyelesaikan problem kuantitatif dan
praktis. Sebagai hasilnya, setelah tahun pertama abad ke 20, penggunaan
statistik sebagai alat yang mampu memberikan solusi kuantitatif problem
bidang sain dan praktis berkembang sangat cepat. Lihat Tabel 3
7
Tabel 3: Perubahan definisi statistik
Statistics has then for object that of presenting a faithful repressntation of a state
at a determined epoch. (Quatelet, 1849)
Statistics are the onoy tools by which an opening can be cut through the formidable
thicket of difficulties that bars the path of those who pursue the Science of man.
(Galton, 1889)
Statistics may be regarded (i) as the study of populations, (ii) as the study of
variation, and (iii) as the study of methods of the reduction of data. (Fisher, 1925)
Statistics is a scientific discipline concerned with collection, analysis, and
interpretation of data obtained from observation or experiment. The subject has a
coherent structure based on the theory of Probability and includes many different
procedures which contribute to research and development throughout the whole of
Science and Technology. (E. Pearson, 1936)
Statistics is the name for that science and art which deals with uncertain inferences
which uses numbers to find out something about nature and experience. (Weaver,
1952)
Statistics has become known in the 20th century as the mathematical tool for
analyzing experimental and observational data. (Porter, 1986)
Statistics is the art of learning from data. (this book, 2004)