Anda di halaman 1dari 11

Inisiasi 1

Pengertian Data dan Statistik



Data dan statistik mempunyai hubungan yang sangat erat. Selain itu, keduanya juga
mempunyai hubungan yang sangat erat dengan kehidupan manusia sehari-hari, dengan bidang
ilmu pengetahuan, baik yang eksakta, sosial, ekonomi, bisnis dan lain-lain. Data dan statistik
serta fungsi keduanya, banyak memberikan kegunaan yang sangat tidak ternilai bagi manusia,
bagi kita semua.
DATA, KEGUNAAN DAN FUNGSINYA
Anda sebagai individu, seorang manajer, atau mungkin seorang pengusaha, menginginkan
untuk:
Mengetahui siapa saja yang akan pensiun tahun depan, dari bagian mana, apa jabatannya,
berapa pesangon yang akan didapat, dan sebagainya. Tujuannya adalah antara lain:
- Mempersiapkan dana, berapa besarnya untuk pembayaran pesangon mereka.
- Mempersiapkan penerimaan karyawan baru untuk mengganti karyawan yang bakal
pensiun tersebut (walaupun tidak semua).
Untuk maksud tersebut, Anda memerlukan data berupa data pegawai, yang mungkin cukup
didapat dari dalam perusahaan sendiri.
Mengetahui tingkat kepuasan konsumen produk yang anda pasarkan, bagaimana respon
mereka terhadap mutu produk Anda, harga, pelayanan dan sebagainya. Untuk inipun, Anda
perlu data, malah mungkin data tersebut perlu dikumpulkan di lapangan melalui survei
(terlepas dari apakah dilakukan sendiri atau dengan membayar lembaga riset yang Anda
percayai).
Mengetahui apakah proses produksi saat ini masih terkendali atau tidak. Berapa persen dari
produksi yang tertolak karena dianggap cacat, lengkap dengan perinciannya per mesin, per
lokasi, kapan, mengapa dan lain-lain. Untuk inipun, Anda memerlukan data (yang didapat
dari bagian produksi).
Mengetahui perkembangan perekonomian (trend) untuk jangka waktu tertentu,
pertumbuhan penduduk penduduk, pendapatan nasional dan sebagainya . Termasuk juga
mengetahui faktor-faktor atau variabel yang mempengaruhi pertumbuhan ekonomi.
Dari contoh-contoh tersebut diatas, kita mengetahui betapa pentingnya data. Dengan data, kita
mengetahui gambaran perusahaan sekarang, masalah apa yang sedang dihadapi, mengapa
terjadi masalah-masalah tersebut, bagaimana cara pemecahannya. Dengan data, kita dapat
meramal atau memperkirakan, apa yang kira-kira bakal terjadi di masa mendatang. Dengan
data, kita pun bisa membuat perencanaan, peramalan, mengontrol pelaksanaan, mengevaluasi
target apakah tercapai atau tidak, dan sebagainya. Dengan adanya data, kita dapat banyak
mengetahui tentang berbagai hal. Dengan data, kita bisa mengambil keputusan-keputusan,
kebijakan-kebijakan perusahaan, dan sebagainya. Pendeknya, fungsi dan manfaat data sangat
penting dan banyak sekali. Sering kali, akan berbahaya jika kita mengambil kesimpulan dan
keputusan tanpa didukung oleh data. Orang bilang Speak with data, berbicaralah dengan data
agar objektif dan lebih akurat. Sebenarnya apa itu data?
PENGERTIAN DATA DAN PENGGOLONGANNYA
Dari uraian di atas, sebenarnya data adalah kumpulan keterangan atau informasi yang
diperoleh dari suatu pengamatan, dapat berupa angka, lambang atau sifat. Jika kita
mendapatkan data yang tidak baik, sebaik apa pun cara pengolahan data yang kita lakukan,
hasilnya atau kesimpulan yang didapat dari data tersebut tetap tidak baik. Semisal, ungkapan
garbage in, garbage out, yang artinya jika yang masuk sampah, yang keluar pun juga
sampah. Jadi, syarat utama agar analisa data secara statistik menghasilkan informasi atau
kesimpulan yang baik adalah data yang diolah haruslah juga baik.
Apa itu data yang baik? Data yang baik adalah data yang sifatnya representatif (mewakili),
objektif (sesuai dengan apa yang ada atau yang terjadi), relevan (ada hubungannya dengan
persoalan yang sedang dihadapi dan akan dipecahkan), mempunyai tingkat ketelitian yang
tinggi atau standard error (kesalahan baku) yang kecil.
Dari mana data diperoleh? Data dapat diperoleh dari sumber internal (internal data) dan
sumber eksternal (external data). Data internal adalah data yang didapat oleh organisasi itu
sendiri untuk keperluan operasi sehari-hari. Organisasi dimaksud dapat berupa instansi
pemerintah maupun swasta, misalnya departemen-departemen, Biro Pusat Statistik, BAPPENAS,
BUMN, perusahaan-perusahaan swasta dan sebagainya. Sedangkan, data eksternal adalah data
yang didapat dari luar organisasi yang bersangkutan, biasanya menggambarkan keadaan di luar
organisasi tersebut. Contoh data jenis ini misalnya data pendapatan nasional, penduduk, harga-
harga bahan pokok yang dukumpulkan oleh Biro Pusat Statistik, data keuangan negara yang
dikumpulkan oleh departemen keuangan, data perbankan dari Bank Indonesia dan sebagainya,
termasuk data yang dikumpulkan oleh badan-badan internasional, seperti UNESCO, IMF, FAO
dan lain-lain.
1. DATA KUANTITATIF DAN DATA KUALITATIF
DATA KUANTITATIF
Banyak data yang berbentuk angka atau bilangan, misalnya luas tanah, jumlah penduduk
dan sebagainya. Untuk jenis data ini dapat dilakukan perhitungan-perhitungan atau operasi
matematika, seperti penambahan, pengurangan, perkalian, pembagian dan sebagainya.
Data kuantitatif nilainya bisa berubah-ubah sehingga disebut variabel.
Data kuantitatif dapat dibagi atas:
- Data Interval
Ukuran data mempunyai interval atau jarak, misalnya berat badan antara 50-60 kg.
- Data Rasio
Data berupa angka dalam arti yang sebenarnya, sehingga mempunyai nilai nol.
Data jenis ini diperoleh melalui pengukuran dan memiliki tingkat pengukuran paling tinggi
diantara jenis data lainnya.

DATA KUALITATIF
Data kualitatif adalah data yang bukan berbentuk angka atau bilangan, misalnya kepuasan
pelanggan (sangat puas, puas, kurang puas dan sebagainya), sehingga kita tidak dapat
melakukan operasi matematika terhadapnya. Jenis data ini disebut atribut.
Data kualitatif dapat dibagi atas:
- Data nominal
Ukuran data nominal adalah kategori, misalnya jenis kelamin, laki-laki atau wanita,
tempat tinggal dan sebagainya. Dilihat dari tingkat pengukuran data, data nominal
mempunyai tingkatan yang paling rendah dari jenis data lainnya. Hal tersebut karena
walaupun dalam prakteknya data ini bisa diangkakan, tetapi terhadapnya tidak bisa
dilakukan operasi matematika. Contoh pemberian angka tersebut di atas misalnya,
angka 1 untuk yang tinggal di Jakarta, 2 untuk yang tinggal di Bandung, 3 untuk
Surabaya dan sebagainya.
- Data Ordinal
Data ordinal hampir sama dengan data nominal, hanya saja data orrdinal mempunyai
tingkatan data atau urutan kelas, ada yang lebih tinggi ada yang lebih rendah. Contoh
data ini adalah data tentang kepuasan pelanggan, yang dibagi menjadi sangat puas,
tidak puas, antara puas dan tidak puas, tidak puas dan sangat tidak puas. Data ordinal
mempunyai tingkatan yang lebih tinggi dari data nominal. Walaupun mempunyai
tingkatan, terhadap jenis data ini kita tetap tidak dapat melakukan operasi matematika.
Dilihat dari tingkat data, urutan dari yang paling tinggi adalah data rasio, data interval,
data ordinal dan paling rendah data nominal.Untuk mengolah data kualitatif (data
nominal dan ordinal), biasanya digunakan statistik non parametrik, sedangkan untuk
data kuantitatif digunakan statistik parametrik.

2. DATA INTERNAL DAN DATA EKSTERNAL
- DATA INTERNAL
Data yang berasal dari dalam organisasi atau perusahaan sendiri. Data jenis ini biasanya
berkaitan langsung dengan organisasi sendiri, misalnya data keuangan (neraca, laporan
laba-rugi dan sebagainya), data kepegawaian, data produksi dan lain-lain.
- DATA EKSTERNAL
Data yang berasal bukan dari dalam organisasi perusahaan sendiri. Data ini sering tidak
berkaitan langsung dengan organisasi sendiri, misalnya data tentang jumlah kendaraan di
Jakarta, jumlah penduduk di suatu desa dan lain-lain.

3. DATA PRIMER DAN DATA SEKUNDER
- DATA PRIMER
Data yang dukumpulkan, diolah serta diterbitkan sendiri oleh organisasi yang
menggunakannya. Contoh jenis data ini adalah data kependudukan yang dibuat oleh Biro
Pusat Statistik, data tentang pertanian yang dibuat oleh Departemen Pertanian dan
sebagainya.
- DATA SEKUNDER
Data yang tidak dibuat atau diterbitkan oleh penggunanya, misalnya data tentang jumlah
kendaraan dari Departemen Perhubungan merupakan data primer bagi Departemen
tersebut karena dibuat dan diterbitkannya, tapi merupakan data sekunder bagi PT X sebagai
pengguna, yang mendapatkannya dari sumber lain (misalnya media massa) yang
mengutipnya. Jadi, orang bisa mendapatkan data sekunder dari harian, majalah, buletin dan
media massa lainnya yang mengutip data dari sumber-sumber lain yang menerbitkannya
(misalnya data dikutip dari departemen, Biro Pusat Statistik, Bank Indonesia dan lain-lain).
Dengan demikian, data eksternal bisa berupa data primer, bisa juga berupa data sekunder.
4. DATA DISKRIT DAN DATA KONTINYU
Seperti telah dikatakan di muka, data kuantitatif disebut variabel, karena nilainya atau besarnya
bisa berubah-ubah, data ini dapat mempunyai variabel diskrit sehingga disebut data diskrit,
dapat juga mempunyai variabel kontinyu atau indiskrit dan disebut dengan data kontinyu.
Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan
(angka utuh). Sedangkan data kontinyu adalah data yang sifatnya sinambung atau
kontinyu, nilainya bisa berupa pecahan. Contoh data diskrit adalah data tentang jumlah
penduduk, kendaraan dan sebagainya, sedangkan contoh data kontinyu adalah data tentang
hasil panen padi, panjang jalan, berat sapi dan sebagainya.
























Gambar I. Jenis Data

sumber: Kuncoro, 2001:24
Statistik atau statistika adalah ilmu yang berhubungan dengan cara pengumpulan, pengolahan
atau analisis, penyajian data dan cara pengambilan kesimpulannya. Fungsi utamanya adalah
membantu dalam pengambilan keputusan dan keputusan tentang parameter populasi dengan
menggunakan data sampel yang diambil dari populasi tersebut.


Data
Kuantitatif
Kualitatif
Dimensi
Waktu
Sumber
I nterval
Rasio
Nominal
Ordinal
Runtut Waktu
Silang Tempat
Poling
I nternal
Eksternal
Primer
Sekunder
PENGGOLONGAN STATISTIK
Statistik dapat digolongkan dengan berbagai cara.

STATISTIK DESKRIPTIF DAN INDUKTIF (INFERENSI)
- STATISTIK DESKRIPTIF
Statistik Deskriptif berusaha menjelaskan atau menggambarkan berbagai karakteristik data,
seperti berapa rata-ratanya, seberapa jauh data bervariasi dan sebagainya, tanpa membuat
interpretasi apa-apa terhadap data tersebut.
- STATISTIK INDUKTIF (INFERENSI)
Statistik Induktif berusaha membuat berbagai inferensi terhadap sekumpulan data yang
berasal dari suatu sampel. Tindakan inferensi tersebut misalnya melakukan perkiraan,
peramalan, pengambilan keputusan dan sebagainya.

STATISTIK PARAMETRIK DAN NON PARAMETRIK
- STATISTIK PARAMETRIK
Statistik Parametrik adalah statistik induktif untuk populasi yang parameternya telah
memenuhi persyaratan-persyaratan tertentu (misalnya, sebaran data mengikuti distribusi
normal)
- SATISTIK NON PARAMETRIK
Statistik non parametrik adalah statistik induktif yang berusaha mengambil kesimpulan
tentang keseluruhan populasi yang parameternya tidak memenuhi persyaratan, yaitu tidak
mengikuti suatu distribusi tertentu. Jadi, statistik non parametrik digunakan untuk populasi
yang tidak menetapkan persyaratan-persyaratan parameter populasinya.

PENGERTIAN DALAM STATISTIK PENTING YANG PERLU DIPAHAMI: POPULASI,
ELEMEN, SAMPLING DAN SAMPEL
Populasi adalah kumpulan semua elemen yang ada yang akan diobservasi atau diteliti,
sedangkan sampling adalah pengambilan sebagian kecil dari seluruh elemen populasi tersebut
yang dijadikan sebagai contoh atau sampel yang dianggap dapat mewakili seluruh elemen
dalam populasi. Sedangkan sampling adalah cara pengumpulan data dengan mengambil sampel
atau contoh dari seluruh anggota populasi.
Misalkan, ada 100 orang murid kelas 3 di SMU Garuda. Pimpinan Sekolah ingin melihat prestasi
ujian matematika mereka pada tahun 2001 yang lalu dan untuk itu diadakan pencatatan nilai
ujian dari setiap murid yang berjumlah 100 murid tersebut satu per satu tanpa kecuali. Setiap
murid tersebut disebut elemen. Kumpulan dari 100 orang murid tersebut (seluruh elemen)
disebut populasi dan pekerjaan untuk meneliti seluruh elemen yang terdapat dalam populasi
disebut sensus. Jika untuk maksud tersebut, hanya diambil 20 murid saja sebagai contoh, hal
tersebut disebut sampling, dan contoh yang diambil dinamakan sampel.
Jika data yang didapat dari sensus dinamakan data sebenarnya (true value), data yang terdapat
dari sampling merupakan data dugaan sehingga nilainya dinamakan nilai perkiraan (estimate
value). Nilai perkiraan tentunya tidak akan sama betul dengan nilai sebenarnya, tentu ada
selisih. Selisih ini disebut kesalahan perkiraan (error estimate) atau kesalahan sampling
(sampling error) dan jika nilainya kecil, cara pengumpulan data dengan sampling masih dapat
dipertanggung-jawabkan.
Agar data yang diperoleh dari sampling mempunyai nilai kepercayaan yang tinggi (valid) atau
nilai kesalahan perkiraannya sekecil mungkin, dalam pengambilan sampel kita harus mengikuti
metode pengambilan sampel yang baik (termasuk jumlah sampel yang harus diambil), sesuai
dengan keadaan populasinya. Ada berbagai macam teknik sampling namun tidak akan dibahas
di sini.(Silakan lihat Modul Metode Penelitian)
Alasan-alasan mengapa kita menggunakan sampling:
- Menghemat waktu, tenaga dan biaya.
- Secara teknis, tidak mungkin mengamati seluruh anggota populasi. Misalnya, meneliti
seluruh jumlah ikan yang terdapat di suatu sungai, meneliti seluruh jumlah kelelawar di
suatu hutan, jumlah seluruh kendaraan di suatu negara dan sebagainya.
- Pengamatan terhadap seluruh anggota populasi dapat bersifat merusak. Misalnya, pengaruh
pemakaian narkoba terhadap kerusakan otak.
- Contoh lain-lain yang bergantung pada pertimbangan peneliti atau pengguna data.

Secara teoritis atau logika, hasil analisa atau pengolahan data yang dihasilkan oleh sensus
(harusnya) memberikan data yang sebenarnya (true value). Sebaliknya, karena sampling hanya
mengambil sebagian elemen saja yang ada dalam populasi, hasil analisa datanya hanya
merupakan perkiraan (estimate value). Mengingat alasan-alasan dan pertimbangan-
pertimbangan tersebut, khususnya oleh karena sensus biasanya memerlukan biaya, tenaga dan
waktu yang lebih banyak dibandingkan dengan sampling, maka pada umumnya penelitian
dilakukan hanya dengan cara sampling saja, dengan catatan pelaksanaan sampling tersebut
dilakukan dengan baik. Baik dalam hal ini artinya, baik metode sampling maupun pelaksanaan
pengumpulan datanya dilakukan dengan benar dan cermat, sehingga perkiraan yang diperoleh
tidak banyak berbeda dari keadaan populasi yang sebenarnya.
Sampling yang baik pun tidak akan sempurna betul, selalu ada ketidaksempurnaan atau
kesalahan (sampling error). Untuk dapat mewakili seluruh elemen dalam populasi harus
diusahakan agar sampling dilaksanakan dengan sebaik-baiknya sehingga kesalahan yang terjadi
dapat sekecil mungkin. Jadi, seperti halnya dalam sensus, dalam melakukan sampling pun,
kesalahan selalu dapat terjadi. Jika nilai sampling ternyata sama betul dengan nilai yang
sebenarnya seperti yang dilakukan pada sensus, hal tersebut hanya bersifat kebetulan.
Berapa besarnya sampel agar didapat data yang baik sehingga dapat mewakili suatu populasi?
Untuk mengetahui berapa jumlah sampel, biasanya digunakan rumus-rumus sebagai berikut :



E = Kesalahan atau error yang diizinkan menyangkut ketelitian pendugaan.
Z = Nilai Z yang sesuai dengan interval keyakinan yang digunakan, yaitu 1,96 untuk I.K =
95% dan 2,58 untuk I.K = 99%.
S = Deviasi standar dari pra-survey yang dilakukan dengan sampel yang kecil untuk
menduga deviasi standar populasi.

Untuk proporsi



P = Estimasi atau perkiraan proporsi populasi
Z = Nilai Z yang sesuai dengan interval keyakinan yang ditentukan
E = Kesalahan (error) maksimum yang diizinkan
Kesalahan (error) yang diizinkan misalnya sebesar 5%, berarti ketelitian yang diinginkan dalam
pendugaan parameter populasi (interval keyakinan) adalah sebesar 95% (100%-5%), dan jika
error yang diizinkan sebesar 1%, berarti tingkat ketelitian (interval keyakinan) yang ingin
2
.
(

=
E
S Z
n
2
) 1 (
(

=
E
Z
P P n
dicapai sebesar 99% (100%-1%). Dengan demikian, besarnya sampel bergantung pada interval
keyakinan yang digunakan (error maksimum yang diizinkan) dan deviasi standar atau estimasi
proporsi populasi (ukuran sampel untuk proporsi). Jika deviasi standar atau proporsi populasi
belum diketahui, kita perlu mengadakan survey pendahuluan dengan ukuran sampel yang kecil
untuk menduga deviasi standar populasi. Deviasi standar populasi dapat juga dilakukan
berdasarkan pengetahuan tentang populasi.
Perhitungan deviasi standar distribusi sampling harus dikoreksi dengan faktor koreksi sebesar
1

N
n N

Jika ukuran sampel (n) dibagi ukuran populasi (N) relatif cukup besar, akan tetapi jika ukuran
populasi besar sekali apalagi tak terhingga atau ukuran populasi terbatas tapi
N
n
relatif kecil,
faktor koreksi tidak diperlukan.
Dari rumus tersebut di atas, semakin tinggi interval keyakinan maka semakin besar ukuran
sampel yang dibutuhkan. Untuk lebih jelasnya, jika kita ingin yakin 100% interval duga akan
sama dengan parameter populasi jumlah sampel yang harus diambil adalah seluruh populasi, ini
berarti sama dengan sensus.

PARAMETER DAN SAMPLING ERROR
Seperti telah diterangkan dimuka, baik dalam melaksanakan sensus maupun cara pengambilan
sampel (sampling), kesalahan dapat saja terjadi (error sampling) baik disengaja maupun yang
tidak disengaja. Jenis kesalahan yang mungkin terjadi dimaksud adalah:
- Kesalahan secara umum (baik sensus maupun sampling):
- Kesalahan mencatat (recordings error),
- Kesalahan mengukur (measurements error),
- Kesalahan menjawab (responses error),
- Kesalahan mengingat (recals error),
- Kesalahan mengamati (observations error) dan sebagainya.
- Kesalahan lainnya khusus dalam sampling :
- Kesalahan penentuan responden (misspecification of sample subject).
- Kesalahan variasi acak (random variation error).
- Kesalahan penarikan sampel (sampling error).
- Kesalahan spesifikasi (specification error).
- Kesalahan karena tidak lengkapnya respon (non response error).
- Kesalahan karena tidak lengkapnya cakupan elemen populasi (coverage error) dan
sebagainya.

Sumber Bahan Bacaan disarankan
Kachigan, Sam Kash (1986), Statistical Analyisis: An Interdisiplinary Introduction to
Univariate & Multivariate Methods, Radius Press, New York.
Kuncoro. Mudrajat (2003), Metode Riset Untuk Bisnis dan Ekonomi: Bagaimana
Meneliti dan Menulis Tesis ?, Erlangga, Jakarta
Mutiara, Kurwadi Erna (2004), Statistik Berbasis Komputer untuk Orang-Orang Non
Statistik, Elek Media Komputindo, Jakarta
Santoso, Purbayu Budi dan Ashari (2005), Analisis Statistik dengan Microsoft Excel dan
SPSS, Andi, Yogyakarta.
Santoso, Singgih (2003), Statistik Deskriptif Konsep dan Aplikasi Dengan Microsoft
Excel dan SPSS, Andi, Yogyakarta.
Santoso, Singgih dan Fandy Tjiptono (2001), Riset Pemasaran: Konsep dan Aplikasi
dengan SPSS, Elek Media Komputindo, Jakarta
Santoso, Singgih, Mengatasi Berbagai Masalah Statistik dengan SPSS ver. 11.5, Elek
Media Komputindo, Jakarta
Trihendradi, Cornelius (2004), Memecahkan Statistik: Deskriptif, Parametrik dan Non
Parametrik dengan SPSS 12, Andi, Yogyakarta