Anda di halaman 1dari 36

BAB II

TINJAUAN PUSTAKA

2.1 Pengertian Statistika


Statistika adalah ilmu yang mempelajari bagaimana merencanakan,
mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data.
Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah
'statistika' (bahasa Inggris: statistics) berbeda dengan 'statistik' (statistic).
Statistika merupakan ilmu yang berkenaan dengan data, sedang statistik
adalah data, informasi, atau hasil penerapan algoritma statistika pada suatu
data. Dari kumpulan data, statistika dapat digunakan untuk menyimpulkan
atau mendeskripsikan data ini dinamakan statistika deskriptif. Sebagian besar
konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah
statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.
Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-
ilmu alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial
termasuk sosiologi dan psikologi), maupun di bidang bisnis, ekonomi, dan
industri. Statistika juga digunakan dalam pemerintahan untuk berbagai
macam tujuan; sensus penduduk merupakan salah satu prosedur yang paling
dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedur
jajak pendapat atau polling (misalnya dilakukan sebelum pemilihan umum),
serta jajak cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang
komputasi, statistika dapat pula diterapkan dalam pengenalan pola maupun
kecerdasan buatan.
a. Statistika deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan
informasi yang berguna. Pengklasifikasian menjadi statistika deskriptif
dan statistika inferensia dilakukan berdasarkan aktivitas yang dilakukan.
Statistika deskriptif hanya memberikan informasi mengenai data
yang dipunyai dan sama sekali tidak menarik inferensia atau kesimpulan

II-1
apapun tentang gugus induknya yang lebih besar. Contoh statistika
deskriptif yang sering muncul adalah, tabel, diagram, grafik, dan besaran-
besaran lain di majalah dan koran-koran. Dengan Statistika deskriptif,
kumpulan data yang diperoleh akan tersaji dengan ringkas dan rapi serta
dapat memberikan informasi inti dari kumpulan data yang ada. Informasi
yang dapat diperoleh dari statistika deskriptif ini antara lain ukuran
pemusatan data, ukuran penyebaran data, serta kecenderungan suatu
gugus data.
b. Statistika Inferensia
Statistika inferensial/Induktif adalah statistik yang digunakan untuk
menganalisa data sampel, dan hasilnya akan digeneralisasikan untuk
populasi dimana sampel berada. Statistika inferensial berusaha membuat
berbagai inferensi terhadap sekumpulan data yang berasal dari suatu
sampel. Tindakan inferensi tersebut seperti melakukan perkiraan besaran
populasi, uji hipotesis, forecasting dsb.
Kedua bagian statistik tersebut dalam prakteknya sering dipakai
bersama-sama, namun ada juga yang hanya menggunakan salah satu saja,
tergantung dari kebutuhan.  Seringnya dalam penelitian dilakukan statistis
deskriptif dahulu, baru statistif inferensial. Misal suatu kegiatan penelitian
dalam bidang komputer misalnya: Saya ingin mengetahui penyebab
kecepatan internet di Laboratoium Sekolah, apakah benar semakin banyak
user yang menggunakan internet akan memperlambat kecepatan internet ?
Nah berangkat dari masalah tersebut membutuhkan data untuk
mengetahui data-data kecepatan internet pada saat usernya hanya 1 orang,
kemudian pada saat usernya 2 orang dan seterusnya, sampai semua
komputer terpakai semua misalnya, data-data tersebut disajikan
menggunakan Statistik Deskriptif, setelah itu untuk mengetahui seberapa
besar, pengaruh banyak user terhadap kecepatan internet ? disinilah data-
data tersebut perlu dilakukan analisis secara Inferensial atau Induktif,
sehingga nantinya diharapkan bisa dibuat suatu kesimpulan yang bisa
dijadikan pedoman dalam pengambilan keputusan disuatu tempat yang

II-2
diteliti.

2.2 Pengertian Data


Data adalah sesuatu yang belum mempunyai arti bagi penerimanya dan
masih memerlukan adanya suatu pengolahan. Data bisa berujut suatu
keadaan, gambar, suara, huruf, angka, matematika, bahasa ataupun simbol-
simbol lainnya yang bisa kita gunakan sebagai bahan untuk melihat
lingkungan, obyek, kejadian ataupunsuatu konsep.
Informasi merupakan hasil pengolahan dari sebuah model, formasi,
organisasi, ataupun suatu perubahan bentuk dari data yang memiliki nilai
tertentu, dan bisa digunakan untuk menambah pengetahuan bagi yang
menerimanya. Dalam hal ini, data bisa dianggap sebagai obyek dan informasi
adalah suatu subyek yang bermanfaat bagi penerimanya. Informasi juga bisa
disebut sebagai hasil pengolahan ataupun pemrosesan data.Data bisa
merupakan jam kerja bagi karyawan perusahaan. Data ini kemudian perlu
diproses dan diubah menjadi informasi.
Jika jam kerja setiap karyawan kemudian dikalikan dengan nilai per-
jam, maka akan dihasilkan suatu nilai tertentu. Jika gambaran penghasilan
setiap karyawan kemudian dijumlahkan, akan menghasilkan rekapitulasi gaji
yang harus dibayar oleh perusahaan. Penggajian merupakan informasi bagi
pemilik perusahaan. Informasi merupakan hasil proses dari data yang ada,
atau bisa diartikan sebagai data yang mempunyai arti. Informasi akan
membuka segala sesuatu yang belum diketahui
Data yang baik tentu saja harus yang mutakhir, cocok dengan masalah
penelitian dari sumber yang dapat dipertanggung jawabkan, lengkap, akurat,
objektif dan konsisten.Pengumpulan data sedapat mungkin diperoleh dari
tengah pertama.Data yang baik sangat diperlukan dalam penelitian, sebab
bagaimanapun canggihnya suatu analisis data jika tidak ditunjang oleh data
yang baik maka hasilnya kurang dapat dipertanggungjawabkan.Suatu data
disebut sebagai data parametric bila memenuhi kriteria sebagai berikut:

II-3
1. Normally distributed data.
Data yang mempunyai distribusi normal adalah data yang dapat
mewakili populasi yang diteliti. Secara kasat mata kita bisa melihat
histogram dari data yang dimaksud, apakah membentuk kurva normal
atau tidak. Tentu saja cara ini sangat subyektif. Cara lainnya yaitu dengan
melakukan uji normalitas pada data yang dimaksud –caranya akan
dijelaskan lebih lanjut.
2. Homogenity of variance.
Variansi dari data yang dimaksud harus stabil tidak berubah atau
homogen. Ada banyak tes yang bisa dilakukan untuk mengetahui
homogenity of variance, bahkan untuk untuk jenis-jenis analisis tertentu
SPSS secara otomatis menyertakan hasiltes ini.
3. Interval data.
Data yang dimaksud minimal merupakan data interval.
4. Independence.
Tabel adalah penyajian data dalam bentuk kumpulan angka yang
disusun menurut kategori-kategori tertentu, dalam suatu daftar. Dalam
tabel, disusun dengan cara alfabetis, geografis, menurut besarnya angka,
historis, atau menurut kelas-kelas yang lazim.Berdasarkan pengaturan
datanya, tabel dibedakan atas beberapa jenis, yaitu :
a. Tabel frekuensi adalah tabel yang menunjukkan atau memuat
banyaknya kejadian atau frekuensi dari suatu kejadian.
b. Tabel klasifikasi adalah tabel yang menunjukkan atau memuat 
pengelompokkan data. Tabel klasifikasi dapat berupa tabel klasifikasi
tunggal dan ganda.
c. Tabel kontingensi adalah tabel yang menunjukkan atau memuat data
sesuai dengan rinciannya. Apabila bagian baris tabel berisikan m
baris dan bagian kolom tabel berisikan n kolom maka didapatkan
tabel kontingensi berukuran m x n
d. Tabel korelasi adalah tabel yang menunjukkan atau memuat adanya
korelasi (hubungan) antara data yang disajikan.

II-4
Grafik data disebut juga diagram data, adalah penyajian data dalam
bentuk gambar-gambar. Grafik data biasanya berasal dari tabel dan grafik
biasanya dibuat bersama-sama, yaitu tabel dilengkapi dengan grafik.Grafik
data sebenarnya merupakan penyajian data secara visual dari data
bersangkutan. Grafik data dibedakan atas beberapa jenis, yaitu :
a. Pictogram adalah grafik data yang menggunakan gambar atau lambang
dari data itu sendiri dengan skala tertentu.
b. Grafik batang atau balok Adalah grafik data berbentuk persegi panjang
yang lebarnya sama dan dilengkapi dengan skala atau ukuran sesuai
dengan data yang bersangkutan.  Setiap batang tidak boleh saling
menempel atau melekat antara satu dengan lainnya dan jarak antara
setiap batang yang berdekatan harus sama.
c. Grafik garis Adalah grafik berupa garis, diperoleh dari beberapa ruas
garis yang menghubungkan titik-titik pada bidang bilangan. Pada grafik
garis digunakan dua garis yang saling berpotongan. Pada garis
horizontal (sumbu-X) ditempatkan bilangan-bilangan yang sifatnya
tetap, seperti tahun dan ukuran-ukuran. Pada garis tegak (sumbu-Y)
ditempatkan bilangan-bilangan yang sifatnya berubah-ubah, seperti
harga, biaya jumlah, dan jumlah.
d. Grafik lingkaran adalah grafik data berupa lingkaran yang telah dibagi
menjadi juring-juring sesuai dengan data tersebut. Bagian-bagian dari
keseluruhan data tersebut dinyatakan dalam persen.
e. Kartogram atau peta statistik adalah grafik data berupa peta yang
menunjukkan kepadatan penduduk, curah hujan, hasil pertanian, hasil
pertambangan dsb.

2.3 Manajemen Data


Sumber data statistik sebenarnya terdapat dimana-mana dalam
kehidupan dewasa ini.Data tersebut sangat besar peranannya untuk
meningkatkan taraf hidup manusia.Misalnya pada suatu industri, data statistik
dibutuhkan pimpinan sebagai suatu landasan pengambilan keputusan.Sering

II-5
kali kita menghadapi masalah penyajian sejumlah besar Data Statistik dalam
bentuk yang ringkas dan kompak meskipun ukuran numerik bagi lokasi dan
varian adalah merupakan pendeskripsian data yang kompak dan bermanfaat
bagi sekumpulan pengamatan, tetapi ukuran-ukuran tersebut tidak dapat
mengidentifikasi semua ciri yang penting.Secara garis besar, terdapat dua
cara penyajian data, yaitu dengan tabel (tabel atau daftar merupakan
kumpulan angka yang disusun menurut kategori atau karakteristik data
sehingga memudahkan untuk analisis data) dan grafik atau diagram
(penyajian data dengan grafik dianggap lebih komunikatif karena dalam
waktu singkat dapat diketahui karakteristik dari data yang disajikan). Dua
cara penyajian data ini saling berkaitan karena pada dasarnya sebelum dibuat
grafik data tersebut berupa tabel. Penyajian data berupa grafik lebih
komunikatif.
Sedangkan untuk distribusi frekuensi yang merupakan salah satu bentuk
tabel yang merupakan suatu penyusunan data ke dalam kelas-kelas tertentu
dimana individu hanya termasuk ke dalam kelas tertentu. Atau dengan kata
laian distribusi frekuensi umumnya merupakan penyajian data statistic yang
berbentuk kolom dan jalur yang di dalamnya dimuat angka yang dapat
melukiskan atau menggambarkan pencaran atau pembagian frekuensi dari
variable yang sedang menjadi objek penelitian. Uraian di atas
memperlihatkan alasan mengapa kita melakukan suatu percobaan mengenai
manajemen data dalam ilmu statistik agar kita dapat mengetahui dan lebih
mengetahui dan lebih memahami fungsi dari ilmu statistik di bidang industri.
Manajemen data di pergunakan untuk menganalisis data dan menyelesaikan
data yang belum diolah maupun yang telah diolah, untuk mempermudah kita
dalam mengolah data yang ada.

Data statistik adalah keterangan atau ilustrasi mengenai sesuatu hal


yang bisa berbentuk kategori (misalnya rusak, baik, cerah, berhasil) atau
bilangan.Selanjutnya data yang berupa kategori disebut sebagai data kualitatif
dan data bilangan disebut data kuantitatif. Berdasarkan cara perolehannya

II-6
data kuantitatif dibedakan menjadi data diskrit dan data kontinu. Data-data
yang diperoleh dari hasil menghitung atau membilang termasuk dalam data
diskrit, sedangkan data-data yang diperoleh dari hasil mengukur termasuk
dalam data kontinu.
1. Jenis Data Menurut Cara Memperolehnya
a. Data primer adalah secara langsung diambil dari objek / obyek
penelitian oleh peneliti perorangan maupun organisasi. Contoh :
Mewawancarai langsung penonton bioskop 21 untuk meneliti
preferensi konsumen bioskop.
b. Data sekunder adalah data yang didapat tidak secara langsung dari
objek penelitian. Peneliti mendapatkan data yang sudah jadi yang
dikumpulkan oleh pihak lain dengan berbagai cara atau metode baik
secara komersial maupun non komersial. Contohnya adalah pada
peneliti yang menggunakan data statistik hasil riset dari surat kabar
atau majalah.
2. Jenis-jenis Data Menurut Waktu Pengumpulannya
a. Data cross-section adalah data yang menunjukkan titik waktu tertentu.
Contohnya laporan keuangan per 31 desember 2006, data pelanggan
PT. angin ribut bulan mei 2004, dan lain sebagainya.
b. Data berkala adalah data yang datanya menggambarkan sesuatu dari
waktu ke waktu atau periode secara historis. Contoh data time series
adalah data perkembangan nilai tukar dollar amerika terhadap euro
eropa dari tahun 2004 sampai 2006, jumlah pengikut jamaah nurdin m.
top dan doktor azahari dari bulan ke bulan, dll.
3. Macam-Macam Data Berdasarkan Sumber Data
a. Data Internal adalah data yang menggambarkan situasi dan kondisi
pada suatu organisasi secara internal. Misal : data keuangan, data
pegawai, data produksi, dsb.
b. Data Eksternaladalah data yang menggambarkan situasi serta kondisi
yang ada di luar organisasi. Contohnya adalah data jumlah penggunaan
suatu produk pada konsumen, tingkat preferensi pelanggan, persebaran

II-7
penduduk, dan lain sebagainya.

MEMBUAT DAFTAR DISTRIBUSI FREKUENSI

Perhatikan nilai ujian mtk untuk 50 orang mahasiswa berikut ini:

52 43 45 71 64 85 58 74 75 65
74 62 63 47 86 64 84 68 55 87
63 53 72 65 48 66 68 63 85 77
76 75 64 82 55 83 57 35 66 68
68 68 65 64 78 76 65 65 97 86

Dari data diatas akan dibuat daftar distribusi frekuensi dengan panjang kelas yang
sama. Untuk itu dilakukan perhitungan sebagia berikut:

a) Tentukan rentang yaitu data terbesar dikurangi data terkecil dalam hal ini
data terbesar adalah 95 dan data terkecil adalah 35 sehingga rentang/r
adalah 64
b) Tentukan banyak kelas interval yang diperlukan banyak kelas yang sering
digunakan berkisar antara 5 sampai 15 sesuai keperluan caralian yang
biasa digunakan adalah aturan sturges yaitu dgn rumus berikut:
Banyak kelas=1+3,3 log n

N adalah jumlah data

Sehingga diperoleh banyak kelas = 1+3,3, log 50 = 6,5

Jadi, kita bisa membuat daftar distribusi dengan banyak kelas interval 6
atau 7 buah

c) Tentukan panjang kelas interval p, dgn rumus:


P = rentang dibagi Banyak kelas

II-8
Harga p diambil sesuai dgn tingkat ketelitian satuan data yang digunakan

d) Pilih ujung kelas interval pertama. Untuk ini bias diambil sama dgn data
yang lebih kecil tapi selisihnya harus kurang dari panjang kelasnya. Dala
hal inidiambil ujung bawah kelas interval adalah 31. Maka kelas interval
pertama adalah 31-40, kelas kedua 41-50 dan seterusnya.
e) Buat daftar tabulasi untuk mengetahui frekuensi masing-masing kelas
interval

3.4 Pembagian Data Menurut Skala Pengukurannya


Skala pengukuran adalah peraturan penggunaan notasi bilangan
dalam pengukurannya, data dapat dibedakan atas empat yaitu data
nominal, data ordinal, data interval, dan data rasio.
3.4.1 Data nominal
Data dikotomi disebut data diskrit, data kategorik atau data
nominal. Data ini merupakan data yang diberikan kepada objek atau
kategori yang tidak menggambarkan kedudukan objek atau
kategori lainnya, tetapi hanya sekedar label atau kode saja. Data ini
hanya mengelompokkan objek atau kategori ke dalam kelompok
tertentu.Data nominal adalah tingkatan data paling rendah menurut
tingkat pengukurannya. Data nominal ini pada satu individu tidak
mempunyai variasi sama sekali, jadi 1 individu hanya punya 1
bentuk data.
3.4.2 Data Ordinal
Data ordinal adalah data yang penomoran objek atau
kategorinya disusun menurut besarnya, yaitu dari tingkat terendah
ke tingkat tetinggi atau sebaliknya dengan jarak/rentang yang tidak
harus sama. Data ini memiliki ciri seperti pada ciri data nominal
ditambah satu ciri lagi, yaitu kategori data dapat disusun
berdasarkan urutan logis dan sesuai dengan besarnya karakteristik
yang dimiliki.

II-9
Data ordial, seperti pada nominal, adalah juga data kualitatif
namun dengan level yang lebih ‘tinggi’ daripada data nominal. Jika
pada data nominal, semua data kategori dianggap sama, pada data
ordinal, ada tingkat data. Misal pada data jenis kelamin diatas, lelaki
dianggap setara dengan wanita, atau dalam data tempat kelahiran,
data Yogyakarta dianggap sama dengan data Solo, Surabya,
boyolali daan seterusnya.
Pada data ordinal, ada data dengan urutan lebih tinggi dan
urutan lebih rendah, missal tentang sikap orang terhadap produk
tertentu.Dalam pengukuran sikap konsumen, ada sikap suka dan
tidak suka, sangat suka dan lainnya.Di sini data tidak bisa
disamakan derajatnya, dalam arti suka dianggap lebih tinggi dari
tidak suka, namun lebih rendah dari sangat suka dan lainnya. Jadi ,
di sini ada preferensi atau tingkatan data, yaitu data yang satu status
lebih tinggi atau lebih rendah dari yang lain, Namun, data ordinal
juga tidak bisa dilakukan operasi matematika, seperti jika tidak suka
dikategorikan 1, suka dikategorikan 2, sangat suka dikategorikan 3,
tidak bisa dianggap 1 + 2 = 3, atau tidak suka ditambah suka
menjadi sangat suka.
2.4.3 Data Interval
Data interval mempunyai sifat-sifat nominal dari data ordinal.
Dimana data interval adalah data di mana objek/kategori dapat
diurutkan berdasarkan suatu atribut yang memberikan informasi
tentang interval antara tiap objek/kategori sama. Besarnya interval
dapat ditambah atau dikurangi. Data ini memiliki ciri pada data
ordinal ditambah satu cirri lagi, yaitu urutan kategori data yang
mempunyai jarak yang sama.Data interval mempunyai tingkatan
lebih rendah dari data rasio.Data rasio memiliki jarak data yang
pasti namun tidak memiliki nilai nol mutlak.

2.4. 5 Data rasio

II-10
Data rasio mengandung sifat-sifat interval, dan selain ia sudah
mempunyai nilai nol mutlak. Data rasio bersifat eksklusif,
mempunyai urutan baru dan mempunyai nol mutlak.Data rasio
adalah tingkatan data yang paling tinggi. Data rasio memiliki jarak
antar nilai yang pasti dan memiliki nilai nol mutlak yang tidak
dimiliki oleh jenis-jenisdata lainnya..

Ada lagi jenis data yang sering disebutkan dalam statistik yaitu data
parametric dan non-parametric.Jika “NOIR (Nominal, Ordinari, Interval,
Rasio)” adalah pembagian data menurut tingkatan pengukuran, pembagian
parametric dan non-parametric dipengaruhi oleh karakteristik empirik dari
data tersebut. Pengetahuan tentang batasan data parametric dan
nonparametric ini sangat penting karena pada proses analisis memang
dibedakan untuk masing-masing jenis data tersebut. Suatu data disebut
sebagai data parametric bila memenuhi kriteria sebagai berikut:
1. Normally distributed data. Data yang mempunyai distribusi normal
adalahdata yang dapat mewakili populasi yang diteliti. Secara kasat
mata kita bisamelihat histogram dari data yang dimaksud, apakah
membentuk kurva normalatau tidak. Tentu saja cara ini sangat
subyektif. Cara lainnya yaitu denganmelakukan uji normalitas pada
data yang dimaksud –caranya akan dijelaskanlebih lanjut.
2. Homogenity of variance. Variansi dari data yang dimaksud harus stabil
tidakberubah atau homogen. Ada banyak tes yang bisa dilakukan untuk
mengetahuihomogenity of variance, bahkan untuk untuk jenis -jenis
analisis tertentu SPSSsecara otomatis menyertakan hasil tes ini.
3. Interval data. Data yangdimaksud minimal merupakan data interval.
4. Independence. Data yang diperoleh merupakan data dari tiap individu
yangindependen, maksudnya respon dari 1 individu tidak
mempengaruhi ataudipengaruhi respon individu lainnya.
Jenis – jenis data diatas akan di kupas dengan cukup mendalam
karena penerapan dalam statistic akan berbeda untuk jenis data yang

II-11
berbeda. Data kualitatif, karena bukan data angka dalamarti sesungguhnya,
tidak dapat disamakan perlakuannya dengan data kuantitatif.Data nominal
dan ordinal bisanya memakai statistic nonparametik, sedangkan data
kuantitatif biasanya memakai statistic parametik.

3.5 Sumber data dan teknik pengumpulan data


Data statistik dapat dikumpulkan dengan menggunakan prosedur yang
sistematis.Pengumpulan data dimaksudkan sebagai pencatatan peristiwa
atau karakteristik dari sebagian atau seluruh elemen populasi.
Berdasarkan jenis cara pengumpulannya, ada beberapa cara
pengumpulan data, yaitu sebagai berikut :
a. Pengamatan (observasi)
Pengamatan atau observasi adalah cara pengumpulan data
dengan terjun dan melihat langsung kelapangan ,(lab) terhadap objek
yang diteliti (populasi).Obrservasi merupakan salah satu teknik
pengumpulan data yang tidak hanya mengukur sikap dari responden
(wawancara dan angket) namun juga dapat digunakan untuk merekam
berbagai fenomena yang terjadi (situasi, kondisi).Teknik ini digunakan
bila penelitian ditujukan untuk mempelajari perilaku manusia, proses
kerja, gejala-gejala alam dan dilakukan pada responden yang tidak
terlalu besar.
Sifat: Tidak ada interaksi antara obyek yang diamati dengan
Kelebihan Observasi:
1. Data yang diperoleh up to date terbaru) karena diperoleh dari
keadaan yang terjadi pada saat itu (pada saat berlangsungnya
peristiwa tersebut).
2. Data lebih obyektif dan jujur karena obyek yang diteliti atau
responden tidak dapat mempengaruhi pengumpul data
(menutupkemungkinan manipulasi).
Kelemahan Observasi:
1. Memerlukan banyak waktu.

II-12
2. Tidak dapat digunakan untuk pengumpulan data masa lalu dan masa
mendatang.
3. Tidak dapat digunakan untuk pengumpulan data yang berkaitan
dengan sikap dan motivasi serta perilaku responden
b. Penelusuran literatur
Adalah cara pengumpulan data dengan menggunakan sebagian atau
seluruh data yang telah ada atau laporan data dari peneliti sebelumnya.
Penelusuran literatur disebut juga pengamatan tidak langsung.
c.Penggunaan kuesioner (angket)
Kuesioner merupakan serangkaian pertanyaan yang dikirimkan lewat
pos atau diserahkan secara langsung guna diisi.Jawaban pertanyaan dari
kuesioner dilakukan sendiri oleh responden tanpa bantuan dari pencari
data sehingga pencari data harus dapat membuat pertanyaan yang
benar-benar jelas dan tidak meragukan bagi konsumen. Angket /
kuesioner adalah teknik pengumpulan data yang dilakukan dengan cara
memberikan seperangkat pertanyaan atau pernyataan kepada orang lain
yang dijadikan responden untuk dijawabnya. Meskipun terlihat mudah,
teknik pengumpulan data melalui angket cukup sulit dilakukan jika
respondennya cukup besar dan tersebar di berbagai wilayah.
Sifat: terdapat interaksi antara obyek yang diamati dengan
pengamat/pengumpul data.
Kelebihan Survei:
1. Data yang diperoleh autentik, obyektif dan jujur karena berasal dari
sumber data (responden) secara langsung.
2. Dapat diterapkan untuk pengumpulan data dalam lingkup yang luas.
3. Dalam hal tertentu, efisien dalam penggunaan waktu pengumpulan
data.
Kelemahan Survei:
1. Ada informasi terselubung dari responden khususnya untuk
informasi yang berkaitan dengan sifat, motivasi atau perilaku
responden.

II-13
2. Responden terkadang tidak menjawab apa adanya tetapi apa yang
sebaiknya
3. Responden terlalu dibatasi pada jawaban-jawaban tertentu.
4. Responden sering tidak mengembalikan kuesioner.
5. Sering muncul jawaban-jawaban yang tidak diinginkan dan tidak
sesuai dengan yang diinginkan.
d. Wawancara (interview)
Wawancara (interview) adalah pengumpulan data dengan langsung
mengadakan tanya jawab kepada objek yang diteliti atau kepada
perantara yang mengetahui persoalan dari objek yang diteliti.
Wawancara terbagi atas wawancara terstruktur dan tidak terstruktur.
1. Wawancara terstruktur artinya peneliti telah mengetahui dengan
pasti apa informasi yang ingin digali dari responden sehingga
daftar pertanyaannya sudah dibuat secara sistematis. Peneliti juga
dapat menggunakan alat bantu tape recorder, kamera photo, dan
material lain yang dapat membantu kelancaran wawancara.
2. Wawancara tidak terstruktur adalah wawancara bebas, yaitu
peneliti tidak menggunakan pedoman wawancara yang berisi
pertanyaan yang akan diajukan secara spesifik, dan hanya memuat
poin-poin penting masalah yang ingin digali dari responden.

3.6 Penyajian data


Data yang dikumpulkan atau disajikan dalam bentuk tertentu. Bentuk-
bentuk penyajian data meliputi :
1) Histogram adalah grafik yang digambarkan dalam bentuk kolom
sedemikian rupa sehingga luas bidang datar kolom tersebut sebanding
dengan frekuensi kelasnya. Dalam penggambarannya, sumbu vertikal
histogram menyatakan nilai frekuensi atau nilai frekuensi relatif.
Sedangkan sumbu horizontalnya menyatakan nilai titik tengah. Diagram
batang sangat cocok untuk menyajikan data yang berbentuk kategori
atau atribut, dan data tahunan yang tahunnya tidak terlalu banyak.

II-14
Diagram garis sangat cocok untuk menyajikan data yang terbentuk terus
atau berkesinambungan. Diagram lambang sangat cocok untuk
menyajikan data kasar sesuatu hal dan sebagai alat visual bagi orang
awam.Dari suatu data yang diperoleh dapat disusun dalam tabel
distribusi frekuensi dan disajikan dalam bentuk diagram yang disebut
histogram. Jika pada diagram batang, gambar batang-batangnya terpisah
maka pada histogram gambar batang-batangnya berimpit. Histogram
dapat disajikan dari distribusi frekuensi tunggal maupun distribusi
frekuensi bergolong. Histogram didasarkanpada table distribusi
frekuensi baik absolute maupun table distribusi frekuensi persentase,
dimana interval tiap kelas sudah dibuat dalam batas batas kelas (batas
bawah maupun batas atas)
2) Grafik atau Diagrampenyajian data dengan grafik atau diagram dapat
dilakukan dengan berbagai cara diantaranya:
a. Diagram Garis,Penggambaran diagram garis dapat menggunakan
garis lurus (diagram garis lurus) atau menggunakan garis lengkung
(diagram garis lengkung). Diagram garis penggunaannya ditekankan
untuk melihat perkembangan. Pada umumnya diagram garis
digunakan untuk data-data yang kontinu. Contoh: suhu (perubahan
suhu dari bulan ke bulan). Yang perlu diperhatikan dalam
pembuatan diagram garis ini, dasar garis vertikal harus dimulai dari
0.Sumbu X menunjukkan waktu-waktu pengamatan, sedangkan
sumbu Y menunjukkan nilai data pengamatan untuk suatu waktu
tertentu. Kumpulan waktu dan pengamatan membentuk titik-titik
pada bidang XY, selanjutnya kolom dari tiap dua titik yang
berdekatan tadi dihubungkan dengan garis lurus sehingga akan
diperoleh diagram garis atau grafik garis.
b. Diagram Batang. Pembuatan diagram batang hampir sama dengan
diagram garis tetapi diagram garis biasanya untuk menunjukkan
naik turunnya suatu harga (nilai), sedangkan diagram batang
terutama untuk menunjukkan jumlah. Sehingga panjang dari batang

II-15
sesuai dengan jumlah atau nilai datanya. Pewarnaan atau pemberian
pola arsiran dapat menambah kejelasan dari diagram batang
tersebut. Diagram batang dapat dibedakan menjadi:
c. Diagram Lingkarang. Diagram ini berbentuk lingkaran, dengan
tujuan untuk membandingkan jumlah. Bentuk grafik berupa
lingkaran (360°) yang dibagi dalam bagian yang dibuat seimbang
dengan harga dan biasanya disajikan dalam % (persen) atau berupa
pembagian berdasarkan derajat. Perbandingan luas pada setiap
bagian pada lingkaran sesuai dengan kuantitas nilai data. Diagram
lingkaran bentuk lain, yaitu diagram setengah lingkaran dan
diagram lingkaran gabungan. Diagram lingkaran tersebut dapat
digunakan untuk membandingkan nilai atau jumlah pada dua kurun
waktu yang berbeda.
3) Tabel yang terdiri atas tabel biasa, tabel distribusi, frekuensi relatif,
frekuensi komulatif, frekuensi relatif komulatif.Penyajian data dengan
menggunakan tabel mempunyai kelebihan dan kekurangan. Salah satu
kekurangan penyajian data dengan tabel, yaitu apabila digunakan
sebagai perbandingan, pembaca kurang cepat menangkap tingkat
perbandingan karena nilai data disajikan dengan angka. Tetapi hal ini
akan memberikan kelebihan, karena data disajikan dengan nominal
angka sehingga tidak akan terjadi kesalahan pembacaan.
4) Poligon frekuensi merupakan data dari tabel distribusi frekuensi
dapat pula disajikan dalam bentuk grafik lainnya. Pada grafik poligon,
nilai sumbu vertikal dapat berupa nilai frekuensi. Sedangkan sumbu
horizontal dapat menyatakan nilai titik tengah. Cara lain yang sangat
bermanfaat dalam menyajikan data numerik dalam bentuk
gambar/grafik adalah dengan menggunakan poligon frekuensi. Poligon
frekuensi diperoleh dengan cara memplotkan frekuensi tiap kelas
terhadap nilai tengah/tanda kelas masing-masing kelas tersebut dan
kemudian menghubungkan titik yang berurutan hasil plot tersebut
dengan garis lurus. Itu dapat dilakukan dengan menghubungkan titik

II-16
tengah sebelah atas dari segi empat pada histogram.
5) Ogive adalah sejenis poligon, tetapi digunakan untuk menggambarkan
distribusi frekuensi komulatif. Sumbu vertikal menyatakan frekuensi
komulatif, sedangkan sumbu horizontal menyatakan nilai frekuensi
kurang dari atau lebih dari.
6) Kurve adalah gambar distribusi frekuensi yang berbentuk garis
melengkung yang luasnya relative sama dengan luas histogram. Dalam
penggambarannya, sumbu vertikal kurve dapat menyatakan nilai
frekuensi, sedangkan sumbu horizontal menyatakan nilai batas bawah
kelas.
7) Penyajian data menggunakan diagram dibagi atas:
a. Piktogram adalah suatu cara untuk menampilkan besar
data menggunakan gambar yang sesuai dengan datanya. Cara ini
paling sederhana dan jelas untuk menyajikan suatu data. Salah satu
kelemahan dalam penggunaan piktogram adalah sulitnya
membedakan setengah dan satu pertiga gambar atau jumlahnya
tidak dapat diwakili dengan satu unit gambar sehingga penggunaan
piktogram sangat terbatas.
b. Diagram batang adalah cara menyajikan data dalam
bentuk batang-batang. Tiap batang lebarnya sama, sedangkan tinggi
batang menyatakan frekuensi dari data yang bersangkutan. Untuk
membuat diagram batang diperlukan sumbu mendatar dan sumbu
tegak yang berpotongan tegak lurus. Sumbu mendatar (horizontal)
menunjukkan jenis kategorinya, sedangkan sumbu tegak (vertikal)
menunjukkan frekuensinya. Skala sumbu mendatar tidak harus sama
dengan skala sumbu tegak. Letak batang yang satu dengan yang lain
dibuat terpisah.
c. Diagram Lingkaran, Penyajian data juga dapat dilakukan
dengan menggunakan lingkaran. Daerah lingkaran menggambarkan
keseluruhan data. Data disajikan dengan menggunakan juring atau
sektor, di mana besar sudut pusat dari juring sesuai dengan

II-17
perbandingan setiap data terhadap keseluruhan data.
d. Diagram garis biasanya digunakan untuk menyajikan
data yang diperoleh dari waktu ke waktu secara teratur dalam
interval waktu tertentu. Diagram garis digunakan untuk mengetahui
pertumbuhan/perkembangan suatu hal secara kontinu.
Diagram dapat memberikan informasi dengan cepat yang
dikandung dari sekelompok data dalam bentuk yang ringkas.Diagram
biasanya lebih menarik dibandingkan penyajian data dengan
menggunakan tabel. Hal ini bisa dimungkinkan karena dengan diagram
kita bisa ditambahkan manipulasi warna. Salah satu diagram yang
sering kali digunakan antara lain histogram, poligon frekuensi, kurva
frekuensi, diagram batang/bar chart, pie chart dan lain-lain.

3.7 Pengolahan Data


a) Nilai rata-rata ( X̄ )
Rata-rata (mean) adalah hasil penjumlahan nilai-nilai anggota sebuah
kelompok (∑Xn) dibagi jumlah anggota kelompok tersebut. Ada tiga
jenis rata-rata yang dikenal dalam statistik yaitu rata-rata hitung (x ̅),
rata-rata ukur (Gm atau U) dan rata-rata harmonik (rh atau H). Nilai
rata-rata adalah nilai rata-rata dari data-data yang ada, disekitar mana
nilai-nilai dari sekumpulan data tersebar itu. Dapat ditentukan dengan
rumus:

∑ Xi
X̄ = N
Dimana : X̄ = rata-rata hitung (mean).
Xi = wakil data
N = jumlah data.
b) Varian sampel
Varian sampel adalah dua dari simpangan-simpangan itu kemudian
dijumlahkan seluruhnya dan dibagi dengan jumlah data (n) dan nilai

II-18
dari hasil itu dinamakan varian dari kumpulan data tersebut.

∑ ( Xi− X̄ )2
S2 = n−1
Dimana :
S2 = Varian sampel
n = jumlah data
X̄ = nilai rata-rata
Xi = Wakil data
c) Median
Median adalah salah satu ukuran pemusatan data, yaitu, jika segugus
data diurutkan dari yang terkecil sampai yang terbesar atau yang
terbesar sampai yang terkecil, nilai pengamatan yang tepat di tengah-
tengah bila jumlah datanya ganjil, atau rata-rata kedua pengamatan yang
di tengah bila banyaknya pengamatan genap.Dan median dari suatu
kumpulan nilai adalah sebuah nilai yang membagi 2 kumpulan nilai
tersebut .sehingga setengah dari nilai-nilai itu (atau lebih) sama dengan
atau kurang dari nilai atau median itu dan setengah dari besar atau sama
dengan nilai itu.Median Merupakan setengah dari data, salah satu
ukuran pemusatan yang sering digunakan.Median merupakan ukuran
pemusatan data juga seperti halnya mean. Kenapa median dapat
menjadi sebagai ukuran pemusatan data? Median digunakan sebagai
ukuran pemusatan data untuk data yang memiliki sifat keterurutan
karena median adalah ukuran yang membagi data terurut menjadi dua
bagian yang sama banyak.Median adalah nilai yang terletak di tengah
dari data yang terurut.Jika banyak data ganjil, median adalah nilai
paling tengah dari data yang sudah diurutkan. Jika banyak data genap,
median adalah mean dari dua bilangan yang di tengah setelah data
diurutkan.

Dapat dirumuskan dengan :

II-19
Me = Bk + P (n/2 – F)
f
Dimana :
Bk = batas kelas
P = panjang kelas
N/2 = letak median
(f)= frekuensi komulatif
F = frekuensi
Selain itu juga dapat dicari median dari data yang telah tersusun
dalam bentuk distribusi frekuensi. Rumus yang digunakan ada dua,
yaitu:

Dimana :
Bbk : batas kelas bawah median
C : lebar kelas
S : Selisih antara nomor frekuensi median dengan frekuensi
kumulatif dari kelas-kelas di muka kelas median
fM : frekuensi kelas median

Dimana :
Bak : batas kelas atas median
c : lebar kelas
s' : selisih antara nomor frekuensi median dengan frekuensi
kumulatif sampai kelas median
fM : frekuensi kelas median
Sebelum menggunakan kedua rumus di atas, terlebih dahulu

II-20
harus ditentukan kelas yang menjadi kelas median.Kelas median adalah
kelas yang memuat nomor frekuensi median, dan nomor frekuensi
median ini ditentukan dengan membagi keseluruhan data dengan dua.
d) Simpangan baku sampel
Dalam statistika dan probabilitas, simpangan baku atau deviasi standar
adalah ukuran sebaran statistik yang paling lazim. Singkatnya, ia
mengukur bagaimana nilai-nilai data tersebar. Simpangan baku
didefinisikan sebagai akar kuadrat varians. Simpangan b
Dapat dirumuskan dengan :

S= √ S2
Dimana : S = Simpangan baku
e) Jumlah kelas interval (N)
Adalah jumlah data dari selang yang memisahkan kelas yang satu
dengan yang lain. Dapat dirumuskan sebagai berikut :
N = 1 + 3,33 log n
Dimana : n = banyaknya hasil pengamatan.
N = jumlah kelas interval.
f) Lebar kelas
Lebar kelas atau panjang interval kelas adalah jarak antara tepi atas
kelas dan tepi bawah kelas yang dinyatakan dalam rumus :
R
K= N
Dimana : N = Banyaknya kelas
R = Data terbesar – Data terkecil

3.8 Pengertian Distribusi Frekuensi


Distribusi frekuensi adalah susunan data menurut kelas-kelas interval
tertentu atau menurut kategori tertentu dalam sebuah daftar.distribusi
frekuensi adalah daftar nilai data (bisa nilai individual atau nilai data yang
sudah dikelompokkan ke dalam selang interval tertentu) yang disertai dengan

II-21
nilai frekuensi yang sesuai.
Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar
ciri-ciri penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan
memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat
keragaman data sangat penting untuk diketahui, karena dalam pengujian-
pengujian statistik selanjutnya kita harus selalu memperhatikan sifat dari
keragaman data.
Berdasarkan jenis data yang digolongkan didalamnya distribusi
frekuensi dibagi menjadi dua yaltu:
A. distribusi frekuensi bilangan (numerical frequency distribution) adalah
distribusi frekuensi yang berisikan data berupa angka-angka, dimana data
itu dibagi atas golongan-golongan yang dinamakan kelas-kelas, menurut
besarnya bilangan.
B. Dan distribusi frekuensi kategoris (categorical frequency
distribution)adalah distribusi frekuensi yang berisikan data bukan angka,
dimana data itu dibagi atas golongan-golongan yang dinamakan kelas-
kelas, berdasarkan sifat lain.
Jenis-jenis distribusi frekuensi adalah :
1. Distribusi frekuensi biasa
Distribusi frekuensi biasa adalah distribusi frekuensi yang hanya
berisikan jumlah frekuensi dari setiap kelompok data atau kelas.
2. Distribusi frekuensi relatif adalah distribusi yang nilai frekuensinya
tidak dinyatakan dalam angka absolut, tetapi dalam bentuk angka relatif
atau presentase.Variasi penting dari distribusi frekuensi dasar adalah
dengan menggunakan nilai frekuensi relatifnya, yang disusun dengan
membagi frekuensi setiap kelas dengan total dari semua frekuensi
(banyaknya data). Sebuah distribusi frekuensi relatif mencakup batas-
batas kelas yang sama seperti TDF, tetapi frekuensi yang digunakan
bukan frekuensi aktual melainkan frekuensi relatif. Frekuensi relatif
kadang-kadang dinyatakan sebagai persen.

II-22
3. Distribusi frekuensi komulatif
Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif.
Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas
tersebut ditambah dengan jumlah frekuensi semua kelas
sebelumnya.Distribusi frekuensi komulatif adalah frekuensi yang
dijumlahkan. Ada 2 macam distribusi frekuensi komulatif yaitu :
a. Distribusi frekuensi kurang dari adalah distribusi frekuensi yang
memuat jumlah frekuensi yang memiliki nilai kurang dari nilai batas
kelas suatu interval tertentu.
b. Distribusi frekuensi komulatif lebih dari adalah distribusi frekuensi
yang memuat jumlah frekuensi yang memiliki nilai lebih dari nilai
batas kelas suatu interval tertentu.
Selain dalam bentuk diagram, penyajian data juga dengan
menggunakan tabel distribusi frekuensi. Berikut ini akan dipelajari lebih jelas
mengenai tabel distribusi frekuensi tersebut.
a. Distribusi Frekuensi Tunggal. Data tunggal seringkali dinyatakan dalam
bentuk daftar bilangan, namun kadangkala dinyatakan dalam bentuk tabel
distribusi frekuensi. Tabel distribusi frekuensi tunggal merupakan cara
untuk menyusun data yang relatif sedikit.
b. Tabel distribusi frekuensi bergolong biasa digunakan untuk menyusun
data yang memiliki kuantitas yang besar dengan mengelompokkan ke
dalam interval-interval kelas yang sama panjang.

2.8 Histogram, Poligon, Kurva Frekuensi


Umunya distribusi frekuensi disajikan dalam bentuk gambar atau
diagram.Hal ini bertujuan untuk memperjelas sifat-sifat dari distribusi
tersebut.Diagram tersebut dibuat dengan frekuensi pada sumbu y dan batas –
batas kelas interval pada sumbu x diagram yang demikian dinamakan
histogram.

II-23
Histogram adalah merupakan bagian dari grafik batang di mana skala
horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai
frekuensinya.Tinggi batang sesuai dengan nilai frekuensinya, dan batang satu
dengan lainnya saling berdempetan, tidak ada jarak/ gap diantara batang.Kita
dapat membuat histogram setelah tabel distribusi frekuensi data pengamatan
dibuat.
Dari suatu data yang diperoleh dapat disusun dalam tabel distribusi
frekuensi dan disajikan dalam bentuk diagram yang disebut histogram. Jika
pada diagram batang, gambar batang-batangnya terpisah maka pada
histogram gambar batang-batangnya berimpit. Histogram dapat disajikan dari
distribusi frekuensi tunggal maupun distribusi frekuensi bergolong.
Histogram merupakan bentuk diagram yang mudah dipahami.
Histogram merupakan diagram balok, karena frekuensi disajikan dalam
bentuk balok. Histogram menghubungkan antara tepi kelas interval pada
sumbu horizontal (X) dan frekuensi setiap kelas pada sumbu vertical (Y).
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik
yang terletak tepat di atas nilai-nilai titik tengah kelas.Ketinggian dari titik-
titik sesuai dengan frekuensi kelas, dan segmen garis diperluas ke kanan dan
kiri sehingga grafik dimulai dan berakhir pada sumbu horisontal.
Poligon Frekuensi adalah suatu garis putus putus yang
menghubungkan titik tengah ujung batang histogram. Biasanya ditambah dua
segmen garis lain yang menghubungkan titik tengah ujung batang pertama
dan terakhir dengan titik tengah kelas yang paling ujung dimana frekuensinya
bernilai nol.
Poligon hampir sama dengan histogram, perbedaannya histogram
menggunakan balok, sedangkan poligon menggunakan garis yang
menghubungkan titik-titik yang merupakan koordinat antara nilai tengah
kelas dengan jumlah frekuensi pada kelas tersebut. Titik tengah mrupakan
representasi dari karakter kelas dan nilai tengah ini menggantikan posisi
interval kelas pada diagram histogram.
Histogram dan Poligon Frekuensi adalah dua grafik yang

II-24
menggambarkan distribusi frekuensi. Histogram terdiri dari persegi panjang
yang alasnya merupakan panjang kelas interval, sedangkan tingginya sama
dengan frekuensi masing-masing kelas interval.Histogram dan poligon
frekuensi adalah dua grafik yang menggambarkan distribusi frekuensi.
Histogram terdiri dari persegi panjang yang alasnya merupakan
panjang kelas interval, sedangkan tingginya sama dengan frekuensi masing-
masing kelas interval.
Poligon frekuensi adalah suatu garis putus putus yang
menghubungkan titik tengah ujung batang histogram. Biasanya ditambah dua
segmen garis lain yang menghubungkan titik tengah ujung batang pertama
dan terakhir dengan titik tengah kelas yang paling ujung dimana frekuensinya
bernilai nol.
Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif,
seperti daftar distribusi frekuensi kumulatif.Perhatikan bahwa batas-batas
kelas dihubungkan oleh segmen garis yang dimulai dari batas bawah kelas
pertama dan berakhir pada batas atas dari kelas terakhir.Ogive berguna untuk
menentukan jumlah nilai di bawah nilai tertentu.

2.9 Ukuran Pemusatan


Salah satu aspek yang paling penting untuk menggambarkan distribusi
data adalah nilai pusat data pengamatan (tendensi sentral).Setiap pengukuran
aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili
nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan)
dikenal sebagai Ukuran Tendensi Sentral.
Ukuran pemusatan adalah sembarang ukuran yang menunjukkan
pusat segugus data, yang telah diurutkan dari yang terkecil sampai yang
terbesar atau sebaliknya dari yang terbesar sampai yang terkecil.Salah satu
kegunaan dari ukuran pemusatan data adalah untuk membandingkan dua
( populasi ) atau contoh, karena sangat sulit untuk membandingkan masing-
masing anggota dari masing-masing anggota populasi atau masing-masing
anggota data contoh. Nilai ukuran pemusatan ini dibuat sedemikian sehingga

II-25
cukup mewakili seluruh nilai pada data yang bersangkutan.
Ukuran pemusatan yang paling banyak digunakan adalah nilai tengah,
median, dan modus.Masing-masing dari ukuran pemusatan data tersebut
memiliki kekurangan. Nilai tengah akan sangat dipengaruh nilai
pencilan.Median terlalu bervariasi untuk dijadikan parameter
populasi.Sedangkan modus hanya dapat diterapkan dalam data dengan
ukuran yang besar.
Ukuran pemusatan sekelompok data adalah nilai atau data yang dapat
mewakili sekelompok data tersebut atau sering juga disebut rata-rata. Nilai
rata-rata pada umumnya mempunyai kecenderungan terletak di tengah-tengah
dalam suatu kelompok data yang disusun terurut atau dengan kata lain
mempunyai kecenderungan memusat. Misalkan suatu data tinggi badan
beberapa siswa (dalam cm) adalah sebagai berikut. 135 140 150 150 150 155
157 160
Dari data di atas tampak bahwa sebagian besar tinggi siswa di sekitar
150.Dengan demikian, 150 disebut ukuran pemusatan dari data tinggi badan
siswa. Ada beberapa jenis ukuran pemusatan (ukuran tendensi sentral), antara
lain mean. modus. dan median.
1. Rata-rata hitung
Merupakan pembagian antara jumlahan nilai dari keseluruhan data
dengan banyaknya data
n
∑ xi
x= i=1
n
Rata-rata hitung adalah rata-rata yang paling sering digunakan
dalam kehidupan sehari-hari.Mean atau rata-rata hitung dari sekumpulan
data adalah jumlah seluruh data dibagi banyaknya data. Mean biasanya
dilambangkan dengan Jika data terdiri atas n, yaitu x1, x2, x3, ...xn maka
mean dari data tersebut dapat dirumuskan sebasai berikut:

II-26
untuk data tunggal

Mean (rata-rata) merupakan suatu ukuran pemusatan data. Mean


suatu data juga merupakan statistik karena mampu menggambarkan
bahwa data tersebut berada pada kisaran mean data tersebut. Hati-hati
mean tidak dapat digunakan sebagai ukuran pemusatan untuk jenis data
nominal dan ordinal.
2. Rata-rata Harmonik
Misalnya ada kasus untuk mencari rata-rata kecepatan si Badu
bersepeda dari Perak ke Sukolilo sepanjang 20 km.  Kecepatan berangkat
adalah 10 km/jam dan pulangnya 20 km/jam.  Berapa rata-rata
kecepatannya ?
Jika jawabannya adalah (10 + 20)/2 = 15 km/jam, maka anda telah
salah. Yang  benar adalah :     waktu  =  (2 + 1)  =  3  jam perjalanan.  
Jarak  =  40 km/jam
Maka kecepatan = 40/3  =  13 1/3 km / jam.
3. Modus
Merupakan nilai atau data yang paling sering muncul. Modus
untuk data berkelompok : segugus pengamatan adalah nilai yang terjadi
paling sering atau yang mempunyai frekuensi paling tinggi. Modus tidak
selalu ada, hal ini bila semua pengamatan mempunyai frekuensi terjadi
yang sama. Untuk data tertentu, mungkin saja terdapat beberapa dengan
frekuensi tinggi, dan dalam hal demikian kita mempunyai lebih dari satu
modus.
Modus adalah nilai dengan frekuensi terbesar.Jika pada suatu

II-27
gugus data terdapat dua nilai frekuensi terbesar maka kedua nilai tersebut
adalah modus yang disebut dengan bimodus atau bimodal.Jika pada suatu
gugus data terdapat tiga nilai frekuensi terbesar maka ketiga nilai tersebut
adalah modus yang disebut dengan trimodus atau trimodal.
Data yang kalian peroleh biasanya bervariasi, ada yang muncul
sekali ada yang muncul lebih dari sekali.Data yang paling sering muncul
disebut modus.Modus adalah data yang paling sering muncul atau
frekuensinya paling tinggi. Pengertian lain adalah nilai data yang sering
muncul (mempunyai frekuensi terbesar). Modus dapat ada ataupun tidak
ada.Kalaupun ada dapat lebih dari satu.
Sedangkan untuk mencari modus dari data yang telah disusun
dalam bentuk distribusi frekuensi terlebih dahulu ditentukan kelas yang
menjadi kelas modus.Kelas Modus adalah kelas yang mempunyai
frekuensi paling tinggi, lalu nilai modus ditentukan menggunkan rumus
berikut ini :

B1 = Batas bawah kelas modus.


d1 = Selisih antara frekuensi kelas modus dengan frekuensi kelas yang
mendahuluinya.
d1 = Selisih antara frekuensi kelas modus dengan frekuensi kelas
berikutnya.
c = Lebar kelas modus.
Modus merupakan ukuran pemusatan data sama seperti dengan
mean dan median. modus memiliki kelebihan dibandingkan dua ukuran
pemusatan sebelumnya mean dan modus yaitu bisa digunakan untuk
semua jenis data. Hanya Modus yang dapat dijadikan sebagai ukuran
pemusatan data yang jenis kategori/nominal. Cara menentukan modus
amat sangat mudah hanya dengan mengamati data yang paling sering

II-28
muncul
4. Median
Median Merupakan setengah dari data, salah satu ukuran
pemusatan yang sering digunakan.Median dari segugus data yang telah
diurutkan dari yang terkecil sampai yang terbesar atau dari terbesar
sampai terkecil adalah pengamatan yang tepat di tengah-tengah bila
banyaknya pengamatan itu ganjil, atau rata-rata kedua pengamatan yang
di tengah bila banyaknya pengamatan genap.
Median adalah nilai yang terletak di tengah dari data yang
terurut.Jika banyak data ganjil, median adalah nilai paling tengah dari
data yang sudah diurutkan. Jika banyak data genap, median adalah mean
dari dua bilangan yang di tengah setelah data diurutkan.
Median adalah salah satu ukuran pemusatan data, yaitu, jika
segugus data diurutkan dari yang terkecil sampai yang terbesar atau yang
terbesar sampai yang terkecil, nilai pengamatan yang tepat di tengah-
tengah bila jumlah datanya ganjil, atau rata-rata kedua pengamatan yang
di tengah bila banyaknya pengamatan genap. Dan median dari suatu
kumpulan nilai adalah sebuah nilai yang membagi 2 kumpulan nilai
tersebut .sehingga setengah dari nilai-nilai itu (atau lebih) sama dengan
atau kurang dari nilai atau median itu dan setengah dari besar atau sama
dengan nilai itu.
Median adalah nilai tengah setelah data terurut naik. Pengeritan
lain adalah nilai tengah dari data yang telah diurutkan menurut besarnya.
Dengan ketentuan: Jika banyak data ganjil, maka median adalah nilai
tengah dari data yang telah diurutkan.
setelah disortir dengan cara :
a. Susun data mulai yang terkecil
b. Jika banyak data ganjil, median adalah yang paling tengah
c. Jika banyak data genap, median adalah rata-rata data tengah
5. Variansi
Varians didefinisikan sebagai rata-rata dari skor penyimpangan

II-29
kuadrat. Untuk mencari varians, dibedakan antara varians populasi yang
dilambangkan dengan (σ2) dengan varians sample yang dilambangkan
dengan (s2).

Dimana:
µ = rata-rata populasi
N = total jumlah populasi
Adapun varians untuk sample dapat dicari dengan rumus yang sama
namun mengurangkan N dengan 1 sebagai berikut:

Dimana :
s = rata-rata sample
n = jumlah sampel yang digunakan
Berbicara tentang standar deviasi atau simpangan baku dalam
bahasa Indonesia tidak bisa lepas dari varians. Hal ini karena standar
deviasi adalah akar kuadrat dari varians atau sebaliknya, varians adalah
kuadrat dari standar deviasi.
Selain rumus di atas, kita juga dapat menggunakan rumus-rumus
lain untuk mencari varians.Pada dasarnya, pemilihan rumus yang
digunakan tergantung pengguna yang merasakan rumus manakah yang
paling mudah digunakan. Rumus-rumus yang lain tersebut diantaranya
adalah:

variansi merupakan salah satu ukuran sebaran yang paling sering

II-30
digunakan dalam berbagai analisis statistika. Standar deviasi merupakan
akar kuadrat positif dari variansi. Berbicara tentang standar deviasi atau
simpangan baku dalam bahasa Indonesia tidak bisa lepas dari varians. Hal
ini karena standar deviasi adalah akar kuadrat dari varians atau
sebaliknya, varians adalah kuadrat dari standar deviasi.Varians adalah
kuadrat dari standar deviasi.Salah satu ukuran variabilitas (measure of
dispersion) yang paling sering digunakan jika data yang diukur berskala
interval adalah varians.
6. Simpangan Baku
Simpangan baku adalah ukuran simpangan yang paling banyak
digunakan dalam statistika.
Rumus:

Jika data sampel telah disusun dalam daftar disekitar frekuensi,


maka s2 dihitung berdasarkan:

7. Kuartil, desil dan persentil


Jika median adalah harga yang membagi distribusi data menjadi
dua bagian yang sama, maka kuarti (K) adalah harga yang membagi
distribusi data menjadi 4 bagian yang sama, sehingga terdapat tiga harga
kuartil I,II, dan III. Kuartil II berimpit/ sama dengan menghitung median,
kuartil I dan III adalah mediab dari bsgian data pertama dan kedua setelah
median seluruh ditentukan. 
Untuk menetukan nilai kurtil, desil maupun persentil,maka
langkah mengerjakannya sama dengan cara ketika kita menetapkan nilai
median, begitupun dengan rumusnya. Adapaun perbedaanya hanya pada
nilai yang dikalikan dengan N. jika pada median digunakan1/2 N maka
pada kuartil 1 nilai ½ N yang ada pada rumus diubah menjadi 1/4N dan
pada kuartil ke 2 menjadi 2/4N sedangkan pada kuartil ke 3 menjadi3/4N.

II-31
Adapaun untuk menetapkan nilai Desil 1 menjadi 1/10N, dan desil 7
menjadi 7/10N. Untuk menetapkan persenti 5 menjadi 5/100N dan desil
60 menjadi 60/100N
Untuk penyelesaian data berkelompok, beberapa langkah yang
harus dilakukan adalah :
a. Menentukan letak data kuartil untuk data berkelompok.
b. Melakukan interpolasi untuk mengetahui nilai kuertil dengan rumus
sebagai berikut :
(i. n/ 4 )−Cf
NK i =L+ .Ci
Fk
Desil (D) adalah harga-harga yang membagi data menjadi 10
bagian maka ada 9 harga desil. Letak/harga desil yang ke 5 sama dengan
median prinsip cara harga desil yang lain menghitungnya sama dengan
menghitung median.
Untuk mencari nilai desil data berkelompok, ada beberapa langkah
yaitu :
a) Menentukan letak desil dalam data yang sudah berbentuk distribusi
frekuensi.
b) Menentukan nilai desil dengan melakukan interpolasi dengan rumus
sebagai berikut :
(in/10 )−Cf
NDi =L+ . Ci
Fk
Persentil (P) adalah harga-harga yang membagi distribusi data menjadi
100 bagian maka ada 99 harga persentil.
Untuk mencari nilai Persentil data berkelompok ada beberapa
langkah yang harus dilakukan yaitu :
a. Menentukan letak Persentil dalam dat yang sudah
terdistribusi frekuensinya.
b. Menentukan nilai Persentil dengan melakukan
interpolasi dengan rumus sebagai berikut :

II-32
(in/10 )−Cf
NPi = . Ci
Fk

Selain ketiga ukuran pemusatan data di atas, terdapat beberapa

ukuran pemusatan lagi.Salah satunya adalah kuartil. Kuartil adalah nilai

ukuran yang membagi data yang sudah terurut menjadi empat bagian

yang sama. Contoh suatu data terurut seperti berikut.bawah (Q1), batas

pengelompokan kedua disebut kuartil tengah (Q2), dan batas

pengelompokan ketiga disebut kuartil atas (Q3).

Data yang terdapat pada batas pengelompokan pertamadisebut

kuartil bawah (Q1), batas pengelompokan kedua disebut kuartil tengah

(Q2), dan batas pengelompokan ketiga disebut kuartil atas (Q3).

 
Banyak contoh di sekitar kita yang secara langsung telah menggunakan
metode statistika dalam melaksanakan tugas sehari-hari. Seorang
karyawan/karyawati sebuah bank, setiap hari memasang table nilai kurs mata uang
asing terhadap nilai rupiah. Apabila daftar tersebut ditulis setiap hari selama dua
bulan misalnya maka kita dapat mengetahui naik turunnya nilai kurs mata uang
asing terhadap nilai rupiah selama dua bulan.

II-33
Contoh diatas adalah penggunaan dari metode statistika secara sederhana
yang dapat kita lihat pada kehidupan sehari-hari. Sebenarnya penggunaan metode
statistika yang lebih lanjut telah dimulai sejak tahun 1880 oleh F. GOLTON.
Untuk pertama kalinya di melakukan pengukuran korelasi dalam penyelidikan
biologi. Pada saat itu penggunaan metode statistika dalam bidang biologi dan ilmu
social belum lazim dilakukan oleh orang. Bahkan pada akhir abad ke 19,
kecaman-kecaman pedas sering dilontarkan pada Karl Pearson yang mempelopori
penggunaan metode statistika dalam berbagai penelitian ilmu biologi serta ilmu-
ilmu lainnya. Kini, lebih kurang satu abad tidak ada seorang sarjana peneliti yang
menyangkal betapa pentingnya metode statistika untuk penelitian ilmiah.
Andaikan kita ingin meneliti kemampuan siswa kelas 3 program ilmu
socialse-Jawa Tengah dalam penguasaannya terhadap mata pelajaran metematika
maka seluruh siswa kelas 3 program social yang akan kita teliti atau keseluruhan
objek penelitian dinamakan populasi. Sebagian dari populasi yang dapat mewakili
populasi dinamakan sample. Dengan demikian sampledisini harus memiliki sifat
ataupun cirri-ciri dari populasi nya.
Seorang peneliti karena keterbatasan tenaga, biaya, dan waktu. Tidaklah
mungkin dapat meneliti keseluruhan objek penelitian. Apabila keseluruhan objek
penelitian tersebut sangat besar maka akan sangat menguntungkan dan juga tidak
mengurangi makna dari penelitian tersebut. Tetapi jika hanya mengambil sebagian
dari seluruh objek penelitian, ada metode tersendiri tentang bagaimana cara
pengambilan sample tersebut sehingga sample yang diambil dapat benar-benar
memiliki ciri atau sifat dari populasinya., hasilnya akan tetap dan dapat
dipertanggungjawabkan.
Pada awalnya “statistik”berasal dari kata state yang artinya
Negara.Mengapa disebut Negara?karena sejak dahulu statistik hanya digunakan
untuk kepentingan-kepentingan Negara saja.Juga state dapat berarti himpunan
angka-angka,kemudian berkembang bahwa setiap angka disebut statum dan
lambat laun menjadi”stato”sampai akhirnya menjadi statistik.Selanjutnya statistik
diartikan sebagai besaran dalam sampel dapat memberikan informasi mengenai

II-34
suatu gejala atau fenomena.Besaran dalam sampel ini digunakan untuk menaksir
parameter populasi.
Statistika bermula sebagai suatu cara berhitung untuk membantu
pemerintah yang ingin mengetahui kekayaan rakyatnya dan usaha untuk menarik
pajak. Kita mengetahui bahwa Kaisar Agustus pernah mengeluarkan dekrit bahwa
semua daerah harus dikenai pajak. Akibatnya ia mengharuskan setiap orang
melapor kepada statistikawan terdekat, yaitu ketika itu adalah pengumpul pajak.
William si penakluk memerintahkan diadakannya survey di seluruh Inggris untuk
tujuan pajak dan tugas kemiliteran.Hasil survey ini dikumpulkan dalam sebuah
kumpulan yang disebut DomesdayBook.
Pada hakekatnya statistika adalah suatu konsep eksperimen yang
bertujuan untuk efisiensi waktu, tenaga dan biaya, serta memperoleh hasil yang
optimal.Eksperimen lahir karena adanya usaha manusia untuk memenuhi
dorongan rasa keingin tahuan terhadap dunia sekitarnya.Eksperimen adalah
penggunaan metode ilmiah secara formal dan sistematis untuk menyelesaikan
masalah.
Berangkat dari kondisi di atas, dengan perkembangan daya pikir dan
kondisi lingkungan masyarakat yang permasalahannya semakin kompleks dimana
timbul kendala yang serius dalam mengolah dan mencari informasi dari apa yang
disajikan oleh lingkungan disekitarnya mendorong timbulnya konsep matematis
yang lebih teratur dalam pengolahan data. Dimulai dengan sensus penduduk di
Amerika Serikat, mulailah digunakan suatu konsep manajemen data yang lebih
sistematis karena masalah yang dihadapai pada saat itupun membutuhkan hal
yang demikian.Selanjutnya, konsep tersebutpun digunakan pada bidang-bidang
lain seperti keuangan, industri dan sebagainya.
Lebih lanjut, konsep manajemen data pun mulai diterapkan dalam
bangku pendidikan khususnya untuk tingkatan institusi yang bertujuan untuk
melatih dan mendidik mahasiswa dalam mengolah data untuk memperoleh
informasi yang akurat dan relevan sebagai faktor pendukung utama dalam
melakukan penelitian atau pengukuran ilmiah.

II-35
II-36

Anda mungkin juga menyukai