BAB I
PENDAHULUAN
1. Peranan Statistika
Disadari atau tidak, statistik banyak digunakan dalam kehidupan sehari-hari.
Pemerintah menggunakan statistik untuk menilai hasil pembangunan masa lalu dan
merencanakan masa depan. Dunia survei dan penelitian, di mana pun itu terjadi, tidak
hanya mendapat banyak manfaat dari statistik, tetapi juga sering harus
menggunakannya. Evaluasi statistik melalui studi laboratorium atau lapangan
diperlukan untuk menentukan apakah metode yang baru ditemukan lebih unggul dari
metode konvensional.
Evaluasi statistik melalui studi laboratorium atau lapangan diperlukan untuk
menentukan apakah metode yang baru ditemukan lebih unggul dari metode
konvensional. Apakah model dapat diadopsi untuk apa pun harus dipertimbangkan
dalam teori statistik. Statistik juga dapat menentukan apakah faktor dipengaruhi atau
dipengaruhi oleh faktor lain. Jika ada hubungan antar faktor, seberapa kuat hubungan
tersebut?Dapatkah satu faktor dipertahankan dan hanya faktor lain yang
dipertimbangkan untuk dipelajari lebih lanjut?
Pengantar singkat di muka akan memberi Anda gambaran tentang kebutuhan aktual
akan statistik, atau setidaknya penerapan metode ini. Dengan pemikiran ini, bab-bab
berikut tidak akan fokus pada statistik teoretis tetapi pada teknik statistik yang dapat
digunakan dalam berbagai disiplin ilmu dan disiplin ilmu.
Data yang bukan kuantitatif disebut data kualitatif. Ini tiada lain daripada data
yang dikategorikan menurut lukisan, kualitas objek yang dipelajari. Golongan ini
dikenal pula dengan nama atribut.
4. POPULASI DAN SAMPEL
Jumlah semua nilai yang mungkin, hasil perhitungan atau pengukuran,
kuantitatif atau kualitatif, untuk sifat tertentu dari semua anggota himpunan yang
lengkap dan pasti yang sifat-sifatnya diperiksa, disebut populasi. Bagian yang
diambil dari suatu populasi disebut sampel. Sampel harus representatif dalam
arti bahwa semua karakteristik populasi tercermin dalam sampel dari mana ia
diambil.
Sensus tidak selalu memungkinkan karena populasi tidak terbatas atau tidak
terbatas. Grup seperti ini disebut grup tak hingga. Lotre satu koin terus
menghasilkan populasi tak terbatas. Pemahaman ini sebenarnya hanya
konseptual untuk memudahkan teori grup titik lain, yaitu aliran grup berhingga
dengan jumlah anggota berhingga.
Pelajar di seluruh Indonesia, banyak sistem transportasi umum Indonesia, dan
populasi dunia adalah contoh populasi yang tak terbatas. Fase statistik yang
hanya mencoba menggambarkan dan menganalisis kelompok
Ini disebut statistik deskriptif tanpa menarik kesimpulan tentang populasi atau
kelompok yang lebih besar.
5. PENGUMPULAN DATA
Untuk statistika induktif diperlukan statistika deskriptif yang benar dan untuk hal
terakhir ini diperlukan data-data harus betul-betul “jujur”, yakni kebenarannya harus
dapat dipercaya. Proses pengumpulan data dapat dilakukan dengan jalan sensus
atau sampling titik untuk kedua hal, sensus maupun sampling, banyak Langkah yang
dapat ditempuh dalam usaha mengumpulkan data, antara lain:
a. Mengadakan penelitian langsung ke lapangan atau di laboratorium terhadap
objek penelitian. Hasilnya dicatat untuk kemudian dianalisis.
b. Mengambil atau menggunakan, sebagian atau seluruhnya, dari sekumpulan data
yang telah dicatat atau dilaporkan oleh badan atau orang lain.
c. Mengadakan angket.
6. PEMBULATAN ANGKA
Aturan 1: jika angka terkiri dari yang harus dihilangkan 4 atau kurang, maka angka
tekanan dari yang mendahuluinya tidak berubah.
Contoh : Rp 59.376.402,96 dibulatkan hingga jutaan rupiah menjadi Rp 59 juta.
Aturan 2 : jika angka terkiri dari yang harus dihilangkan lebih dari 5 atau 5 diikuti oleh
angka Bukan nol, maka angka terkanan dari yang mendahuluinya bertambah dengan
satu.
Contoh : 6.948 kg, dibulatkan hingga ribuan akan menjadi 7 ribu kg.
Aturan 3 : jika angka terkiri dari yang harus dihilangkan hanya angka 5 atau 5 yang
diikuti oleh angka angka nol belaka, maka angka terkanan dari yang mendahuluinya
tetap Jika ia genap, tambah 1 Jika ia ganjil.
Contoh : bilangan 8,5 atau 8500 menjadi 8 jika dibulatkan teliti hingga satuan. Angka
yang harus dihilangkan masing-masing 5 dan 500 sedangkan yang mendahuluinya
adalah genap, yakni 8. Jadi harus tetap 8.
Aturan 3 disebut aturan genap terdekat yang diambil untuk membuat
keseimbangan antara pembulatan ke atas dan pembulatan ke bawah, jika yang harus
dihilangkan itu terdiri atas angka 5 atau 5 diikuti oleh hanya angka-angka nol.
7. PEMERIKSAAN TERHADAP DATA
Sebelum data diolah lebih lanjut, lakukanlah pemeriksaan kembali terhadap data
itu! Ini perlu Untuk menghindarkan terjadinya hal-hal yang tidak diinginkan misalnya
kekeliruan ataupun ketidakbenaran tentang data.
Periksalah Apakah ada data yang meragukan; dan jika ini terjadi cepatlah
diyakinkan kebenarannya. Demikian pula, periksalah Apakah semua pertanyaan
dalam angket sudah diisi oleh responden. Jika terdapat yang kosong, usahakan untuk
melengkapinya.
BAB II
PENYAJIAN DATA
1. PENDAHULUAN
Ada dua cara penyajian data yang sering dipakai, yaitu : tabel/grafik dan
grafik/diagram.
Macam-macam daftar yang dikenal :
a. Daftar baris kolom
b. Daftar kontigensi
c. Daftar distribusi frekuensi
Sedangkan diagram yang akan diuraikan disini, yaitu :
a. Diagram batang
b. Diagram garis
c. Diagram lambang atau diagram simbul
d. Diagram pastel dan diagram lingkaran
e. Diagram peta atau kartogram
f. Diagram pencar atau diagram titik
Gambar 2.2.1
Gambar 2.2.2 Luas daerah Indonesia dalam km2 Tahun 1962
Gambar 2.2.3 Pembelian barang-barang dalam jawatan A dalam ribuan unit dan jutaan rupiah 1965-
1967
Gambar 2.2.4 Keadaan pegawai di jawatan A menurut jenis kelamin, pendidikan, dan pengalaman
tahun 1980
Gambar 2.2.5 Banyak murid sekolah di daerah A menurut tingkat sekolah dan jenis kelamin Tahun
1970
Gambar 2.2.6 Banyak murid sekolah di daerah A menurut tingkat sekolah dan jenis kelamin Tahun
1970
Jika data kuantitatif dibuat menjadi
beberapa kelompok, maka akan diperoleh
daftar distribusi frekuensi. Sebuah contoh
adalah seperti sebagai berikut :
3. DIAGRAM BATANG
Sumbu datar dibagi menjadi beberapa skala bagian yang sama; demikian
pula sumbu tegaknya. Jika diagram dibuat tegak, maka sumbu datar dipakai
untuk menyatakan waktu.
Gambar 2.3.1 Banyak murid di daerah A menurut tingkat sekolah dan jenis kelamin
Gambar 2.3.2
Gambar 2.3.3
Jika jenis kelamin juga digambarkan, maka terdapat diagram batang dua
komponen. Bentuk yang tegak adalah deperti ini :
Gambar 2.3.4
Supaya jumlah murid ikut tergambarkan, maka dapat dibuat diagram batang
tiga komponen, seperti :
Gambar 2.3.5
Untuk kategori berlawanan, seperti data diatas, dapat juga dibuat diagram
batang dua arah.
Gambar 2.3.6
Untuk satu kesatuan kumpulan data yang terdiri atas beberapa bagian,
diagram batangnya sering digambarkan seperti :
Gambar 2.3.7
4. DIAGRAM GARIS
Untuk menggambarkan keadaan yang serba terus atau berkesinambungan,
misalnya produksi tiap tahun, jumlah penduduk tiap tahun, keadaan temperatur
badan tiap jam, dll., dibuat diagram garis. Contoh :
Jika nilai data terkumpul sekitar harga yang cukup besar sehingga
diagramnya cukup jauh dari sumbu horizontal, maka lebih baik dilakukan
loncatan atau pemutusan sumbu tegak. Sebuah contoh ialah seperti pada
(Gambar 2.4.4) berikut.
Gambar 2.4.4
Gambar 2.2.4 kurang baik, karena garis horizontal kelihatan cukup jauh dari
sumbu datar. Jika digambarkan dengan loncatan sumbu tegak akan didapat
seperti Gambar 2.4.5 berikut :
Gambar 2.4.5
Gambar 2.4.5 diambil dari gambar 2.4.4 yang nampak bahwa seolah-olah
kertas pada skala 9000 disobek, dibuang sebagian antara 0 dan 9000, lalu
didekatkan. Cara lain untuk memperbaiki Gambar 2.4.4 adalah dengan
memutuskan sumbu tegaknya saja. Hasilnya seperti dalam gambar 2.4.6 berikut
:
Gambar 2.4.6
Sebuah contoh, berikut adalah data hasil usaha yang telah dilakukan oleh A
dan B selama 1974-1980 :
Gambar 2.4.8
Variasi bentuk dalam lingkaran seperti gambar 2.5.2 disebut diagram pastel.
6. DIAGRAM LAMBANG
Sering dipakai untuk mendapatkan gambaran kasar sesuatu hal dan sebagai
alat visual bagi orang awam. Gambar berikut merupakan contoh untuk
melukislakn pegwai di berbagai jawatan :
Gambar 2.6.1
Gambar 2.6.2
Gambar 2.7.1
Gambar 2.7.2 melukiskan penempatan transmigran dari Jawa Barat ke
Kalimantan selama periode 1951-1972/1973. Dihitung banyak jiwa yang
ditransmigrasikan, datanya dapat dibaca di atas gambar kepala orang.
Gambar 2.7.2
8. DIAGRAM PENCAR
Untuk kumpulan data yang terdiri atas dua variabel, dengan nilai kuantitatif,
diagramnya dapat dibuat dalam sistem sumbu koordinat dan gambarnya akan
merupakan kumpulan titik-titik yang terpencar.
Gambar 2.8.1
BAB III
DAFTAR DISTRIBUSI FREKUENSI DAN GRAFIKNYA
1. PENDAHULUAN
Urutan kelas interval disusun mulai dari data terkecil terus ke bawah
sampai nilai data terbesar. Bilangan-bilangan di sebelah kiri kelas interval
disebut ujung bawah dan bilangan-bilangan di sebelah kanannya disebut
ujung atas. Selisih positif antara tiap dua ujung bawah berurutan disebut
panjang kelas interval. Dalam gambar 3.1.1 panjang kelasnya disingkat
dengan p, adalah 10, jadi p = 10 dan semuanya sama.
Selain dari ujung kelas interval, ada juga yang disebut batas kelas interval
yang bergantung pada ketelitian data yang digunakan. Jika dicatat teliti
hingga satuan, maka batas bawah kelas sama dengan ujung bawah
dikurangi 0,5. Untuk data dicatat hingga satu desimal, batas bawah sama
dengan ujung bawah dikurangi 0,05 dan batas atas sama dengan ujung atas
ditambah 0,05. Untuk perhitungan nanti,dari tiap kelas interval bisa diambil
sebuah nilai wakil kelas itu. Yang digunakan disini ialah tanda kelas interval
yang didapat menggunakan aturan :
Gambar 3.2.1
Jika ujung bawah kelas pertama diambil sama dengan data terkecil, yakni
35, maka daftarnya menjadi seperti :
Gambar 3.1.1 dan gambar 3.2.2 keduanya dapat digunakan. Tetapi,
gambar 3.2.2, kelas interval terakhir (95-104), melebihi nilai yang biasa
diberikan, yaitu 100. Oleh karena itu, gambar 3.1.1 lebih baik digunakan.
Gambar 3.2.2 Nilai ujian statistika untuk 80 mahasiswa
Kelas terbuka terjadi pada kelas pertama, kedua, dan atau terakhir. Kelas
terbuka ini dibuat apabila tidak cukup banyak pengamatan yang akan
terdapat
jika interval itu dibuat tertutup dan jika data
ekstrim tidak diketahui atau tidak perlu
diperhatikan.
Gambar 3.2.3.
Banyak siswa di daerah A menurut umur dalam tahun
Bentuk frekuensi, absolut, dan relatif dapat disajikan dalam sebuah daftar,
seperti :
Contoh : Daftar berikut menyatakangaji bulanan untuk 135 pegawai yang terdapat pada
suatu daerah.
Kelas-kelas interval pertama hingga keempat panjangnya sama, yaitu 1000. Kelas
interval kelima dan keenam masing-masing 4000 dan 500.
Diagram untuk data yang telah tersusun dalam daftar distribusi frekuensi
kumulatif, bentuknya akan berlainan dengan diagram-diagram diatas. Untuk
data dalam gambar 3.3.3, yakni daftar kumulatif kurang dari dan lebih dari,
diagramnya dapat dilihat seperti :
Gambar 3.4.5
Untuk gambar diatas, semua frekuensi bernilai absolut.
5. MODEL POPULASI
Poligon frekuensi yang merupakan garis patah-patah dapat didekati oleh
sebuah lengkungan halus yang bentuknya se-cocok mungkin dengan bentuk
poligon tersebut. Lengkungan yang di dapat dinamakan kurva frekuensi.
Untuk poligon frekuensi dalam gambar 3.1.1 misalnya. Kurva frekuensinya
digambar dengan garis tebal, seperti :
Gambar 3.5.1
Kurva ini merupakan model populasi yang akan ikut menjelaskan ciri-ciri
populasi. Dalam praktiknya, model populasi ini biasanya diturunkan dari kurva
frekuensi yang diperoleh dari sampel representatif yang diambil dari populasi
itu.
Pada saat sekarang, hanya akan diberikan bentuk kurva untuk model
populasi yang sering dikenal, yaitu model normal, simetrik, positif (miring ke
kiri), negatif (miring ke kanan), bentuk J dan U.
Gambar 3.5.2
Untuk gambar-gambar diatas, kita kenal :
(A) Model normal, yang sebenarnya akan lebih tepat digambarkan
berdasarkan persamaan matematikanya. Bentuk model normal selalu
simetrik dan mempunyai sebuah puncak. Kurva dengan sebuah puncak
disebut unimodal.
(B) Model simetrik juga unimodal. Perhatikan bahwa model normal selalu
simetrik tetapi tidak sebaliknya.
Kurva untuk model miring, positif, ataupun negatif, dapat dilihat dalam
gambar 3.5.3 berikut :
Gambar 3.5.3
Model positif menggambarkan bahwa terdapat sedikit gejala yang bernilai
makin besar. Sedangkan model negatif terjadi sebaliknya.
Gambar 3.5.4
Kedua gambar di atas memperlihatkan fenomena yang modelnya
berbentuk J. Ini banyak terdapat dalam dunia ekonomi, industri, dan fisika.
1. PENDAHULUAN
Dalam bab ini, akan diuraikan tentang ukuran gejala pusat dan ukuran
letak. Beberapa macam ukuran dari golongan pertama ialah : rata-rata atau
rata-rata hitung, rata-rata ukur, rata-rata harmonik, dan modus. Golongan
kedua meliputi
: median, kuartil, desil, dan persentil.
Ukuran yang dihitung dari kumpulan data dalam sampel dinamakan
statistik. Apabila ukuran itu dihitung dari kumpulan data dalam populasi atau
dipakai untuk menyatakan populasi, maka namanya parameter.
∑ 𝑓𝑖𝑥𝑖 1036
𝑥= ∑ 𝑓𝑖 = 16 = 64.6
Gambar 4.2.1
Nilai rata-rata ujian statistika untuk ke-16 mahasiswa tersebut adalah 64,6.
Rumus 4.2 disebut pula rumus rata-rata diboboti yang sering dipakai untuk
memperbaiki rata-rata yang dihitung oleh rumus 4.1.
Contoh : Data berikut merupakan daftar barang yang disimpan di gudang, diantaranya
terdapat yang rusak
Gambar 4.2.2
Jika rata-rata persen barang yang rusak dihitung dengan (Rumus 4.1), maka :
96 + 92 + 80 + 60
𝑥= % = 66,75%
4
328
Tetapi, barang yang rusak ada 328 dari 540. Ini berarti × 100% =
540
60,07%. Hasil ini akan didapat menggunakan
(Rumus 4.2) sebagai berikut :
∑ 𝑓𝑖 = 540
∑ 𝑓𝑖𝑥𝑖 = 328
Sehingga,
∑ 𝑓𝑖𝑥𝑖 328
𝑥= × 100% = ×100% = 60,67
∑ 𝑓𝑖 540
Gambar 4.2.1
Rata-rata terdapat 60,67% barang yang rusak.
Selanjutnya, kita juga dapat menentukan rata-rata gabungan, yaitu rata-
rata dari beberapa sub sampel lalu dijadikan satu. Kalau ada k buah sub
sampel masing-masing dengan keadaan berikut :
Sub sampel 1 : berukuran n1 dengan rata-rata 𝑥1
Sub sampel 2 : berukuran n2 dengan rata-rata 𝑥2
.....................................................................
Sub sampel k : berukuran nk dengan rata-rata 𝑥k
Maka rata-rata gabungan dari k buah sub sampel itu dihitung dengan (Rumus
4.3) :
Contoh : Tiga sub sampel masing-masing berukuran 10, 6, dan 8. Sementara rata-ratanya
masing-masing 145, 118, dan 162
145+118+162
Adalah salah jika perhitungan dengan Rumus 4.1, yaitu : 𝑥 = =
3
141,7.
Yang benar, harus dihitung dengan Rumus 4.3, yaitu :
(10)(145)+(6)(118)+(8)(162)
𝑥= 3 = 143,9
Untuk data yang telah disusun dalam daftar distribusi frekuensi, rata-
Rumus 4.5
Yaitu akar pangkat n dari produk (x1, x2, ..., xn)
Contoh : Rata-rata ukur untuk data x1 = 2, x2 = 4, x3 = 8 adalah 𝑈 = 3√2 × 4 × 8 = 4
Contoh : penduduk Indonesia pada akhir tahun 1946 ada 60 juta sedangkan akhir tahun
1956 mencapai 78 juta. Untuk menentukan laju rata-rata pertumbuhan penduduk tiap
tahun kita pakai Rumus 4.7 dengan t = 10, P0 = 60, dan Pt = 78.
𝑥
Maka didapat 78 = 60 ( 1 +
100 )10 ;
𝑥
Atau log 78 = log 60 + 10 log ( 1 +
100 10
)
Atau ( 1 + 10
𝑥
)10 = 1,0627 𝑥 = 2,67
0
5. MODUS
Untuk menyatakan fenomena yang paling banyak terjadi (Mo). Jika data
kuantitatif telah disusun dalam daftar distribusi frekuensi, modusnya dapat
ditentukan dengan (Rumus 4.9) :
Dengan
b = batas bawah kelas modal, ialah kelas interval dengan frekuensi
terbanyak
p = panjang kelas modal
b1 = frekuensi kelas modal dikurangi frekuensi kelas interval dengan
tanda kelas yang lebih kecil sebelum tanda kelas modal
b2 = frekuensi kelas modal dikurangi frekuensi kelas interval dengan
tanda kelas yang lebih besar sesudah tanda kelas modal
6. MEDIAN
Jika banyak data ganjil, maka median Me, setelah
data disusun menurut nilainya, merupakan data paling tengah. Untuk sampel
berukuran genap, setelah data disusun menurut urutan nilainya, mediannya
sama dengan rata-rata hitung dua data tengah.
Untuk data yang telah disusun dalam daftar distribusi frekuensi, mediannya
dihitung dengan (Rumus 4.10) :
Dengan
b = batas bawah kelas median, ialah kelas dimana median akan
terletak p = panjang kelas median
n = ukuran sampel atau banyak data
F = jumlah semua frekuensi dengan tanda kelas lebih kecil dari tanda
kelas median
F = frekuensi kelas median
Rumus 4.11
Untuk data yang telah disusun dalam
daftar distribusi frekuensi, kuartil Ki ( i = 1, 2, 3)
dihitung dengan (Rumus 4.12) :
Dengan
b = batas bawah kelas Ki, ialah kelas interval dimana Ki terletak
p = panjang kelas Ki
F = jumlah frekuensi dengan tanda kelas lebih kecil dari tanda kelas
Ki f = frekuensi kelas Ki
Jika kumpulan data itu dibagi menjadi 10 bagian yang sama, maka
didapat sembilan pembagi dan tiap pembagi dinamakan desil (D1, D2, D3, .....,
D9). Ditentukan oleh (Rumus 4.13) :
Dengan
b = batas bawah kelas Di, ialah kelas interval di mana Di akan terletak
p = panjang kelas Di
F = jumlah frekuensi dengan tanda kelas lebih kecil dari tanda kelas
Di f = frekuensi kelas Di
Sekumpulan data yang dibagi menjadi 100 bagian yang sama, akan
menghasilkan 99 pembagi yang berturut-turut dinamakan persentil pertama,
persentil kedua, , persentil ke-99. Simbol yang digunakan berturut-turut ialah
P1, P2, P3, P99).
Rumus 4.15
Sedangkan nilai Pi untuk data dalam daftar
distribusi frekuensi dihitung dengan :
Rumus 4.16
Dengan
b = batas bawah kelas Pi, ialah kelas interval dimana Pi berada
p = panjang kelas Pi
F = jumlah frekuensi dengan tanda kelas lebih kecil dari tanda kelas
Pi f = frekuensi kelas Pi
BAB V
UKURAN SIMPANGAN, DISPERSI, DAN VARIASI
1. PENDAHULUAN
Kecuali ukuran gejala pusat dan ukuran letak, masih ada lagi ukuran lain,
yaitu ukuran simpangan atau ukuran dispersi. Ukuran ini kadang-kadang
dinamkan pula ukuran variasi, yang menggambarkan bagaimana
berpencarnya data kuantitatif. Beberapa ukuran dispersi yang terkenal dan
akan diuraikan disini, yaitu : rentang, rentang antar kuartil, simpangan kuartil
atau rata-rata deviasi, simpangan baku atau deviasi standar, varians, dan
koefisien variasi.
Simpangan kuartil atau deviasi kuartil atau disebut juga rentang semi
antar kuartil, harganya setengah dari rentang antar kuartil. Jadi, jika
simpangan kuartil disebut dengan SK, maka :
1
SK = ( K3 – K1 )
2
3. RATA-RATA SIMPANGAN
4. SIMPANGAN BAKU
Ukuran simpangan yang paling banyak digunakan ialah simpangan baku
atau deviasi standar. Pangkat dua dari simpangan baku dinamakan varians.
Untuk sampel, simpangan baku diberi simbol s, sedangkan untuk populasi
diberi simbol 𝜎 (baca : sigma). Variansnya tentulah s2 untuk varians sampel
dan
𝜎2 untuk varians populasi. Jelasnya, s dan s2 merupakan statistik, sedangkan
𝜎 dan 𝜎2 merupakan parameter.
Jika data dari sampel telah disusun dalam daftar distribusi frekuensi,
maka untuk menentukan varians s2 dipakai rumus :
Cara singkat atau cara sandi dapat digunakan untuk menghitung varians,
sehingga perhitungan akan lebih sederhana. Rumus-rumusnya adalah :