Statistik inferensial adalah statistik yang digunakan untuk menganalisis data sampel dan
hasilnya akan digeneralisasikan untuk populasi di mana sampel diambil. Selanjutnya statistik
inferensial dapat dibedakan menjadi statistik parametris dan non parametris. Statistik
parametris digunakan untuk menganalisis data interval atau rasio yang diambil dari populasi
yang berdistribusi normal. Sedangkan statistik non-parametris digunakan untuk menganalisis
data nominal dan ordinal dari populasi yang bebas distribusi.
STATISTIK DESKRIPTIF
A. Data Statistik
Menurut Sumber dan Pengguna
1. Data Internal, yaitu data yang menggambarkan keadaan atau kegiatan suatu badan yang
dikumpulkan sendiri dan hasil datanya digunakan oleh badan itu sendiri.
Contoh:
– Data pengeluaran keuangan untuk membayar biaya produksi perusahaan tekstil
– Data hasil produksi pabrik mie “sedaap”
2. Data Eksternal, yaitu data yang menggambarkan keadaan atau kegiatan di luar badan dan
data tersebut tidak terdapat dalam aktivitas intern suatu badan.
Contoh:
– Bagi perusahaan “LG”, data daya beli masyarakat terhadap barang produksinya (seperti
TV “Turbo Swing”) adalah data eksternal perusahaan tersebut
– Data tingkat kepuasan masyarakat terhadap barang produksi menjadi tolok ukur dalam
mengembangkan daerah pemasaran
1. Data Primer, yaitu data yang dikumpulkan dan diolah sendiri oleh suatu badan secara
langsung serta diterbitkan oleh badan itu pula. Contoh: sensus penduduk oleh BPS,
dihasilkan data primer langsung dari penduduk.
2. Data Sekunder, yaitu data yang dilaporkan oleh suatu badan sedang badan ini tidak secara
langsung mengumpulkan sendiri tapi diperoleh dari pihak lain yang telah
mengumpulkannya. Contoh: data kenaikan atau penurunan nilai tukar rupiah terhadap mata
uang asing dari BEJ
Menurut Sifat
1. Data Kualitatif, yaitu kemungkinan observasi yang tidak dinyatakan dengan angka-angka.
Contoh: nilai rupiah sangat kuat serta pengangguran dan kemiskinan meningkat tajam
2. Data Kuantitatif, yaitu serangkaian observasi atau pengajaran yang dapat dinyatakan
dengan angka-angka. Contoh: nilai rupiah Rp 9.250,00 per US$ di akhir tahun 2006
a) Data Diskrit, yaitu data yang hanya mempunyai sejumlah terbatas nilai-nilai.
Contoh: jumlah mahasiswa di sebuah universitas.
b) Data Kontinu, yaitu data yang secara teoritis dapat menjalani setiap nilai. Disebut juga nilai
pengamatan kuantitatif kontinyu. Contoh: pengukuran debit air di bendungan.
Menurut Waktu
1. Data Cross Section, yaitu data yang dikumpulkan pada suatu waktu tertentu yang bisa
menggambarkan keadaan atau kegiatan pada waktu tersebut. Contoh: data jumlah TKI
yang meninggal pada tahun 2006 akibat kekerasan menggambarkan kurangnya
perlindungan keselamatan TKI di luar negeri.
2. Data Time Series, yaitu data yang dikumpulkan dari waktu ke waktu sehingga ada
perkembangannya (trend) yang menunjukkan arah secara umum. Garis trend sangat
berguna untuk membuat ramalan (forecasting) yang dibutuhkan bagi perencanaan.
Contoh:
– Data persebaran penduduk di Indonesia dibutuhkan untuk perencanaan transmigrasi
sebagai upaya pemerataan jumlah persebaran di tiap daerah
– Data tingkat curah hujan tiap tahunnya dibutuhkan untuk mengantisipasi datangnya tanah
longsor atau banjir
2. Data Ordinal, yaitu data yang memiliki tingkatan-tingkatan tertentu, tetapi antara tingkatan
satu dengan tingkatan yang lain tidak ada batas-batas yang jelas dan pasti. Singkatnya data
ordinal adalah data yang dinyatakan dalam bentuk peringkat atau rangking. Data ordinal
memiliki skala yang menunjukkan perbedaan tingkatan subjek secara kuantitatif, biasanya
dikenal dengan skala likert. Contohnya:
a) Skala prestasi: Sangat baik, baik, cukup, sedang, kurang.
b) Dalam pengujian instrumen matematika di SD, 25% siswa memperoleh predikat sangat
baik, 45% baik, 20% cukup, 10% sedang.
c) Skala sikap: Sangat rajin, rajin, cukup rajin, kurang rajin, tidak rajin. Dari penilaian
sikap 10 siswa SD, 2 anak sangat rajin, 4 anak rajin, 2 anak cukup rajin, 1 anak kurang
rajin, 1 anak tidak rajin.
3. Data interval, yaitu data yang memiliki tingkatan-tingkatan tertentu dan antara tingkatan
satu dengan lainnya mempunyai batasan yang jelas. Data ini menunjukan klasifikasi dan
kedudukan subjek dalam kelompok serta memiliki ciri kesamaan jarak (aquality of
interval) antara skor yang satu dengan skor yang lain. Contohnya:
A 4 85-98
B 3 71-84
C 2 57-70
D 1 43-56
E 0 29-42
Dari contoh tersebut, dapat dipahami bahwa masing-masing jarak (interval) sama yaitu 14. Pada
data tersebut, yang dijumlahkan bukan kuantitas atau besaran melainkan interval, serta tidak
terdapat titik nol absolut (nol mutlak). Meskipun pada kolom skor terdapat tanda nol, hal ini bukan
berarti tidak ada mahasiswa yang mempunyai nilai E. Dalam hal ini, nol menyatakan skor bagi
mahasiswa yang mempunyai niai E.
a) Interval nilai pelajaran matematika siswa SMA 4 Surabaya adalah antara 0 sampai 100.
Bila siswa A dan B masing-masing mempunyai nilai 45 dan 90, bukan berarti tingkat
kecerdasan B dua kali A. Nilai 0 sampai 100 hanya merupakan rentang yang dibuat
berdasarkan kategori pelajaran matematika dan mungkin berbeda dengan mata pelajaran
lain.
b) Dasar Pemrograman memiliki 1 SKS, waktunya adalah 50menit, begitupun dengan Teknik
Digital yang memiliki 2 sks berarti waktunya 100 menit, dan yangterakhir yaitu kalkulus
memiliki 3 SKS waktunya adalah 150 menit sehingga dapat disimpulkan bahwa selisih
data diatas adalah 50 menit.
c) Kecepatan masing – masing orang dalam berkendara di jalan raya, Maharani jika
berkendaraan dengan kecepatan 20 – 40 km/jam masuk keukuran pelan, untuk Ichsan
dalam berkendaraan memiliki kecepatan 50 – 60 km/jam maka masuk ke dalam ukuran
sedang dan yang terakhir Valentina Rosi dalam berkendaraannya selalu berkecepatan 70 –
80 km/jam maka masuk ke ukuran cepat.
d) Rata – rata tinggi badan berdasarkan usia, untuk anak – anak yang berusia 6 – 12 memiliki
rata – rata tinggi badan 130 – 145 cm, untuk remaja yang berusia 13 – 18 memilikirata –
rata tinggi badan 146 – 160 cm, dan untuk dewasa yang berusia 19 – 26 cm memiliki rata –
rata tinggi badan 161 – 199 cm.
e) Pengiriman barang ke berbagai tempat, seperti contoh diatas Sintamengirimkan barang dari
Bandung ke Jakarta dengan harga Rp. 10.000,- /kg, dan Santi mengirimkan dari bandung
ke Yogyakarta dengan harga Rp. 20.000,- /kg sedangkan Santamengirimkan barang dari
Bandung ke Surabaya dengan harga Rp. 30.000,- /kg.
4. Data rasio, yaitu data yang memiliki ciri-ciri sebagaimana tersebut pada ketiga macam data
sebelumnya (nominal, ordinal, dan interval). Data rasio menunjukkan klasifikasi,
perbedaan kedudukan kelompok, dan persamaan jarak. Data rasio hampir sama dengan
data interval, tetapi memiliki nilai nol mutlak dengan makna empiris. Artinya kalau ada
data nol, dianggap tidak ada nilainya, misalnya hasil pengukuran panjang dan berat. Saat
dilakukan pengukuran, ternyata hasilnya adalah nol meter yang berarti tidak mempunyai
panjang. Karena terdapat angka nol mutlak, maka data ini dapat dibuat dalam bentuk
perkalian atau pembagian. Sebagai contoh:
a) A dan B adalah dua orang mahasiswa universitas X yang nilainya masing-masing 60 dan
90. Maka, ukuran rasio dapat dinyatakan bahwa nilai mahasiswa B adalah 1,5 kali nilai
mahasiswa A.
b) Seseorang memiliki berat badan 80 Kg. Maka, ukuran rasionya dapat dinyatakan bahwa
berat orang tersebut dua kali orang dengan berat 40 Kg. Tetapi, pernyataan semacam ini
tidak dapat dibuat dengan data interval. Kita tidak dapat mengatakan bahwa tingkat
kecerdasan orang yang memiliki IQ 150 adalah satu setengah kali kecerdasan orang yang
memiliki IQ 100.
DISTRIBUSI FREKUENSI
Distribusi frekuensi merupakan suatu keadaan yang menggambarkan bagaimana frekuensi dari
gejala atau variabel yang dilambangkan dengan angka itu telah tersalur, terbagi, tersebar, dan
terpancar. Penggambaran angka (bilangan) atau penyajian data angka tersebut dapat disajikan
dalam bentuk tabel atau grafik/gambar, yang kemudian dikenal dengan istilah tabel distribusi
frekuensi dan grafik distribusi frekuensi.
Kelas-kelas (class) adalah kelompok nilai data atau variable dari suatu data acak.
Batas kelas (class limits) adalah nilai-nilai yang membatasi kelas yang satu dengan kelas
yang lain. Batas kelas merupakan batas semu dari setiap kelas, karena di antara kelas yang
satu dengan kelas yang lain masih terdapat lubang tempat angka-angka tertentu. Terdapat
dua batas kelas untuk data-data yang telah diurutkan, yaitu: batas kelas bawah (lower class
limits) dan batas kelas atas (upper class limits).
Tepi kelas disebut juga batas nyata kelas, yaitu batas kelas yang tidak memiliki lubang
untuk angka tertentu antara kelas yang satu dengan kelas yang lain. Terdapat dua tepi kelas
yang berbeda dalam pengertiannya dari data, yaitu: tepi bawah kelas dan tepi atas kelas.
Titik tengah kelas atau tanda kelas adalah angka atau nilai data yang tepat terletak di
tengah suatu kelas. Titik tengah kelas merupakan nilai yang mewakili kelasnya dalam data.
Titik tengah kelas = ½ (batas atas + batas bawah) kelas.
Interval kelas adalah selang yang memisahkan kelas yang satu dengan kelas yang lain.
Panjang interval kelas atau luas kelas adalah jarak antara tepi atas kelas dan tepi bawah
kelas.
Frekuensi kelas adalah banyaknya data yang termasuk ke dalam kelas tertentu dari data
acak.
Distribusi frekuensi terdiri dari dua yaitu: Distribusi Frekuensi Kategori dan Distribusi Frekuensi
Numeric.
2 35 – 44 8
3 45 – 54 11
4 55 – 64 14
5 65 – 74 12
6 75 – 84 8
7 85 – 94 6
Jumlah 65
Pengertian
Statistika mempunyai fungsi untuk mencari angka atau nilai disekitar mana nilai-nilai memusat
dalam suatu distribusi frekuensi data. Ukuran pusat menunjukan kecenderungan data memusat
pada nilai tertentu.Nilai yang menjadi pusat sesuatu distribusi disebut dengan tendensi pusat atau
tendensi sentral.
Mean dipengaruhi oleh observasi atau pengamatanMean dapat menyimpang jauh pada
distribusi data yang memiliki kecondongan jelek/ tidak normalJumlah dari penyimpangan
semua nilai pengamatan dengan nilai mean yaitu nolMean dapat dimanipulasi secara
aljabar
Median dipengaruhi banyaknya observasi atau pengamatanMedian sering digunakan pada
distribusi dengan kecondongan yang jelekJumlah penyimpangan (dengan tanda diabaikan)
nilai-nilai dari medianlebih kecil daripada jumlah penyimpangan nilai-nilai dari titik yang
lain
Pada serangkaian data, modus bisa tidak ada dan bisa lebih dari satu nilaiLetak atau nilai
modus yang sebenarnya sulit ditentukan, biasanya hanya berdasarkan taksiran dalam suatu
distribusiPerhitungan modus tidak didasarkan pada seluruh nilai pengamatan, tetapi pada
individu yang titik tempat terjadinya pemusatan terbanyak
Keterangan:
Data Kelompok
Keterangan:
Keterangan: