MUMUH MUHARAM
1
PRAKATA
Puji syukur kepada Allah SAW yang telah memberi rahmat kepada penulis untuk
menyelesaikan materi buku ini. Materi buku ini berasal dari materi untuk perkuliahan
Probabilitas dan Statistik di Jurusan Teknik Elektro Fakultas Teknik Universitas
Andalas Padang. Penulis telah mengajar perkuliahan Probabilitas dan Statistik ini
sejak tahun 2001, dimana dalam proses pembelajaran materi perkuliahan ini dibagi
dalam tiga kategori, yaitu Statistika Deskriptif, Probabilitas, dan Statistika Inferensi.
Pada buku ajar ini penulisan difokuskan pada materi Statistika Deskriptif.
Materi Statistika Deskriptif menjadi bahan utama dalam perkuliahan ini
dikarenakan beberapa keuntungan yang dimilikinya. Pertama, sebagai dasar dari
materi perkuliahan, Statistika Deskriptif memberikan pemahaman kepada mahasiswa
tentang pentingnya data. Sebagai contoh, bagaimana dari data dapat diperoleh
informasi. Lebih lanjut, proses penyamplingan (pengambilan data) menjadi sangat
penting ketika akan melakukan evaluasi terhadap permasalahan. Di bidang industri,
sangatlah penting untuk mengevaluasi kinerja dari suatu produksi, beberapa ‘tool’
dari statistika deskriptif seperti Diagram Pareto dan Fishbone dapat digunakan untuk
mengevaluasi dan keputusan dapat diambil setelah tahapan pengambilan data,
pengolahan data, dan evaluasi. Kedua, frekuensi relatif dalam distribusi frekuensi
dapat digunakan sebagai dasar untuk menghitung probabilitas berdasarkan empiris.
Ketiga, materi Statistika Deskriptif ini dapat dijadikan sebagai dasar sebuah hipotesis
bahwa adanya hubungan dari satu faktor terhadap permasalahan yang ada. Dapat
dikatakan bahwa faktor tersebut mungkin merupakan faktor yang dapat di-assosiasi-
kan dengan permasalahan tetapi mungkin bukan penyebab utama dari permasalahan.
Sebagai contoh, hasil survey di lapangan memperlihatkan adanya hubungan polutan
dengan keadaan penyakit di Buyat. Statistika Deskriptif hanya memberikan
pengetahuan hubungan antara polutan dengan penyakit tersebut, untuk lebih
mengetahui penyebabnya maka dibutuhkan data eksperimen dengan melakukan
pengontrolan terhadap variabel.
Buku ini dapat digunakan untuk mahasiswa yang mengikuti perkuliahan
Statistik atau Probabilitas dan Statistik satu semester untuk Jurusan Teknik Elektro.
Meskipun begitu buku ini dapat digunakan oleh umum untuk sekedar pengetahuan
tentang Statistika. Untuk mencapai tujuan pembelajaran perkuliahan, maka
pengorganisasian buku disusun sebagai berikut:
2
Bab IV: membahas tentang ukuran terpusat, ukuran sebaran, letak posisi
kuartil, bentuk kurva, skewness dan kurtosis.
Bab V: membahas tentang beberapa permasalahan khusus seperti data
pencilan.
3
DAFTAR ISI
PRAKATA................................................................................................................. 2
DAFTAR ISI................................................................... Error! Bookmark not defined.
DAFTAR GAMBAR....................................................................................................... 7
DAFTAR TABEL ........................................................................................................... 8
BAB I PENDAHULUAN .......................................................................................... 9
1.1 DEFINISI STATISTIKA ........................................................................... 9
1.2 MOTIVASI ................................................................................................ 9
1.3 FUNGSI STATISTIKA ........................................................................... 11
1.4 METODE STATISTIKA ......................................................................... 11
1.5 POPULASI DAN SAMPEL .................................................................... 12
1.6 PARAMETER DAN STATISTIK........................................................... 12
1.7 VARIABEL DAN DATA ........................................................................ 13
1.8 RANGKUMAN ....................................................................................... 13
1.9 SOAL-SOAL ........................................................................................... 13
BAB II DATA.......................................................................................................... 15
2.1 PENGERTIAN DATA ............................................................................ 15
2.2 JENIS DATA ........................................................................................... 15
2.2.1 Data Kualitatif dan Data Kuantitatif ................................................ 15
2.2.2 Data Primer dan Data Sekunder ....................................................... 16
2.2.3 Data Mentah dan Data Olah ............................................................. 16
2.2.4 Data Tunggal dan Data Kelompok ................................................... 16
2.2.5 Data Urutan Waktu dan Data Waktu Sesaat .................................... 16
2.2.6 Skala Pengukuran Data .................................................................... 16
2.3 BAGAIMANA DATA DIPEROLEH? .................................................... 18
2.3.1 Sampling dan Sensus ....................................................................... 18
2.3.2 Observasi.......................................................................................... 19
2.3.3 Eksperimen ...................................................................................... 19
2.3.4 Wawancara ....................................................................................... 19
2.3.5 Kuesioner ......................................................................................... 19
4
2.4 RANGKUMAN ....................................................................................... 20
2.5 SOAL-SOAL ........................................................................................... 20
BAB III .................................................................................................................... 21
PENGOLAHAN DAN PENYAJIAN DATA.......................................................... 21
3.1 PENDAHULUAN ................................................................................... 21
3.2 PENGOLAHAN DATA .......................................................................... 21
3.3 PENYAJIAN DATA : TABEL................................................................ 22
3.3.1 Tabel Searah......................................................................................... 23
3.3.2 Tabel Kontingensi ................................................................................ 23
3.4 PENYAJIAN DATA : GRAFIK.............................................................. 24
3.4.1 Grafik Batang ....................................................................................... 24
3.4.2 Diagram Pareto .................................................................................... 25
3.4.3 Histogram ............................................................................................. 27
3.4.4 Diagram Lingkaran .............................................................................. 27
3.4.5 Grafik Garis ......................................................................................... 28
3.4.6 Poligon ................................................................................................. 30
3.4.7 Ogive .................................................................................................... 30
3.4.8 Diagram Pencar .................................................................................... 30
3.5 DESKRIPSI DATA ................................................................................. 31
3.6 DISTRIBUSI FREKUENSI ..................................................................... 32
3.7 RANGKUMAN ....................................................................................... 38
3.8 SOAL-SOAL ........................................................................................... 39
BAB IV .................................................................................................................... 41
UKURAN-UKURAN STATISTIK ......................................................................... 41
4.1 Pendahuluan ............................................................................................. 41
4.2 UkuranTerpusat........................................................................................ 41
4.2.1 Nilai Rata-rata ......................................................................................... 41
4.2.2 Median .................................................................................................... 44
4.2.3 Modus ..................................................................................................... 46
4.3 Ukuran Tersebar....................................................................................... 47
5
4.3.1 Jangkauan ......................................................................................... 47
4.3.2 Standar Deviasi ................................................................................ 49
4.4 Ukuran Posisi ........................................................................................... 51
4.4.1 Kuartil Data Tunggal ....................................................................... 52
4.4.2 Kuartil Data Berkelompok ............................................................... 53
4.4.3 Jangkauan AntarKuartil ................................................................... 56
4.5 Bentuk Kurva ........................................................................................... 57
4.5.1 Bentuk Kemerengan Kurva .............................................................. 57
4.5.2 Bentuk Keruncingan Kurva ............................................................. 58
4.5.3 Transformasi Distribusi ke Nilai Standar z ...................................... 58
4.6 Rangkuman .............................................................................................. 60
4.7 Soal-soal................................................................................................... 60
BAB V ..................................................................................................................... 62
BEBERAPA PERMASALAHAN KHUSUS .......................................................... 62
5.1 Pendahuluan ............................................................................................. 62
5.2 Koefisien Variasi ..................................................................................... 62
5.3 Apa itu Pencilan ....................................................................................... 63
5.3.1. Metoda Untuk Menghitung Pencilan ............................................... 63
5.3.2. Metoda Diagram Titik...................................................................... 64
5.3.3. Metoda Kuartil dan Boxplot ............................................................ 65
5.3.4. Metoda Nilai Standar z ....................... Error! Bookmark not defined.
5.4 Nilai Rata-rata dan Lima Ukuran Posisi: Mana yang lebih kokoh? ....Error!
Bookmark not defined.
5.5 Soal-soal................................................................................................... 67
6
DAFTAR TABEL
7
DAFTAR GAMBAR
8
BAB I PENDAHULUAN
Definisi 1.1
Statistika adalah ilmu atau metode atau teknik dalam pengumpulan
data, pengolahan data, penyajian data, analisis data, dan penarikan
kesimpulan serta pengambilan keputusan berdasarka analisis data
tersebut.
1.2 MOTIVASI
Statistika menjadi bagian yang tidak terpisahkan dalam semua bidang ilmu.
Untuk itu mempelajari Statistika harus memahami motivasinya. Motivasi pertama,
bagian terpenting dari statistika adalah kemampuan untuk menyarikan informasi dari
data. Oleh karena itu bagaimana cara memperoleh dan memperlakukan data menjadi
subyek utama dari Statistika. Dalam bidang rekayasa, baik mahasiswa atau peneliti
secara umum tidak akan terlepas dari data ataupun statistik. Sebagai contoh, dalam
Metode Ilmiah seperti pada Gambar 1.1 peranan statistika sangat penting guna
tercapainya tujuan.
9
Menarik
Kesimpulan
Merumuskan
Menguji Hipotesis Masalah dan
Hipotesis
Mengumpulkan
Data
Pada Gambar 1.1 tersebut terlihat bahwa dalam Metoda Ilmiah peranan
statistika secara umum dapat dijelaskan sebagai berikut. Pertama, Perumusan
Masalah dan Hipotesis sangat erat dengan informasi ataupun data yang ada di
lapangan. Pada perumusan masalah dapat dilakukan melalui pertanyaan misalnya
permasalahan apakah yang timbul dalam suatu proses produksi. Informasi tentang
adanya permasalahan dapat dicari dari informasi yang tersedia di lapangan, misalnya
data tentang kinerja atau capaian produksi tiap bulan apakah menurun atau turun-
naik. Hipotesis dapat dibangun dari informasi sebelumnya mengenai solusi dari
permasalahan yang pernah ada sebelummya yang memiliki kesamaan. Kedua,
Pengumpulan data dapat dilakukan dengan melakukan observasi ataupun serangkain
percobaan. Ketiga, Pengujian Hipotesis dilakukan melalui analisa terhadap data yang
diperoleh dan yang diolah. Dalam hal ini, Metode Statistika yang tepat harus dipilih
untuk memberikan hasil yang terbaik. Terakhir, Penarikan Kesimpulan dilakukan
untuk memberikan keputusan apakah Hipotesis tersebut benar atau salah. Dalam hal
Hipotesis salah, pengulangan terhadap Metode Ilmiah ini dilakukan dengan cara
membuat Hipotesis yang baru.
Selain motivasi yang tersebut di atas, keberagaman (variasi) dan
ketidakpastian menjadi hal yang sangat memberikan hasil yang tidak tetap terhadap
10
keluaran suatu eksperimen atau observasi, walaupun eksperimen tersebut diulang.
Keberagaman dan ketidakpastian dapat bersumber dari beberapa keadaan. Pertama,
karakteristik individu dalam populasi memiliki sifat tersendiri. Sebagai contoh,
elemen-elemen dalam motor seperti belitan akan memberikan tanggapan yang
berbeda untuk setiap motor meskipun jumlah lilitannya sama. Hal ini dapat terjadi
apabila bahan belitan berasal dari komposisi bahan yang agak berbeda atau magnet
yang digunakan memiliki nilai fluks yang berbeda. Kedua, kondisi operasi suatu
sistem atau proses yang berbeda akan memberikan variasi parameter dari sistem
sehingga keluaran sistem berbeda. Ketiga, lingkungan eksternal di luar sistem atau
proses itu sendiri sangat mempengaruhi hasil eksperimen sehingga keluaran sistem
berbeda.
Pemahaman terhadap ketidakpastian akan memberikan keuntungan sebagai
berikut: dapat merancang kebijakan untuk mengatasi ketidakpastian, dan dapat
merancang kebijakan untuk mengantisipasi kondisi terburuk. Atau dapat dikatakan
bahwa Statistika dapat digunakan untuk menggambarkan dan memahami
ketidakpastian atau keberagaman tersebut, sehingga dapat mengurangi efek dari
ketidakpastian tersebut terhadap hasil eksperimen.
11
Definisi 1.2
Statistika Deskriptif adalah Metode Statistika yang mempelajari hal-hal
yang berkaitan dengan data yang ada, data yang diperoleh dari hasil
pengamatan ataupun percobaan untuk menganalisa data tersebut
dalam bentuk deskripsi data atau meringkas data.
Definisi 1.3
Statistika Inferensi adalah Metode Statistika dimana analisis data
sampel dapat digunakan untuk memberikan kesimpulan terhadap
populasi.
Definisi 1.4
Populasi adalah seluruh anggota dari obyek yang dipelajari
karakteristiknya berdasarkan nilai-nilai yag diperoleh dari data.
Definisi 1.5
Sampel adalah sebagaian anggota dari populasi.
Definisi 1.6
Parameter adalah ukuran-ukuran yang digunakan untuk
mengkarakterisasi populasi.
Definisi 1.7
Statistik adalah ukuran-ukuran yang digunakan untuk
mengkarakterisasi sampel.
12
1.7 VARIABEL DAN DATA
Variabel adalah karakteristik atau sifat-sifat dari obyek yang diteliti yang
memiliki nilai-nilai tertentu yang dapat berbeda dari satu obyek dengan obyek
lainnya, sedangkan data adalah keterangan-keterangan yang berupa fakta atau yang
diasumsikan dari suatu variabel baik yang bersifat kualitatif ataupun kuantitatif.
1.8 RANGKUMAN
Statistika merupakan suatu ilmu atau metode atau teknik yang digunakan
untuk mengumpulkan data, mengolah data, menganalisa data, dan menarik
kesimpulan dari data yang telah dianalisa tersebut yang dapat digunakan untuk
mengambil keputusan. Dalam mempelajari Statistika terdapat dua metode dalam
pengolahan datanya yaitu Statistika Deskriptif dan Statistika Inferensi. Apabila
Statistika hanya digunakan untuk mengumpulkan data, mengolah data, dan
mendeskripsikan data, maka metode yang digunakan adalah Statistika Deskriptif. Di
sisi lain, apabila ada manipulasi terhadap data dari sampel yang digunakan untuk
menarik kesimpulan terhadap populasi, maka digunakan Statistika Inferensi. Lebih
lanjut, Populasi merupakan seluruh obyek yang digunakan dalam penelitian,
sedangkan sampel adalah sebagian obyek dalam populasi. Ukuran-ukuran yang
digunakan dalam populasi disebut parameter, sedangkan ukuran dalam sampel
disebut stastistik.
Dalam buku ini, seluruh materi statistika berdasarkan metoda statistika
deskriptif. Untuk Bab 2 akan dibahas hal yang menjadi fokus penelitian dalam
statistika, yaitu data. Pengertian data, jenis-jenis data, dan bagaimana data diperoleh
menjadi pokok-pokok materi dalam Bab 2 tersebut.
1.9 SOAL-SOAL
1. Jelaskan dengan kata-kata sendiri, Apa pengertian dari:
a. Statistika?
b. Populasi?
c. Sampel?
d. Parameter?
e. Statistik?
f. Variabel?
g. Metoda statistika?
2. Anda ingin mengetahui berapa jumlah persentasi tenaga kerja wanita di suatu
kota yang sedang melanjutkan jenjang pendidikan yang lebih tinggi. Anda
melalukan survei dengan memilih 100 wanita pekerja di kota tersebut. Tentukan:
a. Populasi
b. Sampel
c. Parameter
d. Statistik
13
3. Apakah variabel yang mungkin terdapat pada soal no. 2?
4. Metoda Statistik Deskriptif ataukah Inferensi yang tepat untuk penelitian hal
berikut:
a. Jumlah wisudawan Teknik Elektro untuk setiap tahunnya.
b. Pengaruh responsi terhadap Nilai akhir matakuliah.
c. Pengaruh keterlibatan mahasiswa sebagai asisten di Laboratorium
terhadap waktu penyelesaian Tugas Akhir.
d. Perbandingan IPK rata-rata untuk setiap Angkatan pada akhir semester
IV.
14
BAB II DATA
Definisi 2.1
Data adalah keterangan-keterangan berupa fakta atau sesuatu yang
diasumsikan dari suatu variabel.
15
berupa bilangan bulat, sedangkan data kuantitatif kontinyu berasal dari proses
pengukuran dan berupa bilangan real. Contoh data kuantitatif diskrit adalah
menghitung jumlah siswa di kelas 1 SD yaitu 25 siswa, angka 25 di sini merupakan
bilangan bulat. Contoh data kuantitatif kontinyu adalah proses mengukur tinggi badan
siswa kelas 1 SD yaitu 120,5 cm, angka 120,5 adalah bilangan real.
16
a. Skala Nominal
Angka-angka yang diperoleh tidak mencerminkan besarnya ukuran ataupun
urutan angka tersebut disebut skala nominal. Dalam skala nominal, angka hanya
menunjukan kategori. Angka 1 atau 2 tidak memperlihatkan bahwa 2 lebih besar
daripada 1. Contoh, jenis alat ukur digital diberi label 1, alat ukur analog diberi
label 2. Angka 1 dan 2 pada contoh ini dapat saling ditukarkan tanpa memberikan
arti pada urutannya.
b. Skala Ordinal
Dalam Skala Ordinal, angka-angka yang digunakan untuk melabelkan data yang
diperoleh diurutkan berdasarkan besarnya angka, diurutkan dari angka terkecil ke
terbesar atau sebaliknya. Apabila pada skala nominal tidak mengenal urutan
angka, maka pada skala Ordinal memperlihatkan bahwa urutan angka adalah
penting. Contoh, hasil kinerja pelayanan publik dari kuesioner/angket diberi label
5=sangat memuaskan, 4=memuaskan, 3=sedang, 2=tidak memuaskan, dan
1=sangat tidak memuaskan.
Pada penelitian yang menghasilkan data kualitatif, skala nominal dan skala
ordinal biasanya digunakan untuk memudahkan dalam analisa data dikarenakan
angka-angka memudahkan proses penghitungan secara numerik. Skala nominal
dan ordinal biasanya menggunakan bilangan diskrit atau bilangan bulat.
c. Skala Interval
Pada penelitian kuantitatif, angka-angka memperlihatkan hal yang sangat
penting. Besar dan urutan angka memiliki makna yang berkaitan dengan
kuantitas dari variabel yang diukur. Skala Interval tidak memiliki nilai nol
mutlak, artinya walaupun diketahui suatu variabel memiliki nilai 0 tidak berarti
bahwa kuantitas dalam variabel tersebut tidak ada. Contoh, pengukuran
temperatur ruang pendingin penyimpanan persediaan makanan, disetel pada suhu
0oC. Angka nol disini bukan berarti bahwa temperatur tidak ada.
d. Skala Rasio
Skala rasio hampir sama dengan skala interval, hanya saja pada skala rasio
terdapat nilai nol mutlak. Pengertian nol mutlak sangat berarti dengan pengertian
fisik. Dalam hal ini nilai nol berarti tidak ada kuantitas yang diukur. Contoh, gula
memiliki berat 1 kg artinya kuantitas fisiknya ada dan sebesar 1 kg, sedangkan
gula 0 kg artinya tidak ada kuantitas gula tersebut.
17
2.3 BAGAIMANA DATA DIPEROLEH?
Pengumpulan data sangat erat berhubungan dengan penelitian. Dalam buku
ini dibahas teknik pengumpulan data yang ditinjau dari jenis-jenis penelitian yang
dilakukan dan yang lebih penting adalah teknik pengumpulan data berdasarkan
jumlah obyeknya.
2.3.1 Sampling dan Sensus
Pengumpulan data yang ditinjau dari jumlah obyek yang diambil dapat
dikelompokan dalam dua jenis teknik, yaitu sampling (pencuplikan) dan sensus.
Definisi 2.2
Sensus adalah teknik pengambilan data terhadap seluruh obyek yang
ditinjau dari populasi.
Definisi 2.3
Sampling adalah teknik pengambilan data terhadap sebagian obyek
dari populasi.
𝑵
Rumus 2.1 𝒏 = 𝟏+𝑵𝒆𝟐
dimana,
n = jumlah sampel
N = jumlah populasi
E = tingkat kesalahan (margin of error)
(𝒁𝜶/𝟐 )𝟐 𝒑𝒒
Rumus 2.2 𝒏= 𝒆𝟐
dimana,
n = jumlah sampel
Z = tingkat kepercayaan
p = probabilitas populasi melakukan suatu hal yang ditinjau
q = 1-p
e = margin of error
18
Di sisi lain, keberhasilan suatu penelitian juga bergantung pada bagaimana
cara pengambilan sampel dilakukan. Terdapat dua jenis teknik sampling, yaitu
Teknik Sampling Probabilitas dan Teknik Sampling Nonprobabilitas. Teknik
Sampling Probabilitas merupakan teknik sampling dimana setiap obyek dari populasi
memiliki peluang yang sama untuk dipilih, sedangkan Teknik Sampling
Nonprobabilitas adalah teknik sampling dimana setiap obyek populasi tidak memiliki
kesempatan yang sama untuk dipilih.
2.3.2 Observasi
Observasi merupakan jenis penelitian dengan cara melakukan pengamatan
secara langsung terhadap obyek ataupun sistem yang ditinjau. Kegiatan pengambilan
data pada observasi dilakukan dengan mengamati langsung variabel-variabel dari
obyek yang diteliti. Sebagai contoh, Observasi terhadap danau untuk mengetahui
hubungan kadar polutan tertentu terhadap perkembangan ikan. Variabel yang
mungkin diukur/diamati adalah jenis polutan, besar kadar setiap polutan, jenis ikan,
dan perubahan bentuk fisik ikan.
2.3.3 Eksperimen
Eksperimen merupakan jenis penelitian yang hampir mirip dengan observasi,
hanya saja semua elemen sistem dan variabel-variabel yang ditinjau dibuat modelnya.
Contoh observasi di atas dapat dibuat eksperimennya dalam skala laboratorium
dimana danau dimodelkan dengan kolam buatan, kadar dan jenis polutan dapat
dikendalikan, dan jenis ikan pun dapat dikendalikan. Oleh karena variabel-variabel
dapat dikendalikan dalam eksperimen, efek atau pengaruh variabel terhadap variabel
lainnya dapat diamati secara lebih rinci. Hal ini dapat menunjukaan faktor atau
variabel yang dominan dalam eksperimen tersebut.
2.3.4 Wawancara
Wawancara merupakan jenis penelitian untuk pengumpulan data dengan cara
tanya-jawab antara pewawancara dengan orang yang diambil keterangannya.
Panduan wawancara harus digunakan dalam proses wawancara agar hasilnya terarah.
2.3.5 Kuesioner
Kuesioner atau angket adalah jenis penelitian dengan pengumpulan data
berupa tanya-jawab seperti wawancara tetapi menggunakan media tertulis.
19
2.4 RANGKUMAN
Data merupakan bagian terpenting dari suatu penelitian. Data dapat
dikelompokan berdasarkan sifatnya sebagai data kualitatif dan data kuantitatif. Kedua
jenis data tersebut memiliki skala pengukuran yang bergantung pada hasil
pengukurannya seperti skala nominal, ordinal, interval, dan rasio. Untuk
memudahkan analisa biasanya data kualitatif diubah menjadi data kuantitatif dengan
mengubah skala pengukuran dari nominal atau ordinal menjadi skala interval atau
rasio. Data dapat dikumpulkan atau diperoleh melalui teknik sampling ataupun sensus
dengan melakukan suatu penelitian seperti observasi, eksperimen, wawancara, atau
kuesioner.
2.5 SOAL-SOAL
1. Lakukan survey terhadap 10 orang rekan anda, catat semua data yang mungkin.
Jelaskan hal berikut ini:
a. Tuliskan variabel yang mungkin!
b. Jelaskan jenis-jenis data yang diperoleh!
2. Tentukan apakah data berikut ini data kualitatif atau kuantitatif:
a. Warna seragam sekolah
b. Tinggi badan calon mahasiswa kepolisian
c. Jenjang pendidikan penduduk di suatu desa
d. Pendapatan perkapita penduduk Indonesia
e. Tingkat kepuasan pemakai jalan tol
f. Pada salah kolom KTP terdapat jenis pekerjaan
g. Jenis provider yang digunakan pada telepon genggan yang digunakan
mahasiswa
h. Jumlah rupiah yang digunakan setiap bulan untuk biaya percakapan
telepon
3. Diberitakan dalam koran bahwa sebuah danau telah tercemar zat kimia dan
mempengaruhi ekosistem danau tersebut, anda melakukan observasi. Tentukan
variabel yang mungkin anda amati dan perkirakan jenis datanya!
4. Apakah memungkinkan untuk mengubah skala ukuran dari satu skala ke skala
lainnya seperti skala nominal ke interval dan lainnya?
20
BAB III
PENGOLAHAN DAN PENYAJIAN DATA
3.1 PENDAHULUAN
Tujuan yang ingin dicapai dalam bab ini terdiri dari tiga hal. Pertama,
pengolahan data acak atau data tunggal menjadi data terurut dan data berkelompok.
Kedua, penyajian data dalam bentuk tabel, grafik dan juga dalam bentuk deskripsi
(komentar terhadap data tabel atau grafik). Terakhir, penyajian data dalam bentuk
distribusi frekuensi.
Data tunggal tersebut diolah menjadi data tunggal terurut sebagai berikut:
7 7 8 8 8 9 9 9
10 10 10 10 10 10 10 10
11 11 11 12 12 12 13 13
21
dari contoh data terurut, akan lebih mudah mengetahui niali terkecil yaitu 7, nilai
terbesar yaitu 13, dan jangkauannya yaitu nilai terbesar-nilai terkecil = 13-7=6.
Apabila data tersebut ingin diolah lebih lanjut menjadi data berkelompok,
misalnya dapat dibuat kelas sebagai berikut (untuk materi pembentukan data
berkelompok akan dibahas pada subbab Distribusi Frekuensi pada bab ini):
Tabel 3.1 Contoh Data Berkelompok
Dari Tabel 3.2 terlihat bahwa nama baris adalah Nama Peserta yang memiliki
data sebanyak 10 orang, sedangkan nama kolom adalah Nama-nama variabelnya,
yaitu Nilai Matematika I dan Nilai Rangkaian Listrik I.
22
Tabel dapat dikelompokan dalam dua jenis, yaitu tabel searah dan tabel dua
arah (tabel kontingensi).
23
3.4 PENYAJIAN DATA : GRAFIK
Grafik merupakan bentuk penyajian data dalam bentuk visual berupa gambar.
Pada subbab berikut ini dibahas macam-macam grafik dn kegunaannya.
25
Jumlah Peserta
20
15
10 7
5 2 3 3
0
2010 2011 2012 2013 2014
Tahun Angkatan
24
Jumlah Peserta Matematika Teknik I dan Sensor
50
45 43
40
35 32
Jumlah Peserta
30
25
Matematika Teknik I
20
Sensor
15
10 7
4 3 3
5 2 2
0 0
0
2010 2011 2012 2013 2014
Tahun Angkatan
25
urutan tabel diperlihatkan dan juga ditambah nilai persentase setiap jenis
kerusakannya.
Tabel 3.5 Jenis-jenis Kerusakan IC dan Jumlahnya
35
30 1. Retak
2. Tergores
25
Jumlah Kerusakan
3. Kaki Patah
20
4. Orientasi Salah
5. Circuit error
15
10
0
1 2 3 4 5
Jenis Kerusakan
26
Tinjau Gambar 3.3, Diagram Pareto memperlihatkan susunan jenis-jenis
kerusakan berdasarkan dari jumlah kerusakan terbesar ke terkecil. Hal ini
mempermudah analisa data bahwa jenis kerusakan IC Retak memberikan sumbangan
terbesar terhadap kerusakan produksi IC, sehingga dapat diambil keputusan
berdasarkan prioritas bahwa kerusakan akibat retak harus segera diatasi.
3.4.3 Histogram
Histogram merupakan jenis penyajian data dalam bentuk grafik batang, tetapi
histogram memiliki perbedaan dengan grafik batang yang biasa. Pertama, histogram
merupakan bentuk penyajian data yang berkelompok. Kedua, histogram memiliki
batang-batang yang sisinya saling berhimpitan. Pembahasan histogram dan cara
membuatnya dibahas pada subbab 3.6 Distribusi Frekuensi.
27
1
2, 3%
3, 5%
2
10, 17%
30, 50% 3
4
15, 25%
28
60
40
30
20
10
0
0 10 20 30 40 50 60 70 80
o
Suhu ( C)
MKS MK MJ MKS + MJ MK + MJ
70
60
Viskositas (N.s/m^2)
50
40
30
20
10
0
0 20 40 60 80 100 120
o
Suhu ( C)
29
3.4.6 Poligon
Poligon atau Poligon Frekuensi adalah grafik garis untuk menyajikan data
berkelompok. Oleh karena Poligon membentuk kurva dari data berkelompok yang
mewakili distribusi frekuensi, maka Poligon dapat menampilkan kurva yang
mendekati kurva distribusi normal. Bagaimana cara membuat Poligon dibahas pada
subbab 3.6 Distribusi Frekuensi.
3.4.7 Ogive
Ogive merupakan bentuk penyajian data dalam bentuk grafik garis untuk data
berkelompok. Berbeda dengan Poligon, Ogive menampilkan frekuensi kumulatif dan
dibahas pada subbab 3.6 Distribusi Frekuensi.
3.4.8 Diagram Pencar
Diagram Pencar atau Scatter Diagram merupakan bentuk penyajian data
berupa titik-titik yang merupakan himpunan titik dari variabel pertama pada sumbu
horizon dan variabel kedua pada sumbu vertikal. Diagram Pencar berfungsi untuk
melihat apakah ada hubungan atau korelasi antara variabel pertama dan variabel
kedua.
Tabel 3.8 Hubungan Nilai Puncak-puncak dengan Nilai RMS Kecepatan
getar Mesin Elektrik (Sumber: Afri Yualdi, Tugas Akhir, Unand, 2011)
30
1.8
1.6
31
Gambar 3.7 memperlihatkan Diagram Pencar hubungan antara Nilai Puncak-
puncak terhadap Nilai RMS dari getaran Mesin Elektrik. Walaupun terdapat
titik-titik yang memperlihatkan Nilai Puncak-puncak yang besar tidak
memberikan Nilai RMS yang besar pula, tetapi secara keseluruhan Diagram
Pencar tersebut memperlihatkan adanya kecenderungan hubungan atau
korelasi positif antara Nilai Puncak-puncak dan Nilai RMS. Dapat dikatakan
bahwa secara umum apabila Nilai Puncak-puncak semakin besar, maka Nilai
RMS pun akan semakin membesar.
Tabel 3.9 Jenis Kendaraan dan Jumlah Kejadian kecelakaan tahun 2014
Pada subbab ini cara membuat Distribusi Frekuensi Numerik dibahas secara
lebih mendalam dan untuk mempersingkat penulisan selanjutnya Distribusi
Frekuensi Numerik ini ditulis Distribusi Frekuensi.
32
Dalam membuat Distribusi Frekuensi harus diperhatikan langkah-langkah
berikut:
1. Data acak/tunggal harus diurutkan dari data terkecil hingga data terbesar
Diperoleh: xmin= data terkecil dan xmax= data terbesar
J = jangkauan = xmax – xmin
n = jumlah data
𝑱
Rumus 3.2 𝑰=𝑲
dimana:
I = panjang interval kelas
33
5. Menuliskan Tabel Frekuensi
Menuliskan tabel frekuensi, yaitu menuliskan batas-batas kelas dan menghitung
jumlah frekuensi data dari anggota masing-masing kelas yang mungkin bisa
menggunakan bantuan turus.
8. Menggambarkan Ogive
Ogive merupakan grafik garis yang digunakan untuk menggambarkan distribusi
frekuensi kumulatif.
Contoh untuk membuat distribusi frekuensi adalah sebagai berikut, tinjau data
mentah nilai pelajaran:
87 79 67 62 69 69 67 67 70 63
72 94 70 75 59 56 90 85 71 62
59 60 62 65 36 64 65 59 77 70
57 66 57 54 52 73 50 50 55 72
73 81 70 95 57 41 64 55 86 45
49 80 45 47 37 76 54 47 60 66
66 83 76 82 40 56 43 50 55 57
72 66 68 75 63 66 70 78 56 68
34
Penyelesaian:
1. Data diurutkan dari terkecil ke terbesar
36 37 40 41 43 45 45 47 47 49
50 50 50 52 54 54 55 55 55 56
56 57 57 57 57 59 59 59 60 60
62 62 62 62 63 63 64 64 65 65
66 66 66 66 66 67 67 67 68 68
69 69 70 70 70 70 70 71 72 72
72 73 73 75 75 76 76 77 78 79
80 81 82 83 85 86 87 90 94 95
Diperoleh: xmin= 36
xmax= 95
J = 95-36 = 59
2. Jumlah Kelas
K 1 3.3Log (n)
K 1 3.3Log 80
K 1 6.28
K 7.28 8
4. Menentukan kelas-kelas
35
Batas atas kelas = 52 + 8 – 1 = 59
36
25
20
20
17
15
15
10 9
8
5
5 4
2
25
20
20
17
15
frekuensi
15
9
10 8
5
4
5
2
0 0
0
31,5 39,5 47,5 55,5 63,5 71,5 79,5 87,5 95,5 103,5
Nilai Pelajaran
7. Menggambarkan Ogive
Untuk menggambarkan Ogive, terlebih dahulu dibuat tabel frekuensi
kumulatif kurang dari. Tabel frekuensi kumulatif kurang dari adalah tabel
frekuensi yang menampilkan frekuensi kumulatif yang memiliki nilai kurang
dari nilai batas kelas suatu interval kelas tertentu.
37
Tabel 3.12 Tabel untuk membuat Diagram Ogive
90
78 80
80 74
70 65
Frekuensi Kumulatif
60
48
50
40
28
30
20 13
10 5
0
0
36 44 52 60 68 76 84 92 100
Nilai Pelajaran
3.7 RANGKUMAN
Pengolahan dan penyajian data memberikan peranan yang sangat penting
terhadap informasi yang ingin diperoleh dari sekumpulan data. Untuk data dengan
jumlah data yang cukup kecil pengolahan dan penyajian data dengan cara diurutkan,
lalu dibuat tabel dan selanjutnya dibuat grafik yang sesuai dengan kebutuhan akan
memberikan kemudahan dalam memahami data tersebut. Di sisi lain, apabila jumlah
data sangat banyak maka data tidak dapat secara langsung disajikan dalam tabel atau
grafik. Penanganan yang tepat untuk jumlah data yang sangat besar adalah dengan
menggunakan bantuan distribusi frekuensi. Distribusi Frekuensi merupakan
38
penyajian data berkelompok yang menggunakan tabel frekuensi, Grafik batang
berupa Histogram, grafik garis berupa poligon frekuensi, dan grafik frekuensi
kumulatif dalam bentuk grafik Ogive.
Pada bab selanjutnya, Bab 4, akan dibahas tentang ukuran-ukuran statistik
seperti ukuran terpusat, ukuran tersebar, ukuran posisi, dan bentuk kurva. Nilai rata-
rata, median, dan modus dibahas pada pembahasan ukuran terpusat. Ukuran tersebar
akan mencakup standar deviasi dan jangkauan. Sedangkan ukuran posisi berisi
tentang kuartil. Terakhir, bentuk kurva membahas keruncingan dan kerampingan
kurva distribusi.
3.8 SOAL-SOAL
1. Terdapat data mahasiswa yang mendaftar kegiatan Seni dan Olahraga pada
tahun akademik berjalan sebagai berikut: Catur = 5%, Karate = 10%,
Taekwondo = 13%, Sepak Bola = 25%, Pencinta Alam = 16% Tari Daerah =
15%, Musik Daerah = 14%, Tari Modern = 2%.
a. Buat diagram lingkaran untuk menyajikan data tersebut.
b. Apabila yang mendaftar 1000 orang, tentukan jumlah peserta Tari Modern!
2. Apakah penyajian data pada soal no.1 dapat disajikan menggunakan Grafik
Batang?
3. Tinjau Grafik Batang pada Tabel 3.13 yang menyajikan jumlah siswa tidak
masuk sekolah dan alasannya dalam 1 tahun akademik.
a. Tentukan jumlah siswa yang tidak masuk sekolah dalam 1 tahun akademik.
b. Berapa persentase siswa yang tidak masuk sekolah karena bolos?
35
30
25
Jumlah Siswa
20
15
10
0
Sakit Ada PR Bolos Keluarga
Alasan tidak Masuk Sekolah
Gambar 3.11 Jumlah Siswa Tidak Masuk Sekolah dan alasannya dalam 1
Tahuun akademik
39
4. Buat diagram lingkaran untuk Tabel 3.13 soal no 3 tersebut.
5. Buat diagram pareto untuk soal no 3 tersebut.
6. Tinjau data nilai mata kuliah Sistem Instrumentasi dari 50 orang mahasiswa:
75 70 71 60 60 63 63 65 80 80
78 77 90 89 88 70 80 80 80 81
79 78 77 65 67 68 69 70 75 75
77 80 81 81 82 85 80 81 88 90
82 84 80 85 76 79 88 76 81 87
40
BAB IV
UKURAN-UKURAN STATISTIK
4.1 Pendahuluan
Selain penyajian data dengan tabel dan grafik, terdapat beberapa ukuran
statistik yang dapat digunakan untuk menganalisa sekelompok data. Ukuran-ukuran
tersebut adalah ukuran terpusat, ukuran tersebar, ukuran posisi, dan bentuk kurva.
4.2 UkuranTerpusat
Karakteristik statistik yang digunakan untuk mengetahui nilai tengah dari
sekelompok data, baik data tunggal ataupun data berkelompok adalah ukuran
terpusat.
Definisi 4.1: Ukuran terpusat adalah karakteristik statistik yang
mengukur seberapa dekat ukuran tersebut menjadi pusat data lainnya.
Ukuran terpusat menggambarkan suatu nilai yang memiliki gambaran
keberadaan posisi nilai tersebut di titik tengah dari deretan data. Terdapat tiga ukuran
terpusat, yaitu nilai rata-rata, median, dan modus. Untuk semua definisi ukuran
terpusat yang digunakan adalah karakteristik statistik dimana data yang dimaksud
adalah data hasil penyamplingan.
Rumus 4.1
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 ∑𝒏𝒊=𝟏 𝒙𝒊
̅=
𝒙 =
𝒏 𝒏
41
Contoh 1, tentukan nilai Rata-rata dari sekelompok data berikut ini:
2 3 3 4 5 5 6 6 6 7
8 9
Jawab:
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟑 + ⋯ + 𝒙𝒏 𝟐 + 𝟑 + 𝟑 + 𝟒 + 𝟓 + 𝟓 + 𝟔 + 𝟔 + 𝟔 + 𝟕 + 𝟖 + 𝟗
̅=
𝒙 =
𝒏 𝟏𝟐
𝟔𝟒
̅=
𝒙 = 𝟓, 𝟑𝟑
𝟏𝟐
Rumus 4.2
∑𝑲
𝒊=𝟏 𝒇𝒊 𝒕𝒊
̅=
𝒙
∑𝑲
𝒊=𝟏 𝒇𝒊
Dimana:
fi = frekuensi kelas ke-i
ti = nilai titik tengan kelas ke-i
K = jumlah kelas
Contoh 2, tinjau data tunggal yang terurut berikut ini, tentukan Nilai Rata-
rata data tunggal dan data berkelompok. Data nilai 60 Peserta Kuliah Sensor:
40 45 45 47 50 50 50 53 55 55
55 60 60 60 65 65 65 65 67 67
70 70 70 70 70 73 74 75 75 75
75 75 77 77 80 80 80 80 80 80
80 83 83 85 85 85 85 85 85 85
85 85 85 90 90 90 95 95 95 95
Jawab:
42
a. Nilai Rata-rata Data Tunggal
∑𝒏𝒊=𝟏 𝒙𝒊
̅=
𝒙
𝒏
𝟒𝟑𝟕𝟏
̅=
𝒙 = 𝟕𝟐, 𝟖𝟓
𝟔𝟎
J = jangkauan = 95 – 40 = 55
diperoleh, 𝑥̅ = 72,7
43
4.2.2 Median
Jumlah data = 8
Posisi median terletak pada (n + 1)/2 = (8 + 1)/2 9/2 = 4,5
Sehingga nilai median = (nilai data ke-4 + nilai data ke-5)/2 = (3 + 4)/2
=3,5
Jadi, nilai median = 3,5
44
Rumus 4.4
𝒏
− 𝑭𝑩𝑴𝒆
𝑴𝒆 = 𝑻𝑲𝑴𝒆 + 𝟐 .𝑰
𝒇𝑴𝒆
Dimana,
TKMe = Nilai tepi kelas bawah kelas median
FBMe = jumlah frekuensi kelas-kelas sebelum kelas median
fMe = frekuensi kelas median
I = panjang interval kelas
Contoh 3, tentukan nilai median dari data berkelompok pada Tabel 4.1
Jawab:
Tabel 4.1 diperbaharui menjadi Tabel 4.2 sebagai berikut.
Tabel 4.2 Distribusi Frekuensi Nilai 60 Peserta Sensor (yang
diperbaharui)
No. Kelas Kelas Interval Nilai Tepi Frekuensi (fi)
1 40 – 47 39,5 – 47,5 4
2 48 – 55 47,5 – 55,5 7
3 56 – 63 55,5 – 63,5 3
4 64 – 71 63,5 -71,5 11
5 72 – 79 71,5 – 79,5 9
6 80 – 87 79,5 – 87,5 19
7 88 – 95 87,5 – 95,5 7
Total ∑ 𝑓𝑖 = 60
Diperoleh:
Letak median = n/2 = 60/2 =30, Kelas median = kelas ke-5
TKMe = Nilai tepi kelas bawah kelas median = 71,5
FBMe = jumlah frekuensi kelas-kelas sebelum kelas median = 4 + 7
+ 3 + 11 = 25
fMe = frekuensi kelas median = 9
I=8
45
𝒏
− 𝑭𝑩𝑴𝒆 𝟑𝟎 − 𝟐𝟓
𝑴𝒆 = 𝑻𝑲𝑴𝒆 + 𝟐 . 𝑰 = 𝟕𝟏, 𝟓 + . 𝟖 = 𝟕𝟓, 𝟗𝟒
𝒇𝑴𝒆 𝟗
Jadi median Data berkelompok = 75,94
4.2.3 Modus
Modus merupakan ukuran terpusat yang memperlihatkan nilai dari data yang
paling sering muncul. Olehkarena dikaitkan dengan jumlah data yang sering muncul,
terdapat tiga kemungkinan tentang modus, yaitu ada kemungkinan sekelompok data
tidak memiliki modus, ada kemungkinan modus terdapat satu buah, dan kemungkinan
terakhir modus dapat lebih dari satu buah.
Definisi 4.3 Modus adalah data yang memiliki frekuensi terbesar atau
data yang paling sering muncul dari sekelompok data. Modus
disimbulkan Mo.
A. Modus Data Tunggal
Untuk data tunggal, mencari modus dengan Rumus 4.5 berikut ini.
Rumus 4.5 𝑴𝒐 = 𝒅𝒂𝒕𝒂 𝒅𝒆𝒏𝒈𝒂𝒏 𝒇𝒓𝒆𝒌𝒖𝒆𝒏𝒔𝒊 𝒕𝒆𝒓𝒃𝒆𝒔𝒂𝒓
Contoh 1, tinjau data Nilai 60 Peserta Kuliah Sensor.
40 45 45 47 50 50 50 53 55 55
55 60 60 60 65 65 65 65 67 67
70 70 70 70 70 73 74 75 75 75
75 75 77 77 80 80 80 80 80 80
80 83 83 85 85 85 85 85 85 85
85 85 85 90 90 90 95 95 95 95
Jawab:
Mo = 85, karena memiliki frekuensi terbesar yaitu 10.
B. Modus Data Berkelompok
Untuk data berkelompok Modus dapat dihitung menggunakan Rumus 4.6
berikut ini.
𝒅𝒇𝟏
Rumus 4.6 𝑴𝒐 = 𝑻𝑲𝑴𝒐 + 𝒅𝒇𝟏+𝒅𝒇𝟐 . 𝑰
Dimana,
TKMo = nilai tepi bawah kelas modus yaitu kelas dengan frekuensi
terbesar
46
df1 = selisih frekuensi kelas modus dengan frekuensi kelas
sebelumnya
df2 = selisih frekuensi kelas modus dengan kelas sesudahnya
I = panjang interval kelas
Contoh 2, tentukan modus untuk data berkelompok dari 60 peserta kuliah
Sensor seperti pada Tabel 4.2 dari contoh 1 sebelumnya.
Jawab:
Tabel 4.2 memperlihatkan bahwa kelas interval no. 6 memiliki frekunsi
terbesar yaitu 19.
Nilai tepi bawah kelas modus tersebut, TKMo = 79,5
df1 = 10
df2 = 12
I=8
Sehingga:
10
𝑀𝑜 = 79,5 + 10+12 . 8 = 83,1
4.3.1 Jangkauan
Jangkauan merupakan ukuran tersebar yang diperoleh dengan cara menarik
selisih niai data terbesar ddan nilai data terkecil. Selanjutnya ditentukan rumus untuk
menghitung jangkauan untuk data tunggal dan data berkelompok.
A. Jangkauan Data Tunggal
Untuk menentukan Jangkauan data tunggal, data harus diurutkan dari dara
terkecil sampai data terbesar, misalkan sekelompok data : x1, x2, x3, ..., xn dengan x1
= xmin dan xn = xmax.
Rumus 4.7 𝑱 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏
47
Dimana:
J = Jangkauan
xmax = nilai data terbesar = xn
xmin = nilai data terkecil = x1
Contoh 1, tinjau data berikut ini dan tentukan Jangkauannya: 5, 3. 5, 7, 7, 6, 11, 14,
15
Jawab:
Setelah data diurut diperoleh: 3, 5, 5, 6, 7, 7, 11, 14, 15
J = 15 – 3 = 12
Contoh 2, tinjau data berikut dan tentukan jangkauannya: 11, 11, 10, 9, 11, 3, 14, 15,
11
Jawab:
Setelah data diurut diperoleh: 3, 9, 10, 11, 11, 11, 11, 14, 15
J = 15 – 3 = 12
Apabila kita lihat kedua kelompok data tersebut memiliki jangkauan yang
sama yaitu 12, maka timbul pertanyaan apakah kedua data tersebut memiliki sebaran
yang sama? Untuk menjawab pertanyaan ini, sebaiknya ditunda setelah semua ukuran
statistik dibahas agar jawaban lebih jelas dan rinci.
48
Tabel 4.3 Distribusi Frekuensi Nilai 60 Peserta Sensor (dari Tabel 4.2)
Jawab:
a. Untuk Metode Pertama
Titik tengah kelas pertama = 43,5
Titik tengah kelas terakhir = 91,5
Jangkauan = 91,5 – 43,5 = 48
Rumus 4.8
∑𝒏(𝒙𝒊 − 𝒙
̅)𝟐
𝒔𝒅 = √ 𝒊
𝒏−𝟏
49
Jawab:
Untuk menjawab dibuat tabel berikut ini:
No. xi ̅
xi - 𝒙 ̅ )2
(xi - 𝒙
1 3 -5,11 26,112
2 5 -3,11 9,672
3 5 -3,11 9,672
4 6 -2,11 4,452
5 7 -1,11 1,232
6 7 -1,11 1,232
7 11 2,89 8,352
8 14 5,89 34,692
9 15 6,89 47,472
∑ 𝑥𝑖 = 73 Σ(xi - 𝒙
̅)2 =142,888
142,888
sd = √ 8
= 4,23
No. xi ̅
xi - 𝒙 ̅ )2
(xi - 𝒙
1 3 -7,56 57,154
2 9 -1,56 2,434
3 10 -0,56 0,314
4 11 0,44 0,194
5 11 0,44 0,194
6 11 0,44 0,194
7 11 0,44 0,194
8 14 3,44 11,834
9 15 4,44 19,714
∑ 𝑥𝑖 = 95 Σ(xi - 𝒙
̅)2 = 92,222
92,222
sd = √ 8
= 3,40
50
B. Standar Deviasi Data Berkelompok
Untuk data berkelompok, standar deviasi dapat dihitung dengan rumus 4.9
berikut ini.
Rumus 4.9
∑𝒏 𝒇𝒊 (𝒙𝒊 − 𝒙
̅)𝟐
𝒔𝒅 = √ 𝒊
∑𝒇 − 𝟏
Tabel 4.4 Distribusi Frekuensi Nilai 60 Peserta Sensor (dari Tabel 4.2)
Kelas Titik Frekuen fixi ̅
xi - 𝒙 ̅)2
(xi - 𝒙 ̅)2
fi(xi - 𝒙
Interval Tengah si (fi)
(xi)
40 – 47 43,5 4 174 -29,2 852.64 3410.56
48 – 55 51,5 7 360,5 -21,2 449.44 3146.08
56 – 63 59,5 3 178,5 -13,2 174.24 522.72
64 – 71 67,5 11 742,5 -5,2 27.04 297.44
72 – 79 75,5 9 679,5 2,8 7.84 70.56
80 – 87 83,5 19 1586,5 10,8 116.64 2216.16
88 – 95 91,5 7 640,5 18,8 353.44 2474.08
Σ 60 4362 12137.6
12137.6
sd =√ 60−1
= 14,34
51
Definisi 4.3
Kuartil adalah ukuran statistik yang menyatakan letak suatu nilai-nilai
data yang membagi data dalam empat kelompok data dengan jumlah
data yang sama pada data terurut.
𝒊(𝒏+𝟏)
Rumus 4.10 𝑸𝒊 = 𝒌𝒖𝒂𝒓𝒕𝒊𝒍 𝒌𝒆 − 𝒊 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 −
𝟒
𝟏(𝒏 + 𝟏)
𝑸𝟏 = 𝒌𝒖𝒂𝒓𝒕𝒊𝒍 𝒌𝒆 − 𝟏 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 −
𝟒
𝟐(𝒏 + 𝟏)
𝑸𝟐 = 𝒌𝒖𝒂𝒓𝒕𝒊𝒍 𝒌𝒆 − 𝟐 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 −
𝟒
𝟑(𝒏 + 𝟏)
𝑸𝟑 = 𝒌𝒖𝒂𝒓𝒕𝒊𝒍 𝒌𝒆 − 𝟑 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 −
𝟒
a. Kasus untuk n ganjil
Contoh 1, tentukan Kuartil dari data : 3, 4, 5, 6, 6, 7, 8
Jawab:
𝟏(𝟕 + 𝟏)
𝑸𝟏 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − 𝟐 = 𝒙𝟐 = 𝟒
𝟒
𝟐(𝟕 + 𝟏)
𝑸𝟐 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − 𝟒 = 𝒙𝟒 = 𝟔
𝟒
𝟑(𝟕 + 𝟏)
𝑸𝟑 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − 𝟔 = 𝒙𝟔 = 𝟕
𝟒
𝒙𝟐 + 𝒙𝟑 𝟒 + 𝟓
𝑸𝟏 = = = 𝟒, 𝟓
𝟐 𝟐
52
𝟐(𝟖 + 𝟏)
𝑸𝟐 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − 𝟒, 𝟓
𝟒
𝒙𝟒 + 𝒙𝟓 𝟔 + 𝟕
𝑸𝟐 = = = 𝟔, 𝟓
𝟐 𝟐
𝟑(𝟖 + 𝟏)
𝑸𝟑 = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − = 𝒏𝒊𝒍𝒂𝒊 𝒅𝒂𝒕𝒂 𝒌𝒆 − 𝟔, 𝟓
𝟒
𝒙𝟔 + 𝒙𝟕 𝟕 + 𝟖
𝑸𝟑 = = = 𝟕, 𝟓
𝟐 𝟐
Rumus 4.11
𝒊𝒏
− ∑ 𝒇𝒒𝒊
𝑸𝒊 = 𝑻𝑩𝒒𝒊 + 𝑰( 𝟒 )
𝒇𝒒𝒊
dimana:
TBqi = nilai tepi batas bawah Kuartil ke – i
I = panjang interval kelas
Σfqi = jumlah frekeunsi kelas-keas sebelum kelas Kuartil ke – i
fqi = frekensi kelas Kuartil ke -i
Contoh 1, tentukan kuartil data berkelompok dari contoh Tabel 4.2 berikut.
Tabel 4.5 Distribusi Frekuensi Nilai 60 Peserta Sensor (dari Tabel 4.2)
53
Jawab:
a. Kuartil ke – 1 (Q1)
Tentukan kelas untuk Kuartil ke – 1
Kuartil ke – 1 terletak pada in/4 = 1.60/4 = 15,
Frekeunsi 15 terletak pada kelas ke – 4, yaitu 4 + 7 + 3 + 11
Tentukan nilai tepi batas bawah kelas Kuartil ke – 1 ilai tepi
batas bawah kelas ke – 4 diperoleh dari Tabel 4.4 adalah 64 –
0.5 = 63,5
Sehingga diperoleh: TBqi = 63,5
Tentukan jumlah frekuensi kelas-kelas di bawah kelas Kuartil
ke – 1
Σfqi = frekuensi kelas ke – 1 + frekuensi kelas ke – 2 +
frekuensi kelas ke – 3
Σfqi = 4 + 7 + 3 = 14
Tentukan frekuensi kelas Kuartil ke – 1
fqi = frekuensi kelas Kuartil ke – 1 = 11
Tentukan panjang interval kelas (I)
I = 71,5 – 63,5 = 8
Tentukan nilai Kuartil ke – 1
𝒊𝒏
− ∑ 𝒇𝒒𝒊
𝑸𝟏 = 𝑻𝑩𝒒𝟏 + 𝑰( 𝟒 )
𝒇𝒒𝒊
𝟏. 𝟔𝟎
− 𝟏𝟒
𝑸𝟏 = 𝟔𝟑, 𝟓 + 𝟖( 𝟒 )
𝟏𝟏
𝑸𝟏 = 𝟔𝟒, 𝟐𝟑
b. Kuartil ke – 2 (Q2)
Tentukan kelas untuk Kuartil ke – 2
Kuartil ke – 2 terletak pada in/4 = 2.60/4 = 30
Frekuensi 30 terletak pada kelas ke – 5, yaitu 4 + 7 + 3 + 11 + 9
Tentukan nilai tepi batas bawah kelas Kuartil ke – 2
Nilai tepi batas bawah kelas ke – 5 dari Tabel 4.4 adalah 72 –
0,5 = 71,5
Sehingga diperoleh: TBqi = 71,5
Tentukan jumlah frekuensi kelas-kelas di bawah kelas Kuartil
ke – 2
54
Σfqi = frekuensi kelas ke – 1 + frekuensi kelas ke – 2 +
frekuensi kelas ke – 3 + frekuensi kelas ke – 4
Σfqi = 4 + 7 + 3 + 11 = 25
𝒊𝒏
− ∑ 𝒇𝒒𝒊
𝑸𝟐 = 𝑻𝑩𝒒𝟐 + 𝑰( 𝟒 )
𝒇𝒒𝒊
𝟐. 𝟔𝟎
− 𝟐𝟓
𝑸𝟐 = 𝟕𝟏, 𝟓 + 𝟖( 𝟒 )
𝟗
𝑸𝟐 = 𝟕𝟓, 𝟗𝟒
c. Kuartil ke – 3 (Q3)
Tentukan kelas untuk Kuartil ke – 3
Kuartil ke – 3 terletak pada in/4 = 3.60/4 = 45
Frekuensi 45 terletak pada kelas ke – 6, yaitu 4 + 7 + 3 + 11 + 9
+ 19
Tentukan nilai tepi batas bawah kelas Kuartil ke – 3
Nilai tepi batas bawah kelas ke – 5 dari Tabel 4.4 adalah 80 –
0,5 = 79,5
Sehingga diperoleh: TBqi = 79,5
Tentukan jumlah frekuensi kelas-kelas di bawah kelas Kuartil
ke – 3
Σfqi = frekuensi kelas ke – 1 + frekuensi kelas ke – 2 +
frekuensi kelas ke – 3 + frekuensi kelas ke – 4 + frekuensi kelas
ke – 5
Σfqi = 4 + 7 + 3 + 11 + 9 = 34
Tentukan frekuensi kelas Kuartil ke – 3
fqi = frekuensi kelas Kuartil ke – 2 = 19
Tentukan panjang interval kelas (I)
I = 87,5 – 79,5 = 8
Tentukan nilai Kuartil ke – 3
55
𝒊𝒏
− ∑ 𝒇𝒒𝒊
𝑸𝟑 = 𝑻𝑩𝒒𝟑 + 𝑰( 𝟒 )
𝒇𝒒𝒊
𝟑. 𝟔𝟎
− 𝟑𝟒
𝑸𝟑 = 𝟕𝟗, 𝟓 + 𝟖( 𝟒 )
𝟏𝟗
𝑸𝟑 = 𝟖𝟒, 𝟏𝟑
56
Setelah data diurut diperoleh: 3, 9, 10, 11, 11, 11, 11, 14, 15
J = 15 – 3 = 12
Q1 = (9 + 10)/2 = 9,5
Q3 = (11 + 14)/2 = 12,5
Sehingga: JQ = Q3 - Q1 = 12,5 – 9,5 = 3
Terlihat dari kedua contoh tersebut bahwa meskipun harga Jangkauannya (J)
sama yaitu 12, tetapi nilai Jangkauan Antarkuartilnya sangat jauh berbeda, kelompok
data pertama JQ = 9,5 sementara untuk kelompok data kedua JQ = 3. Hal ini
memperlihatkan bahwa Jangkauan antarkuartil dapat memberikan informasi yang
lebih baik daripada Jangkauan karena memberikan tingkat distribus data yang lebih
homogen. Pembahasan tentang hal ini akan lebih rinci pada bab selanjutnya yang
membahas tentang pencilan.
Rumus 4.14
3(𝑥̅ − 𝑀𝑒)
𝛽1 =
𝑠𝑑
57
a. Bentuk Kurva Simetris
Bentuk Simetris terjadi apabila nilai 𝛽1 = 0, yaitu Nilai rata-rata hitung
= median (Me) = Modus (Mo).
b. Bentuk kurva Miring ke Kanan
Bentuk kurva miring ke kanan terjadi apabila 𝛽1 > 0,
yaitu nilai rata-rata hitung > median > modus
c. Bentuk Kurva Miring ke Kiri
Bentuk kurva miring ke kanan terjadi apabila 𝛽1 < 0,
Yaitu nilai rata-rata hitung < median < modus
4.5.2 Bentuk Keruncingan Kurva
Bentuk Keruncingan Kurva (Kurtosis) adalah seberapa runcing suatu kurva
bila dibandingkan dengan distribusi normal. Terdapat tiga kondisi keruncingan kurva,
yaitu mesokurtis, leptokurtis, dan platikurtis. Kondisi keruncingan kurva tersebut
dapat dinyatakan dengan koefisien keruncingan berikut ini.
Rumus 4.15
1
𝑛 (∑(𝑥𝑖 − 𝑥̅ )4
𝛼4 =
𝑠4
58
Keunikan nilai standar z adalah nilai rata-rata z sama dengan nol, dan standar
deviasi z sama dengan satu.
Pembuktian:
a. Pembuktian nilai rata-rata z =0
∑ 𝒛𝒊
𝒛̅ =
𝒏
̅)
(𝒙𝒊 − 𝒙
∑
𝒛̅ = 𝒔𝒅
𝒏
∑ 𝒙𝒊
̅
̅ 𝒏 ( 𝒏 ) − 𝒏𝒙
∑ 𝒙𝒊 − ∑ 𝒙
𝒛̅ = =
𝒏𝒔𝒅 𝒏𝒔𝒅
̅ − 𝒏𝒙
𝒏𝒙 ̅
𝒛̅ = =𝟎
𝒏𝒔𝒅
Terbukti.
b. Pembuktian Standar deviasi z = 1
∑(𝒛𝒊 − 𝒛̅)𝟐
𝒔𝒅𝒛 𝟐 =
𝒏−𝟏
∑ 𝒛𝒊 𝟐
𝒔𝒅𝒛 𝟐 =
𝒏−𝟏
𝒙 −𝒙 ̅ 𝟐
∑( 𝒊 )
𝒔𝒅𝒛 𝟐
= 𝒔𝒅
𝒏−𝟏
̅)𝟐
𝟏 ∑(𝒙𝒊 − 𝒙
𝒔𝒅𝒛 𝟐 =
𝒔𝒅𝟐 𝒏 − 𝟏
𝟏
𝒔𝒅𝒛 𝟐 = . 𝒔𝒅𝟐
𝒔𝒅𝟐
𝒔𝒅𝒛 𝟐 = 𝟏
𝒔𝒅𝒛 = 𝟏
Terbukti.
59
4.6 Rangkuman
Terdapat empat jenis ukuran statistik yang dapat digunakan untuk
mengkarakteristik sekelompok data atau distribusi data. Pertama, ukuran terpusat
yang memberikan nilai-nilai yang menjadi pusat dari data lainya, yaitu nilai rata-rata
hitung, median, dan modus. Nilai rata-rata hitung dapat memperkirakan distribusi
frekuensi disebabkan nilai rata-rata hitung berdasarkan semua data, sedangkan
median merupakan nilai pusat yang terletak di tengah-tengah data, dan modus
merupakan data yang sering muncul atau yang terbesar frekuensinya.
Kedua, ukuran tersebar merupakan ukuran yang memperlihatkan seberapa
jauh data tersebar dari nilai pusatnya. Ukuran tersebar terdiri dari jangkauan dan
standar deviasi. Jangkauan akan memberikan informasi yang tidak tepat apabila data
terkecil dan data terbesar merupakan niali yang ekstrem. Sebaliknya, standar deviasi
dapat memberikan informasi yang lebih akurat karena dihitung menggunakan selisih
terhadap nilai rata-rata hitunnya.
Ketiga, ukuran posisi yang memperlihatkan posisi-posisi yang dapat
membagi kelompok data menjadi daerah yang memiliki jumlah data yang sama, yaitu
kuartil. Kuartil terdapat tiga jenis yaitu kuaril pertama, kedua, dan ketiga. Selisih
antara kuartil ketiga dan pertama memberikan nilai jangkauan antarkuartil yang dapat
digunakan untuk memperbaiki nilai jangkauan data. Olehkarena nilai jangkauan
antarkuartil tidak dipengaruhi oleh nilai-nilai ekstrim, jangkaun antarkuartil lebih
memberikan informasi tentang sebaran distribusi data.
Keempat, bentuk kurva dapat digunakan secara visual untuk menentukan
derajat kemiringan ataupun keruncingan distribusi data. Derajat kemiringan distribusi
data dapat diperkirakan dengan membandingan nilai-niai pusat data, yaitu nilai rata-
rata hitung, median, dan modus. Apabila nilai rata-rata hitung sama dengan median
dan juga modus, maka bentuk kurva menjadi simetris. Di sisi lain keruncingan
distribusi dapat diukur dari koefisien keruncingan yang merupakan fungsi dari
standar deviasi. Semakin kecil nilai standar deviasi, maka betuk kurva semakin
runcing.
4.7 Soal-soal
1. Tentukan nilai rata-rata dan standar deviasi dari data ini:
5 5 5 5 5
2. Tinjau kembali data soal no.3 Bab 3, yaitu data nilai mata kuliah Sistem
Instrumentasi dari 50 orang mahasiswa:
75 70 71 60 60 63 63 65 80 80
78 77 90 89 88 70 80 80 80 81
79 78 77 65 67 68 69 70 75 75
60
77 80 81 81 82 85 80 81 88 90
82 84 80 85 76 79 88 76 81 87
61
BAB V
BEBERAPA PERMASALAHAN KHUSUS
5.1 Pendahuluan
Terdapat banyak permasalahan yang mungkin timbul pada saat penyajian
data. Pertama, apabila terdapat dua kelompok data dengan ukuran-ukuran statistik
yang dimiliki masing-masing kelompok, kelompok data yang manakah yang lebih
baik? Kedua, ketika terdapat data yang sangat besar atau sangat kecil dalam
kelompok data, apakah yang harus dilakukan membuang data tersebut karena
mengganggu distribusi data? Ketiga, adanya data ekstrim mempengaruhi nilai rata-
rata hitung, sementara itu nilai ukuran posisi seperti Kuartil tidak dipengaruhi oleh
data ekstrim tersebut, perlukah memodifikasi cara menghitung nilai rata-rata?
5.2 Koefisien Variasi
Pertanyaan pertama, apabila terdapat dua kelompok data dengan ukuran-
ukuran statistik yang dimiliki masing-masing kelompok, kelompok data yang
manakah yang lebih baik? Distribusi data dapat disajikan menggunakan ukuran
statistik seperti nilai rata-rata dan standar deviasi, seperti contoh berikut kelompok
data A memiliki nilai rata-rata 75 dan standar deviasi 10, sedangkan kelompok data
B memiliki nilai rata-rata 69 dan standar deviasi 8. Apakah data A lebih baik dari B
karena nilai rata-ratanya lebih besar ataukan data B lebih baik karena standar deviasi
lebih kecil?
Walaupun standar deviasi yang sangat kecil memperlihatkan homogenitas
yang baik, tetapi ada pula standar deviasi yang tidak cukup kecil sehingga kurang
mampu untuk memperlihatkan homogenitas dari distribusi data. Apabila terdapat
beberapa kelompok pengamatan dengan distribusi data, untuk melihat data mana
yang lebih baik, diperkenalkan suatu ukuran yang membandingkan antara nilai rata-
rata dan standar deviasi seperti pada ruus 8.1 berikut.
𝒔𝒅
Rumus 5.1 𝑲𝑽 = ̅
𝒙
. 𝟏𝟎𝟎%
Dimana:
KV = koefisien variasi
Sd = standar deviasi
𝑥̅ = nilai rata-rata
62
Contoh 1: Tinjau data A : 1 2 3 4 5
Data B : 2 3 3 3 4
Manakah dari kelompok data tersebut yang lebih homogen distribusi datanya?
Jawab:
Data A: 𝒙̅ = 3, sd = 1,58 KV = 52,74%
Data B: 𝒙̅ = 3, sd = 0,71 KV = 23,57%
Terlihat bahwa data B lebih homogen dibanding data A, karena nilai KV data B <
KV data A.
63
nilai standar z pada dasarnya adalah untuk melihat seberapa jauh suatu data terletak
dari nilai rata-ratanya.
Metode diagram titik hanya menggunakan gambar untuk melihat
kecenderungan data terhadap data lainnya. Metode ini tidak melakukan perhitungan
matematik. Berbeda dengan metode diagram titik, metode boxplot (kuartil) dan
metode nilai standar z menggunakan perhitungan matematik. Oleh karena itu ada
kemungkinan hasil yang akan berbeda antara metode diagram titik dibndingkan
dengan metode boxplot ataupun metode nilai standar z.
0 2 4 6 8 10 12 14 16
64
0 20 40 60 80 100 120 140
65
JQ = Q3 – Q1 = 12,5 – 9,5 = 3
Batas bawah nilai pencilan = BBP = Q1 – 1,5JQ = 9,5 – 1,5x3 = 5
Batas atas nilai pencilan = BAP = Q3 + 1,5JQ = 12,5 + 4,5 = 16,5
18
16
14
12
10
66
JQ = Q3 – Q1 = 80 – 60 = 20
Batas bawah nilai pencilan = BBP = Q1 – 1,5JQ = 60 – 1,5x20 = 30
Batas atas nilai pencilan = BAP = Q3 + 1,5JQ = 80 + 1,5x20 = 110
Sehingga diperoleh 20 dan 120 merupakan pencilan.
120
100
80
60
40
20
5.4 Soal-soal
1. ljlkj
67
DAFTAR PUSTAKA
Freund, John E., and Simon, Gary A. 1997. Modern Elementary Statistics. New
Jersey: Prentice Hall, Inc. 9th Edition.
Kreyszig, Erwin. 1993. Advanced Engineering Mathematics: Chapter 24
Mathematical Statistics. Singapore: John Wiley and Sons, Inc. 7th Edition.
Leon-Garcia, Alberto. 2008. Probability, Statistics, and Random Processes for
Electrical Engineering. New Jersey: Pearson Education, Inc. 3rd Edition.
Levine, David M., Stephan, David L., Krehbiel, Timothy C., and Berenson, Mark L.
2008. Statistics for Managers: Using MicrosoftR Excel. New Jersey: Prentice
Hall, Inc. 5th Edition.
Luftig, Jeffrey T., and Jordan, Victoria S. 1998. Design of Experiment in Quality
Engineering. New York: McGraw-Hill.
Mann, Prem S. 2010. Introductory Statistics. New Jersey: John Wiley & Sons, Inc.
7th Edition.
Montgomery, Douglas C., Runger, George C., and Hubele, Norma Faris. 2011.
Engineering Statistics. New Jersey: John Wiley and Sons, Inc. 5th Edition.
Montgomery, Douglas C., and Runger, George C. 2014. Applied Statistics and
Probability for Engineers. New Jersey: John Wiley & Sons, Inc. 6th Edition.
Singh, Yogesh Kumar. 2006. Fundamental of Research Methodology and Statistics.
New Delhi: New Age International (P) Ltd., Publisher.
Siregar, Syofian. 2012. Statistika Deskriptif untuk Penelitian, Dilengkapi
Perhitungan Manual dan Aplikasi SPSS Versi 17. Jakarta: Rajawali Pers.
Spiegel, Murray R., Schiller, John J., and Srinivasan, R. Alu. Schaum’s Outline of:
Teori dan Soal-soal Probabilitas dan Statistik. Jakarta: Penerbit Erlangga.
Edisi Kedua.
Spiegel, Murray R., and Stephens, Larry J. 2008. Schaum’s Outline of: Theory and
Problems of Statistics. New York: McGraw-Hill. 4th Edition.
Sumanto. 2014. Statistika Deskriptif untuk Mahasiswa, Dosen, dan Umum.
Yogyakarta: CAPS (Center of Academic Publishing Service).
68
Walpole, Ronald E., Myers, Ramon H., and Myers, Sharon L. 2002. Probability and
Statistics for Engineers and Scientists. New Jersey: Prentice Hall
International, Inc. 7th Edition.
69
RIWAYAT PENULIS
Mumuh Muharam, ST, MT lahir di Jakarta 13 Nopember 1967 adalah Staff Pengajar
di Jurusan Teknik Elektro Fakultas Teknik Universitas Andalas sejak tahun 1998. Ia
memperoleh gelar Sarjana Teknik di Jurusan Teknik Fisika ITB pada 1993 dan
menyelesaikan pendidikan Pasca Sarjana (S2) dengan gelar Magister Teknik di
Jurusan Teknik Elektro ITB pada 2000. Sejak 2001, mengajar matakuliah
Probabilitas dan Statistik (3 sks) di Jurusan Teknik Elektro Fakultas Teknik
Universitas Andalas dan pernah mengampu matakuliah Statistika di Jurusan Sistem
Informasi di Universitas yang sama.
70