Anda di halaman 1dari 77

MODUL

STATISTIKA

Oleh:

Ai Ilah Warnilah,S.T.,M.Kom

UNIVERSITAS BINA SARANA INFORMASTIKA

FAKULTAS TEKNOLOGI DAN INFORMASI

PROGRAM STUDI SISTEM INFORMASI

TASIKMALAYA
2020
KATA PENGANTAR

Puji syukur kami panjatkan kehadirat Allah SWT., yang telah

memberikan nikmat lahir maupun batin kepada kami sehingga modul

Statistika ini dapat selesai dengan tepat waktu. Selanjutnya modul ini

disusun pegangan Mahasiswa Pada Statistika.

Modul ini berisikan tentang Dasar dasar Statistika. Dimana isi dari

modul ini didalamnya tercantum contoh kasus dan penyelesaian kasus ,

sehingga akan memudahkan pembelajaran statistika bagi pembacanya.

Kami mengucapkan terima kasih banyak kepada semua pihak yang

telah membantu dengan tenaga dan pikirannya, terima kasih juga kepada

teman-teman yang telah membantu dalam proses penyusunan modul ini.

Kami menyadari masih banyak kekurangan dalam penyusunan modul

ini. Untuk itu saran dan kritik yang membangun sangat kami harapkan guna

perbaikan dan pengembangan modul ini di masa yang akan datang. Akhir

kata kami berharap semoga modul pemrograman java ini dapat bermanfaat

bagi pembacanya.

Tasikmalaya, Juni 2019

Ai ilah Warnilah
PERTEMUAN I

1.1. Pengertian Statistik Dan Statistika


Statistika adalah Suatu ilmu yang mempelajari cara pengumpulan, pengolahan,
penyajian dan analisis data serta cara pengambilan kesimpulan secara umum
berdasarkan hasil penelitian yang tidak menyeluruh. Dalam arti sempit Statistik
adalah data ringkasan berbentuk angka (kuantitatif)
Sebagai suatu bidang studi, statistik memiliki dua bagian utama, yaitu :
1. Statistika Deskriptif adalah ilmu statistika yang mempelajari tentanpengumpulan,
pengolahan, dan penyajian data.
2. Statistika Inferensi (Statistika Induktif) adalah ilmu statistika yang mempelajari
tentang cara pengambilan kesimpulan secara menyeluruh (populasi) berdasarkan
data sebagian (sampel) dari populasi tersebut. Kegunaan Statistika dalam bidang
ekonomi yaitu
• Bidang produksi
• Bidang akuntansi
• Bidang pemasaran
Pengetahuan tentang statistik membantu untuk :
1. Menjelaskan hubungan antar variabel.
2. Membuat keputusan lebih baik.
3. Mengatasi perubahan-perubahan.
4. Membuat rencana dan ramalan.
5. Dan masih banyak manfaat yang lain.
Tahap-tahap dalam statistik
1. Mengidentifikasikan persoalan.
2. Pengumpulan fakta-fakta yang ada.
3. Mengumpulkan data asli yang baru.
4. Klasifikasi data.
5. Penyajian data.
6. Analisa data.
1.2 Populasi, Sampel dan Data.
Populasi adalah seluruh elemen yang akan diteliti. Sampel adalah elemen yang
merupakan bagian dari populasi.
Data adalah fakta-fakta yang dapat dipercaya kebenarannya Jenis-jenis pengambilan
sampel yaitu :
1. Random sederhana (simple random sampling) Adalah pengambilan sampel secara
acak sehingga setiap anggota populasi mempunya kesempatan yang sama untuk
menjadi sampel, misalnya dengan cara undian.
2. Random berstrata (Stratified Random Sampling) Adalah pengambilan sampel
yang populasinya dibagi-bagi menjadi beberapa bagian/stratum. Anggota-anggota
dari stratum dipilih secara random, kemudian dijumlahkan, jumlah ini membentuk
anggota sampel
3. Sistematis (Systematic Sampling) Adalah pengambilan sampel berdasarkan
urutan tertentudari populasi yang telah disusun secara teratur dan diberi nomer
urut.
4. Luas/Sampel Kelompok (Cluster sampling) Adalah pengambilan sampel tidak
langsung memilih anggota populasi untuk dijadikan sampel tetapi memilih
kelompok terlebih dahulu. Yang termasuk sebagai sampel adalah anggota yang
berada dalam kelompok terpilih tersebut. Jika kelompok-kelompok tersebut
merupakan pembagiandaerah-daerah geografis, maka cluster sampling ini disebut
juga area sampling.
Pembagian data dapat dibedakan menurut :
1. Sifatnya
a. Data kualitatif adalah data yang disajikan bukan dalam bentuk angka, misalnya
agama, jenis kelamin, daerah, suku bangsa, pangkat pegawai, jabatan pegawai dan
sebagainya.
b. Data kuantitatif adalah data yang disajikan dalam bentuk angka.
Data ini terbagi menjadi :
1) Data kontinu adalah data yang satuannya bisa dalam pecahan.
2) Data diskret adalah data yang satuannya selalu bulat dalam bilangan asli, tidak
berbentuk pecahan.
2. Waktunya.
a. Data silang (Cross Section) adalah data yang dikumpulkan pada suatu waktu
tertentu yang bisa menggambarkan keadaan /kegiatan pada waktu tersebut,
misalnya jumlah warga DKI Jakarta menurut asal dan agama pada tahun 2011
b. Data Berkala (Time Series) adalah data yang dikumpulkan dari waktu ke waktu,
misalnya data angka kematian dan kelahiran dari tahun ke tahun di Indonesia yang
cenderung membesar atau mengecil
3. Cara memperolehnya.
a. Data primer adalah data yang didapatkan langsung dari responden.Contoh : data
pegawai negeri sipil di BKN, data registrasi mahasiswa di suatu universitas dan
sebagainya.
b. Data Sekunder adalah data yang diambil dari data primer yang telah diolah, untuk
tujuan lain, Contoh : data perkawinan antara umur 17 s/d 20 tahun di Indonesia yang
diambil dari Departemen Agama untuk tujuan analisa pola perkawinan setiap suku
bangsa di Indonesia.
4. Sumbernya.
a. Data Internal adalah data yang menggambarkan dari keadaan di dalam suatu
organisasi. Contoh : dari suatu universitas adalah data dosen, jumlah mahasiswa,
data kelulusan dan sebagainya.
b. Data Eksternal adalah data yang dibutuhkan dari luar untuk kebutuhan suatu
organisasi tersebut. Contoh: data orang tua mahasiswa BSI untuk keperluan
beasiswa.
Syarat Data yang baik adalah
1. Benar/Obyektif.
2. Mewakili/Wajar (representative).
3. Dipercaya, artinya kesalahan bakunya kecil.
4. Tepat waktu (up to date).
5. Relevan (data yang dikumpulkan ada hubungannya dengan permasalahannya)
1.3 Pengukuran dan Jenis-jenis Skala Pengukuran.
Variabel (peubah) adalah karakteristik - karakteristik yang terdapat pada elemen-
elemen dari populasi tersebut. Contoh : Pada masyarakat, elemennya adalah
manusia, karakteristiknya misalnya penghasilan, umur, pendidikan, jenis kelamin
dan status perkawinan yang merupakan variabel-variabel dalam penelitian. Variabel
terbagi atas :
1. Variabel kualitatif (kategori). Contoh:Tingkat Pendidikan ,Jenis kelamin dsb.
2. Variabel kuantitatif (Numerik). Contoh : Penghasilan, umur, jumlah keluarga, dsb
Untuk analisa data penelitian, diperlukan macam-macam ukuran skala yaitu :
1. Skala Nominal (Skala Klasifikasi) adalah skala yang paling sederhana dimana
angka yang diberikan kepada obyek sebagai label saja dan tidak menunjukkan
tingkatan apa-apa. contoh: jenis kelamin, no urut absen
2. Skala Ordinal Adalah skala yang diberikan kepada obyek sebagai label dan
menunjukkan tingkatan. contoh: tingkat pendidikan
3. Skala Interval Adalah suatu pemberian angka kepada set dari obyek yang
mempunyai sifat-sifat ukuran ordinal dan ditambah 1 sifat lain yaitu jarak yang
sama. contoh : data nilai , berat badan
4. Skala Rasio. Adalah suatu pemberian angka pada set obyek yang mempunyai sifat-
sifat ukuran ordinal, mempunyai jarak yang sama dan ditambah 1 sifat yaitu nilai
absolut dari obyek yang diukur. contoh : suhu badan
PERTEMUAN II

NOTASI SIGMA DAN UKURAN GEJALA PUSAT BELUM DI


KELOMPOKAN

2.1 Notasi Sigma

2.2. Ukuran Gejala Pusat Data Belum Dikelompokkan


a. Rata-rata hitung
adalah nilai yang mewakili sekelompok data.

∑xi =1/N {x1+x2+...xn}


Keterangan:

𝑥̅ = rata-rata hitung
𝑥𝑖 = nilai hitung ke-i
𝑛 = jumlah sampel
Contoh Soal :

Y= 8, 20, 12, 7, 7, 9, 13, 16, 20, 10, 5, 7, 13,2, 1

Tentukan rata-rata hitungnya !

Jawab : Y = 8, 20, 12, 7, 7, 9, 13, 16, 20, 10, 5, 7, 13,2, 1

15

150
= = 10 (C)
15

b. Rata-rata geometrik
adalah akar ke-n dari hasil perkalian unsur-unsur datanya. Secara
matematis dapat dinyatakan dengan formula berikut:

G=N√X1.X2. ...XN atau

Log G=(∑log X1)/N

Keterangan :

G = rata-rata ukur (rata-rata geometrik)

N = banyaknya sampel

Rata-rata geometrik sering digunakan dalam bisnis dan ekonomi


untuk menghitung rata-rata tingkat perubahan, rata-rata tingkat
pertumbuhan, atau rasio rata-rata untuk data berurutan tetap atau
hampir tetap atau untuk rata-rata kenaikan dalam bentuk persentase.
Contoh:

Diketahui data suku bunga tabungan beberapa bank adalah sebagai


berikut:

6.75, 5.75, 6.50, 6.25, 6.25, 6.10, 5.70, 5.90, 6.25, 5.60

Berapa rata-rata ukur (geometrik) suku buka bank tersebut?

Jawab:

G=𝑛. √. 𝑥2 . 𝑥3…. . 𝑥𝑛

G=10. √6,75 . 5,75 . 6.50 . 6,25 . 6,25 . 6,10 . 5,70 . 5,90 . 6,25 . 5,60

G=10. √70757056,11

G=6,095

c. Rata-rata harmonik dari seperangkat data


Rata-rata harmonik (harmonic average) adalah rata-rata yang
dihitung dengan cara mengubah semua data menjadi pecahan,
dimana nilai data dijadikan sebagai penyebut dan pembilangnya
adalah satu, kemudian semua pecahan tersebut dijumlahkan dan
selanjutnya dijadikan sebagai pembagi jumlah data. Rata-rata
harmonik ini sering disebut juga dengan kebalikan dari rata-rata
hitung (aritmatik). Secara matematis rata-rata harmonik dirumuskan
sebagai berikut.

Keterangan:
H = rata-rata harmonik
n = jumlah data sampel
xi = nilai data ke-i

Contoh:
Suatu pertandingan bridge terdiri dari 10 meja. Pada pertandingan
tersebut ingin diketahui rata-rata lama bermain dalam 1 set kartu
bridge. Pada pertandingan pertamanya dihitung lama bermain untuk
setiap set kartu di setiap meja. Hasilnya adalah sebagai berikut (dalam
menit).

7, 6, 8, 10, 8, 8, 9, 12, 9, 11
Berapakah rata-rata harmonik lama pertandingan tersebut?

Jawab:
Dari rumus dapat dihitung rata-rata harmonik adalah sebagai
berikut.

10
H=
1 1 1 1 1 1 1 1 1 1
7 + 6 + 8 + 10 + 8 + 8 + 9 + 12 + 9 + 11

10
H = 1,180988456 = 8,46

d. Rata-rata tertimbang

Rata-rata tertimbang/terbobot (weighted average) adalah rata-rata


yang dihitung dengan memperhitungkan timbangan/bobot untuk
setiap datanya. Setiap penimbang/bobot tersebut merupakan
pasangan setiap data.
Rumus rata-rata tertimbang/terbobot adalah sebagai berikut.
∑𝑛𝑖−1 𝑥𝑖 𝑤𝑖
𝑥̅ = 𝑛
∑𝑖−1 𝑤𝑖
Keterangan:
= rata-rata tertimbang
𝑥𝑖 = nilai data ke-i
𝑤𝑖 = bobot data ke-i
n = jumlah data

Contoh penggunaan rata-rata tertimbang


Sebuah perguruan tinggi membuka penerimaan mahasiswa baru.
Dalam rangka penerimaan, perguruan tinggi tersebut melaksanakan
ujian masuk untuk calon mahasiswa baru. Calon mahasiswa baru
diwajibkan mengkuti tes kemampuan 3 mata pelajaran, yaitu
matematika, bahasa inggris dan pengetahuan umum.

Untuk memberikan penilaian yang lebih baik, perguruan tinggi


tersebut membobot setiap mata pelajaran yang diujiankan.
Matematika diberi bobot 50, bahasa Inggris 30 dan pengetahuan
umum 20.
Setelah ujian dilaksanakan, seorang calon mahasiswa baru
mendapatkan nilai sebagai berikut. Matematika 65, bahasa inggris 70
dan pengetahuan umum 80. Berapakah nilai rata-rata calon
mahasiswa tersebut?

Jawaban :
Diketahui bahwa penilaian bersifat terbobot, oleh karena itu
penghitungan nilai mahasiswa tersebut menggunakan rumus rata-rata
tertimbang.

Dengan menggunakan rumus rata-rata tertimbang maka


penghitungan nilai mahasiswa tersebut adalah sebagai berikut.

(65x50) + (70x30) + (80x20) 6950


𝑥̅ = = = 69,5
50 + 30 + 20 100
Jadi, nilai rata-rata calon mahasiswa baru tersebut adalah 69,5.

e. Median (Nilai Tengah)


Pengertian median adalah salah satu teknik penjelasan kelompok
yang didasarkan atas nilai tengah dari kelompok data yang telah
disusun urutannya dari yang terkecil sampai yang terbesar, atau
sebaliknya dari yang terbesar sampai yang terkecil.
1. Median data tunggal
Contoh:
Hasil observasi umur pegawai di kantor X adalah :
20, 45, 60, 56, 45, 45, 20, 19, 57, 45, 45, 51, 35

Untuk dapat mencari mediannya maka data umur diatas harus


disusun terlebih dahulu urutannya. Setelah disusun, menjadi
sebagai berikut :
19, 20, 20, 35, 45, 45, 45, 45, 45, 51, 56, 57, 60
Nilai tengah data diatas berada pada urutan ke 7 yaitu 45. Jadi
mediannya adalah 45.
2. Median data berkelompok
𝑛
−𝐹
Me = Tb+p[ 2
]
𝑓

Keterangan:
Me = median
Tb = tepi bawah kelas median
p = panjang kelas
n = banyak data
F = frekuensi kumulatif sebelum kelas median
F = frekuensi kelas median
Data Frekuensi FK
11-20 5 5
21-30 3 8
31-40 8 16
41-50 7 23
51-60 4 27
61-70 9 36
Jumlah 36
Penyelesaian:
𝑛
−𝐹
Me = Tb+p[ 2
]
𝑓
36
−16
= 40,5+10[ 2
]
7

18−16
= 40,5+10[ ] = 40,5+2,86 = 43,36
7

karena banyaknya data adalah 36 maka median terletak di antara


data ke-18 dan data ke-19 sehingga diperoleh kelas yang
mengandung median adalah 4-40. Dengan demikian, Tb = 41- 0,5
= 40,5; p = 10(11-20); f = 7; F = 16.

f. Modus (Nilai Yang Paling Banyak Muncul)


Pengertian modus adalah teknik penjelasan kelompok yang
didasarkan atas nilai yang sedang populer (yang sedang menjadi
mode) atau nilai yang sering muncul dalam kelompok tersebut.
1. Modus data tunggal
Contoh Modus Pada Data Kuantitatif :
Umur pegawai kantor Y adalah :
20, 45, 60, 56, 45, 45, 20, 19, 57, 45, 45, 51, 35

Dari data diatas, dapat dilihat bahwa yang paling banyak muncul
adalah umur 45. Munculnya sebanyak 5 kali, jadi dapat dijelaskan
bahwa kelompok pegawai kantor Y sebagian besar berumur 45
tahun.
2. Modus data tergolong
𝑑
Mo = Tb+p[ ]
𝑑1 +𝑑2

Keterangan:
Mo = modus
Tb = tepi bawah kelas modus
P = panjang
𝑑1 = selisih frekuensi kelas modus dengan kelas sebelumnya
𝑑2 = selisih frekuensi kelas modus dengan kelas sesudahnya

Contoh:
Data Frekuensi
11-20 5
21-30 3
31-40 8
41-50 7
51-60 4
61-70 9
Jumlah 36
Jawab:
Karena kelas dengan frekuensi terbanyak 9 maka modus terletak
diantara kelas 51-60; tb=51-0,5=50,5; p =10(11-20); 𝑑𝑖 =9-4=5; F=16.
Penyelesaian:
𝑑
Me = Tb+p[ ]
𝑑1 +𝑑2
2
= 50,5+10[ ]
2+5

= 50,5+2,28 = 53,36
Jadi, modusnya adalah 53,36

g. Kuartil
Kuartil adalah nilai yang membagi suatu data terurut menjadi
empat bagian yang sama. Kuartil dilambangkan dengan Q . Jenis
kuartil ada 3, yaitu kuartil pertama (Q1) , kuartil kedua (Q2), dan
kuartil ketiga (Q3).

1. Kuartil untuk Data Tunggal

i(n+1)
𝐿𝑒𝑡𝑎𝑘 𝑄1 = 4

Keterangan :

𝑄1 = kuartil ke i

n= banyaknya data

Tentukan Q1 , Q2 dan Q3 dari data : 7,3,8,5,9,4,8,3,10,2,7,6,8,7,2,6,9,

Jawab :

Data terurut : 2,2,3,3,4,5,6,6,7,7,7,8,8,8,9,9,10

n = 17

1(17 + 1) 18
𝐿𝑒𝑡𝑎𝑘 𝑄1 = = = 4,5
4 4

𝑄1 = 𝑋4 + 0,5 (𝑋5 + 𝑋4 )

= 3 + 0,5 (4-3) = 3,5

2(17 + 1) 36
𝐿𝑒𝑡𝑎𝑘 𝑄2 = = =9
4 4

𝑄2 = 𝑋9 = 7
3(17 + 1) 54
𝐿𝑒𝑡𝑎𝑘 𝑄3 = = = 13,5
4 4

𝑄3 = 𝑋13 + 0,5 (𝑋14 + 𝑋13 )

= 8 + 0,5 (8 – 8) = 8

2. Kuartil untuk data Bergolong (Berkelompok)

Menentukan letak kuartil untuk data berkelompok

𝑖. 𝑛
−𝐹
𝑄𝑖 = 𝑇𝑏 + 𝑝 ( 4 )
𝑓

Keterangan :
Qi = kuartil ke-i n = banyak data
Tb = tepi bawah kelas kuartil f = frekuensi kelas
kuartil
F = frekuensi kumulatif sebelum kelas kuartil p = panjang kelas

Tentukan Qi dari data berikut:

Data F
11-20 2
21-30 7
31-40 4
41-50 6
51-60 5
61-70 6

Jawab
Data F
11-20 2
21-30 7
31-40 4
41-50 6
51-60 5
61-70 6

𝑖. 𝑛
−𝐹
𝑄𝑖 = 𝑇𝑏 + 𝑝 ( 4 )
𝑓

7,5−2
= 20,5 + 10 ( )
7

= 20,5 + 7,86 = 28,36

h. Desil

Desil merupakan nilai yang membagi data menjadi sepuluh bagian


sama besar. Desil sering dilambangkan dengan D. jenis ada 6, yaitu D1
, D2 , D3, ….,…,…,D9.

1. Desil untuk data tunggal

𝑖(𝑛−1)
𝑳𝒆𝒕𝒂𝒌 𝑫𝟏 = 10

Keterangan :
Di = desil ke-i
n = banyaknya data

Tentukan desil ke-8 dari data : 6,3,8,9,5,9,9,7,5,7,4,5,8,3,7,6,.

Jawab:

n = 16
data terurut = 3,3,4,5,5,5,6,6,7,7,7,8,8,9,9,9.

8(16 − 1)
𝐿𝑒𝑡𝑎𝑘 𝐷8 = = 13,6
10

𝐷8 = 𝑋13 + 0,6 (𝑋14 + 𝑋13 )

= 8 + 0,6 (9-8) = 8,6

2. Desil untuk data Bergolong ( berkelompok)

Menentukan letak desil untuk data berkelompok

𝑖. 𝑛
−𝐹
𝐷𝑖 = 𝑇𝑏 + 𝑝 ( 10 )
𝑓

Keterangan :
D1 = desil ke-i F = frekuensi kumulatif sebelum
Tb = tepi bawah kelas kuartil kelas kuartil
p = panjang kelas f = frekuensi kelas kuartil
n = banyak data

Contoh soal :

Tentukan nilai D6 dari data berikut

Data F

11 – 13 5
14 – 16 6
17 – 19 3
20 – 22 5
23 – 25 7
26 – 28 4

𝑖
𝐷𝑖 = ×𝑛
10
6
= × 30
10

=18

Jawab:

Data F 𝑭𝒌

11 – 13 5 5
14 – 16 6 11
17 – 19 3 14
20 – 22 5 19
23 – 25 7 26
26 – 28 4 30
6𝑛
−𝐹
𝐷6 = 𝑇𝑏 + 𝑝 (10 )
𝑓

18 − 14
= 19,5 + 3 ( )
5

= 19,5 + 2,4 = 21,9 Jadi, nilai D6 adalah 21,9


i. Persentil
Persentil merupakan nilai yang membagi data menjadi seratus
bagian sama besar. Persentil sering dilambangakan dengan P. jenis
persentil ada 99, yaitu P1, P2, P3 … P99.
1. Data tunggal
𝑖(𝑛 − 1)
𝐿𝑒𝑡𝑎𝑘 𝑃𝑖 =
100
Keterangan :
Pi = pesentil ke-i
n = banyaknya data
Tentukan persentil ke-65 dari data : 6,5,8,7,9,4,5,8,4,7,8,5,8,4,5.

Jawab:

n = 15

data terurut : 4,4,4,5,5,5,5,6,7,7,8,8,8,8,9.

65(15 − 1)
𝐿𝑒𝑡𝑎𝑘 𝑃65 = = 10,4
100

𝑃65 = 𝑋10 + 0,4 (𝑋11 + 𝑋10 )

= 7 + 0,4 (8-7) = 7,4

Jadi, nilai persentil ke-65 adalah 7,4.

2. Data bergolong (Berkelompok)

Menetukan letak persentil untuk data berkelompok

𝑖(𝑛 − 1)
𝐿𝑒𝑡𝑎𝑘 𝑃𝑖 =
100

Keterangan :
Pi = persentil ke-i
Tb = tepi bawah kelas persentil
p = panjang kelas
n = banyak data
F = frekuensi kumulatif sebelum kelas persentil
f = frekuensi kelas persentil

Tentukan P30 dari data berikut


Data F 𝑭𝒌

10 – 4 4 4
15 – 19 6 10
20- 24 5 15
25 – 29 7 22
30 – 34 3 25
35 – 39 5 30

𝑖
𝑃𝑖 = ×𝑛
100

30
= × 30
100

=9

Jawab:

30𝑛
−𝐹
𝑃30 = 𝑇𝑏 + 𝑝 (100 )
𝑓

9−5
= 14,5 + 5 ( )
6

= 14,5 + 3,33 = 17,83

2.3. Pembuatan Statistik Deskriptif dengan Program Ms. Excel


2007/2010
Jika sudah mengaktifkan Analysis Toolpack langkah langkah dalam

pembuatan Distribusi Frekuensi dan Histogram dengan excel 2007/2010

adalah sbb :
1. Masukan data

2. Pilih Data pada menu utama

3. Pilih Data Analysis

4. Pilih Deskriptive Statistics pada Analysis Tools

5. Ketika kotak dialog muncul,

Pada kotak Input Range, selanjutnya blok/sorot range data

Pada kotak output range, arahkan kursor pada kolom kosong

Berikan tanda check pada “Summary Statistics”

Klik OK
BAB IV
UKURAN DATA DIKELOMPOKAN

4.2.. Pengertian Data Dikelompokkan


Data yang dikelompokkan adalah data yang sudah disusun ke dalam
sebuah distribusi frekuensi sehingga data tersebut mempunyai interval kelas
yang jelas dan mempunyai titik tengah kelas.

4.2.1 Macam-Macam Ukuran Gejala Pusat


Ukuran pemusatan data yang termasuk ke dalam analisis
statistika deskriptif adalah rata-rata hitung (mean), median, modus,
dan fraktil (kuartil, desil, persentil).
Berikut ini adalah macam-macam ukuran gejala pusat data yang
sudah di kelompokkan, yaitu:

1. Rata-Rata Hitung (mean)


Istilah mean dikenal dengan sebutan angak rata-rata. Nilai rata-
rata hitung (mean) adalah total dari semua data yang diperoleh dari
jumlah seluruh nilai data dibagi dengan jumlah frekuensi yang ada.
Untuk mencari rata-rata hitung berupa data kelompok, maka terlebih
dahulu harus ditentukan titik tengah dari masing-masing kelas.
Rumus rata-rata hitung (mean):

Keterangan : fi = frekuensi ke-i

mi = titik tengah kelas ke-i

2. Median
Median merupakan sebuah nilai data yang berada di tengah-
tengah dari rangkaian data yang telah tersusun secara teratur.
Hasil median sama dengan hasil dari kuartil kedua.
Rumus median :

Keterangan: Lm = tepi bawah kelas median


N = jumlah frekuensi
∑f = frekuensi kumulatif di atas kelas median
fm = frekuensi kelas median
c = interval kelas median

3. Modus
Modus merupakan nilai data yang memiliki frekuensi
terbesar atau nilai data yang paling sering muncul.
Rumus modus :

Keterangan: Lmo = tepi bawah kelas modus


d1 = selisih antara frekuensi kelas modus dengan
frekuensi kelas sebelum modus
d2 = selisih antara frekuensi kelas modus dengan
frekuensi kelas sesudah modus
c = interval kelas modus
4. Kuartil
Pada prinsipnya, pengertian kuartil sama dengan median.
Perbedaanya hanya terletak pada banyaknya pembagian kelompok
data. Median membagi kelompok data atas 2 bagian, sedangkan
kuartil membagi kelompok data atas 4 bagian yang sama besar,
sehingga akan terdapat 3 kuartil yaitu kuartil ke-1, kuartil ke-2 dan
kuartil ke-3, dimana kuartil ke-2 sama dengan median.
Rumus Kuartil:
Keterangan: Qi = kuartil ke-i
LQ= tepi bawah kelas kuartil, desil, persentil
N = jumlah frekuensi
∑f = frekuensi kumulatif “dari atas” pada kelas sebelum
kelas
f = frekuensi kelas kuartil
c = interval kelas kuartil
5. Desil
Desil adalah suatu rangkaian data yang membagi suatu
distribusi menjadi 10 bagian yang sama besar.
Rumus Desil:

Keterangan: Di = desil ke-i

L = tepi bawah kelas kuartil, desil, persentil


N = jumlah frekuensi
∑f = frekuensi kumulatif “dari atas” pada kelas sebelum
kelas
f = frekuensi kelas desil
c = interval kelas desil
6. Persentil
Persentil adalah ukuran letak yang membagi suatu distribusi
menjadi 100 bagian yang sama besar.
Rumus Persentil:

Keterangan: Pi = persentil ke-i


L = tepi bawah kelas kuartil, desil, persentil
N = jumlah frekuensi
∑f = frekuensi kumulatif “dari atas” pada kelas sebelum
kelas
f = frekuensi kelas kuartil, desil, persentil
c = interval kelas kuartil, desil, persentil
7. Jangkauan (range)
Jangkauan atau range adalah selisih antara data
pengamatan terbesar dengan data pengamatan terkecil yang
terdapat pada kumpulan suatu data tersebut.
Rumus jangkauan (range):
R = Xmax - Xmin

Keterangan : R = jangkauan
Xmax = nilai maksimum
Xmin = nilai minimum

CONTOH KASUS
Contoh soal :
Berikut ini adalah data nilai dari 80 mahasiswa kelas 11.2A.04:

Dari data diatas, buatlah: 1. Rata-rata hitung


2. Median
3. Modus
4. Kuartil ke-1
5. Kuartil ke-2
6. Desil ke-2
7. Desil ke-8
8. Persentil ke-10
9. Persentil ke-60
10. Range (Jangkauan)

2.3. PEMBAHASAN KASUS


1. Rata-Rata Hitung (Mean)
∑𝒇𝒊.𝒙𝒊 𝟔𝟐𝟗𝟎
𝒙 = ∑𝒇𝒊 = 𝟖𝟎 = 𝟕𝟖, 𝟔

2. Median
Letak median = X(N/2) = X(80/2) = X40
Letak median pada data ke 40 yaitu pada nilai 70-79
𝑁
− ∑𝑓
𝑀𝑒𝑑 = 𝐿𝑚 + 2 𝑥𝑐
𝑓𝑚
40−16
= 69,5 + 25 𝑥 10
24
= 69,5 + 𝑥 10
25
= 69,5 + 9,6 = 79,1

3. Modus
Modusnya terletak pada nilai 70-79 dengan frekuensi 25
𝑑1
𝑀𝑜𝑑 = 𝐿𝑚𝑜 + 𝑥𝑐
𝑑1 + 𝑑2
16
= 69,5 + 𝑥 10
16 + 3
16
= 69,5 + 19 𝑥 10
= 69,5 + 8,4
= 77,9
4. Kuartil Ke-1
Letak Q1 = ¼ (N+1) = ¼(80+1) = 20,25
Berarti posisi nya pada kelas ke 3
𝑁
𝑖 4 − ∑𝑓
𝑄1 = 𝐿𝑄 + 𝑐
𝑓𝑞
80
1 4 − 16
= 69,5 + 10
25
20 − 16
= 69,5 + 10
25
= 69,5 + 1,6 = 71,1

5. Kuartil Ke-2
Letak Q1 = 2/4 (N+1) = ½ (80+1) = ½(81) = 40,5
Berarti posisinya pada kelas ke 3
𝑁
𝑖 4 − ∑𝑓
𝑄2 = 𝐿𝑄 + 𝑐
𝑓𝑞
80
2 4 − 16
= 69,5 + 10
25
40 − 16
= 69,5 + 10
25
= 69,5 + 9,6 = 79,1
Terbukti bahwa Q2=median

6. Desil Ke-2
2 1
Letak D2 = 10 80 = 5 80 = 16
Berarti posisinya pada data ke 16 dan kelas 60-69
𝑁
𝑖 10 − ∑𝑓
𝐷2 = 𝐿𝐷 + 𝑐
𝑓𝑑
80
2 10 − 7
= 59,5 + 10
9
16 − 7
= 59,5 + 10
9
= 59,5 + 10 = 69,5

7. Desil Ke-8
8
Letak D8 = 10 80 = 64

Berarti letaknya pada data ke 64 dan kelas 90-99

𝑁
𝑖 10 − ∑𝑓
𝐷8 = 𝐿𝐷 + 𝑐
𝑓𝑑
80
8 10 − 63
= 89,5 + 10
17
64 − 63
= 89,5 + 10
17
= 89,5 + 0,6 = 90,1
8. Persentil Ke-10

10 1
Letak P10 = 100 80 = 10 80 = 8

Berarti posisinya pada data ke 8 kelas 60-69

𝑁
𝑖 100 − ∑𝑓
𝑃10 = 𝐿𝑃 + 𝑐
𝑓𝑝
80
10 100 − 7
= 59,5 + 10
9
8−7
= 59,5 + 10
9
= 59,5 + 1,1 = 60,6

9. Persentil Ke-60
60 30
Letak P60 = 80 = 80 = 48
100 50
Berarti letaknya pada data ke 48 dan kelas 80-89
𝑁
𝑖 100 − ∑𝑓
𝑃60 = 𝐿𝑃 + 𝑐
𝑓𝑝
80
60 100 − 41
= 79,5 + 10
22
48 − 41
= 79,5 + 10
22
= 79,5 + 3,2 = 82,7
10. Jangkauan (Range)
R = Xmax - Xmin = 99 -50 = 49

4.2 Menentukan Ukuran Statistik Deskriptif Menggunakan Excel


Microsoft Excel menyediakan fasilitas untuk mengolah data statistik
yaitu dengan memanfaatkan fungsi-fungsi statistik yang ada, dan perintah
analisis yang merupakan perintah tambahan (add-ins) sehingga tidak
ditampilkan pada menu utama Microsoft Excel.
Sebelum dapat menggunakan perintah data analisis, langkah
pertama yang harus dilakukan adalah mengaktifkan referensi tools
yang disediakan oleh Microsoft Excel , di mana langkah-langkahnya
sebagai berikut :
1. Aktifkan program Microsoft Excel hingga
terdapat worksheet kosong.
2. Klik Office button yang berada di ujung kiri atas jendela utama.
3. Klik Menu Excel Options.
4. Sebuah kotak dialog Excel Options ditampilkan, dan klik menu add-
ins yang ada di jendela sebelah kiri, dan klik Analysis ToolPack pada
daftar aplikasi add-ins.
5. Klik tombol Go, dan sebuah kotak dialog add-ins ditampilkan.
6. Berikan tanda check (lihat gambar) pada kotak check analysis tool
pack.
7. klik tombol OK dan tunggu beberapa saat sampai proses instalasi
berakhir.
8. Kini dalam Ribbon “Data“, akan muncul menu baru “Data
Analysis“, yang bila ditekan akan memunculkan kotak dialog pilihan
untuk melakukan kalkulasi statistika.

Beberapa langkah yang dapat dilakukan dalam


melakukan analysis data statistik adalah sebagai berikut :
1. Dari menu utama Microsoft Excel klik menu Data dan pilih
menu Data Analysis.
2. Pilih menu Descriptive Statistics lalu klik OK.
3. Klik button pada Input Range dan masukkan data batas atas kelas
kedalam kolom Input Range dengan cara mem-blok data tersebut.
4. Klik button Output Range dan tempatkan pointer pada tempat
yang kosong.
5. Pilih Summary Statitstics dan klik OK.
PERTEMUAN IV

KEMIRINGAN KERUNCINGAN DAN ANGKA INDEKS

4.1. KEMIRINGAN
Kemiringan (skewness) dari suatu distribusi adalah derajat
kesetangkupan (derajat simetris) dari distribusi tersebut (Sartono, 1997).
Adapun ukuran kemiringan adalah ukuran yang menyatakan derajat
ketidaksimetrisan suatu lengkungan halus (kurva) dari suatu distribusi
frekuensi. Dapat pula dikatakan bahwa ukuran kemiringan adalah harga yang
menunjukkan seberapa jauh distribusi itu menyimpang dari simetris. Jika
kita tinjau berdasarkan kemiringan, suatu kurva distribusi dapat
dikelompokkan menjadi tiga bagian, yaitu sebagai berikut:

Distribusi Positif Distribusi Simetrik Distribusi Negatif

Menurut Pearson, dari hasil koefisien kemiringan diatas ada tiga kriteria
untuk mengetahui model distribusi dari sekumpulan data (baik data tidak
berkelompok maupun data berkelompok), yaitu:
1. Jika koefisien kemiringannya lebih kecil dari nol (<0), model
distribusinya negatif
2. Jika koefisien kemiringannya sama dengan nol (= 0), model
distribusinya simetris
3. Jika koefisien kemiringannya lebih besar dari nol (> 0), model
distribusinya positif.

Ada beberapa rumus untuk menghitung koefisien kemiringan, yaitu:


a. Koefisien kemiringan pertama dari Pearson
𝑥̅ −Mo
Koefisien kemiringan = s

Keterangan : 𝑥̅ = rata
Mo = modus
S = simpangan baku
b. Koefisien kemiringan kedua dari Pearson
3 (𝑥̅ −Me)
Koefisien kemiringan = s

Keterangan : 𝑥̅ = rata-rata
Me = median
S = simpangan baku
c. Koefisien kemiringan menggunakan nilai kuartil
𝑄3 −2 𝑄2 + 𝑄1
Koefisien kemiringan = 𝑄3 − 𝑄1

dengan 𝑄1 = kuartil pertama


𝑄2 = kuartil kedua
𝑄3 = kuartil ketiga.

d. Koefisien kemiringan menggunakan nilai persentil


𝑃90 −2 𝑃50 + 𝑃10
Koefisien kemiringan = 𝑃90 − 𝑃10

dengan 𝑃90 = Persentil ke 90


𝑃50 = Persentil ke 50
𝑃10 = Persentil ke 10
Contoh :
Misalkan berat badan bayi (dicatat dalam kg) yang baru lahir selama
seminggu tertentu di rumah sakit bersalin “Sehat” dapat dilihat dalam tabel
berikut.
Berat Badan bayi yang Baru Lahir
Selama Seminggu tertentu di Rumah Sakit Bersalin
Berat Badan (Kg) Banyak Bayi

2,5 – 2,6 2

2,7 – 2,8 3

2,9 – 3,0 5

3,1 – 3,2 7

3,3 – 3,4 6

3,5 -3,6 5
Jumlah 28
Hitung koefisien kemiringannya dengan menggunakan nilai kuartil.
Penyelesaian :
1. Menggunakan rumus kemiringan pertama dari pearson
Untuk memudahkan mencari koefisien kemiringan, maka kita
gunakan tabel dibawah ini

Berat Banyak Nilai Fi .xi Fk µ d F. d F.d²


Badan Bayi Tenga
(Kg) h (xi)
(Fi)

2,5 – 2,6 2 2,55 5,1 2 - 0,6 -3 -6 36

2,7 – 2,8 3 2,75 8,25 5 -0,4 -2 -6 36


2,9 – 3,0 5 2,95 14,75 10 -0,2 -1 -5 25

3,1 – 3,2 7 3,15 22.05 17 0 0 0 0

3,3 – 3,4 6 3,35 20,1 23 0,2 1 6 36

3,5 -3,6 5 3,55 17,75 28 0,4 2 10 100

Jumlah 28 88 19 233
𝑥̅ − 𝑀𝑜
Koefisien kemiringan pertama dari pearson = 𝑠
∑𝐹. 𝑥𝑖 88
̅=
𝒙 = 28 = 3,14
∑𝐹
𝑑1
Modus = Tb Mo + p (𝑑1+𝑑2)

Keterangan : tbm = tepi bawah kelas modus


p = panjang kelas
d1 = selisih frekuensi kelas modus dengan kelas sebelumnya
d2 = selisih frekuensi kelas modus dengan kelas sesudahnya
Berdasarkan frekuensi kelas modus terletak di kelas keempat. Jadi tbm =
3,1 – 0,05 = 3,05, p =0,2, d1= 7-5 = 2, d2 = 7-6 = 1.

𝑑1
Modus = tbm + p (𝑑1+𝑑2)
2
= 3,05+ 0,2 (2+1)

= 3,05+ 0,13
= 3,18
√∑𝐹𝑖.𝑑2 √(∑𝐹𝑖.𝑑)2
S =P −
𝑛 𝑛

√61 √(−1)²
= 0,2 −
28 28

√61 √1
= 0,2 − 784
28

√1708 √1
= 0,2 − 784
784
√1707
= 0,2 784

= 0,2 √2,17

= 0,2 . 1,47

= 0,294

𝑥̅ − 𝑀𝑜
Koefisien kemiringan pertama dari pearson = 𝑠
3,14−3,18
= 0,294
−0,04
= 0,294

= -0,13
Karena koefisien kemiringannya -0,13 yaitu kurang dari 0, maka model
distribusinya adalah distribusi negatif.

2. Koefisien kemiringan kedua dari Pearson

3 (𝑥̅ −Me)
Koefisien kemiringan = s

Sebelumnya kiita sudah ketahui :

̅ = 3,14 , s = 0,294
𝒙

𝑛 28
Median = 2 = = 14 , terletak dikelas interval ke-4.
2

Jadi tbm = 3,1 – 0,05 = 3,05, p = 3,1 – 2,9 = 0,2, F =

𝑛
−𝐹
Me = Tb Me + p (𝐹𝑚𝑒) 2

28
−10
= 3,05+ 0,2 ( 2 7 )
4
= 3,05 + 0,2 ( 7 )

= 3,05 + 0,11
= 3,16
3 (𝑥̅ −Me)
Koefisien kemiringan = s
3 (3,14−3,16)
= 0,294
3 (−0,02)
= 0,294
− 0,06
= 0,294

= - 0,204
Karena koefisien kemiringannya -0,204 yaitu kurang dari 0, maka model
distribusinya adalah distribusi negatif.

3. Koefisien kemiringan menggunakan nilai kuartil

Rumus yang digunakan adalah:

𝑄3 −2 𝑄2 + 𝑄1
Koefisien kemiringan =
𝑄3 − 𝑄1

dengan
𝑄1 = kuartil pertama
𝑄2 = kuartil kedua
𝑄3 = kuartil ketiga.
Sebelumnya kita harus mencari terlebih dahulu nilai-nilai 𝑄1(kuartil
pertama), 𝑄2 (kuartil kedua, 𝑄3 (kuartil ketiga)

Untuk 𝑸𝟏 (kuartil pertama)


Kelas kuartil pertama adalah sebuah kelas interval yang frekuensinya apabila
1
dijumlahkan dati frekuensi kelas interval pertama mencapai paling sedikit 4
1
n, yaitu 4 x 28 orang = 7 orang.

Ternyata kelas kuartil pertama terletak pada kelas interval ketiga, karena
jumlah frekuensinya (2 + 3 + 5) orang = 10 orang. Sehingga kita bisa
menghitung besaran-besaran yang diperlukan dalam rumus kuartil pertama,
yaitu
𝑇𝑏𝑄1 = 2,9 – 0,05 = 2, 85
p = 0,2
F =2+3=5
f𝑄1 =5
1
𝑛−𝐹
𝑄1 = 𝑇𝑏𝑄1 + p ( 4 f )
𝑄1

7−5
= 2,85 + 0,2 ( )
5

= 2,85 + 0,08
= 2,93
Untuk 𝑸𝟐 (kuartil kedua)
1 1
Letak 𝑄2 ada pada data ke- 2 = x 28 orang = 14 orang, yaitu pada kelas ke-4, interval
2

3,1 – 3,2 sehingga:


𝑇𝑏𝑄2 = 3,1 – 0,05 = 3,05; p = 0,2; F = 10; dan f𝑄2 = 7.
1
𝑛−𝐹
𝑄2 = 𝑇𝑏𝑄2 + p ( 2
)
f𝑄2

14 − 10
= 3,05 + 0,2 ( )
7

= 3,05 + 0,11
= 3,16

Untuk 𝑸𝟑 (kuartil ketiga)


3 3
Letak Q3 ada pada data ke- 4 n = x 28 orang = 21, yaitu pada kelas ke-5, interval 3,3 –
4

3,4 sehingga:
𝑇𝑏𝑄3 = 3,3 – 0,05 = 3,25; p = 0,2; F = 17; dan f𝑄3 = 6.
3
𝑛−𝐹
𝑄3 = 𝑇𝑏𝑄3 + p ( 4
)
f𝑄3

21 − 17
= 3,25 + 0,2 ( )
6
4
= 3,25 + 0,2 ( 6 )

= 3,25 + 0,13
= 3,38
Diperoleh koefisien kemiringan
𝑄3 −2 𝑄2 + 𝑄1
= 𝑄3 − 𝑄1
3,38−2.3,16+2,93
= 3,38−2,93
−0,01
= 0,45

= -0,022
Karena koefisien kemiringannya -0,022 yaitu kurang dari 0, maka model distribusinya
adalah distribusi negatif.

4. Koefisien kemiringan menggunakan nilai persentil


𝑃90 −2 𝑃50 + 𝑃10
Koefisien kemiringan = 𝑃90 − 𝑃10

Untuk persentil ke 90, 𝑷𝟗𝟎


Kelas persentil ke 90 adalah sebuah kelas interval yang frekuensinya apabila
90
dijumlahkan dari frekuensi kelas interval pertama mencapai paling sedikit n. yaitu
100
90
x 28 orang = 25,2 orang.
100

Ternyata kelas persentil ke 90 terletak pada interval keenam, karena jumlah


frekuensinya mencapai (2 + 3 + 5 + 7 + 6 + 5) orang = 28 orang sehingga kita bisa
menghitung besar-besaran yang diperlukan dalam rumus persentil ke 90, yaitu b = 3,5
– 0,05 = 3,45; p = 0,2; F= 2 + 3 + 5 + 7 + 6 = 23; dan 𝑓90 = 5
90
𝑛–𝐹
Jadi: 𝑃90 = Tb𝑃90 + p ( 100
)
𝑓 𝑃90

25,2 – 23
= 3,45 + 0,2 ( )
5
2,2
= 3,45 + 0,2 ( )
5

= 3,45 + 0,088
= 3.538

Untuk persentil ke 50, 𝑷𝟓𝟎


Kelas persentil ke 50 adalah sebuah kelas interval yang frekuensinya apabila
50
dijumlahkan dari frekuensi kelas interval pertama mencapai paling sedikit n, yaitu
100
50
= 100 x 28 orang = 14 orang.

Ternyata kelas persentil ke 50 terletak pada kelas interval keempat, karena jumlah
frekuensinya mencapai (2+3+5+7) orang = 17 orang. Sehingga kita bisa menghitung
besar-besaran yang diperlukan dalam rumus persentil ke 50, yaitu b = 3,1 – 0,05 = 3,05;
p = 0,2, F = 10 ; 𝑓𝑝50 = 7
50
𝑛–𝐹
Jadi : 𝑃50 = Tb𝑃50 + p (100 )
𝑓𝑃 50

14−10
= 3,05 + 0,2 ( )
7
4
= 3,05 + 0,2 ( 7 )

= 3,05 + 0,11
= 3,16
Untuk persentil ke 10, 𝑷𝟏𝟎
Kelas persentil ke 10 adalah sebuah kelas interval yang frekuensinya apabila
10
dijumlahkan dari frekuensi kelas interval pertama mencapai paling sedikit n, yaitu
100
10
= 100 x 28 orang = 2,8 orang.

Ternyata kelas persentil ke 10 terletak pada kelas interval kedua, karena jumlah
frekuensinya mencapai (2 + 3) orang = 5 orang. Sehingga kita bisa menghitung besar-
besaran yang diperlukan dalam rumus persentil ke 10, yaitu b = 2,7 – 0,05 = 2,65; p = 2,9
– 2,7 = 0,2; F = 2; 𝑓𝑝10 = 3
10
𝑛–𝐹
Jadi : 𝑃10 = Tb𝑃10 + p (100 )
𝐹𝑃 10

2,8−2
= 2,65 + 0,2 ( )
3
0,8
= 2,65 + 0,2 ( 3 )

= 2,65 + 0,053
= 2,703

Koefisien kemiringan
𝑃90 −2 𝑃50 + 𝑃10
= 𝑃90 − 𝑃10

3,538−2 (3,16)+2,703
= 3,538−2,703
3,538−6,32+2,703
= 3,538−2,703
− 0,079
=
0,835

= - 0,094
Karena koefisien kemiringannya -0,094 yaitu kurang dari 0, maka model distribusinya
adalah distribusi negatif.
4.3.2. UKURAN KERUNCINGAN (Kurtosis)

Selain kemiringan, kita perlu juga mengetahui keruncingan/kelancipan (kurtosis)


suatu distribusi. Kurtosis (peadkedness) dari suatu distribusi adalah derajat kelancipan
dari distribusi tersebut dibandingkan terhadap distribusi normal (kurva normal).
Ditinjau dari segi kelancipannya, suatu distribusi dapat dibedakan menjadi tiga :

Leptokurtik Platikurtik Mesokurtik

1. Jika suatu distribusi (kurva) lebih landai atau lebih tumpul dibandingkan terhadap
kurva normal, distribusinya disebut platikurtis
2. Jika suatu distribusi (kurva) normal, distribusinya disebut mesokurtis
3. Jika suatu distribusi (kurva) lebih lancip ataulebih ramping dibandingkan terhadap
kurva normal, distribusinya disebut leptokurtis.

Untuk mengetahui apakah sekumpulan data mengikuti distribusi leptokurtik,


platikurtik atau mesokurtik, hal ini dapat dilihat berdasarkan nilai koefisien
kurtosisnya. Untuk menghitung koefisien kurtosis digunakan rumus koefisien kurtosis,
yaitu :
1
2
( 𝑄3− 𝑄1 )
K=
𝑃90 − 𝑃10

dengan : 𝑄1 = Kuartil kesatu


𝑄3 = Kuartil ketiga
𝑃10 = Persentil ke 10
𝑃90 = Persentil ke 90
Dari hasil koefisien kurtosis diatas, ada tiga kriteria untuk mengetahui model distribusi
dari sekumpulan data, yaitu :
1. jika koefisien kurtosisnya kurang dari 0,263 (< 0,263), maka distribusinya adalah
platikurtis
2. jika koefisien kurtosisnya sama dengan 0,263 (=0,263), maka distribusinya adalah
mesokurtis
3. jika koefisien kurtosisnya lebih dari 0,263 (>0,263), maka distribusinya adalah
leptokurtis

Contoh:
Lihat data dalam daftar (1), yaitu mengenai berat badan bayi yang baru lahir selama
seminggu tertentu dari rumah sakit bersalin “Sehat”. Hitung koefisien kurtosisnya.

Penyelesaian:

Rumus yang digunakannya adalah :


1
2
( 𝑄3− 𝑄1 )
Q=
𝑃90 − 𝑃10

Kita sudah menghitung : 𝑄1 = 2,93, 𝑄 = 3,38, 𝑃10 = 2,703 dan 𝑃90 = 3,538
1
( 𝑄3− 𝑄1 )
Berarti: K = 2𝑃
90 − 𝑃10
1
( 3,38 −2,93 )
2
= 3,538−2,703
0,225
= 0,835

= 0,269
Karena koefisien keruncingannya lebih dari 0,263 (>0,263), maka distribusinya adalah
leptokurtis.
Soal latihan :

1. Tentukan koefisien kemiringan data berat badan 100 orang dibawah ini
menggunakan rumus pertama dari pearson dan tentukan jenis distribusinya !

Berat Badan (kg) Banyaknya (orang)

25-29 8

30-34 12

35-39 26

40-44 16

45-49 15

50-54 9

55-59 14

Jumlah 100

2. Dari data soal no. 1 di atas, tentukanlah koefisien kemiringannya dengan


menggunakan rumus kedua dari pearson dan tentukan jenis distribusinya !
3. Dari data soal no. 1 di atas, tentukanlah koefisien kemiringannya dengan
menggunakan nilai kuartilnya dan tentukan jenis distribusinya !
4. Dari data soal no. 1 di atas, tentukanlah koefisien kemiringannya dengan
menggunakan nilai persentilnya dan tentukan jenis distribusinya !
5. Dari data soal no. 1 di atas, tentukanlah koefisien keruncingannya dan termasuk
jenis distribusi apakah nilai koefisien keruncingan tersebut ?
Kunci jawaban :
Penyelesaian :

Berat F xi Fi .xi Fk µ d F. d F.d²


Badan
(Kg)

25-29 8 27 216 8 -10 -2 -16 32

30-34 12 32 384 20 -5 -1 -12 12

35-39 26 37 962 46 0 0 0 0

40-44 16 42 672 62 5 1 16 16

45-49 15 47 705 77 10 2 30 60

50-54 9 52 468 86 15 3 27 81

55-59 14 57 798 100 20 4 56 224

Jumlah 100 4205 101 425

𝑥̅ − 𝑀𝑜
1. Koefisien kemiringan pertama dari pearson =
𝑠
∑𝐹 − 𝑥𝑖 4205
̅=
𝒙 = = 42,05
∑𝐹 100
𝑑1
Modus = tbm + p (𝑑1+𝑑2)

Keterangan : tbm = tepi bawah kelas modus


p = panjang kelas
d1 = selisih frekuensi kelas modus dengan kelas sebelumnya
d2 = selisih frekuensi kelas modus dengan kelas sesudahnya
Berdasarkan frekuensi kelas modus terletak di kelas ketiga. Jadi tbm = 35 – 0,5 = 34,5,
p = 5, d1= 26-12 = 14, d2 = 26-16 = 10.
𝑑1
Modus = tbm + p (𝑑1+𝑑2)
14
= 34,5 + 5 (14+10)

= 34,5 + 2,916
= 37,416
√∑𝐹𝑖.𝑑2 √(∑𝐹𝑖.𝑑)2
S =P −
𝑛 𝑛

√425 √(101)²
=5 −
100 100

√425 √10201
=5 −
100 10000

√42500 √10201
=5 −
10000 10000

√32299
=5 10000

= 5 √3,2299
= 5 . 1,79
= 8,95
𝑥̅ − 𝑀𝑜
Koefisien kemiringan pertama dari pearson = 𝑠
42,05− 37,416
= 8,95
4,634
= 8,95

= 0,517
Karena koefisien kemiringannya 0,517 yaitu lebih dari 0, maka model distribusinya
adalah distribusi positif.
2. Diketahui :Kita sudah mendapatkan hasil 𝑥̅ = 42,05, s = 8,95
Ditanya : Berapa nilai koefisien kemiringan kedua dari Pearson ?

3 (𝑥̅ −Me)
Penyelesaian : Koefisien kemiringan = s
𝑛 100
Median = 2 = = 50 , terletak dikelas interval ke-4.
2

Jadi, tbMe = 40 – 0,5 = 39,5, p = 5, F = 8+12+26 = 46, F𝑄2 = 16


𝑛
−𝐹
Me = Tb Me + p (𝐹𝑚𝑒) 2

50−46
= 39,5 + 5 ( )
16

= 39,5 + 1,25
= 40,75
3 (𝑥̅ −Me)
Koefisien kemiringan kedua dari pearson = s
3 (42,05−40,75)
= 8,95
3 (1,3)
= 8,95
3,9
= 8,95

= 0,435
Karena koefisien kemiringannya 0,435 yaitu lebih dari 0, maka model distribusinya
adalah distribusi positif.

3. Diketahui : 𝑄2 = 40,75
Ditanya :Berapa nilai koefisien kemiringannya menggunakan nilai kuartil?
Penyelesaian : Koefisien kemiringan menggunakan nilai kuartil
𝑄3 −2 𝑄2 + 𝑄1
Koefisien kemiringan = 𝑄3 − 𝑄1

1
Letak 𝑄1 =4.n
1
= 4 . 100

= 25 terletak dikelas interval ke 3.


Jadi tb𝑄1 = 35 – 0,5 = 34,5, p= 5, F = 8+12 = 20, F𝑄1 = 26
1
𝑛−𝐹
𝑄1 = tb𝑄1 + p (4𝐹 𝑄 )
1
1
.100−20
= 34,5 + 5 ( 4
)
26
25−20
= 34,5 + 5 ( )
26

= 34,5 + 0,961
= 35,461
Median = 𝑄2
= 40,75
3∑F 3.100
Letak 𝑄3 = = = 75 terletak dikelas interval ke 5.
4 4

Jadi tb𝑄3 = 45 –0,5= 44,5, p = 5, F =8+12+26+16 = 62, F𝑄3 =15


3.∑𝐹
−𝐹
𝑄3 = tb𝑄3 + p ( 4
)
𝐹 𝑄3
75−62
= 44,5 + 5 ( )
15

= 44,5 + 4,3
= 48,5
𝑄3 −2 𝑄2 + 𝑄1
Koefisien kemiringan = 𝑄3 − 𝑄1
48,5−2 (40,75)+35,461
= 48,5− 35,461
48,5−81,5+35,461
= 48,5− 35,461
2,461
= 13,039

= 0,188
Karena koefisien kemiringannya 0,188 yaitu lebih dari 0, maka model distribusinya
adalah distribusi positif

4. Penyelesaian : Nilai koefisien kemiringan menggunakan nilai persentil


𝑃90 −2 𝑃50 + 𝑃10
Koefisien kemiringan = 𝑃90 − 𝑃10
90 .∑𝐹 90 .100
Letak 𝑃90 = = = 90 terletak dikelas interval ke 7.
100 100

Jadi tb𝑃90 = 55 –0,5= 54,5, p = 5, F =8+12+26+16+15+9 = 86, F𝑃90 =14


90.∑𝐹
−𝐹
𝑃90 = tb 𝑃90 + p ( 100
)
𝐹 𝑃90
90−86
= 54,5 + 5 ( )
14

= 54,5 + 1,42
= 55,92
50 .∑𝐹 50 .100
Letak 𝑃50 = = = 50 terletak dikelas ke 4.
100 100

Jadi tb𝑃50 = 40 –0,5= 39,5, p = 5, F =8+12+26 = 46, F𝑃50 =16


50.∑𝐹
−𝐹
𝑃50 = tb 𝑃50 + p ( 100 )
𝐹𝑃 90

50−46
= 54,5 + 5 ( )
16

= 39,5 + 1,25
= 40,75
10 .∑𝐹 10 .100
Letak 𝑃10 = = = 10 terletak dikelas ke 2.
100 100

Jadi tb𝑃10 = 30 –0,5= 29,5, p = 5, F =8, F𝑃10 =12


10.∑𝐹
−𝐹
𝑃10 = tb 𝑃10 + p ( 100
)
𝐹 𝑃10
10−8
= 29,5 + 5 ( )
12

= 29,5 + 0,83
= 30,33
𝑃90 −2 𝑃50 + 𝑃10
Koefisien kemiringan = 𝑃90 − 𝑃10
55,92−2 (40,75)+30,33
= 55,214 − 30,33
55,92−81,5+30,33
= 55,92 − 30,33
4,75
= 25,59

= 0,185
Karena koefisien kemiringannya 0,185 yaitu lebih dari 0, maka model distribusinya
adalah distribusi positif.

5. Diketahui : 𝑄1= 35,461, 𝑄3 = 48,5 , 𝑃90 = 55,214 , 𝑃10 = 30,33


Ditanya : Berapa nilai koefisien keruncingannya dan termasuk jenis distribusi
apa ?
Penyelesaian :
1
( 𝑄3− 𝑄1 )
K = 2𝑃
90 − 𝑃10
1
( 48,5−35,461)
2
= 55,92− 30,33
1
( 13,039)
=2 25,59
6,5159
= 25,59

= 0,254
Karena nilai koefisien kurtosisnya kurang dari 0,263 (< 0,263), maka distribusinya
adalah platikurtil.

4.3. Indeks Tertimbang

4.3.1 Angka Indeks Tertimbang

Menurut Sansubar Saleh, Indeks tertimbang merupakan angka indeks yang


mencerminkan pentingnya suatu angka penimbang (bobot atau weight) terhadap
angka-angka lainnya, sedangkan pemberian bobot angka penimbang tersebut
ditentukan berdasarkan pentingnya barang/ komoditi tersebut secara subyektif. Rumus
yang digunakan untuk menghitung indeks tertimbang :
I = [(ΣPn x W) / (ΣPo x W)] x 100%.

Terkait dengan indeks tertimbang, disamping menggunakan angka penimbang


secara subyektif dapat juga memperhatikan kuantitas atau jumlah barang sebagai
pengganti angka penimbang tersebut, sehingga sering disebut dengan Indeks
Kuantitas. Dalam menghitung indeks kuantitas tersebut variabel yang sangat penting
untuk menjadi pertimbangan adalah kuantitas dari masing - masing komoditi. Secara
umum indeks kuantitas dapat dihitung dengan lima model, yaitu Indeks Laspeyres,
Indeks Paasche, Indeks Drobisch, Indeks Fisher dan Indeks Edgeworth.

 Indeks Laspeyres, yaitu model penghitungan indeks dengan menggunakan


kuantitas pada tahun dasar (Qo) sebagai faktor penimbang. Dirumuskan :
IL = [(ΣPn x Qo) / (ΣPo x Qo)] x 100%

 Indeks Paasche, yaitu model penghitungan indeks dengan menggunakan


kuantitas pada tahun ke-n (Qn) sebagai faktor penimbang. Dirumuskan :
IP = [(ΣPn x Qn) / (ΣPo x Qn)] x 100%

 Indeks Drobisch, merupakan kombinasi dari Indeks Laaspeyres dengan


Indeks Paasche atau rata-rata dari kedua indeks tersebut. Indeks Drobisch ini
untuk memperkecil perbedaan dari Indeks Laaspeyres dan Indeks Paasche.
Dirumuskan :
ID = (IL + IP)/2

 Indeks Fisher, merupakan rata-rata dari Indeks Laaspeyres dan Indeks Paasche,
tetapi dengan jalan mengakarkan hasil perkalian kedua indeks tersebut.
Dirumuskan :
IF = √(IL x IP)

 Indeks Edgeworth, yaitu model penghitungan indeks dengan menjumlahkan


kuantitas dari tahun ke-n dengan kuantitas tahun dasar atau (Qo + Qn) dan
digunakan sebagai faktor penimbang. Dirumuskan :
IL = [(ΣPn x (Qn + Qo)) / (ΣPo x (Qn + Qo))] x 100%

Contoh :
Perkembangan Komoditi tahun 2001 – 2002
omoditi P.01 P.02 Q.01 Q.02 PoQo PnQo PoQn PnQn

A 10 12 100 120 1.000 1.200 1.200 1.440

B 42 43 80 85 3.360 3.440 3.570 3.655

C 12 14 50 60 600 700 720 840

D 14 16 70 75 980 1.120 1.050 1.200

E 25 27 60 80 1.500 1.620 2.000 2.160

F 17 20 40 50 680 800 850 1.000

JUMLAH 8.120 8.880 9.390 10.295

Berdasarkan tabel di atas, untuk mencari indeks tahun 2002 dengan tahun dasar 2001
dengan model Indeks Laspeyres (IL), Indeks Paasche (IP), Indeks Drobisch (ID), Indeks
Fisher (IF) dan Indeks Edgeworth (IE) adalah sebagai berikut :
IL=(8.880/8.120)x100%=109,35%
IP=(10.295/9.390)x100%=109,63%
ID=(109,35%+109,63%)/2=109,49%
IF=√(109,35%+109,635)=109,49%

Perkembangan Komoditi tahun 2001 – 2002


Komodit P.0 P.0 Q.0 Q.0 Q.01+Q.0 P.01(Q.01+Q.02 P.02(Q.01+Q.02
i 1 2 1 2 2 ) )

A 10 12 100 120 220 2.200 2.640

B 42 43 80 85 165 6.930 7.095

C 12 14 50 60 110 1.320 1.540

D 14 16 70 75 145 2.030 2.320

E 25 27 60 80 140 3.500 3.780

F 17 20 40 50 90 1.530 1.800
JUMLAH 17.510 19.175

IE = (19.175 / 17.510) x 100% = 109,50

4..3.2Angka Indeks Tidak Tertimbang


Menurut DR. Winardi, angka indeks merupakan sebuah alat angka matematik
yang digunakan untuk menyatakan tingkat harga, volume perniagaan dan sebagainya
dalam periode tertentu, dibandingkan dengan tingkat harga, volume perniagaan suatu
periode dasar, yang nilainya dinyatakan dengan 100. Sedangkan menurut Samsubar
Saleh, angka indeks merupakan suatu analisis data statistik yang terutama ditujukan
untuk mengukur berapa besarnya fluktuasi perkembangan harga dari berbagai macam
komoditas selama satu periode waktu tertentu. Dalam suatu analisis perekonomian,
angka indeks mempunyai peranan yang sangat besar, karena dapat digunakan untuk
mengetahui besarnya laju inflasi mapun deflasi yang terjadi di negara tertentu.
Angka indeks dapat sebagai indikator yang penting untuk menentukan kebijakan
apa yang harus diambil oleh pemerintah guna mengatasi permasalahan dalam
perekonomian. Misalnya, dengan mengetahui perkembangan produksi suatu produk
tahun sekarang dibandingkan produksi tahun yang lalu atau perkembangan penduduk
tahun sekarang dibandingkan tahun yang lalu, maka pemerintah akan dapat
mengambil kebijakan untuk mengembangkan produksi produk tersebut dan mengatasi
pertumbuhan penduduk yang terlau cepat.
Dalam menghitung angka indeks, waktu atau tahun yang lalu disebut sebagai
tahun dasar (base periods atau base year), yaitu waktu atau tahun yang dijadikan dasar
untuk menentukan perkembangan suatu harga atau berfungsi sebagai waktu atau tahun
pembanding. Penentuan tahun dasar untuk menghitung angka indeks perlu
memperhatikan tiga faktor, yaitu:
a) Tahun dasar hendaknya dipilih pada waktu kondisi perekonomian yang relatif
stabil;
b) Jarak antara tahun dasar dengan tahun sekarang tidak terlalu jauh; dan
c) Penentuan tahun dasar hendaknya memperhatikan kejadian-kejadian penting,
misalnya tahun pada saat terjadinya kenaikan harga BBM, kenaikan tarif dasar
listrik dan lain-lain.
Metode angka indeks tidak tertimbang digunakan untuk mengetahui perkembangan
suatu harga, yaitu terfokus hanya pada harga dan tidak mempertimbangkan
kuantitasnya. Metode angka indeks tertimbang dibagi menjadi tiga, yaitu :
1. Angka Indeks Relatif, yaitu untuk mengukur perbedaan “satu” macam
nilai/harga/ kualitasnya saja dalam waktu yang berbeda.
2. Angka Indeks Aggregate Sederhana, yaitu membandingkan jumlah dari harga-
harga barang persatuan untuk tiap-tiap tahun. Rumus yang digunakan adalah :
I = (ΣPn/ΣPo) x 100%
Keterangan :
I = Angka Indeks
Pn = Jumlah harga tahun yang dicari indeksnya dan
Po = Jumlah harga tahun dasar

3. Angka Indeks Rata-Rata Relatif, yaitu dimulai dengan mencari angka relatif dari
masing-masing barang dan kemudian dicari rata-rata dari angka relatif tersebut.
Rumus yang digunakan adalah :
I = [(Σ(Pn/Po) x 100%) / (k)]
Keterangan :
I = Angka Indeks
Pn = Jumlah harga tahun yang dicari indeksnya
Po = Jumlah harga tahun dasar dan
k = Jumlah barang.
Contoh :
Angka Indeks Relatif : Perkembangan Harga Beras
Tahun Harga per Penghitungan Indeks
kg
1998 Rp. 2.500 sebagai tahun dasar 100 %
1999 Rp. 2.750 (2.750 / 2.500) x 100 % 110 %
2000 Rp. 2.900 (2.900 / 2.500) x 100 % 116 %
2001 Rp. 3.000 (3.000 / 2.500) x 100 % 120 %
2002 Rp. 3.100 (3.100 / 2.500) x 100 % 124 %
Indeks relatif tahun 2001 adalah sebesar 120 %, artinya dibandingkan tahun 1998 harga
beras per kg pada tahun 2001 mengalami kenaikan sebesar 20 %.

Angka Indeks Aggregate Sederhana : Perkembangan Harga Komoditi


Komoditi Harga 2001 Harga 2002 Indeks 2002
A 2.000 2.100 I = (7.650/7.300) x 100%
B 1.500 1.750 = 104,79%
C 2.000 1.900
D 1.800 1.900
JUMLAH 7.300 7.650
Indeks aggregate sederhana pada tahun 2002 sebesar 104,79% atau mengalami
kenaikan sebesar 4,79% dibandingkan dengan harga pada tahun 2001.

Angka Indeks Rata-Rata Relatif : Perkembangan Harga Komoditi


Harga Harga
Komoditi Indek per komoditi
2001 2002
A 2.000 2.100 (2.100 / 2.000) x 100% = 105 %
B 1.500 1.750 (1.750 / 1.500) x 100% = 116,67 %
C 2.000 1.900 (1.900 / 2.000) x 100% = 95 %
D 1.800 1.900 (1.900 / 1.800) x 100% = 105,56 %
JUMLAH 422,23 %
Indeks rata-rata relatif tahun 2002 sebesar 422,23% / 4 = 105,56%. Dengan menggunakan
angka indeks rata-rata relatif, pada tahun 2002 terjadi kenaikan harga komoditi A, B, C
dan D sebesar 5,56% dibandingkan tahun tahun 2001.
PERTEMUAN V

REGRESI DAN KORELASI

5.1.Pengertian Regresi
Secara umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan
satu variabel dependen (terikat) dengan satu atau lebih variabel independent (variabel
penjelas/bebas), dengan tujuan untuk mengestimasi dan/ atau memprediksi rata-rata
populasi atau niiai rata-rata variabel dependen berdasarkan nilai variabel independen
yang diketahui. Pusat perhatian adalah pada upaya menjelaskan dan mengevalusi
hubungan antara suatu variabel dengan satu atau lebih variabel independen.
Hasil analisis regresi adalah berupa koefisien regresi untuk masing-masing variable
independent. Koefisien ini diperoleh dengan cara memprediksi nilai variable dependen
dengan suatu persamaan.
Regresi merupakan suatu alat ukur yang juga dapat digunakan untuk mengukur
ada atau tidaknya korelasi antarvariabel. Jika kita memiliki dua buah variabel atau lebih
maka sudah selayaknya apabila kita ingin mempelajari bagaimana variabel-variabel itu
berhubungan atau dapat diramalkan. Analisis regresi mempelajari hubungan yang
diperoleh dinyatakan dalam persamaan matematika yang menyatakan hubungan
fungsional antara variabel-variabel. Hubungan fungsional antara satu variabel prediktor
dengan satu variabel kriterium disebut analisis regresi sederhana (tunggal), sedangkan
hubungan fungsional yang lebih dari satu variabel disebut analisis regresi ganda.
Jika dalam analisis korelasi peneliti hanya tertarik pada derajat asosiasi atau
kecenderungan umum dua buah peubah atau lebih, maka dalam analisis regresi peneliti
ingin memperoleh hubungan fungsional antara dua peubah yang dinyatakan dalam
bentuk, Y a bX = + yang merupakan penduga dari fungsi yang ada pada populasi yang
biasa dinotasikan dengan 0,1. Regresi mengukur seberapa besar suatu variabel
mempengaruhi variabel yang lain, sehingga dapat digunakan untuk melakukan
peramalan nilai suatu variabel berdasarkan variabel lain. Analisa regresi ada dua :
Analisa Regresi Sederhana dan Analisis Regresi Berganda.
Analisis regresi linier berganda adalah hubungan secara linear antara dua atau lebih
variabel independen (X1, X2,….Xn) dengan variabel dependen (Y). Analisis ini untuk
mengetahui arah hubungan antara variabel independen dengan variabel dependen
apakah masing-masing variabel independen berhubungan positif atau negatif dan
untuk memprediksi nilai dari variabel dependen apabila nilai variabel independen
mengalami kenaikan atau penurunan. Data yang digunakan biasanya berskala interval
atau rasio.
Analisis regresi sederhana hanya terdiri atas satu peubah bebas (peubah
penjelas/eksplanatori) X dan satu peubah terikat (respon) Y dengan hubungan linier.
Kedua peubah ini merupakan peubah kuantitatif, khusus untuk Y harus dengan skala
interval atau rasio. Dengan visualisasi secara geometris dapat ditafsirkan bahwa dengan
analisis regresi kita ingin menduga garis populasi yang sesungguhnya tidak pernah
diketahui (garis lurus putus-putus) berdasarkan sampel pasangan data pada sampel.
Persoalanvini merupakan persoalan estimasi uji inferensi daam regresi. Garis regresi
penduga ini dapat dipergunakan untuk meramal (prediksi) rentang rata-rata nilai Y
pada saat nilai X diketahui, demikian juga rentang nilai-nilai Y pada saat nilai tertentu
dari X .
Persamaan regresi linier dari Y terhadap X dirumuskan sebagai berikut:
Y=a+bX
Keterangan :
Y = nilai yang diukur/dihitung pada variabel tidak bebas
x = nilai tertentu dari variabel bebas
a = intersep/perpotongan garis regresi dengan sumbu y
b = koefisien regresi /kemiringan dari garis regresi/untuk mengukur
kenaikan atau penurunan y untuk setiap perubahan satu-satuan x /untuk
mengukur besarnya pengaruh x terhadap y kalau x naik satu unit.
Rumus untuk mencari a dan b ialah sebagai berikut :

5.2.Pengertian Korelasi
Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik
pengukuran asosiasi / hubungan (measures of association). Pengukuran
asosiasi merupakan istilah umum yang mengacu pada sekelompok teknik dalam
statistik bivariat yang digunakan untuk mengukur kekuatan hubungan antara dua
variabel.
Analisis korelasi sederhana (Bivariate Correlation) digunakan untuk mengetahui
keeratan hubungan antara dua variabel dan untuk mengetahui arah hubungan yang
terjadi. Koefisien korelasi sederhana menunjukkan seberapa besar hubungan yang
terjadi antara dua variabel. Dalam SPSS ada tiga metode korelasi sederhana (bivariate
correlation) diantaranya Pearson Correlation, Kendall’s tau-b, dan Spearman
Correlation. Pearson Correlation digunakan untuk data berskala interval atau rasio,
sedangkan Kendall’s tau-b, dan Spearman Correlation lebih cocok untuk data berskala
ordinal.
Dalam korelasi sempurna tidak diperlukan lagi pengujian hipotesis, karena kedua
variabel mempunyai hubungan linear yang sempurna. Artinya variabel X
mempengaruhi variabel Y secara sempurna. Jika korelasi sama dengan nol (0), maka
tidak terdapat hubungan antara kedua variabel tersebut. Dalam korelasi sebenarnya
tidak dikenal istilah variabel bebas dan variabel tergantung. Biasanya dalam
penghitungan digunakan simbol X untuk variabel pertama dan Y untuk variabel kedua.
Dalam contoh hubungan antara variabel remunerasi dengan kepuasan kerja, maka
variabel remunerasi merupakan variabel X dan kepuasan kerja merupakan variabel Y.
Analisis korelasi sederhana (Bivariate Correlation) digunakan untuk mengetahui
keeratan hubungan antara dua variabel dan untuk mengetahui arah hubungan yang
terjadi. Koefisien korelasi sederhana menunjukkan seberapa besar hubungan yang
terjadi antara dua variabel
Korelasi digunakan untuk mengukur kekuatan keeratan hubungan antara dua variabel
melalui sebuah bilangan yang disebut koefisien korelasi. Dalam analisis korelasi, kita
menghitung derajat asosiasi antara satu peubah peubah lain (misalnya antara berat
badan dan tinggi badan, antara berat dengan kolesterol, antara nilai IQ dengan
perolehan nilai ujian mata matematika dan sebagainya). Ada dua jenis ukuran korelasi
yang banyak yaitu:
1. Korelasi produk momen Pearson untuk mengukur derajat asosiasi beberapa
peubah dengan skala interval atau rasio.
2. Korelasi Spearman untuk mengukur derajat asosiasi antara beberapa dengan
skala ordinal (rank).
 Koefisien korelasi linier ( r ) adalah ukuran hubungan linier antara dua
variabel/peubah acak X dan Y untuk mengukur sejauh mana titik-titik
menggerombol sekitar sebuah garis lurus regresi. Berikut ini adalah rumus dari
Korelasi :

Koefisien korelasi atau derajat asosiasi dua peubah (dinotasikan dengan


r). Besarnya r berkisar antara -1<.r<1. Ilustrasi grafik sebaran data dengan
berbagai nilai korelasi dapat disajikan dalam bentuk diagram pencar.
Kegunaan diagram pencar : variabel.
1. Membantu menetapkan tipe persamaan yang menunjukkan hubungan
antara kedua variabel tersebut.
2. Menentukan persamaan garis regresi atau mencari nilai-nilai konstan.
 Koefisien Determinasi ( r2 )
1. nilainya antara 0 dan 1
2. untuk menyatakan proporsi keragaman total nilai-nilai peubah Y yang dapat
dijelaskan oleh nilai-nilai peubah X melalui hubungan linier tersebut.
3. Contoh : r = 0,6 artinya 0,36 atau 36 % diantara keragaman total nilai-nilai Y
dapat dijelaskan oleh hubungan liniernya dengan nilai-nilai X. atau Besarnya
sumbangan X terhadap naik turunnya Y adalah 36 % sedangkan 64 %
disebabkan oleh faktor lain.
Berikut ini adalah rumus dari Korelasi :

korelasi atau derajat asosiasi dua peubah (dinotasikan dengan r). Besarnya r
berkisar antara -1<.r<1. Ilustrasi grafik sebaran data dengan berbagai nilai korelasi
dapat disajikan dalam bentuk diagram pencar.

5.3. Analisis Korelasi dan Regresi dengan Excel


1. Untuk dapat menggunakan perintah data analisis :
 Aktifkan program Microsoft Excel hingga terdapat worksheet kosong.
 Klik File, Klik Menu Options,
 Sebuah kotak dialog Excel Options ditampilkan, dan klik menu add-ins,
 Dibagian bawah terdapat kotak Manage: Excel Add-ins. Klik icon Go.
 Check list Anaylsis Tool Pak dan klik Go

2. Analisis Regresi
Analisis regresi bertujuan untuk melihat pengaruh satu variabel terhadap
variabel lainnya.
Langkah-langkah membuat Regresi dengan menggunakan excel:
1. Ketik data X pada kolom B dan data Y pada kolom C
2. Pilih Data pada menu utama
3. Pilih Data Analysis
4. Pilih Regression
5. Klik OK Setelah muncul kotak dialog

3. Analisis Korelasi
 Analisis korelasi juga dapat digunakan dalam Excel.
 Korelasi menunjukkan keeratan hubungan antar variabel
 Keeratan tersebut dicerminkan dari nilai korelasi yang semakin tinggi.
 Nilai korelasi berada di antara 0 hingga 1
 Tanda nya dapat positip dan negatif
 Positip menunjukkan hubungan dua variabel searah sedang negatif
menunjukkan hubungan kedua variabel berlawanan.
Langkah-langkahnya membuat korelasi dengan menggunakan excel:
1. Pilih Data pada menu utama
2. Pilih Data analysis
3. Pilih Correlation
4. Klik OK Setelah muncul kotak dialog
4. Membuat grafik regresi linier
Pilih menu Insert – Scatter, pilih type scatter only mark. Pada Chart Layout
dimenu bar, pilih Layout ke 3.Silakan Tampilkan Hasilnya

5.4. Perbedaan Regresi dan Korelasi


Pernyataan yang sering kita dengan adalah bahwa regresi dimengerti
dengan kata kunci pengaruh, dan korelasi dimengerti dengan kata kunci
hubungan. Pengertian sederhana itu tidaklah salah, akan tetapi, tidak ada
salahnya juga kita memahami secara lebih lanjut tentang regresi dan korelasi.
Analisis korelasi berkaitan erat dengan regresi, tetapi secara konsep berbeda
dengan analisis regresi. Analisis korelasi adalah mengukur suatu tingkat atau
kekuatan hubungan linear antara dua variabel. Koefisien korelasi adalah mengukur
kekuatan hubungan linear. Sebagai contoh, kita tertarik untuk menemukan korelasi
antara merokok dengan penyakit kanker, berdasarkan penjelasan statistik dan
matematika, pada anak sekolah dan mahasiswa (dst). Dalam analisis regresi, kita
tidak menggunakan pengukuran tersebut. Analisis regresi mencoba untuk
mengestimasi atau memprediksikan nilai rata-rata suatu variabel yang sudah
diketahui nilainya, berdasarkan suatu variabel lain yang juga sudah diketahui
nilainya. Misalnya, kita ingin mengetahui apakah kita dapat memprediksikan nilai
rata-rata ujian statistik berdasarkan nilai hasil ujian matematika.
Regresi mempelajari bentuk hubungan antar variabel mealui suatu
persamaan. Persamaan yang digunakan untuk melihat hubungan antar variabel
adalah Regresi Linear Sederhana (RLS), Regresi Linear Berganda (RLB), dan Regresi
non Linear. Regresi bisa berupa hubungan sebab akibat. Regresi mengukur seberapa
besar suatu variabel mempengaruhi variabel yang lain, sehingga dapat digunakan
untuk melakukan peramalan nilai suatu variabel berdasarkan variabel lain.
Korelasi juga mempelajari hubungan antar variabel, tetapi digunakan untuk
melihat seberapa erat hubungan antar dua variabel kuantitatif dilihat dari besarnya
angka dan bukan dari tandanya. Dengan menggunakan korelasi, kita dapat
mengetahui arah hubungan yang terjadi dalam dua variabel. Jika korelasi bertanda
positif artinya berbanding lurus dan jika bertanda negatif maka berbanding terbalik.
Korelasi tidak bisa menyatakan hubungan sebab akibat meskipun angka
korelasinya tinggi. Misal ada dua pernyataan:
1. Tanaman mati kekeringan di musim kemarau
2. Pupuk kompos diberikan saat musim kemarau
Dari kedua pernyataan di atas, kita tidak dapat mengatakan bahwa pupuk kompos
menyebabkan tanaman mati meskipun korelasinya tinggi.
5.5. Manfaat Korelasi dan Regresi
Kegunaan Analisis Korelasi dan Regresi. Dalam kebanyakan fenomena alam,
menaksir rerata populasi, atau menguji perbedaan dua rerata dengan teknik uji
statistika, baik yang memerlukan asumsi sebaran khusus (parametrik) mau pun
yang tidak ketat asumsi sebarannya (nonparametrik) menjadi tidak efisien dan tidak
efektif lagi. Hal ini disebabkan oleh banyaknya peubah yang berhubungan dan saling
menjelaskan antara yang satu dengan yang lainnya. Misalnya, kita akan
memperkirakan nilai jual sebuah rumah di suatu daerah tertentu. Kita dapat
mengambil sampel acak dari ratusan rumah yang ada dalam daerah tersebut,
kemudian kita menghitung rerata harga jualnya. Tetapi, menggunakan metode ini,
kita mengabaikan informasi yang mudah diamati, misalnya luas lantai, banyaknya
kamar tidur, banyaknya kamar mandi, dan umur rumah tersebut. Informasi ini akan
lebih bermanfaat kalau digunakan menaksir nilai jual rumah yang bersangkutan.
Dari latar belakang yang kita perhatikan di atas, metode atau analisis korelasi
dan regresi merupakan topik penting untuk dibicarakan. Metode korelasi dapat
mengukur kuatnya hubungan antara dua peubah yang sifat hubungannya simetris
atau timbal balik Seperti metode korelasi; metode regresi sudah menjadi bagian
integral dari setiap analisis data yang memperhatikan hubungan antara satu peubah
tanggapan (response variable) dengan satu atau lebih peubah penjelas (explanatory
variables). Istilah peubah tanggapan kadang-kadang juga disebut peubah terikat
atau terikat (dependent variable), dan peubah penjelas disebut peubah penaksir
(predictor variable) atau peubah bebas (independent variable). Penggunaan istilah
ini biasanya disesuaikan dengan situasi peubah-peubah yang dipelajari
hubungannya, dan juga selera penggunanya.
Pertama-tama kita akan membicarakan masalah yang berkaitan dengan nilai
rerata suatu peubah terikat Y (katakanlah harga jual rumah) terhadap suatu peubah
bebas X (misalnya luas lantai rumah) dengan menggunakan hubungan linear. Model
ini disebut model linear karena semua peubah yang muncul dalam model itu
berpangkat satu. Kalau dilihat dari banyaknya peubah bebas dalam model, maka
model itu disebut model linear sederhana, karena hanya mempunyai satu peubah
bebas.
Dalam hal mempelajari hubungan antarpeubah, regresi linear bukan satu-
satunya model yang harus digunakan, kita juga dapat menggunakan model
nonlinear, seperti model kuadratik, kubik, eksponen, logaritma, dan lain-lain.
Penentuan model tergantung pada sifat peubah atau Pemilihan Peubah dalam
Model populasi tempat data diambil. Sebelum menentukan model pilihan, kita perlu
mengadakan suatu diagnosis terhadap data yang diperoleh. Diagram pencar adalah
salah satu alat diagnosis untuk mendapatkan gambaran tentang hubungan antara
peubah bebas dan peubah terikat. Dari diagram pencar itu, kita dapat
memperkirakan bahwa model yang relevan adalah linear atau nonlinear
Selanjutnya, kalau kita memasukkan lebih dari satu peubah bebas dalam model,
maka diperoleh model regresi ganda (multiple regression model). Seperti model
sederhana, model regresi ganda dapat juga dibedakan atas model regresi linear
ganda dan model regresi nonlinear ganda. Dalam hal ini, kita dapat membangun
model satu peubah tanggapan Y (katakanlah nilai jual rumah) sebagai fungsi dari
peubah-peubah kuantitatif (seperti luas lantai, umur rumah, luas pekarangan, dan
banyaknya kamar), atau sebagai fungsi dari peubah-peubah kualitatif (seperti jenis
konstruksi, dan lokasi).
Penggunaan Paket Komputer dalam StatistikaTersedianya paket statistika
sebagai perangkat lunak komputer memudahkan banyak peneliti dalam
penggunaan analisis statistik terhadap data yang diperoleh. Ketersediaan fasilitas ini
memudahkan dan sangat menguntungkan karena beberapa faktor :
1. Proses analisis, terutama perhitungan dapat dilakukan dengan cepat sekali tanpa
ada kesalahan hitung.
2. Peneliti dapat menghindari pekerjaan hitung yang memerlukan waktu lama
apabila dikerjakan dengan cara manual, yang akibatnya bisa melelahkan dan
terjadinya kesalahan.
3. Peneliti sudah dapat memiliki waktu yang cukup memadai untuk berpikir dan
mengembangkan masalah penelitiannya, menafsirkan hasil analisis data yang
diperolehnya, dan mengimplementasikan serta menindaklanjuti rekomendasi
dari temuan-temuannya.
Di samping kemudahan dan sejumlah keuntungan lain yang diberikan oleh
fasilitas komputer yang tersedia, ada peringatan keras agar peneliti memilih paket
statistika dengan lebih hati-hati. Paling sedikit tiga situasi yang memerlukan kehati-
hatian dengan penggunaan paket statistika dalam komputer, yaitu:
1. Ketika menganalisis data dan tidak memiliki pengetahuan statistika yang cukup
untuk mengerti secara lengkap hasil (out put) komputer yang diperoleh;
2. ketika mengajarkan penggunaan paket statistika dalam suatu pelatihan yang
terpisah dari pengajaran statistika;
3. ketika menggunakan paket statistika dalam pengajaran bidang tertentu tanpa
memerlukan metode statistika yang menunjang paket tersebut.
PERTEMUAN VI

ANALISA DATA BERKALA

6.1 Pengertian Analisa Data Berkala


Data yang dikumpulkan dari waktu ke waktu untuk menggambarkan
perkembangan suatu kegiatan (perkembangan produksi, harga, hasil
penjualan, jumlah penduduk, jumlah kecelakaan, jumlah kesehatan dsb).
Deret berkala atau runtut waktu adalah serangkaian pengamatan
terhadap peristiwa, kejadian atau variabel yang diambil dari waktu ke waktu,
dicatat secara teliti menurut urut-urutan waktu terjadinya, kemudian
disusun sebagai data statistik.
Dari suatu runtut waktu akan dapat diketahui pola perkembangan
suatu peristiwa, kejadian atau variabel. Jika perkembangan suatu peristiwa
mengikuti suatu pola yang teratur, maka berdasarkan pola perkembangan
tersebut akan dapat diramalkan peristiwa yang bakal terjadi dimasa yang
akan datang. Jika nila variabel atau besarnya gejala (peristiwa)

dalam runtut waktu (serangkaian waktu) diberi simbol Y1, Y2, ..Yn dan

waktu-waktu pencatatan nilai variabel (peristiwa) diberi simbol X1, X2, ..Xn

maka rutut waktu dari nilai variabel Y dapat ditunjukan oleh persamaan Y = f
(X) yaitu besarnya nilai variabel Y tergantung pada waktu terjadinya
peristiwa itu.

6.2.Komponen Data Berkala


Pola gerakan runtut waktu atau deret berkala dapat dikelompokan
kedalam 4 (empat) pola pokok. Pola ini bisanya disebut sebagai komponen
dari deret berkala (runtut waktu). Empat komponen deret berkala itu adalah
:
a. Trend, gerakan yang berjangka panjang yang menunjukkan adanya
kecenderungan menuju ke satu arah kenaikan dan penurunan
secara
keseluruhan dan bertahan dalam jangka waktu yang digunakan
sebagai ukuran adalah 10 tahun keatas.
b. Variasi Musim, ayunan sekitar trend yang bersifat musiman serta
kurang lebih teratur
c. Variasi Sikli, ayunan trend yang berjangka lebih panjang dan agak
lebih teratur.
d. Variasi Random/Residu, yaitu gerakan yang tidak teratur sama sekali.
Gerakan/variasi sebagai bentuk perubahan dari data berkala terdiri dari
empat komponen, sebagai berikut :
a. Gerakan trend jangka panjang atau trend sekuler (Long term
movement or secular trend), suatu gerakan yang menunjukan arah
perkembangan secara umum (kecenderungan menaik atau menurun)
dan bertahan dalam jangka waktu yang digunakan sebagai ukuran
adalah 10 tahun ke atas.
b. Gerakan/variasi sikli atau siklus (Cyclical movement or
variations), gerakan/variasi jangka panjang disekitar garis trend.
c. Gerakan/vaiasi musiman (Seasonal movement or variations),
yang berayun naik dan turun, secara periodik disekitar garis trend dan
memiliki waktu gerak yang kurang dari 1 (satu) tahun, dapat dalam
kwartal, minggu atau hari.
d. Gerakan/variasi random/residu (Irregular or random movement
or variations), gerakan atau variasi yang sporadis sifatnya. Faktor
yang dominan dalam gerakan ini adalah faktor-faktor yang bersifat
kebetulan misalnya perang, pemogokan, bencana alam dll
6.3.Ciri Trend Sekuler
Trend (T) atau Trend Sekuler ialah gerakan dalam deret berkala yang
berjangka panjang, lamban dan berkecenderungan menuju ke satu arah, arah
menaik atau menurun. Umumnya meliputi gerakan yang lamanya 10 tahun
atau lebih. Trend sekuler dapat disajikan dalam bentuk :
a. Persamaan Trend, baik persamaan linier maupun persamaan non linier
b. Gambar atau grafik yang dikenal dengan garis atau kurva Trend,
baik garis lurus maupun garis melengkung.
c. Trend juga sangat berguna untuk membuat ramalan yang sangat
diperlukan bagi perencanaan misalnya :
Menggambarkan hasil penjualan
Jumlah peserta KB
Perkembangan produksi harga
Volume penjualan dari waktu ke waktu.

6.4 Metode Least Square (Kuadrat terkecil)


Metode ini paling sering digunakan untuk meramalkan Y, karena
perhitungannya lebih teliti.

Persamaan garis trend yang akan dicari

a = ( ΣY ) / n b = ( ΣXY ) / Σ
Y ‘ = a + bx

dengan :

Y ‘ = data berkala (time series) = taksiran nilai trend.

a = nilai trend pada tahun dasar.

b = ratarata pertumbuhan nilai trend tiap tahun.

x = variabel waktu (hari, minggu, bulan atau tahun).

Untuk melakukan penghitungan, maka diperlukan nilai tertentu pada


variabel waktu (x) sehingga jumlah nilai variabel waktu adalah nol atau
Σx=0.

Untuk n ganjil maka n = 2k + 1 X k+1 = 0


o Jarak antara dua waktu diberi nilai satu satuan.
o Di atas 0 diberi tanda negative

o Dibawahnya diberi tanda positif.

Untuk n genap maka n = 2k X ½ [k+(k+1)] = 0


o Jarak antara dua waktu diberi nilai dua satuan.

o Di atas 0 diberi tanda negatif

o Dibawahnya diberi tanda positif


6.5 Contoh Kasus
6.5.1 Contoh I (untuk jumlah data ganjil):

Ramalan Penjualan Metode Least Square

Data Penjualan (Ribu Unit) Smartphone di Indonesia Tahun 2010-2014

No. Tahun Penjualan

(Y)

1. 2010 250

2. 2011 357

3. 2012 528

4. 2013 752

5. 2014 975

Dari data tersebut akan dibuat ramalan penjualan


menggunakan Metode Least Square.

Penyelesaian:

2.5.2. Analisis Data menggunakan Metode Least Square

No. Tahun Penjualan X X2 XY

(Y)

1. 2010 250 -2 4 -500


2. 2011 357 -1 1 -357

3. 2012 528 0 0 0

4. 2013 752 1 1 752

5. 2014 975 2 4 1950

Jumlah 2862 0 10 1889

2.5.1.2. Mencari nilai a dan b

a = ∑Y / n

a = 2862 / 5 = 572,4

b = ∑XY / ∑X2
6

b = 1889 / 10

b = 188,9

Setelah mengetahui nilai variabel a dan b maka persamaan


trendnya dapat diketahui yaitu :

Y = 572,4 + 188,9X

Dari persamaan fungsi Y diatas maka nilai trend dari tahun


2010 sampai dengan 2014 dapat diketahui :

No. Tahun Penjualan

(Y)

1. 2010 194.6

2. 2011 383,5

3. 2012 572,4

4. 2013 761,3

5. 2014 950,2
Dengan cara tersebut dapat dihitung pula ramalan untuk
tahun – tahun berikutnya.

2.5.2. Contoh II (untuk jumlah data genap):

Ramala Penjualan Metode Least Square

Data Penjualan (Ribu Unit) Smartphone di Indonesia Tahun 2010-2015

No. Tahun Penjualan

(Y)

1. 2010 250

2. 2011 357

3. 2012 528

4. 2013 752
7

5. 2014 975

6. 2015 1158

dibuat ramalan penjualan


Dari Data tersebut akan dengan

menggunakan Metode Least Square.

Penyelesaian:

6.5.2 Analisis Data menggunakan Metode Least Square

No. Tahun Penjualan X X2 XY

(Y)

1. 2010 250 -5 25 -1250

2. 2011 357 -3 9 -1071

3. 2012 528 -1 1 -528

4. 2013 752 1 1 752

5. 2014 975 3 9 2925

6. 2015 1158 5 25 5790

Jumlah 4020 0 70 6618


6.5.2 Mencari nilai a dan b

a = ∑Y / n

a = 4020 / 6 = 670

b = ∑XY / X2

b = 6618 / 70

b = 94,5
Setelah mengetahuinilai variabel a dan b maka persamaan trendnya dapat
diketahui yaitu :

Y = 670 + 94,5X

Dari persamaan fungsi Y diatas maka nilai trend dari tahun 2010 sampai
dengan 2015 dapat diketahui

Tahun Penjualan

(Y)

2010 197,5

2011 386,5

2012 575,5

2013 764,5

2014 953,5

2015 1142,5
Dengan cara tersebut dapat dihitung pula ramalan untuk tahun – tahun
berikutnya.
DAFTAR PUSTAKA

1. Anoname. 2009.SPSS untuk Pengolahan Data Statistik.Yogyakarta: Andi Offset

2. Kuswadi, dan Mutiara, Erna. 2004. Statistik Berbasis Komputer untuk Orang-Orang
Non-Statistik. Jakarta: Elex Media Komputindo

3. Nazir, Moh. 2005.Metode Penelitian. Bogor: Ghalia Indonesia.

Pendukung:

1. Riana, Dwiza.2008. Statistika Deskriptif itu Mudah. Tanggerang: Jelajah Nusa

Anda mungkin juga menyukai