Anda di halaman 1dari 57

MODUL PRAKTIKUM

STATISTIKA

Nama : _______________________________
NIM/NRP : _______________________________
Shift : _______________________________

Penyusun :
Tim Statistika

PRODI AGROTEKNOLOGI
JURUSAN ILMU & TEKNOLOGI PERTANIAN – FAKULTAS PERTANIAN
UNIVERSITAS TRUNOJOYO MADURA
BANGKALAN
2018
MODUL 1
IDENTIFIKASI JENIS DATA

PENDAHULUAN
Pengelompokan Jenis Data
1. Data Kualitatif, yaitu data yang berbentuk kalimat, kata, sifat, persentase, atau gambar.
2. Data Kuantitatif, yaitu data yang berbentuk angka, bilangan, atau data kualitatif yang diangkakan
(dikuantitatifkan), misalnya skoring.
Data kuantitatif dapat dikelompokkan menjadi 2 kelompok, yaitu :
• Data Deskrit, yaitu data yang diperoleh dari hasil menghitung, membilang, atau mencacah.
Jadi data ini biasanya berupa angka atau bilangan bulat.
• Data kontinyu, yaitu data yang diperoleh dari hasil mengukur obyek. Data kontunyu ini
biasanya berupa angka bukan bilangan bulat.
Berdasarkan skala pengukuranya, data dapat dikelompokkan menjadi 4 kelompok, yaitu : Data
Nominal, Data Ordinal, Data Interval, dan Data Rasio.
Skala Pengukuran Data
Kesesuaian antara macan data dengan metode analisis statistiknya didasarkan pada skala
pengukuran datanya. Pengukuran adalah suatu usaha memperpasangkan suatu angka secara
sistematik sebagai cara untuk menyajikan ciri-ciri atau sifat suatu obyek yang diukur. Ada 4 macam
skala pengukuran untuk menyatakan ciri suatu obyek yaitu: nominal, ordinal, interval dan rasio.
a). Skala pengukuran nominal
Yaitu skala yang digunakan untuk membedakan satu obyek dari obyek lain, dan tidak mempunyai
hubungan langsung dengan besar fisik atau ciri-ciri fisik lainnya. Angka hanya sekedar untuk
membedakan dengan obyek lainnya. Contohnya : Nomor Pokok Mahasiswa (NPM), nomor polisi
kendaraan.
b). Skala pengukuran ordinal
Yaitu skala untuk menyatakan urutan tertentu. Angka yang lebih besar dipakai untuk menyatakan
sesuatu yang lebih dari yang obyek tersebut. Jadi skala ini selain dapat dibedakan juga
mempunyai urutan. Contohnya : nilai ujian.
c). Skala pengukuran interval
Yaitu skala yang digunakan untuk menyatakan interval yang sama. Skala ini selain dapat
dibedakan, mempunyai urutan juga mempunyai interval yang sama. Skala ini tidak mempunyai
nilai nol absolut. Misalnya : suhu 00 tidak berarti tidak ada suhunya. Begitu pula suhu 100 tidak
berarti 10 x lebih panas dari 10.
d). Skala Pengukuran Rasio
Pengukuran ini selain dapat dibedakan, mempunyai urutan, intervalnya sama, juga mempunyai
nilai nol absolut. Artinya nilai nol berarti bahwa obyek tersebut memang tidak ada. Misalnya
berat : 0 gram benda tersebut tidak ada beratnya. Contoh lain volume 0 liter, tahun 0 dan
sebagainya. Benda dengan berat 2 Kg berarti 2 kali dari benda yang beratnya 1 Kg.
Berdasarkan skala pengukurannya, analisis statistik yang dapat digunakan harus disesuaikan. Data
yang menggunakan skala pengukuran Nominal dan atau ordinal, analisis statistik yang digunakan
digolongkan dalam analisis statistik nonparametrik. Sedangkan data yang menggunakan skala
pengukuran interval dan atau rasio, analisis statistik yang digunakan digolongkan dalam analisis
statistik parametrik.
TUJUAN PRAKTIKUM
Tujuan Praktikum ini adalah agar praktikan dapat mengenal jenis-jenis data yang ada di lapangan

CARA KERJA
Amati fenomena di lahan dan ambil beberpa contoh jenis data dari sampel yang saudara dapat,
buatlah klasifikasinya dalam bentuk tabel yang berisi parameter dan jenis datanya serta jenis ujinya !
MODUL 2
PENGAMBILAN SAMPEL

PENDAHULUAN
1. Populasi

Populasi adalah keseluruhan objek yang akan/ingin diteliti. Populasi ini sering juga disebut Universe.
Anggota populasi dapat berupa benda hidup maupun benda mati, dimana sifat-sifat yang ada
padanya dapat diukur atau diamati. Populasi yang tidak pernah diketahui dengan pasti jumlahnya
disebut "Populasi Infinit" atau tak terbatas, dan populasi yang jumlahnya diketahui dengan pasti
(populasi yang dapat diberi nomor identifikasi), misalnya pohon jeruk di kebun, jumlah buah per
pohonl disebut "Populasi Finit". Suatu kelompok objek yang berkembang terus (melakukan proses
sebagai akibat kehidupan atau suatu proses kejadian) adalah Populasi Infinitif. Misalnya populasi
pohon suatu desa adalah populasi yang infinit karena setiap waktu terus berubah jumlahnya.
Apabilah penduduk tersebut dibatasi dalam waktu dan tempat, maka populasi yang infinit bisa
berubah menjadi populasi yang finit. Misalnya jumlah petani sayur di Kota Batu pada tahun 2017 (1
Januari s/d 31 Desember 2017) dapat diketahui jumlahnya. Umumnya populasi yang infinit hanyalah
teori saja, sedangkan kenyataan dalam prakteknya, semua benda hidup dianggap populasi yang finit.
Bila dinyatakan bahwa 60% penduduk Indonesia adalah petani, ini berati bahwa setiap 100 orang
penduduk Indonesia, 60 orang adalah petani. Hasil pengukuran atau karakteristik dari populasi
disebut "parameter"
yaitu untuk harga-harga rata-rata hitung (mean) dan σ untuk simpangan baku (standard deviasai).
Jadi populasi yang diteliti harus didefenisikan dengan jelas, termasuk didalam nya ciri-ciri dimensi
waktu dan tempat.

2. Sampel.

Sampel adalah bagian dari populasi yang menjadi objek penelitian (sampel sendiri secara harfiah
berarti contoh). Hasil pengukuran atau karakteristik dari sampel disebut "statistik" yaitu X untuk
harga rata-rata hitung dan S atau SD untuk simpangan baku.
Alasan perlunya pengambilan sampel adalah sebagai berikut :
1. Keterbatasan waktu, tenaga dan biaya.
2. Lebih cepat dan lebih mudah.
3. Memberi informasi yang lebih banyak dan dalam.
4. Dapat ditangani lebih teliti.
Pengambilan sampel kadang-kadang merupakan satu-satunya jalan yang harus dipilih, (tidak
mungkin untuk mempelajari seluruh populasi) misalnya:
• Meneliti air sungai
• Meneliti jumlah anakan per rumpun padi
• Mengetahui jumlah daun menguning terserang penyakit karat daun pada tanaman kopi di
Perkebunan

3. Defenisi

Dalam rangka pengambilan sampel, ada beberapa pengertian yang perlu diketahui, yaitu:
• Populasi Sasaran (Target Populasi) : yaitu populasi yang menjadi sasaran pengamatan atau
populasi dari mana suatu keterangan akan diperoleh (misalnya efek pemupukan N pada
tingggi tanaman) maka target populasi adalah tinggi tanaman.
• Kerangka Sampel (Sampling Frame) : yaitu suatu daftar unit-unit yang ada pada populasi
yang akan diambil sampelnya (daftar anggota populasinya).
• Unit Sampel(Sampling Unit) : yaitu unit terkecil pada populasi yang akan diambil sebagai
sampel (Petak Kebun). Rancangan Sampel yang meliputi cara pengambilan sampel dan
penentuan besar sampelnya.
• Random : yaitu cara mengambil sampel, dimana setiap unit dalam populasi mempunyai
kesempatan yang sama untuk dipilih menjadi anggota sampel.

4. Teknik Pengambilan Sampel

Pemilihan teknik pengambilan sampel merupakan upaya penelitian untuk mendapat sampel yang
representatif (mewakili), yang dapat menggambarkan populasinya. Teknik pengambilan sampel
tersebut dibagi atas 2 kelompok besar, yaitu :
1. Probability Sampling (Random Sample)
Pada pengambilan sampel secara random, setiap unit populasi, mempunyai kesempatan yang
sama untuk diambil sebagai sampel. Faktor pemilihan atau penunjukan sampel yang mana akan
diambil, yang semata-mata atas pertimbangan peneliti, disini dihindarkan. Bila tidak, akan terjadi
bias. Dengan cara random, maka bias pemilihan dapat diperkecil sekecil mungkin. Ini merupakan
salah satu usaha untuk mendapatkan sampel yang representatif.
Keuntungan pengambilan sampel dengan probability sampling adalah sebagai berikut:
• Derajat kepercayaan terhadap sampel dapat ditentukan.
• Beda penaksiran parameter populasi dengan statistik sampel, dapat diperkirakan.
• Besar sampel yang akan diambil dapat dihitung secara statistik.
2. Nonprobability sampling ( nonrandom sample)
Setiap elemen populasi tidak mempunyai kemungkinan yang sama untuk dijadikan sampel,
misalnya convenience sampling, purposive sampling, quota sampling, snowball sampling

TUJUAN PRAKTIKUM
Agar mahasiswa dapat memperoleh sampel yang diambil dari populasinya secara "representatif"
(mewakili), sehingga dapat diperoleh informasi yang cukup untuk mengestimasi populasinya.

CARA KERJA
1. Rumuskan masalah-masalah yang saudara hadapi, kemudian perincilah masalah-masalah
tersebut dalam bentuk-bentuk informasi yang harus disajikan.
2. Setelah memahami ruang lingkup masalah yang dihadapi, tetapkanlah populasi yang hendak
diteliti itu.
3. Susun rencana lengkap terhadap pelaksanaan praktikum tersebut, termasuk menyusun defenisi
dan klasifikasi populasi.
4. Susun rencana, tabulasi dan tetapkan bentuk serta jenis dari tabel yang final.
5. Tetapkan secara terperinci prosedur sampling yang final, ambil data pada masalah yang saudara
hadapi dan olah dengan mentabulasi data seperti yang direncanakan.
MODUL 3
DISTRIBUSI FREKWENSI

PENDAHULUAN
Raw Data Dan Arry Data

Raw data adalah sekumpulan data kasar yang belum diatur secara numerik. Array data adalah data
sudah diatur secara numerik. Misalnya data yang sudah diurutkan dari kecil ke yang lebih besar atau
sebaliknya.
Contoh raw data :
Nilai ujian Statistika dari 28 orang mahasiswa adalah:
7 7 6 5 8 6 7 8 7 6 9 5 5
6 6 7 6 6 4 4 3 6 8 7 6 5
6 6
Contoh arry data :
Dari raw data diatas dapat disusun dari nilai ujian terkecil sampai terbesar menjadi array data sebagai
berikut:
3 4 4 5 5 5 5 6 6 6 6 6 6
6 6 6 6 6 7 7 7 7 7 7 8 8
8 9
Penyusunan data mentah (raw data) menjadi array data merupakan cara penyajian data yang paling
sederhana. Cara penyajian data yang dipandang lebih baik misalnya dengan menyusun data menjadi
suatu distribusi frekuensi. Distribusi frekuensi dapat berupa tabel atau gambar/diagram.
Distribusi frekuensi dapat dikelompokkan menjadi 2 kelompok : yaitu distribusi frekuensi kuantitatif,
dan distribusi frekuensi kualitatif.
Distribusi frekuensi kuantitatif adalah susunan data yang sudah disusun menurut urutan besar atau
kecilnya dalam kelompok-kelompok atau kelas-kelas. Distribusi kualitatis adalah susunan data
menurut sifat atau kualitasnya dalam kelompok-kelompok atau kelas-kelas.
Distribusi frekuensi dapat juga disajikan dalam bentuk grafik (peta batang), yang biasa disebut
sebagai Histogram. HISTOGRAM terdiri dari persegi panjang yang alasnya merupakan panjang kelas
interval, sedangkan tingginya sama dengan frekuensi masing-masing kelas interval.
Bentuk cara penyajian yang lain adalah dengan grafik poligon. Poligon ini dibuat dengan cara
menghubungkan titik-titik tengah dari setiap puncak batang dari histogram dengan garis lurus.
Biasanya ditambah dua segmen garis lain yang menghubungkan titik tengah ujung batang pertama
dan terakhir dengan titik tengah kelas yang paling ujung dimana frekuensinya bernilai nol. Distribusi
frekuensi juga disajikan dalam bentuk distribusi frekuensi kumulatif kurang dari, atau distribusi
frekuensi kumulatif lebih dari.
Cara membuat data menjadi distribusi frekuensi yang berupa kelas-kelas dengan interval tidak ada
ketentuan yang baku atau mengikat. Tetapi yang penting distribusi yang dibentuk jumlah kelasnya
tidak terlalu sidikit dan tidak terlalu banyak, sehingga tampak menarik. Yang dianggap tidak terlalu
banyak dan tidak terlalu sedikit. Sedikit tidak ada pedoman yang pasti, tetapi umumnya banyaknya
kelas diambil antara 5 sampai 15 kelas.
Ada beberapa langkah yang dapat dijadikan pedoman antara lain :
a). Menghitung hitung range dari data yang akan disusun, yaitu selisih antara nilai data yang
terbesar dengan yang terkecil.
b). Menentukan banyaknya kelas dengan menggunakan rumus HA Sturges :
k = 1 + 3,322 log n
k : banyaknya kelas
n : banyaknya data yang akan disusun.
c). Menghitung lebar masing-masing kelas. Jika menggunakan lebar kelas yang sama untuk semua
kelas, maka lebar kelas kurang lebih :
c=(r)/(k)
c : lebar kelas
r : range
k : banyaknya kelas.
d). Menentukan interval masing-masing kelasnya dan menyusunnya mulai dari interval terkecil
sampai terbesar. Jangan sampai interval kelas ini terjadi overlaping. Untuk itu antara kelas yang
satu dengan kelas yang lain diberi jarak (gap) sekecil mungkin, sehingga tidak ada satu datapun
yang masuk ke dalam gap tersebut.
e). Cara lain adalah dengan menentukan lebih dulu interval kelas atau lebar kelas, baru kita hitung
banyaknya kelas, dengan rumus :
k=(r)/(c)
k : banyaknya kelas (jika hasilnya pecahan, dibulatkan)
r : range
c : lebar kelas.
e). Akhirnya kita hitung frekuensi masing-masing kelas, dengan cara memeriksa setiap data masuk
kelas interval yang mana.
CONTOH :
Data produksi padi per Ha 100 orang petani :

67,15 52,53 72,61 42,12 21,57 55,75 47,35 66,83 54,28 37,47

49,55 51,47 44,41 56,63 48,79 44,44 69,15 56,25 87,71 27,94

34,53 47,22 59,32 73,37 35,42 61,23 44,77 51,87 52,47 77,58

82,56 57,52 63,38 73,59 64,41 56,65 48,72 47,63 41,17 62,19

72,61 85,56 25,45 72,57 54,79 52,61 68,72 44,21 22,56 37,58

66,15 49,16 69,41 42,74 54,37 59,52 58,17 75,63 55,27 67,16

37,64 61,36 28,74 33,29 61,77 33,21 57,42 47,86 51,93 37,99

42,36 51,43

Langkah membuat tabel distribusi frekuensi :


Banyaknya data = 72; nilai data terkecil = 21,57 dan nilai data terbesar = 87,71. Jadi rangenya =
87,71 – 21,57 = 66,14.
Misalnya kita tetapkan lebar kelas = 10, maka banyaknya kelas 66,14 / 10 = 7 (dibulatkan).
Jadi interval kelas tersebut adalah :
20,00 – 29,99 30,00 – 39,99 40,00 – 49,99 … dan seterusnya. Bukan kita buat
interval 20,00 – 30,00 30,00 – 40,00 karena data 30 nantinya akan overlapping, akan
dimasukkan ke kelas pertama atau kelas kedua dan ini tidak boleh. Jadi supaya tidak ada
overlapping, kita buat gap antar kelas sebesar 0,01.
Jadi hasilnya seperti tabel di bawah ini :
No. Produksi Padi (Ku/Ha) Banyaknya Petani
1 20,00 – 29,99 5
2 30,00 – 39,99 8
3 40,00 – 49,99 16
4 50,00 – 59,99 20
5 60,00 – 69,99 13
6 70,00 – 79,00 7
7 80,00 – 89,99 3

TUJUAN PRAKTIKUM
Tujuan praktikum adalah agar praktikan mampu membuat tabel distribusi frekuensi dengan
menghitung nilai range.

CARA KERJA :
1. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua populasi yang berbeda,
masing-masing populasi sebanyak 75 sampel. Buatlah tabel frekuensi dan buatlah tabel frekuensi
dan hitung nilai range, varians, standar deviasi dan koefisien variansi.
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh!
MODUL 4
PENGENALAN SOFTWARE STATISTIK

TUJUAN PRAKTIKUM
Mahasiswa mengenal beberapa software yang bisa digunakan untuk menyelesaikan permasalahan
statistik

PENDAHULUAN
Belajar statistik tidak lagi menjadi masalah besar bagi mahasiswa yang mempunyai kemampuan
berhitung lemah. Pada saat ini banyak tersedia software statistik yang bisa membantu mengolah
data, diantaranya adalah: Excell, SPSS, Minitab, E- views, QSB, Lindo, Lingo, Expert Choice, dll.
Dalam praktikum ini, kita hanya akan membahas dua program yang paling banyak digunakan,
yaitu Excell dan SPSS.

a. Excell

Excell yang merupakan bagian dari Microsoft Office telah menyediakan fasilitas statistik yang
cukup lengkap, baik statistik deskriptif maupun statistik inferensia. Fasilitas statistik deskriptif ada
pada formula, chart dan data analyze. Sedangkan untuk fasilitas statstik inferensia ada pada data
analyze.
Formula digunakan untuk menghitung angka sesuai dengan rumus
Chart digunakan untuk menvisualisasikan data dalam bentuk diagram
Data analyze digunakan untuk menganalisis data
Chart

formula

Gambar 1. Excell: Chart dan Formula

Gambar 2. Excell: Data Analyze


Kalau Data Analyze tidak muncul pada Tool maka pilih Add-ins

Gambar 3. Cara menambah data analyize dengan add ins

b. SPSS

Sama halnya dengan Excell, SPSS juga menyediakan fasilitas mengolah data untuk statistik
deskriptif dan statistik inferensia yang ada pada Analyze dan Graph. Analyze diguankan untuk
menganalisis data dan Graph diguankan untuk menvisualisasikan data dalam bentuk diagram
Tampilan layar SPSS ada dua yaitu:
1. Data view, sebagai lembar kerja seperti excell (ex: entri data)
2. Variable View sebagai definisi operasional (ex: membuat nama variable, membuat kategori, dll)

Gambar 4. Tampilan data view


Gambar 5. tampilan variable view
MODUL 5
PENYAJIAN DATA

TUJUAN PRAKTIKUM
a. Mahasiswa mampu menyajikan data dalam bentuk diagram dengan menggunakan program
Excell
b. Mahasiswa mampu membaca atau mengintepretasikan diagram

PENDAHULUAN
Metode statistic digolongkan menjadi dua yaitu: statistic deskriptif dan statistic Inferensia.
Statistik deskriptif membahas cara pengumpulan data, penyederhanaan angka-angka
pengamatan yang diperoleh (meringkas dan menyajikan), serta melakukan pengukuran
penyebaran dan pemusatan data untuk memperoleh informasi yang lebih menarik, berguna dan
mudah dipahami. Informasi yang dapat diperoleh dari dengan statistic deskriptif ini antara lain
pemusatan data, penyebaran data, serta kecenderungan gugus data. Yang termasuk dalam
ukuran pemusatan data misalnya rata-rata,median, dan modus. Ukuran penyebaran misalnya,
range, simpangan rata-rata, varians, dan simpangan baku

a. Diagram Garis

Diagram garis digunakan untuk menggambarkan keadaan yang serba terus menerus atau jenis
data time series. Dalam grafik ini terdapat informasi waktu yang ditunjukkan oleh sumbu X dan
informasi nilai satuan (kuantum) ditunjukkan oleh sumbu Y. Oleh karena itu, diagram ini
menginformasikan naik turunnya data dalam beberapa rentang waktu
Diagram ini bisa dibuat dengan menggunakan program Excell Contoh:
Diketahui data produksi susu, telur, dan daging di Jawa Timur Tahun 1993-1997 sebagai
berikut:
Susu Telur Daging
Tahun
(Ton) (Ton) (Ton)
1993 124.25 94.66 223.17
1994 129.54 104.87 246.93
1995 129.63 110.26 218.06
1996 134.04 120.63 223.67
1997 139.33 127.03 315.54
1998 150.00 38.83 237.77
1999 200.23 44.17 176.32
2000 214.58 93.04 225.31
2001 196.95 94.72 220.69
2002 197.46 96.12 248.21
2003 235.94 133.23 311.86
2004 237.66 224.40 334.11
2005 239.91 200.67 301.51
2006 244.30 282.48 318.50
2007 249.27 324.91 331.15
Langkah ntuk membuat diagram garisnya:
• Masukkan data di atas ke program excell
• Blok angka yang akan disajikan dalam diagram
• Klik insert → chart → standart types → XY (scatter) → pilih bentuk grafik → next

• Pilih series. Isilah kolom name dengan: susu untuk series 1, telur untuk series 2, dan
daging untuk series 3Înext
• Isilah kolom chart title: produksi ternak jawa timur tahun 1993-2007
• Isilah value (X) axis: Tahun
• Isilah value (Y) axis: Ton
• Klik next

• Klik finish
produksi ternak jawa timur

400.00
350.00
300.00
250.00 susu
ton

200.00 telur
150.00 daging
100.00
50.00
0.00
1992 1994 1996 1998 2000 2002 2004 2006 2008
tahun
Intepretasi :
Produksi daging dan telur mengalami penurunan tajam pada tahun 1998 dan 1999. Sedangkan
produksi susu dari tahun 1993 sampai tahun 2008 cenderung selalu mengalami kenaikan.

b. Diagram Pastel

Diagram pastel digunakan untuk penyajian data berbentuk kategori yang dinyatakan dalam
persentase. Berbeda dengan diagram garis yang datanya time series, pada diagram pastel
datanya adalah cross section.
Contoh soal :
pakai soal pada Diagram Baris
Langkah membuat diagram pastel :
• Blok judul dan angka yang akan disajikan dalam diagram, misalkan produksi tahun 1993
• Klik insert →chart → standart types → pie → pilih bentuk grafik → next

• Pilih rows pada seri inÎklik next


• Pilih titile → isi kolom title chart: produksi ternak jatim tahun 1993
• Pilih data labels → pilih category name, value dan percentage

• Klik finish

Intepretasi :
Distribusi produksi ternak jawa timur pada tahun 1993 terdiri dari 51% daging, 28% susu dan
21% telur.

c. Diagram Batang

Kegunaan diagram batang adalah untuk menyajikan data yang bersifat kategorik atau data
distribusi. Cara menggambarnya diperlukan sumbu tegak (vertikal) dan sumbu mendatar
(horisontal) yang berpotongan tegak lurus. Apabila diagram berbentuk berdiri, maka sumbu
horisontal digunakan untuk menyatakan atribut atau waktu, sedangkan nilai (kuantum) dituliskan
pada sumbu tegak
Contoh soal :
pakai soal pada Diagram Baris
Langkah membuat diagram batang:
• Blok judul dan angka yang akan disajikan dalam diagram
• Klik insert → chart →standart types → column → pilih bentuk grafik → next

• Klik series
• Isilah kolom category (X) labels dengan cara mengeblok data tahun (=Sheet1!$A$3:$A$17)

• Klik next → pilih title


• Isilah kolom cart title: produksi ternak jatim tahun 1993-2007
• Isilah kolom category (X) axis: tahun
• Isilah kolom category (Y) axis: produksi (ton)

• Klik next → finish

TUGAS RUMAH
Diketahui indeks produksi dan produktivitas padi di Jawa Timur Tahun 2000-2008, sebagai
berikut:
Indeks Indeks
Tahun Produksi Produktivitas
2000 1.116 1.007
2001 1.045 0.969
2002 1.061 0.998
2003 1.070 1.005
2004 1.079 1.016
2005 1.081 1.019
2006 1.123 1.022
2007 1.127 1.037
2008 1.250 1.126

• buatlah diagram grafis, diagram pastel, dan diagram batang


• intepretasikan hasilnya
MODUL 6
UKURAN PEMUSATAN

PENDAHULUAN
Ukuran statistik merupakan ukuran yang menunjukkan bagaimana suatu gugus data memusat dan
menyebar. Di dalam ukuran statistik ada tiga bentuk ukuran deskripsi data, yaitu : ukuran pusat data,
ukuran variabilitas data dan ukuran bentuk distribusi data. Ukuran pusat data yang banyak digunakan
untuk mendeskripsikan data adalah mean (rata-rata hitung), median dan modus. Ukuran penyebaran
suatu kelompok data terhadap pusat data disebut disperse atau variasi atau keragaman data. Ukuran
disperse data yang umum dipakai adalah jangkauan (range), variansi dan standar deviasi.
Ukuran Pemusatan
1. Mean (rata-rata hitung)
Rata-rata dihitung dengan menjumlahkan seluruh angka data yang selanjutnya dibagi dengan
banyaknya (jumlah) data. Jumlah data untuk data sampel disebut sebagai ukuran sampel yang
disimbolkan dengan n dan untuk data populasi disebut sebagai ukuran populasi yang disimbolkan
dengan N. Untuk rata-rata hitung sekumpulan data hasil observasi dihitung dengan
menggunakan rumus berikut :
Rata-rata (X) = Σ(Xi) / N
Dimana : Xi = nilai dari observasi yang ke-i
N = banyaknya observasi ukuran sample.
2. Median
Median adalah nilai yang membagi gugus data yang telah tersortir (ascending) menjadi 2 Bagian
yang sama besar.
Median = (n+1)/2
3. Kuartil adalah nilai yang membagi gugus data yang telah tersortir (ascending) menjadi Empat
bagian yang sama besar. Nilai kuartil terdiri dari kuartil 1, kuartil 2 dan kuartil 3.
Nilai kuartil 2 suatu gugus data sama dengan nilai median tersebut.
4. Modus
Modus merupakan nilai yang paling sering muncul atau nilai yang frekuensinya paling tinggi.

TUJUAN PRAKTIKUM
Tujuan dari praktikum materi ukuran pemusatan ini adalah untuk membantu praktikan dalam
mempelajari dan memahami ukuran pemusatan data.

CARA KERJA:
1. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua populasi yang berbeda,
masing-masing populasi sebanyak 20 sampel. Buatlah tabel frekuensi dan hitung nilai rata-rata,
median, kuartil dan modusnya.
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh!
Cara menghitung rata-rata tertimbang di excel
Dengan menggunakan microsoft excel, kita dapat menentukan rata-rata tertimbang sekelompok
data. Rata-rata tertimbang berbeda dengan nilai rata-rata yang umum digunakan, perbedaannya
adalah rata-rata tertimbang bergantung pada variabel nilai dan berat sebuah angka.
Agar lebih mudahnya perhatikan contoh berikut :
Pengiriman 10 barang dengan biaya pengiriman $0.20 per barang . Karena adanya biaya tambahan
bobot konsumsi barang, maka pada pengiriman kedua 40 barang sekarang biaya $0,30 per barang.
demikia juga pada pengiriman ketiga 60 barang dengan biaya $0.35 per barang.
Secara umum , jika menggunakan rumus rata-rata biasa maka biaya rata-rata /barang dalam setiap
pengiriman ditentukan oleh rumus ($0.20+$0.30+ $0.35)/3 = $0,283--bukanlah ukuran yang akurat
dari biaya rata-rata kasus karena itu tidak memperhitungkan bahwa ada 60 kasus dengan biaya
pengiriman $0.35, 40 kasus dengan biaya $0,30 dan selebihnya $0.20. Dengan menggunakan rumus
rata-rata tertimbang akan dihasilkan biaya pengiriman barang rata-rata pada ketiga kasus pegiriman
barang tersebut adalah $0.318.
Untuk menemukan rata-rata tertimbang, ikuti langkah berikut :
Dalam lembar kerja excel, ketik data sebagai berikut:
1. Buat tabel seperti di bawah ini
Kolom A dan B berisi data yang akan diolah
Kolom D dan E akan diisi dengan formula rata/rata tertimbang

2. Selanjutnya buat rumus rata-rata tertimbang


• Rumus untuk mencari rata-rata tertimbang semua pengiriman
a. Menggunakan sumproduct, di cell D3 ketik formula

=SUMPRODUCT(A3:A5,B3:B5)/SUM(B3:B5)

b. Atau rumus manual dengan cara di sell D4 ketik formula

=((A3*B3)+(A4*B4)+(A5*B5))/SUM(B3:B5)

B. Rumus untuk mencari rata-rata tertimbang dari gabungan pengiriman pertama dan kedua
a. Menggunakan sumproduct ,di sel E3 ketik formula

=SUMPRODUCT(A3:A4,B3:B4)/SUM(B3:B4)

b. Atau rumus manual dengan cara di sell E4 ketik rumus

=((A3*B3)+(A4*B4))/SUM(B3:B4)
Cara menghitung kuartil di excel
Dengan menggunakan microsoft excel kita dapat mengihitung kuartil (quartile) dan persentil
(percentile). Jika percentile membagi data menjadi 100 bagian yang sama, maka pada kuartil akan
membagi data menjadi 4 bagian yang sama.
Secara umum cara penulisan kuartil bisa dilihat di bawah ini

QUARTILE(array,quart)

Dimana :
Array adalah array atau range sell yang berisi data numerik Quart adalah kuartil ke-n yang ingin dicari
(Q1, Q2,Q3)

Kuartil yang
Nilai quart dihasilkan
0 Nilai Minimum
1 Q1 (25th percentile)
2 Q2 (50th percentile)
3 Q3 (75th percentile)
4 Nilai Maximum

Dalam bentuk grafik Q1, Q2 (median), dan Q3 bisa dilihat letaknya seperti di bawah ini:

Rumus perhitungan secara manual dan konsep tentang kuartil bisa dilihat disini quartile
Contoh penerapan perhitungan kuartil di excel seperti prosedur berikut:
1. Buat tabel berikut
Isi data pada kolom A dalam range A3:A13
Data berikut sudah berurut dari nilai terkecil hingga nilai terbesar

2. Ketik formula untuk menghitung nilai kuartil


a. Di cell D3 ketik :

=QUARTILE(A3:A13,0)

Persamaan ii untuk menghitung nilai minimum


b. Di cell D4 ketik

=QUARTILE(A3:A13,1)

Persamaan ini untuk mencari nilai Q1 , kuartil ke 1


c. Di sel D5 ketik

=QUARTILE(A3:A13,2)

Persamaan ini untuk mencari nilai Q2 , kuartil ke 2


d. Di cell D6 ketik

=QUARTILE(A3:A13,3)

Persamaan ini untuk mencari nilai Q3 , kuartil ke 3


Di cell C10 ketik median formula:

=MEDIAN(A3:A13)

Nilai median = Q2

Cara menghitung persentil di excel


Dalam statistik yang berkaitan dengan ukuran data populasi dikenal beberapa istilah seperti :
1. Median, median adalah nilai tengah dari sekumpulan data, median membagi data menjadi 2
bagian yang sama dan juga dikenal sebagai kuartil 2 (K2)
2. Kuartil (Quartile). Kuartil adalah nilai-nilai pengamatan yang membagi data menjadi 4 bagian
yang sama, yang terkadang disebut dengan k1, k2 (median) dan k3. Secara manual kuartil dapat
ditentukan dengan terlebih dahulu menentukan nilai n/4 –> p, dan selanjutnya diperoleh k1 dan
k3
3. Desil (Decile), Desil adalah nilai-nilai pengamatan yang membagi data menjadi 8 bagian yang
sama.
4. Persentil (percentile), Persentil adalah nilai-nilai pengamatan yang membagi data menjadi 100
bagian yang sama.

Cara penulisan rumus percentile seperti di bawah ini :

PERCENTILE(array,k)

Dimana :
a. Array dapat berupa array atau range data.
b. k adalah nilai percentle yang diinginkan (nilai percentile berada dalam kisaran 0 sampai1, 0
berarti 0%, sedangkan 1 berarti 100%)

Beberapa hal yang perlu diperhatikan saat menggunakan fungsi percentile di excel :
a. Jika array kosong atau berisi lebih dari 8.191 titik data, maka PERSENTIL aka menghasilkan NUM
#! (nilai kesalahan).
b. Jika k adalah nonnumerik (bukan angka), maka PERSENTIL menghasilkan # VALUE!
c. Jika k adalah <0 atau jika k> 1, PERSENTIL menghasilkan NUM #!
d. Jika k adalah bukan kelipatan dari 1 / (n - 1), PERSENTIL akan melakukan interpolasi untuk
menentukan nilai pada persentil ke-k.

Agar lebih mudah menerapkan fungsi percentile silahkan buat tabel seperti di bawah ini :
1. Kolom A akan diisi data, dalam contoh ini data berada dalam
range A3:A13 Perlu diperhatikan data harus tersortir dari kecil
hingga besar.

2. Selanjutnya lakukan perhitungan percentil


a. Untuk menghitung percentil ke-100 di sel D3 ketik formula

=PERCENTILE(A3:A13,1)

b. Untuk mencari percentil ke-20 di sel D4 type formula

=PERCENTILE(A3:A13,0.2)

c. Untuk menentukan percentil ke-80 di sel D5 type formula

=P
MODUL 7
UKURAN PENYEBARAN

PENDAHULUAN
1. Jangkauan (range)
Jangkauan atau range (r) suatu gugus data adalah selisih antara nilai maksimum dengan nilai
minimum.
Dengan melihat ukuran ini maka dapat diketahui gambaran secara kasar tentang variasi suatu
distribusi data.
Nilai range ini sangat kasar, karena tidak mempertimbangkan nilai-nilai yang lain selain nilai
ekstrimnya.

2. Variansi
Variansi adalah rata-rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata-
rata hitung. Variansi untuk sampel dilambangkan dengan s2. sedangkan untuk populasi
dilambangkan dengan σ2 Variansi (s)2 = [Σ(Xi-X)] / (n-1)
Sebenarnya yang merupakan ukuran simpangan adalah simpangan baku( standar deviasi), namun
demikian ukuran variansi ini merupakan ukuran pangkat dua dari simpangan baku, sehingga bisa juga
dianggap sebagai ukuran penyebaran.

1. Standar Deviasi
Standar deviasi adalah akar pangkat dua dari variansi. Standar deviasi seringkali disebut simpangan
baku. Dengan menggunakan simpangan rata-rata hasil pengamatan penyebaran sudah
memperhitungkan seluruh nilai yang ada pada data. Namun demikian karena dalam penghitungan
menggunakan nilai absolut maka tidak dapat diketahui arah penyebarannya. Maka dengan
simpangan baku kelemahan ini dapat diatasi, yakni dengan cara membuat nilai pangkat 2, sehingga
nilai negatif menjadi positif. Simpangan baku ini merupakan ukuran penyebaran yang paling teliti.

1. Koefisien variansi
Koefisien variasi merupakan suatu ukuran variansi yang dapat digunakan untuk membandingkan
suatu distribusi data yang mempunyai satuan yang berbeda. Kalau kita membandingkan berbagai
variansi atau dua variabel yang mempunyai satuan yang berbeda maka tidak dapat dilakukan dengan
menghitung ukuran penyebaran yang sifatnya absolut.

TUJUAN PRAKTIKUM
Tujuan dari praktikum materi ukuran penyebaran ini adalah untuk membantu praktikan dalam
mempelajari dan memahami ukuran penyebaran data.

CARA KERJA :
1. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua populasi yang berbeda,
masing-masing populasi sebanyak 10 sampel (per pratikan). Buatlah tabel frekuensi (per
kelompok)dan dan hitung nilai range, varians, standar deviasi dan koefisien variansi .
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh!
Menghitung standar deviasi dengan menggunakan excel
Salah satu fungsi statistik yang tersedia di microsoft excel adalah standar deviasi(simpangan baku).
Standar deviasi adalah ukuran dari seberapa luas simpangan nilai dari nilai rata-rata (mean).
Cara penulisan rumus fungsi standar deviasi
STDEV (number1, number2,...)
Dengan :
Number1, number2, ... adalah 1-255 argumen yang sesuai dengan sampel populasi. Anda juga dapat
menggunakan array tunggal atau referensi ke array, bukan argumen yang dipisahkan oleh koma.
Keterangan
a. STDEV mengasumsikan bahwa argumen adalah contoh dari populasi. Jika data anda mewakili
seluruh populasi, untuk menghitung deviasi standar menggunakan STDEVP.
b. Standar deviasi dihitung menggunakan metode "n-1" .
c. Argumen dapat berupa nomor atau nama, array, atau referensi yang mengandung angka.
d. Nilai-nilai logis dan representasi teks dari nomor yang Anda ketik langsung ke daftar argumen
akan dihitung.
e. Jika argumen adalah sebuah array atau referensi, hanya nomor/angka dalam array atau referensi
yang akan dihitung. Sel kosong, nilai-nilai logis, teks, atau nilai-nilai kesalahan dalam array atau
referensi akan diabaikan.
f. Argumen yang kesalahan nilai atau teks yang tidak dapat diterjemahkan ke dalam nomor/angka
akan menyebabkan kesalahan. g. Jika Anda ingin memasukkan nilai-nilai logis dan representasi
teks angka dalam referensi sebagai bagian dari perhitungan, gunakan fungsi STDEVA.
Dalam penerapannya STDEV , perhitungan standar deviasi secara manual menggunakan rumus
berikut:

Dimana :
x = data ke n
x bar = x rata-rata = nilai rata-rata sampel
n = banyaknya data
Sebagai contoh silahkan ikuti prosedur berikut :
1. Buat tabel yang berisi data (Anda bisa menggunakan data yang tidak berurut dari nilai kecil ke
besar)

2. Untuk menghitung standard deviasi , di sel C3 ketik formula berikut : =STDEV(A3:A13)


MODUL 8
UKURAN BENTUK : SKEWNESS, KURTOSIS

PENDAHULUAN
Kemencengan (Skewness)
Kemencengan atau kecondongan (skewness) adalah tingkat ketidaksimetrisan atau kejauhan
simetri dari sebuah distribusi. Sebuah distribusi yang tidak simetris akan memiliki rata-rata, median,
dan modus yang tidak sama besarnya (mean≠ Me ≠ Mo), sehingga distribusi akan terkonsentrasi
pada salah satu sisi dan kurvanya akan menceng. Jika distribusi memiliki ekor yang lebih panjang ke
kanan daripada yang ke kirimaka distribusi disebut menceng ke kanan atau memiliki kemencengan
positif. Sebaliknya, jika distribusi memiliki ekor yang lebih panjang ke kiri daripada yang ke kanan
maka distribusi disebut menceng ke kiri atau memiliki kemencengan negatif.

Untuk mengetahui bahwa konsentrasi distribusi menceng ke kanan atau menceng ke kiri, dapat
digunakan metode-metode berikut :
Koefisien Kemencengan Pearson
Koefisien Kemencengan Pearson merupakan nilai selisih rata-rata dengan modus dibagi simpangan
baku.
Koefisien Kemencengan Pearson dirumuskan sebagai berikut:

Keterangan :
sk = koefisien kemencengan Pearson
Mo = modus
:

Atau

Me = median

Jika nilai sk dihubungkan dengan keadaan kurva maka :


1) sk = 0 kurva memiliki bentuk simetris;
2) sk> 0 nilai-nilai terkonsentrasi pada sisi sebelah kanan ( mean terletak di sebelah kanan Mo),
sehingga kurva memiliki ekor memanjang ke kanan, kurva menceng ke kanan atau menceng
positif;
3) sk< 0 nilai-nilai terkonsentrasi pada sisi sebelah kiri (mean terletak di sebelah kiri Mo), sehingga
kurva memiliki ekor memanjang ke kiri, kurva menceng ke kiri atau menceng negatif.
Menghitung skewness dengan excel
Salah satu fungsi statistik yang tersedia di microsoft excel adalah skewness (kemencengan).
Skewness adalah derajat ketidaksimetrisan suatu distribusi. Jika kurva frekuensi suatu distribusi
memiliki ekor yang lebih memanjang ke kanan (mengacu dari meannya) maka disimpulkan menceng
kanan (positif) dan jika distribusi memiliki ekor yang lebih memanjang ke kiri maka dapat
disimpulkan menceng kiri (negatif). Secara perhitungan, skewness adalah momen ketiga terhadap
mean. Distribusi normal dan distribusi simetris lainnya, misalnya distribusi t memiliki skewness 0.

Cara penulisan rumus skewness di excel

Skew (number1, number2,...)

Dimana :
Number1, number2 ... berupa1-255 argumen yang Anda ingin dighitung skewnessnya. Anda
juga dapat menggunakan array tunggal atau referensi ke array, bukan argumen yang
dipisahkan oleh koma.

Keterangan
a. Argumen dapat berupa nomor atau nama, array, atau referensi yang mengandung angka.
b. Nilai-nilai logis dan representasi teks dari sebauah angka yang anda ketik langsung ke daftar
argumen akan dihitung.
c. Jika sebuah array atau argumen referensi berisi teks, nilai-nilai logis, atau sel-sel kosong, nilai-
nilai tersebut diabaikan, namun sel-sel dengan nilai nol akan disertakan dalam perhitungan.
d. Argumen yang kesalahan nilai atau teks yang tidak dapat diterjemahkan ke dalam angka
menyebabkan kesalahan.
e. Jika ada data yang kurang dari tiga poin, atau deviasi standar sampel adalah nol, Skew
mengembalikan DIV # / 0! kesalahan nilai. Persamaan untuk kemiringan didefinisikan sebagai:

Bentuk kurva distribusi data berdasarkan nilai skewness bisa dilihat di bawah ini :

Perhitungan skewness secara manual menggunakan rumus berikut :

Dengan:
n = banyaknya data
xi = data ke-i
x bar = x rata-rata
s = standar deviasi (simpangan baku)
Sebagai contoh buat tabel seperti di bawah ini :
1. Ketik sembarang data pada sell A3 hingga A13
2. Untuk menghitung nilai skewness, di sel C3 ketik formula

=SKEW(A3:A13)

Terlihat nilai skewnessnya lebih kecil dari 1, berarti jika grafik kurva distribusinya dibuat akan
tampak seperti pada gambar Negative Skew.

Keruncingan atau Kurtosis


Keruncingan atau kurtosis adalah tingkat kepuncakan dari sebuah distribusi yang biasanya diambil
secararelatif terhadap suatu distribusi normal. Berdasarkan keruncingannya, kurva distribusi dapat
dibedakan atas tiga macam,yaitu sebagai berikut :
1) Leptokurtik
Merupakan distribusi yang memiliki puncak relatif tinggi.
2) Platikurtik
Merupakan distribusi yang memiliki puncak hampir mendatar

3) Mesokurtik
Merupakan distribusi yang memiliki puncak tidak tinggi dan tidak mendatar. Bila distribusi
merupakan distribusi simetris maka distribusi mesokurtik dianggap sebagai distribusi normal.
Untuk mengetahui keruncingan suatu distribusi, ukuran yang sering digunakan adalah koefisien
kurtosis persentil.

1. Koefisien keruncingan
Koefisien keruncingan atau koefisien kurtosis dilambangkan dengan 4 (alpha 4).
Jika hasil perhitungan koefisien keruncingan diperoleh :
1) Nilai lebih kecil dari 3, maka distribusinya adalah distribusi pletikurtik
2) Nilai lebih besar dari 3, maka distibusinya adalah distribusi leptokurtik
3) Nilai yang sama dengan 3, maka distribusinya adalah distribusi mesokurtik Untuk mencari nilai
koefisien keruncingan, dibedakan antara data tunggal dan data kelompok.
a. Untuk data tunggal

b. Untuk data kelompok

Atau

Menghitung kurtosis menggunakan excel


Salah satu fungsi statistik yang tersedia di microsoft excel adalah kurtosis . Kurtosis adalah derajat
keruncingan suatu distribusi (biasanya diukur relatif terhadap distribusi normal). Kurva yang lebih
lebih runcing dari distribusi normal dinamakan leptokurtik, yang lebih datar platikurtik dan distribusi
normal disebut mesokurtik. Kurtosis dihitung dari momen keempat terhadap mean.
Cara penulisan rumus kurtosis di excel

Kurt (number1, number2,...)

Dimana :
Number1, number2, ... dapat berupa 1-255 argumen yang ingin dihitung kurtosisnya. Anda
juga dapat menggunakan array tunggal atau referensi ke array, bukan argumen yang
dipisahkan oleh koma.

Keterangan
a. Argumen dapat berupa nomor atau nama, array, atau referensi yang mengandung angka.
b. Nilai-nilai logis dan representasi teks dari nomor yang aAnda ketik langsung ke daftar
argumen akan dihitung.
c. Jika sebuah array atau argumen referensi berisi teks, nilai-nilai logis, atau sel-sel kosong, nilai-
nilai tersebut diabaikan, namun sel-sel dengan nilai nol yang disertakan dalam perhitungan.
d. Argumen yang kesalahan nilai atau teks yang tidak dapat diterjemahkan ke dalam
nomor/angka menyebabkan kesalahan.
e. Jika ada data yang kurang dari empat poin, atau jika standar deviasi sampel sama
dengan nol, Kurt mengembalikan DIV # / 0! (nilai kesalahan)

Rumus untuk menghitung Kurtosis adalah :

Dimana :
n = banyaknya data/sampel
xi = data ke-i
x bar = x rata-rata
s = standar deviasi

Sebagai contoh buat tabel seperti di bawah ini


1. Kolom A berisi data

• Untuk mencari nilai kurtosis, di sel C3 ketik formula

=KURT(A3:A13)

Hasilnya kurtosis = -0.56678

TUJUAN PRAKTIKUM
Tujuan praktikum adalah agar praktikan dapat memahami dan menghitung kemencengan dan
kurtosis suatu kurva
CARA KERJA
1. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua populasi yang berbeda,
masing-masing populasi sebanyak 15 sampel. Buatlah tabel frekuensi dan buatlah tabel frekuensi
dan hitung nilai kemencengan dan kurtosis kurvanya.
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh!
a. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua populasi yang berbeda,
masing-masing populasi sebanyak 15 sampel. Buatlah tabel frekuensi dan buatlah kurva dan
hitung kurtosisnya..
b. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
c. Interpretasikan hasil yang telah saudara peroleh !
MODUL 9
UKURAN PEMUSATAN DAN UKURAN PENYEBARAN
MENGGUNAKAN SPSS

Penggunaan SPSS untuk Menghitung Ukuran Pemusatan dan Ukuran


Penyebaran
• Contoh pengunaan SPSS untuk menghitung ukuran pemusatan dan penyebaran pada modul ini
menggunakan file dengan nama “data praktikum_2.xls”.
• Data tersebut adalah data hasil pengukuran panjang, berat dan isi lambung dari 21 ikan lele
(Clarias batrachus) di sebuah kolam percobaan.
• Setelah data di export ke SPSS untuk mengetahui nilai dari ukuran pemusatan dan penyebaran
klik Analyze > Descriptive Statistics > Descriptives.

• Klik Option lalu checklist parameter-parameter yang diinginkan > Continue > OK. Hasil dari
perhitungan ukuran pemusatan dan penyebaran dari panjang ikan hasil pengamatan adalah
sebagai berikut.

• Descriptive Statistics

N Range Minimum Maximum Mean Std. Variance


Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic
Panjang (cm) 21 20 18 38 26.67 1.245 5.704 32.533
Valid N (listwise) 21
• Dari table diatas dapat diketahui bahwa rataan panjang ikan pengamatan adalah 26.67 cm,
ragam = 32.533 cm, standar deviasi = 5.704 cm dan standar error = 1.245 cm.

Latihan 2
1. Buka file data praktikum_2. xls.
2. Hitunglah ukuran penyebaran dan pemusatan dari hasil yang didapatkan.
3. Berikan analisis singkat dari semua hasil yang diperoleh.

Kurva Normal
• Secara umum distribusi frekuensi dari hasil sebuah pengamatan akan memiliki nilai yang
memusat terhadap nilai rata-rata dan akan memiliki frekuensi yang lebih kecil untuk nilai-
nilai pengamatan yang ekstrim.
• Bila hasil ditribusi frekuensi memenuhi kaidah diatas, maka distribusi data akan disebut
menyebar normal. Bila data tidak menyebar normal, maka tergantung dari bentuk kurva/
histogram, sebaran data dapat disebut menjulur ke kanan (skewed right) atau menjulur ke
kiri (skewed left).
• Dalam SPSS untuk mengetahui apakah data menyebar normal atau tidak, dapat digunakan
histogram frekuensi (dengan kurva normal) dan boxplot.
• Bentuk-bentuk umum dari sebaran frekuensi data dapat dilihat pada gambar di bawah ini

• Contoh penggunaan SPSS dalam memeriksa normalitas data pada modul ini menggunakan
data dengan nama file “data praktikum_2_mahasiswa”. Data ini merupakan hasil observasi
mahasiswa di salah satu PTN di Jakarta. Variable yang diukur adalah usia (age), tinggi badan
(height) dan berat badan (weight).
• Buka file tersebut dengan SPSS
• Untuk membuat histogram frekuensi klik Graphs> Histogram, lalu pilih variable yang akan
dianalisa. Misalnya variable age, check list Display normal curve lalu klik OK.
• Hasilnya sebagai berikut :
dari grafik terlihat bahwa data tidak
menyebar normal, cenderung
menjulur ke kanan (skewed right)
dengan rata-rata 27,6 tahun dan
standar deviasi 9,24.

Latihan
• Buka file data praktikum_2_mahasiswa
• Buatlah histogram frekuensi untuk variable height dan weight dan sajikan intrepetasi
singkat dari hasil yang didapatkan.
• Tentukan ukuran-ukuran pemusatan dan penyebaran dari variable-variable tersebut.
MODUL 10
UJI NORMALITAS DAN HOMOGENITAS

TUJUAN PRAKTIKUM
• Mahasiswa mampu menggunakan program SPSS untuk menguji normalitas dan homogenitas
data.
• Mahasiswa mampu membaca atau mengintepretasikan output SPSS untuk normalitas dan
homogenitas data.

PENDAHULUAN
a. Uji Normalitas

Uji normalitas dimaksudkan untuk memperlihatkan bahwa data sampel berasal dari populasi yang
berdistribusi normal. Sebagaimana sudah dijelaskan pada acara praktikum II bahwa distribusi
normal ditunjukkan oleh bentuk kurva normal, dimana distribusi frekuensi dari hasil sebuah
pengamatan akan memiliki nilai yang memusat terhadap nilai rata-rata dan akan memiliki
frekuensi yang lebih kecil untuk nilai-nilai pengamatan yang ekstrim.
Bila hasil ditribusi frekuensi memenuhi kaidah diatas, maka distribusi data akan disebut menyebar
normal. Bila data tidak menyebar normal, maka tergantung dari bentuk kurva/ histogram,
sebaran data dapat disebut menjulur ke kanan (skewed right) atau menjulur ke kiri (skewed left).
Bentuk-bentuk umum dari sebaran frekuensi data dapat dilihat pada gambar di bawah ini

Data terdistribusi normal Data menjulur ke kanan (SR) Data menjulur ke kiri
(SL)
Rataan = median = modus Rataan > median > modus Rataan < median <
modus

Namun demikian, bentuk viasualisasi seperti gambar di atas mempeunyai kelemahan karena
persepsi setiap orang bisa saja berbeda untuk satu gambar. Sehingga dalam satu gambar bisa ada
perbedaan kesimpulan ”apakah berdistribusi normal atau tidak”. Oleh karena itu diperlukan ukuran
yang pasti untuk menentukan normal/tidaknya sebuah distribusi frekuensi. Ada beberapa teknik
yang dapat digunakan untuk menguji normalitas data, antara lain uji chi-kuadrat, uji lilliefors, dan uji
kolmogorov-smirnov. Dalam praktikum ini akan kita praktikan untuk uji kolmogorov-smirnov.

Contoh :
Jika diketahui data IPK mashaisswa yang dikelompokkan berdasarkan jenis kelamin, sebagai
berikut :
Jenis Jenis
No Nama IPK Kelamin No Nama IPK Kelamin
1 Ani 3.7 Perempuan 1 Adi 2.4 Laki
2 Anis 3.6 Perempuan 2 Abi 2.3 Laki
3 Ayu 2.75 Perempuan 3 Abu 2.8 Laki
4 Adis 2.8 Perempuan 4 Abah 3.2 Laki
5 Alif 2.9 Perempuan 5 Banu 3.6 Laki
6 Atik 3.2 Perempuan 6 Beni 3.4 Laki
7 Dina 3.4 Perempuan 7 Eko 3.7 Laki
8 Bani 3.3 Perempuan 8 Eki 3.7 Laki
9 Cantik 3.4 Perempuan 9 Ary 2.9 Laki
10 Rina 3.3 Perempuan 10 Budi 3.3 Laki
11 Rani 3.2 Perempuan 11 Gito 3.1 Laki
12 Upik 3.1 Perempuan 12 Gati 3 Laki
13 Neni 3 Perempuan 13 Ogik 3 Laki
14 Nani 3.3 Perempuan 14 Gie 3.1 Laki
15 opik 2.5 Perempuan 15 Zie 3.2 Laki
Apakah data tersebut berdistribusi normal?
Kita susun hipotesis dulu :
H0 : Sampel berasal dari populasi berdistribusi normal
H1 : Sampel tidak berasal dari populasi berdistribusi normal

Langkah untuk mengujinya adalah


• Buka SPSS → pilih variable view
• Pada kolom name ketik IPK untuk baris 1, baris ke-2 dan seterusnya kita
kosongi karena data yang akan kita uji adalah data IPK saja
• Pilih data view → masukkan data IPK dibawah kolom IPK
• Pilih menu analyze> Descriptive statistic> Explore
• Masukkan variabel IPK ke dependent list dengan mengeklik tanda panah pada
kolom dependent list

Pilih plots > normality plot with test > continue


• Pilih OK, maka akan didapat hasil :

Tests of Normality

Kolmogorov-Smirnov(a) Shapiro-Wilk
Statistic Df Sig. Statistic Df Sig.
IPK .100 30 .200(*) .959 30 .298
This is a lower bound of the true significance. a
Lilliefors Significance Correction

Pada table di atas terdapat uji Kolmogorov–Smirnov dan Shapiro-Wilk. Pilih salah satu saja
misalnya Kolmogorov–Smirnov. Cara mengetahui signifikan atau tidak signifikan hasil uji
normalitas adalah dengan memperhatikan bilangan pada kolom signifikansi (Sig.). Untuk
menetapkan kenormalan, kriteria yang berlaku adalah sebagai berikut.
• Bandingkan p (sig) dengan taraf signifikansi yang diperoleh
• Jika sig >α , maka sampel berasal dari populasi yang berdistribusi normal
• Jika sig < α , maka sampel bukan berasal dari populasi yang berdistribusi normal
Pada hasil di atas diperoleh taraf signifikansi adalah 0.20 atau sig >α dengan demikian, data
berasal dari populasi yang berdistribusi normal, pada taraf signifikansi 0.05.

b. Uji Homogenitas

Uji homogenitas dimaksudkan untuk memperlihatkan bahwa dua atau lebih kelompok data sampel
berasal dari populasi yang memiliki variansi yang sama.
Contoh: Pakai data pada Uji Normalitas di atas
Pada contoh tersebut ada dua sampel data, yaitu IPK untuk laki-laki dan IPK untuk perempuan.
Kita susun dulu hipotesisnya:
H0 : Variansi pada tiap kelompok sama (homogen)
Hi : Variansi pada tiap kelompok tidak sama (tidak homogen)
Langkah uji dengan SPSS
• Buka SPSSÎpilih variable view
• Pada kolom name ketik IPK untuk baris 1, dan J_kelamin untuk baris ke-2, sengagkan baris ke-3
dan seterusnya kita kosongi
• Pilih data viewÎ masukkan data IPK dibawah kolom IPK dan cewek/cowok di bawah kolom
J_kelamin (disesuaikan dengan IPK)
• pilih lagi variable viewÎ values Îklik baris ke-2Îketik angka 1 pada kolom value dan cewek paka
kolom labelÎklil Add
• ketik angka 2 pada kolom value dan cowok paka kolom labelÎklil Add
• Klik OK

• Pilih menu analyze> Descriptive statistic> Explore


• Masukkan variabel IPK ke dependent list dan variabel J_kelamin ke factor list

• Klik plot
• Pilih untransformed >continue
• Klik OK

Test of Homogeneity of Variance

Levene
Statistic df1 df2 Sig.
IPK Based on Mean .358 1 28 .554
Based on Median .431 1 28 .517
Based on Median and with
adjusted df .431 1 26.165 .517
Based on trimmed mean .390 1 28 .538

Yang penting untuk diperhatikan adalah Based on Mean. Nilai Levene statistic-nya
adalah 0.358 dengan sig 0.554.
Kriteria yang berlaku adalah sbb:
y Jika sig > α, maka variasi setiap sampel sama (homogen)Îterima Ho
z Jika sig < α, maka variasi setiap sampel beda (heterogen)Îtolak Ho

Berdasarkan hasil uji dia atas maka dapat disimpulkan bahwa variasi setiap sampel
adalah homogen (0.554 > 0.05)

Tugas Rumah
Diketahui data hasil pendataan tentang Pendapatan berdasarkan profesi pedagang sate dan
pedagang bakso. Untuk pedagang sate diambil 18 orang sedangkan pedagang bakso diambil 16
orang.
Pendapatan (Rp)
No pedagang Pedagang
Sate Bakso
1 1200000 1450000
2 1250000 1475000
3 900000 1400000
4 975000 1250000
5 1300000 1700000
6 1325000 1650000
7 1310000 1575000
8 1300000 1625000
9 1275000 1600000
10 1225000 1525000
11 990000 1575000
12 1100000 1680000
13 1150000 1100000
14 1125000 1250000
15 1250000 1125000
16 1175000 1050000
17 1180000
18 1350000

• Buat hipotesisnya
• Tentukan normalitas dan homogenitasnya
• Intepretasikan hasil SPSS-nya
MODUL 11
DISTRIBUSI BINOMIAL

PENDAHULUAN
Distribusi binomial merupakan suatu proses distribusi probabilitas yang dapat digunakan apabila
suatu proses sampling dapat diasumsikan sesuai dengan proses Bernoulli. Proses Bernoulli adalah
suatu proses probabilitas yang dapat dilakukan berulang kali.
Misalnya :
Dalam pelemparan sekeping uang logam sebanyak 5 kali. Hasil setiap pelemparan uang
logam tersebut hanya mungkin muncul sisi gambar atau angka saja.
Dalam pengambilan kartu yang dilakukan secara berturut-turut, kemungkinan yang muncul
hanya kartu merah atau kartu hitam saja.
Dari contoh di atas dapat diberikan suatu label “berhasil” untuk sisi gambar dan label “gagal” untuk
sisi angka ataupun sebaliknya. Begitu juga dengan pengambilan kartu, kita dapat memberi label
“berhasil” untuk pengambilan kartu warna merah dan label “gagal” untuk pengambilan kartu warna
hitam ataupun sebaliknya. Ulangan-ulangan tersebut bersifat bebas dan peluang berhasil atau gagal
setiap ulangan memiliki probabilitas yang sama yaitu 50% atau ½. Sebenarnya ada sedikit persamaan
antara distribusi binomial dengan distribusi poisson. Keduanya berusaha mencari kemungkinan yang
timbul dari suatu peristiwa/kejadian yang ada. Namun ada beberapa hal yang membedakan
penggunaan kedua distribusi tersebut yaitu:
• Distribusi binomial digunakan jika besarnya sampel (n) < 20 (kurang dari 20) dan nilai peluang
berhasil dalam setiap ulangan (p) > 0.05
• Distribusi poisson digunakan jika besarnya sampel (n) ≥ 20 (lebih dari 20 atau sama dengan
20) dan nilai peluang berhasil dalam setiap ulangan (p) ≤ 0.05 (kurang dari 0.05 atau sama
dengan 0.05)
Adapun ciri-ciri atau karakteristik distribusi binomial antara lain :
a. Percobaan diulang sebanyak n kali
b. Hasil setiap ulangan dapat dikategorikan dalam 2 kelas
Misal :
o “berhasil” atau
o “gagal” “ya” atau “tidak”
o “success” atau “failed”
c. Peluang berhasil atau sukses disimbolkan dengan p dan dalam setiap ulangan nilai p tetap,
dimana p = 1 - q sedangkan peluang gagal dinyatakan dengan q dimana q = 1 - p
d. Banyaknya keberhasilan dalam peubah acak disimbolkan dengan x
e. Setiap ulangan bersifat bebas (independent) satu dengan lainnya.

Catatan
Untuk memberikan kemudahan dalam membedakan antara nilai p dan nilai q, terlebih dahulu harus
ditetapkan yang mana yang merupakan kejadian yang dapat dikategorikan “sukses atau berhasil”
dan yang mana kejadian yang dapat dikategorikan “gagal”. Perlu diingat bahwa kejadian yang
menjadi pertanyaan ataupun ditanyakan dari suatu permasalahan bisa dikategorikan sebagai
kejadian “sukses atau berhasil”. Dengan demikian kejadian yang menjadi pertanyaan dari suatu
permasalahan dapat disimbolkan dengan p.
Selain itu perlu diperhatikan juga penggunaan simbol yang tepat misalnya :
Kurang dari disimbolkan dengan <
Lebih dari disimbolkan dengan >
Paling banyak disimbolkan dengan ≤
Paling sedikit disimbolkan dengan ≥
Kurang dari sama dengan disimbolkan dengan ≤
Lebih dari sama dengan disimbolkan dengan ≥

Percobaan binomial adalah percobaan yang hanya menghasilkan 2 kejadian saja. Jika kejadian
pertama dinamakan sukses, maka kejadian kedua dinamakan tidak sukses (gagal). Probabilitas
kejadian sukses dinamakan p, maka probabilitas tidak sukses (gagal) dinamakan q, dimana q = 1 – p.
Suatu variabel random diskret X dinamakan berdistribsi Binomial jika fungsi padat probabilitasnya
mengikuti persamaan :

dimana :
p : probabilitas sukses
q : probabilitas tidak sukses (gagal)
n : banyaknya eksperimen (percobaan)
x : banyaknya percobaan yang sukses.

Contoh :
Dalam sebuah kotak berisi 10 apel merah dan 20 apel hijau yang sama bentuk dan besarnya. Jika
diambil sebuah apel dari dalam kotak secara random dan setelah diamati kemudian dikembalikan,
begitu seterusnya sampai sebanyak 6 kali, berapa probabilitasnya bahwa dalam 6 kali pengambilan
tersebut terdapat 2 apel merah.
Jawab :
Misalkan :p adalah probabilitas dari kejadian yang terambil apel merah.
q adalah probabilitas dari kejadian yang terambil selain apel merah.
Maka : p = 10/30 = 1/3 dan q = 1 – 1/3 = 2/3.
x = 2 dan n = 6

Rumus umum binomial


b (x;n,p) = Cx
n px qn-x
Keterangan :
n = banyaknya kejadian berulang
x = banyaknya keberhasilan dalam peubah acak x
p = peluang berhasil dalam setiap ulangan dimana p = 1 - q
q = peluang gagal dimana q = 1 - p
Langkah-langkah mengoperasikan program Excel untuk distribusi binomial :

TUJUAN PRAKTIKUM
Tujuan dari praktikum materi distribusi binomial ini adalah untuk membantu praktikan dalam
mempelajari dan memahami bagaimana cara mencari nilai probabilitas (kemungkinan) dari suatu
kejadian binomial (kejadian dengan jumlah sampel < 20 dan nilai peluang berhasil > 0.05) dengan
menggunakan program Excel atau minitab.

Cara Kerja
Soal-soal:
MODUL 12
PROBABILITAS

Probabilitas atau peluang (P) suatu peristiwa (E) tidak akan pernah berharga negatif dan lebih besar
dari satu (100%). Jika suatu peristiwa itu telah terjadi atau kita yakin 100% bahwa peristiwa itu akan
terjadi, maka kemungkinan peristiwa terjadi adalah 1,00 atau P(E)= 1,00. Sebaliknya, jika suatu
peristiwa tidak terjadi maka kemungkinan terjadi peristiwa itu adalah 0,00 atau P(E) =0,00. Namun
dalam kenyataan kita tidak pernah dapat mengatakan kemungkinan terjadi peristiwa itu 100% atau
0%, kecuali jika peristiwanya sudah terjadi.
Andaikan N adalah jumlah macam kejadian yang dapat dijumpai pada saat pengambilan contoh
untuk suatu kejadian, maka dengan peristiwa A dapat terjadi dengan X cara, maka probabilitas
terjadinya A adalah P(A)= x/N
Contoh: Peluang mendapatkan batang padi yang terserang hama penggerek batang (A) adalah bila x
jmlah batang padi yang terserang = 10, jumlah batang padi seluruhnya N=100 batang padi, maka
peluang P(A)= x/N=10/100= 0,10
Probabilitas dari daftar distribusi frekuensi

Cara kerja
1. Amati fenomena di lahan dan ambil 40 sampel daun secara acak, berapa persen daun yang sudah
menguning, setelah diketahui proporsinya, maka apabila kita mengambil 10 daun, hitunglah
peluang untuk mendapatkan ;
a. paling sedikit 5 daun hijau
b. paling banyak 5 daun kuning.
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh!
MODUL 13
ESTIMASI

PENDAHULUAN
Estimasi disebut juga sebagai penaksiran atau pendugaan. Teori estimasi termasuk dalam statistika
inferensia, yaitu ilmu statistika yang digunakan untuk penarikan kesimpulan. Penarikan kesimpulan
dapat berbentuk pendugaan (penaksiran) tentang satu (beberapa) parameter populasi, atau mungkin
hal-hal yang berhubungan dengan persoalan penerimaan atau penolakan suatu hipotesis yang
memberi spesifikasi tentang nilai dari satu (beberapa) parameter populasi. Yang dimaksud dengan
estimasi adalah kegiatan pendugaan nilai-nilai parameter dari populasi dengan didasarkan pada hasil
perhitungan dari nilai-nilai statistik dari sampel.

TUJUAN PRAKTIKUM
Tujuan praktikum ini adalah agar praktikan dapat menghitung nilai estimasi parameter populasi

CARA KERJA
1. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua puluh sampel. Buatlah tabel
frekuensi dan hitung nilai interval konfidensi 95%nya.
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh!
MODUL 14
HIPOTESIS

PENDAHULUAN
Seperti halnya dengan estimasi, Uji Hipotesis juga termasuk ke dalam Statistika Inferensia, yaitu ilmu
statistika yang mempelajari statistik sampai dengan pengambilan keputusan. Jika pada teori etsimasi
kita menaksir besarnya nilai parameter dari suatu populasi, maka pada uji hipotesis kita sudah
mempuyai taksiran/dugaan dari nilai parameter populasi, yang nantiya harus kita uji apakah
taksiran/dugaan kita tadi diterima atau ditolak.
Hipotesis adalah dugaan sementara yang masih harus dibuktikan kebenarannya. Hipotesis
merupakan pernyataan mengenai parameter populasi, baik sifat, karakter, dan sebagainya.
Kebenaran atau ketidakbenaran suatu hipotesis statistik tidak pernah diketahui dengan pasti, kecuali
jika seluruh anggota populasi diamati. Jika taksiran parameter didasarkan pada penelitian terhadap
populasi, maka kita tidak usah mengujinya, karena ukuran itu memang ukuran populasi. Tetapi hal ini
tentunya tidak praktis. Karena itu pengujian hipotesis ini dilakukan karena penaksiran kita atas nilai
parameter populasi didasarkan pada nilai statistik dari sampel. Jika taksiran kita didasarkan pada
pengukuran dari sampel, padahal kita akan menyimpulkan parameter populasi, maka taksiran kita
akan mengandung kesalahan. Besarnya kesalahan diukur dengan probabilitas. Satu atau seratus
persen dikurangi dengan tingkat kesalahan dinamakan tingkat kepercayaan. Secara teoritis, tingkat
kesalahan ditetapkan menjadi 3 macam tergantung dari keyakinan kita. Tingkat kesalahan yang
disepakati tersebut adalah 1 %, 5 % atau 10 %.
Dalam menguji hipotesis kadang terjadi kesalahan dalam pengambilan kesimpulan. Ada 2 macam
tingkat kesalahan yang mungkin dapat terjadi pada pengujian hipotesis, yaitu :
1. Kesalahan jenis I, yaitu kesalahan yang terjadi akibat menolak hipotesis yang diuji, padahal
hipotesis tersebut benar. Kesalahan jenis I disebut .
2. Kesalahan jenis II, yaitu kesalahan yang terjadi akibat menerima hipotesis yang diuji, padahal
hipotesis tersebut salah. Kesalahan jenis II disebut .
Hipotesis yang diuji dinamakan Hipotesis Nol ditulis dengan notasi HO. Dan hipotesis yang dibuat
sebagai lawan dari hipotesis nol dinamakan Hipotesis Alternatif ditulis dengan notasi Ha atau H1.
Jadi kemungkinan hasil uji hipotesis adalah sebagai berikut :
Hipotesis
Kesimpulan
H0 Benar H0 Salah
H0 ditolak Kesalahan jenis I, dengan Kesimpulan yang benar, dengan
probabilitas =  probabilitas = (1 - )
H0 diterima Kesimpulan yang benar, dengan Kesalahan jenis II, dengan
probabilitas = (1 - ) probabilitas = 

Daerah atau harga-harga statistik yang berkorespondensi dengan penolakan Ho jika Ho benar disebut
daerah kritis atau daerah penolakan Ho. Jadi probabilitas akan mendapatkan harga statistik pada
daerah kritis sama dengan , dan sering disebut dengan tingkat signifikansi (level of significance) dari
uji hipotesis. Untuk dapat mengambil kesimpulan, apakah menerima atau menolak Ho yang
didasarkan atas pengamatan terhadap sampelnya, maka perlu ditentukan lebih dahulu daerah
kritisnya. Daerah kritis ini dapat ditentukan dengan cara membandingkan suatu harga statistik dari
sampel tersebut dengan harga parameter yang dihipotesiskan.
Untuk sampel besar,  tidak diketahui
Contoh :

Suatu wawancara terhadap 40 orang buruh tani di Desa A yang dipilih secara random diketahui
pendapatan rata-rata per harinya adalah Rp. 29.250,- dengan standar deviasi Rp. 4500,-. Dengan
menggunakan tingkat kesalahan 5 %, ujilah apakah pendapatan per hari dari semua buruh tani di
Desa A lebih kecil dari Rp. 30.000,-.

Jawab :

Ini merupakan uji hipotesis tentang harga rata-rata dengan sampel besar (n > 30).
n = 40 = 29.250 S = 4500
Hipotesis :
H0 =  = 30.000
H1 =  < 30.000
Karena H1 tandanya < maka digunakan uji 1 arah sebelah kiri.

Jadi dapat disimpulkan bahwa rata-rata pendapatan per hari semua buruh tani di Desa A tidak
berbeda nyata dengan Rp. 30.000,- atau tidak kurang dari Rp. 30.000,- atau sama dengan Rp.
30.000,-
TUJUAN PRAKTIKUM
Tujuan praktikum ini adalah agar praktikam dapat membuat hipotesis suatu permasalahan dan
menarik kesimpulan dari hipotesis yang telah dibuat

CARA KERJA
1. Amati fenomena di lahan dan ambil satu jenis data sampel dari dua puluh sampel. Buatlah tabel
frekuensi dan hitung nilai rata-ratanya dan standard deviasinya. Dengan menggunakan tingkat
kesalahan 5 %, ujilah apakah pendapat saudara dari semua populasi A lebih kecil dari estimasi
(buat estimasi).
2. Cocokkan hasil yang saudara peroleh dengan menggunakan program excel atau minitab.
3. Interpretasikan hasil yang telah saudara peroleh.

Contoh membandingkan dua rata-rata berpasangan dengan keragaman diketahui:

Contoh membandingkan dua rata-rata tidak berpasangan dengan keragaman diketahui


MODUL 15
REGRESI DAN KORELASI

PENDAHULUAN
Analisa regresi digunakan untuk mempelajari dan mengukur bentuk hubungan statistik yang terjadi
antara dua atau lebih varibel. Dalam regresi sederhana dikaji dua variabel, sedangkan dalam regresi
majemuk dikaji lebih dari dua variabel. Dalam analisa regresi suatu persamaan regresi hendak
ditentukan dan digunakan untuk menggambarkan pola atau fungsi hubungan yang terdapat antar
variabel.
Analisa korelasi bertujuan untuk mengukur "seberapa kuat" atau "derajat kedekatan" suatu relasi
yang terjadi antar variabel. Dalam analisa regresi ingin diketahui adalahi pola relasi dalam bentuk
persamaan regresi, sedangkan dalam analisa korelasi ingin mengetahui kekuatan hubungan tersebut
dalam koefisien korelasinya. Dengan demikian biasanya analisa regresi dan korelasi sering dilakukan
bersama-sama.
Langkah pertama dalam menganalisa relasi antar variabel adalah dengan membuat diagram pencar
(scatter diagram) yang menggambarkan titik-titik plot dari data yang diperoleh. Diagram pencar ini
berguna untuk:
• Membantu dalam melihat apakah ada relasi yang berguna antar variabel,
• Membantu dalam menentukan jenis persamaan yang akan digunakan untuk menentukan
hubungan tersebut.

ANALISIS REGRESI

Variabel yang akan diestimasi nilainya disebut variabel terikat (dependent variable atau response
variable) dan biasanya diplot pada sumbu tegak (sumbu-y). Sedangkan variabel bebas (independent
variable atau explanatory variable) adalah variabel yang diasumsikan memberikan pengaruh
terhadap variasi variabel terikat dan biasanya diplot pada sumbu datar (sumbu-x).
Persamaan garis yang melalui titik–titik koordinat pada diagram pencar dinamakan penduga garis
linier atau regresi linier. Secara matematis dinyatakan dengan persamaan :
y =a +bX
y = subyek dalam variabel dependen yang diprediksi
b = angka peningkatan atau penurunan variabel dependen yang didasarkan pada variabel
independen, bila b (+) maka naik, bila (-) maka turun
X = subyek variabel independen
Dalam perkembangannya, sejalan dengan kemajuan dibidang komputer statistik, analisis regresi
telah menjadi sangat bervariasi:
• Regresi sederhana, untuk sebuah variabel dependent dan satu buah variabel independent.
• Regresi berganda, untuk lebih dari satu variabel independent dan satu variabel dependent.
• Regresi dengan Dummy variabel, yaitu jika data variabel independent ada yang bertipe
nominal.
• Regresi ordinal, untuk data variabel dependent yang berjenis ordinal.
• Log regresion, untuk data variabel dependent yang berjenis nominal.
• Regresi polinomial, yaitu model regresi yang tidak berbebntuk linier.
Dalam percobaan ini akan dibahas regresi sederhana dan regresi ganda yang relatif sederhana.

Analisa Regresi Linier Sederhana


Yang dimaksud dengan analisa Regresi Linier sederhana (univariat) adalah analisis regresi linier
dengan jumlah satu variabel independen x. Dalam membuat regresi parametrik, langkah pertama
yang paling ideal adalah membuat plotting data antara variabel dependen y dan variabel independen
x, hal ini dilakukan untuk melihat kecenderungan pola data asli. Jika datanya mengikuti pola linier,
maka pendekatan modelnya adalah regresi linier.

Analisis Regresi Linier Berganda


Jika kasusnya terdapat lebih dari satu variabel independen, maka model yang cocok adalah analisa
regresi linier berganda. Dalam praktek bisnis, model ini sering digunakan, selain karena banyaknya
variabel dalam bisnis yang perlu dianalisa secara bersama. Pada umunya variabel independen
berkisar dua sampai empat variabel. Walaupun secara teoritis dapat dilakukan banyak variabel
bebas, namun penggunaan lebih dari tujuh variabel independen dianggap akan tidak relevan.

Analisis korelasi
Sebelum dilakukan analisa regresi, langkah yang biasa ditempuh adalah melakukan analisa korelasi
yang ditujukan untuk mengetahui erat tidaknya hubungan antar variabel. Pada analisa regresi, untuk
observasi Y diasumsikan bahwa X adalah tetap konstan dari sampel ke sampel. Interpretasi koefisien
korelasi untuk mengukur kuatnya hubungan antar variabel tergantung pada asumsi yang digunakan
untuk X dan Y. Bila X dan Y bervariasi maka koefisien korelasi akan mengukur “covariability
(kesamaan variasi)” antara X dan Y. Di dalam analisa regresi, koefisien korelasi digunakan untuk
mengukur “cocok/tepat (fitness)” garis regresi sebagai pendekatan data observasi. Besarnya
koefisien korelasi dinyatakan sebagai

Dalam prakteknya,  tidak diketahui tetapi nilainya dapat diestimasi berdasar data sampel. Bila r
adalah penduga , dengan r dinyatakan sebagai

TUJUAN PRAKTIKUM
Tujuan praktikum ini agar pratikan dapat:
• Menjelaskan regresi dan korelasi
• Menghitung dan menginterpretasikan arti dari persamaan regresi dan standard error dari
estimasi-estimasi untuk analisis regresi linier sederhana
• Menggunakan ukuran-ukuran yang diperoleh dari analisis regresi dan korelasi untuk membuat
dugaan-dugaan interval dari variabel-variabel terikat bagi keperluan peramalan (forecasting)
• Menghitung dan menjelaskan makna dari koefisien-koefisien korelasi dan determinasi dalam
menggunakan teknik-teknik analisa korelasi linier sederhana

CARA KERJA

REGRESI
Contoh Kasus
Naik turunya import suatu barang
ditentukan antara lain oleh produksi
dalam negeri barang tersebut dan rasio
tingkat harga barang import tersebut
terhadap harga barang dalam negeri.
Y = indeks import barang A
X1 = indeks produksi dalam negeri
barang A
X2 = rasio indeks harga import dan
harga dalam negeri barang A

Pengolahan Data
1. Pemasukan Data
- Membuka lembar kerja baru : klik menu utama FILE. Klik submenu NEW, klik DATA.
- Mendefinisikan variabel : klik tab sheet VARIABLE VIEW di bagian kiri bawah.

2. Pengisian Data
Isilah data sesuai dengan petunjuk berikut :
3. Menyimpan Data
Klik menu utama FILE, pilih submenu SAVE ASS... , beri nama file dengan Regresi_NRP.
4. Pengolahan Data
- Membuka file Regresi_NRP.
- Klik menu utama ANALYZE, klik submenu COMPARE MEANS, klik MEANS.
▪ Isilah Dependent List dengan variabel Y dan
Independent List dengan X1 dan X2, kemudian pilih
Options, centang (√) Test for Linearity.
▪ Klik OK.

- Klik menu utama ANALYZE, klik submenu REGRESSION, klik


LINEAR...
o Dependent. Klik variabel Y yang akan diuji, klik tanda ‘>’,
maka variabel Y akan berpindah ke Dependent.
o Independent. Klik variabel X1 dan X2 yang akan diuji ,
klik tanda ‘>’, maka variabel X1 dan X2 akan berpindah
ke Independent.
o Statistics.
Centang (√) bagian-bagian pada toolbox seperti
gambar disamping
o Plots
▪ Centang (√) bagian Normal probabilty plot, digunakan untuk normalitas.
▪ Pada Scatter pilih Y : isikan *ZPRED klik pada Toolbox di atas kanan dan X :
isikan *SRESID dengan klik pada Toolbox di atas kanan, digunakan untuk uji
homoskesdastisitas ragam galat.
▪ Klik Continue dan OK.

o Save. Centang (√) bagian


Unstandarized pada Residuals.

- Uji Normalitas
Klik ANALYZE, pilih submenu
Nonparametric Test, pilih Legacy Dialogs,
pilih 1-Sample K-S.

o KlikUnstandardized... dan masukkan ke kotak Test Variable


List.
o Centang (√) Normal pada Test Distribution.
5. Hasil Regresi
- Uji Asumsi Linier.

- Dari hasil output SPSS tersebut dapat disimpulkan bahwa asumsi linieritas terpenuhi pada
hubungan antara Y dengan X1, dan pada hubungan antara Y dan X2. Dilihat dari nilai
signifikansi pada deviation from linearity yang lebih dari 0.05.
6. Intepretasi Hasil Analisis Regresi
- Model regresi dilihat dari tabel Coefficient.

Model yang terbentuk adalah : Y = -6.532 + 1.099X1 + 0.006X2


- Uji parameter regresi secara parsial dilihat dari nilai Sig. (signifikansi untuk uji t) pada tabel
Coefficient. Nilai Sig. untuk X1 adalah kurang dari 0.05 maka secara statistik parameter X1
mempengaruhi model sehingga dengan kata lain Variabel Indeks Produksi Dalam Negeri barang
A mempengaruhi Indeks Import barang A, namun variabel Rasio Indeks Import dan Harga tidak
mempengaruhi Indeks Import barang A.
- Uji parameter regresi simultan dilihat dari tabel ANOVA.

Hasil uji simultan didapatkan bahwa nilai signifikansi kurang dari 0.05 sehingga dapat
disimpulkan bahwa secara simultan variabel X1 dan X2 mempengaruhi Y.
Uji kebaikan model dilihat dari nilai R squarepada tabel Model Summary. R square menunjukkan
seberapa baik keragaman X menjelaskan keragaman Y. Artinya 64.9% keragaman Y dapat dijelaskan
oleh X1 dan X2.
KORELASI
Contoh:
Perusahaan sari buah Agrijuice ingin mengetahui keeratan hubungan (korelasi) antara nilai
penjualan (Y) dengan biaya promosi (X). Data pada tabel berikut adalah nilai penjualan dan biaya
promosi yang dicatat beberapa periode:
No Nilai penjualan Biaya promosi
1 64 20
2 61 16
3 84 34
4 70 23
5 88 27
6 92 32
7 72 18
8 77 22

Apakah ada hubungan (korelasi) antara biaya promsi dengan penjualan? Kalau ada, apa
hubungannya dan seberapa besar koefisien korelasinya. Uji dengan α=1%

Jawab:
Susun hipotesisnya:
Ho : tidak ada hubungan antara biaya promosi dengan nilai penjualan (korelasi antara 2
variabel sama dengan nol)
H1 : ada hubungan antara biaya promosi dengan nilai penjualan (korelasi antara 2 variabel
tidak sama dengan nol)
Langkah menguji korelasi dengan menggunakan SPSS :
1. masukkan data pada data view dan ketik ”penjualan” dan ”promosi” pada variabel view
2. Klik meni utama Analyze → Correlate → Bivariate
3. Klik variable yang akan dikorelasikan dan masukkan ke kolom variables dengan mengklik tanda
panah
4. Untuk kolom Correlation Coefficients, pilihlah Pearson karena anda ingin melakukan uji atas
data rasio.
5. Untuk kolom Test of Significance, pilih option Two-tailed untuk uji dua arah atau dua sisi.
6. Untuk pilihan Flag significant correlations boleh dicentang (dipilih) hingga pada output akan
7. muncul tanda * untuk signifikansi 5% dan tanda ** untuk signifikansi 1%. Klik OK

Hasil output SPSS:


Correlations

PENJUALAN PROMOSI
PENJUALAN Pearson Correlation 1 .862**
Sig. (2-tailed) .006
N 8 8
**
PROMOSI Pearson Correlation .862 1
Sig. (2-tailed) .006
N 8 8
**. Correlation is significant at the 0.01 level (2-tailed).

Berdasarkan pada hasil output SPPS di atas, nilai sig < α (0.006 < 0.01), maka menolak Ho atau
menerima H1 yang berarti bahwa ada hubungan antara biaya promosi dengan nilai penjualan.
Bentuk hubungannya adalah positif yang ditunjukkan oleh nilai koefisien pearson positif. Ini
berarti kenaikan biaya promosi akan menaikkan nilai penjulan. Besar koefisien korelasi adalah
0.862, berarti hubungannya adalah sangat kuat.
Tugas Rumah
Berikut adalah data hasil evaluasi mata kuliah statistic:
No Nama Mahasiswa UTS UAS Praktik
1 Abi 74 80 80
2 Abu 92 89 96
3 Banu 84 82 78
4 Bani 74 70 64
5 Cita 62 66 80
6 Cika 92 90 89
7 Dina 98 86 96
8 Dino 96 98 96
9 Dani 89 87 78
10 Eva 88 84 84
11 Evi 56 62 75
12 Fana 82 80 84
13 Fani 75 72 78
14 Gito 72 76 74
15 Gati 72 72 78

Apakah ada korelasi antar ketiga variabel, berapa koefisien pearsonnya, dan apa bentuk korelasinya!

Anda mungkin juga menyukai