Anda di halaman 1dari 94

MODUL

PRAKTIKUM STATISTIK PERMINYAKAN


DENGAN MINITAB

POLITEKNIK ENERGI DAN MINERAL AKAMIGAS


KEMENTERIAN ENERGI DAN SUMBER DAYA MINERAL

1
Kata Pengantar
Modul praktikum statistika industri adalah modul yang ditujukan sebagai pegangan dalam
pelaksanaan praktikum statistika industri yang dilaksanakan oleh Program Studi Poduksi
Minyak dan Gas PEM Akamigas, Cepu. Praktikum ini sendiri merupakan rangkaian
pembelajaran yang berjalan paralel dengan mata kuliah Statistika Perminyakan dengan bobot
2 sks. Dengan modul ini diharapkan para mahasiswa dan pengajar dalam matakuliah ini
dapat memperoleh banyak informasi dan panduan dalam menyelesaikan analisis data satistik
menggunakan MINITAB terutama pada bidang logistik.

Diktat ini memuat uraian teoritis secara singkat beberapa materi dalam Statistik Perminyakan
serta analisis datanya menggunakan software MINITAB seperti deskriptif statistik, Statistik
inferensi yang memuat uji rata-rata satu populasi, uji rata-rata dua populasi, analisis korelasi,
analisis regresi sederhana serta analisis regresi berganda beserta uji asumsinya. Topik-topik
ini disesuaikan dengan dengan materi teoritis yang disampaikan di kelas dan disusun
sedemikian rupa sehingga mahasiswa dapat menggunakannya sesuai dengan kebutuhan.

Sebelum pelaksanaan praktikum diharapkan para mahasiswa telah memahami materi


statistika industry secara teoritis dengan baik sedemikian sehingga dalam sesi praktikum ini
mahasiswa dapat dengan mudah untuk membaca dan menganalisis data dengan baik. Ada
baiknhya mahasiswa memiliki buku pendamping teori sehingga memiliki landasan teoritis
yang baik.

Untuk mengetahui berhasil atau tidaknya dalam praktikum ini maka dibutuhkan alat ukur
berupa soal-soal dan penugasan yang berkorelasi dengan materi pada bab-bab yang ada yang
juga dapat digunakan untuk mempertajam skill pengolahan data statistik terutama
penerapannya di bidang logistik Migas.
Demikian modul ini disusun untuk dapat dimanfaatkan bersama. Modul ini disusun jauh dari
sempurna sehingga penulis menerima kritik dan saran sedemikian sehingga pemanfaatannya
menjadi optimal.

Cepu, November 2019


Umi Yuliatin, M.Sc

2
BAB I PENDAHULUAN

Statistika adalah sekelompok konsep dan metode untuk merencanakan, mengumpulkan


informasi (data), mengolah atau menganalisis dan kemudian mengambil kesimpulan dalam
situasi dimana ada ketidakpastian dan variasi.

1.1. Metode Statistik


Metode Statistik diklasifikasikan menjadi dua, yaitu :
1. Statistik Deskriptif (Statistik Deduktif)
Statistik deskriptif, yaitu statistik yang menggambarkan kegiatan yang berupa
pengumpulan data, penyusunan data, pengolahan data dan penyajian dalam bentuk tabel,
grafik, atau diagram agar memberikan gambaran yang teratur, ringkas dan jelas
mengenai suatu keadaan atau peristiwa. Statistik deskriptif terdiri dari :
a. Distribusi frekuensi yaitu penyusunan data dari nilai terkecil sampai nilai terbesar
kemudian disajikan dalam bentuk tabel atau diagram.
b. Ukuran tendensi sentral terdiri dari mean, median, modus, kuartil dan presentil.
c. Ukuran penyebaran terdiri dari rentangan(rank), varians dan simpangan baku.
2. Statistik Inferensia (Statistik Indukstif)
Statistik Inferensia merupakan statistik yang berhubungan dengan kegiatan penarikan
kesimpulan yang bersifat umum dari data yang telah disusun dan diolah. Hal yang
berhubungan dengan statistik inferensia diantaranya adalah :
a. Melakukan penaksiran tentang karakteristik populasi dengan menggunakan data
yang diperoleh dari sampel.
b. Membuat prediksi atau ramalan tentang masalah untuk masa yang akan datang.
c. Menentukan ada tidaknya hubungan antar karakteristik.
d. Menguji hipotesa.
e. Membuat kesimpulan secara umum mengenai populasi.

3
1.2. Kegunaan Statistik

Kegunaan Statistik diantaranya adalah sebagai berikut :


1. Membantu peneliti dalam menggunakan sample sehingga peneliti dapat bekerja
efisien dengan hasil yang sesuai dengan objek yang ingin diteliti.
2. Membantu peneliti dalam membaca data yang telah terkumpul sehingga peneliti dapat
mengambil keputusan yang tepat.
3. Membantu peneliti untuk melihat ada tidaknya perbedaan antara kelompok lainnya
atas objek yang diteliti.
4. Membantu peneliti untuk melihat ada tidaknya hubungan antar variable yang satu
dengan yang lainnya.
5. Membantu peneliti dalam melakukan prediksi untuk waktu yang akan datang.
6. Membantu peneliti untuk melakukan interpretasi atas data yang terkumpul.

1.3. Data

Data adalah sejumlah informasi yang dapat memberikan gambaran tentang suatu keadaan
atau masalah baik yang berupa angka maupun kategori seperti : baik buruk, tinggi, rendah
dan sebagainya.
Syarat data antara lain :
1. Objektif yang berarti data tersebut menggambarkan keadaan sebenarnya.
2. Relevan dengan permasalahn yang diteliti.
3. Sesuai jaman (up to date) sebab perubahan waktu dan teknologi dapat mengakibatkan
kejadian mengalami perubahan dengan cepat.
4. Representative terhadap populasinya
5. Sumbernya tepat dan dapat dipercaya.

4
Selanjutnya data dapat diklasifikasikan berdasarkan sifat, cara memperoleh, dan skala
pengukuran sebagai berikut :
Tabel 1.1. Klasifikasi Data

Kategori Data Pengertian Contoh

Kualitatif Data yang tidak berbentuk angka. Kualitas absorbs glycol


Sifat
terhadap moisture
Kuantitatif Data yang berbentuk angka Produksi sales gas harian
Data diperoleh dari pengumpulan
Primer
sendiri. Data pengujian sumur
Cara Data yang diperoleh dari
memperoleh pihaklain(suatu organisasi atau
Sekunder Data Elektrifikasi KESDM
perusahaan) dalam bentuk data
yang sudah jadi.
Status cadangan minyak
Data yang sifatnya hanya bumi )proven, probable,
Nominal membedakan possible)
Data yang dapat membedakan dan Menurutkan fosil
Ordinal mengurutkan berdasarkan umur geologi
Dsts yang jaraknya sama tetapi
Sifat
tidak mempunyai nol absolute Temperature (deg C) yang
pengukuran
(Artinya walaupun data nol tetapi masih memiliki nilai dalam
Interval masih mempunyai nilai) kondisi 0 celcius
Data yang jaraknya sama dan Weight On Bit yang harus
mempunyai nol absolute (artinya di-nol kan sebelum mulai
jika datanya nol maka nilai datanya operasi drilling atau
Rasio tidak mempunyai arti) WO/WS

5
1.4. Populasi dan Sample

Populasi adalah keseluruhan objek penelitian yang terdiri dari manusia, benda, hewan,
tumbuhan, gejala, nilai test atau peristiwa sebagai sumber data yang mewakili karakteristik
tertentu dalam suatu penelitian. Berdasarkan sifat populasi digolongkan menjadi :
1. Populasi Homogen
Populasi homogen merupakan sumber data yang unsurnya mempunyai sifat yang sama
sehingga tidak perlu mempersoalkan jumlahnya secara kuantitas.
2. Populasi Heterogen
Populasi heterogen adalah sumber data yang unsurnya memiliki sifat atau keadaan
bervariasi sehingga perlu ditetapkan batasannya baik secara kualitatif maupun
kuantitatif.
Sampel adalah sebagian dari jumlah dan karakteristik yang dimiliki oleh polulasi tersebut.

1.5. Teknik Sampling

Teknik sampling merupakan suatu teknik atau cara mengambil sample yang representative
dari populasi. Ditinjau dari pengambilan sampelnya, ada beberapa metode sampling, yaitu :
1. Simple Random Sampling
Jika suatu sampel dengan n elemen dipilih dari suatu pupulasi N elemen sehingga setiap
kemungkinan sampel dengan n elemen mempunyai kesempatan yang sama untuk dipilih.
2. Proportionate Stratified Random Sampling
Dalam metode ini, langkah pertama adalah populasi dikelompokkan dalam beberapa
kelompok agar lebih homogen, kemudian dari masing-masing kelompok diambil sampel
berukuran tertentu ( secara proporsional ) secara acak seperti pada metode pertama.
3. Cluster Sampling
Cluster sampling ialah sampel simple random dimana setiap sampling unit terdiri dari
kumpulan atau kelompok elemen seperti bidang tanah terdiri dari beberapa petak tanah.

1.6. Pengenalan Minitab 18

Minitab merupakan program komputer yang dirancang untuk melakukan pengolahan


statistik. Minitab mengombinasikan kemudahan penggunaan layaknya Microsoft Excel
dengan kemampuannya melakukan analisis statistik yang kompleks. Minitab dikembangkan
di Pennsylvania State University oleh peneliti Barbara F. Ryan, Thomas A. Ryan, Jr., dan

6
Brian L. Joiner pada tahun 1972. Minitab memulai versi ringannya OMNITAB, sebuah
program analisis statistik oleh NIST.

Pada laman awal minitab terdapat dua window, yaitu session dan worksheet. Session
merupakan tempat untuk menampilkan semua perintah (command) yang telah dilakukan
dalam bentuk program dan hasil dari pengolahan data yang tidak dapat ditampilkan dalam
worksheet. Sedangkan worksheet sendiri adalah tempat untuk menginput data serta
menampilkan hasil pengolahan data.

Kegunaan Minitab:
1. Mengelola data dan file - spreadsheet untuk analisa data yang lebih baik.
2. Analisa regresi
3. Power dan ukuran sampel
4. Tabel dan grafik
5. Analisa multivariat – termasuk analisa faktor, analisa klaster, analisa korespondensi
dan lainnya
6. Tes Nonparametrik - berbagai tes termasuk tes signal, run tes, friedman tes, dan
lainnya
7. Time Series dan Forecasting – membantu menunjukkan kecenderungan pada data
yang dapat digunakan untuk membuat dugaan. Time series plots, exponential
smoothing, dan trend analysis.
8. Statistical Process Control
9. Analisa sistem pengukuran
10. Analisa varians - untuk menentukan perbedaan antar data.

Gambar 1.1 Tampilan Window dalam Minitab

7
Dalam minitab ini terdapat 11 menu bar beserta submenu diantaranya adalah :
1. File
Dalam menu file terdapat submenu file yang digunakan untuk membuka file, menginput data,
menyimpan pekerjaan, dan lainnya seperti berikut ini

New Membuat Project atau Worksheet baru.


Open Membuka project minitab, worksheet, graph yang telah
disimpan.
Save Project Menyimpan project minitab yang telah dikerjakan.
Save Project As Menyimpan project minitab dengan nama yang berbeda atau
tempat penyimpanan yang berbeda.
Save Session
Menyimpan konten dari window yang aktif.
Window As
Query Database
Mengimport data dari file database.
(ODBC)
Print session
Mengeprint konten dari window yang aktif.
Window
Print setup Mengatur ukuran kertas, halaman, dan printer yang akan
digunakan.
Description Menambah atau mengedit deskripsi dalam project yang
dikerjakan.
Exit Keluar dari aplikasi minitab.
Recent Files Tempat memilih file yang baru dikerjakan.

Gambar 1.1 Sub menu file

8
2. Edit

Menu edit dalam minitab menyediakan fungsi-fungsi editing yang digunakan dalam proses
pengolahan data.
Tabel 1.2. Fungsi Submenu Edit

Submenu Fungsi
Undo Mengembalikan pekerjaan sebelumnya.
Redo Membatalkan operasi undo.
Clear Menghilangkan nilai dari area yang sudah diblok.
Delete Menghapus area yang sudah dipilih.
Copy Menyalin pekerjaan yang dipilih.
Cut Menyalin dan menghapus pekerjaan yang dipilih.
Paste Menampilkan pekerjaan yang di-copy atau di-cut.
Worksheet Memindahkan data yang telah disalin baik dari sel, atau
Link file minitab atau word, excel, dan lain-lain.
Memilih atau menyorot semua data pada sel-sel untuk
Select All
pengolahan
Edit Last
Mengedit dialog terakhir
Dialog
Mengeksekusi perintah secara cepat atau
Command Line
mengekseksekusi ulang atau mengedit perintah yang
Editor
digunakan pada sesi sebelumnya.

9
Gambar 1.2. Submenu Edit

3. Data
Dalam menu data menampilkan submenu-submenu yang berfungsi mengoperasikan
worksheet atau data yang sedang dijalankan.

Tabel 1.3. Fungsi Submenu Data

Submenu Fungsi
Subset Worksheet Menampilkan sebagian worksheet.
Split Worksheet Membagi worksheet menjadi beberapa worksheet.
Merge Worksheet Menggabungkan beberapa worksheet.
Memisahkan data pada satu kolom menjadi beberapa
Unstack Columns
kolom berdasarkan kriteria tertentu.
Menggabung data pada kolom yang berbeda menjadi satu
Stack
kolom.
Transpose Columns Mengubah data kolom menjadi baris dan juga sebaliknya.
Mengurutkan data (mengurutkan suatu kolom
Sort berdasarkan kolom

lainnya).

10
Rank Merangking data (membuat rangking suatu kolom).
Delete Rows Menghapus baris.
Erase Variables Menghapus variabel-variabel.
Mengkonversi data (numerik ke numerik, numerik ke teks
Recode
dsb).
Change Data Type Mengubah tipe data.
Date/Time Menginput data waktu.
Menggabung dua atau lebih kolom yang berisi data text
Concatenate
menjadi satu kolom, syarat penjang kolom sama.
Display Data Menampilkan data.

Gambar 1.3. Submenu Data

4. Calc
Menu calc menyediakan submenu yang dapat digunakan untuk memasukkan formula,
menampilkan distribusi peluang, atau membuat data berpola maupun acak.
Tabel 1.4. Fungsi Submenu Calc

Submenu Fungsi

11
Columns Statistics Menghitung ukuran-ukuran statistik dari suatu kolom
Row Statistics Menghitung ukuran-ukuran statistik dari suatu baris
Standardize Menormalisasikan data
Make Patterned
Data Membuat suatu kolom(data) dengan pola tertentu
Untuk melakukan perhitungan (penjumlahan, perkalian,
Calculator pembagian, sinus, maksimum, eksponen, dan lain-lain)
Membuat sebuah fungsi dua dimensi seperti permukaan
Make Mesh Data berdasarkan pasangan nilai x dan y
Make Indicator
Variables Membuat variabel dummy untuk data kualitatif
Menetapkan titik awal untuk pembangkitan data acak. Bila kita
tidak mengeset titik tersebut, maka titik tersebut akan ditentukan
Set Base oleh minitab.
Random Data Membangkitkan data acak dari berbagai distribusi
Probability Menghitung peluang dan distribusi kumulatif peluang dan
Distributions inversnya dari berbagai distribusi peluang.
Matrices Menghitung matriks dan operasi-operasinya

Gambar 1.4. Submenu Calc

12
5. Stat
Submenu-submenu dalam menu stat memungkinkan untuk menampilkan statistika deskriptif,
analisis regresi, reliabilitas, analisis varian, dan lainnya.
Tabel 1.5. Fungsi Submenu Stat

Submenu Fungsi
Menunjukkan ukuran-ukuran statistika deskriptif, uji
Basic Statistics hipotesis, correlation, covariance, penentuan proporsi
sample, dan uji normalitas.
Menganalisis persamaan regresi baik linier maupun non
Regression
linier untuk kuantitatif atau kualitatif.
ANOVA Menganalisis perbedaan varian.
Menguji pengaruh variabel input terhadap variabel output
DOE yang dapat didesain secara screening, faktorial, response
surface, mixture, dan taguchi.
Memberikan penilaian stabilitas proses berdasarkan nilai
Control Charts statistik untuk mengetahui variabel yang dapat
dikendalikan.
Quality Tools Melakukan analisis kapabilitas berdasarkan variable control.
Menampilkan probabilitas suatu unit yang terjadi pada
Reliability/Survival
periode tertentu.
Multivariate Menganalisis data dengan banyak varian.
Time Series Menganalisis data waktu untuk peramalan.
Tables Membuat tabel kontingensi dan analisis korespondensi.
Nonparametrics Menganalisis data kualitatif tanpa asumsi distribusi tertentu.
Equivalence Test Menguji equivalensi data.
Menghitung peluang menolak Ho ketika salah dan
Power and Sample Size perbedaan minimum sebagai nilai proporsi alternatif pada

uji proporsi.

13
Gambar 1.5. Submenu Stat

6. Graph
Di dalam menu bar Graph terdapat banyak graphic yang dapat digunakan unuk menunjukkan
atau menganalisis suatu data seperti histogram, scatter plot, box plot, contour, stem and leaf
diagram, serta grafik-grafik tertentu yang ditampilkan dalam dua atau tiga dimensi.

Gambar 1.6. Submenu Graph

14
7. Editor
Sub menu editor berbeda untuk setiap window yang aktif. Berikut ini adalah sub menu editor
pada worksheet.
Tabel 1.7. Fungsi Submenu Editor Worksheet
Submenu Fungsi
Find and Replace Menemukan atau mengganti data dalam worksheet.
Sort Columns Mengurutkan data dari yang terbesar atau terkecil.
Cell Properties Memberikan highlight atau komentar pada cell.
Format Column Memberikan format tertentu dalam kolom.
Mengoperasikan kolom dengan menyembunyikannya,
Column Properties
mengatur ukuranya, atau mendeskripsikannya.
Mengondisikan format-format tertentu pada kolom
Conditional Formatting
tersebut.
Formulas Memasukkan formula dalam kolom.
Subset Worksheet Menganalisis data dengan banyak varian.
Worksheet Properties Memberikan deskrips pada worksheet yang aktif.
Insert Cells Menambahkan cell.
Insert Rows Menambahkan baris di atas baris yang dipilih.
Insert Columns Menambahkan kolom
Move Columns Memindahkan kolom ke lokasi tertentu.

15
Gambar 1.7. Submenu Editor Worksheet
Sub menu editor pada Session adalah sebagai berikut :

Tabel 1.8. Fungsi Submenu Editor Session


Submenu Fungsi

Next Command Memindahkan kursor ke command berikutnya.

Previous Command Memindahkan kursor ke command sebelumnya.

Expand All Menampilkan session yang tersedia.

Collapse All Menyebunyikan table pada session.

Show Command Line Menampilkan bahasa pemrograman yang akan dieksekusi.

Add Note Menambahkan catatan pada session yang telah muncul.

Delete Note Mengahapus catatan pada session.


Decimal Place Penempatan desimal.

Zoom Membesarkan atau mengecilkan tampilan tiap session.

16
Gambar 1.8. Submenu Editor Session

8. Tools
Menu tools berguna untuk menyediakan penyesuaian dalam toolbar, menu bar, hinggga
proteksi project minitab yang dikerjakan.

Submenu Fungsi
Mengakses E-Learning untuk mempelajari analisis data
Quality Trainer
statistik dengan minitab.
Menjalankan file excel yang memuat command session
Run an Excel
minitab.
Memunculkan toolbar tertentu untuk memudahkan
Toolbar
pengoperasian minitab.
Menampilkan atau menyembunyikan status bar yang berada
Status Bar
di bawah window minitab.
Menyesuaikan menu, toolbar, pintasan keyboard agar
Customize
memudahkan operasi minitab.
mengubah dan menyimpan standard setting untuk berbagai
Options
macam operasi.
Mengatur, menyimpan, dan membagikan menu, setting, dan
Manage Profiles
toolbar yang telah disesuaikan
File Security Memproteksi project minitab dengan password atau hanya

17
bisa dibaca.

Gambar 1.9. Submenu Tool

9. Window

Submenu yang terdapat dalam menu window digunakan untuk menampilkan,


menyembunyikan, atau menyusun window yang aktif dalam minitab.
Tabel 1.10. Fungsi Submenu Window
Submenu Fungsi

Cascade Memunculkan setiap window yang aktif per layer.

Tile Memuncuklkan keseluruhan window yang aktif.

Minimize All Menutup tampilan window yang terbuka.

Restore Icons Membuka semua window yang telah ditutup.

Arrange Icons Menyusun tampilan icon di dasar window.

Refresh Menyegarkan semua window yang terbuka.

Close All Graphs Menutup semua window grafik.

Update All Graphs Now Memperbarui window grafik yang datanya diubah.

18
Gambar 1.10. Submenu Window

10. Help

Dalam menu Help terdapat submenu yang digunakan untuk membantu user ketika mengalami
kesulitan dalam mengoperasikan minitab. Submenu ini menghubungkan user ke tutorial web
minitab atau laman petunjuk penggunaan minitab.

Gambar 1.11. Submenu Help

19
11. Assistant

Submenu dalam ini menu Assistant memudahkan user untuk memilih metode analisis yang
tepat dalam pengaplikasiannya terhadap data yang dimiliki user. Pemilihan metode-metode
tersebut sangat informatif dan mudah dipahami karena dalam bentuk flow chart.

Gambar 1.12. Submenu Assistant

20
BAB II STATISTIKA DESKRIPTIF

Dalam penyajian statistika deskriptif terdapat beberapa ukuran statistik seperti ukuran
pemusatan, ukuran penyebaran, dan ukuran letak. Selain itu cara menyajikan data juga dapat
dilakukan dalam bentuk grafik histogram, box plot, stem and leaf diagram, beserta analisis
hasilnya.

2.1. Ukuran Pemusatan Data

Ukuran pemusatan data adalah nilai tunggal dari data yang dapat memberikan gambaran yang
lebih jelas dan singkat tentang pusat data sekaligus merepresentasikan seluruh data yang
meliputi mean, median, dan modus.

1. Mean adalah rata-rata dari data dan dinotasikan dengan ̅ atau dimana menyatakan
rata-rata sampel dan menyatakan rata-rata populasi. Secara umum mean memiliki
rumusan sebagai berikut.
n
xi
x = ,untuk sampel
i =1 n
N
xi
 = ,untuk populasi
i =1 N
2. Median adalah nilai yang membagi suatu gugus data yang telah terurut menjadi 2
bagian yang sama. Median memiliki sifat bahwa di bawah nilai median terdapat 50%
data. Cara menentukan median sebagai berikut:
i. Jika jumlah sampel (n) ganjil xmed = x n
+1
2

1 
ii. Jika jumlah sampel (n) genap xmed =  xn + xn 
2 2 +1
2 

3. Modus yaitu nilai yang paling sering muncul dalam suatu gugus data
Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran pemusatan lainnya
karena keakuratannya dalam menentukan nilai tengah suatu gugus data, walaupun ada
beberapa kasus yang membuat nilai tengah menjadi kurang tangguh, misalkan ada nilai yang
dianggap ekstrim.

21
2.2. Ukuran Penyebaran

Ukuran penyebaran adalah suatu ukuran yang menyatakan besaran nilai-nilai data berbeda
atau bervariasi dengan nilai ukuran pusatnya atau besar penyimpangan nilai-nilai dengan nilai
pusatnya. Beberapa ukuran penyebaran antara lain
1. Range atau jangkauan yaitu menyatakan selisih antara nilai maksimum dengan nilai
minimum.
2. Variansi adalah nilai tengah dari kuadrat penyimpangan antara terhadap ̅. Variansi
merupakan ukuran penyebaran yang sering digunakan dalam statistika inferensia.
Variansi dinotasikan s 2 untuk sampel dan  2 untuk populasi. Variansi memiliki
rumusan sebagai berikut :

n
( xi − x ) 2
s2 =  ,
I =1 n −1
dan
N
( xi −  )2
2 =
I =1 N −1
3. Simpangan baku merupakan akar dari variansi.

s = s 2 dan  = 2

2.3. Ukuran Letak

Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian yang sama
besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data terletak di bawah Q1. Q2
sama dengan median. Sedangkan Q3 memiliki sifat bahwa ¾ data terletak di bawah Q3.
Untuk ukuran letak yang lainnya adalah desil, persentil dll.

22
2.4. Penyajian Grafik

Dalam menyajikan grafik, minitab memiliki berbagai jenis grafik dalam menu Graphs
diantaranya adalah:
1. Histogram dibuat berdasarkan tabel distribusi frekuensi. Bila datanya memiliki skala
interval atau rasio, maka histogram dapat digunakan untuk menyajikan data.
2. Box plot merupakan bentuk penyajian data yang hanya menggunakan beberapa
statistik yang disebut ringkasan lima angka yaitu nilai minimum, Q1, median, Q3,
nilai maksimum. Pada box plot dapat juga ditentukan adanya pencilan atau tidak.
Pencilan yaitu suatu nilai pada data yang apabila dibandingkan dengan nilai data yang
lain tidak konsisten.
Pagar dalam (p)
p1 = Q1 − 1.5 ( Q3 − Q1 )

p2 = Q3 − 1.5 ( Q3 − Q1 )

Pagar luar(P)
P1 = Q1 − 2 ( Q3 − Q1 )

P2 = Q1 − 2 ( Q3 − Q1 )

Pencilan dibedakan menjadi pencilan jauh (dalam) dan pencilan jauh sekali (luar).
Pencilan dikatagorikan sebagai pencilan jauh bila letaknya data di antara pagar dalam
dan pagar luar. Sedangkan pencilan jauh sekali, bila data di luar pagar luar.

3. Diagram dahan daun adalah salah satu teknik penyajian data yang menggunakan data
asli secara langsung. Pada dasarnya dalam diagram dahan daun, penyajian data
terbagi atas dua kolom yaitu dahan dan daun, dimana dahan berisi data dengan satuan
yang lebih besar dari pada kolom daun.

Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data dapat berupa
simetri, menjulur ke kiri, atau ke kanan.

23
2.5. Analisis Deskriptif Dengan Minitab 18

Analisis deskriptif adalah analisis yang bertujuan untuk menggambarkan keadaan data.
Analisis deskriptif lebih berhubungan dengan pengumpulan data dan peringkasan data serta
penyajian hasil peringkasan tersebut. Seperti data yang diperoleh dari sensus, survei, atau
pengamatan lainnya yang masih berupa data mentah dan tidak terorganisir sehingga perlu
penyajian yang baik dan teratur sebagai dasar pengambilan keputusan.

Pengolahan data dalam Minitab bisa dilakukan melalui menu Stat. Menu stat menyediakan
beberapa metode analisa statistik. Apabila membutuhkan analisa data melalui grafik, kita
dapat melakukannya melalui Graph dalam Minitab. Selain kedua menu tersebut, apabila
pengguna Minitab akan melakukan perhitungan matematika atau statistik tertentu atau
memanipulasi data sesuai dengan kebutuhan, maka kita dapat melakukannya melalui menu
Data atau Calc. Output analisa data ditampilkan melalui window session atau disimpan dalam
worksheet. Jika melakukan analisis grafik, maka window graph akan menampilkan
outputnya.

Sebagai contoh dalam operasi statistika desktriptif dengan minitab 18, kali ini menggunakan
data score TOEFL dari 100 mahasiswa sebagai berikut :

Tabel 2.1 Score TOEFL Dari 100 Mahasiswa


15.7 16.2 18.2 16.3 17.9 18.1 16.8
17.6 18.1 16.7 16.7 16.0 17.4 17.0
18.6 17.1 14.1 17.5 17.0 17.6 15.6
16.0 17.7 16.1 18.6 15.2 17.1 19.5
17.0 16.9 16.9 16.7 17.3 16.3 17.3
17.0 15.6 15.6 17.9 16.0 17.7 18.2
14.7 17.1 15.2 17.0 17.8 16.1 18.2
16.5 17.7 18.8 14.6 16.5 16.6 15.6
14.9 17.5 16.1 18.5 15.8 16.9 17.3
17.1 15.9 17.1 17.1 16.4 15.6 16.3

24
Langkah-langkah untuk mengoperasikan minitab 18 untuk penyajian data tersebut adalah :
1. Input data yang tersedia pada worksheet ke dalam kolom C1:

Gambar 2.1 Input Data

2. Selanjutnya dari data tersebut kita dapat menyajikan ukuran-ukuran nilai dalam
statistika deskriptif dengan cara pilih menu Stat → Basic Statistics → Display
Descritive Statistics. Lalu akan menampilkan window Display Descriptive Statistics.

Gambar 2.2 Display Descritive Statistics

25
3. Select kolom C1 ke dalam kolom Variables dengan cara klik 2x pada C1.

Gambar 2.3 Window Display Descritive Statistics


4. Untuk menampilkan nilai-nilai ukuran pilih Statistics pada window Display
Descriptive Statistics, lalu tentukan nilai yang ingin ditampilkan :

Gambar 2.4 Ukuran-Ukuran dalam Display Descritive Statistics

26
5. Selain itu, dalam window Display Descriptive Statistics juga dapat menampilkan
grafik dengan cara memilih graphs. Kemudian tentukan jenis grafik yang ingin
ditampilkan, lalu klik OK.

Gambar 2.5 Menampilkan Grafik pada Display Descritive Statistics


6. Lalu klik OK pada setiap window yang kemudian menampilkan output berupa grafik
histogram beserta kurva kenormalan, boxplot, dan nilai-nilai ukuran statistika
deskriptif pada window Session.

Gambar 2.6 Output Hasil Display Descritive Statistics

27
Selain bentuk penyajian statistika seperti yang di atas, dapat pula dalam berbagai bentuk
grafik yang terdapat dalam menu Graphs.
Penyajian data dalam bentuk tabel juga dapat dilakukan dalam aplikasi minitab ini dengan
cara sebagai berikut :
1. Pilih menu Stat → Tables → Tally Individual Variables yang akan memunculkan
box Tally Individual Variables.

Gambar 2.7 Tally Individual Variables


2. Lalu isi kolom variables dengan select C1 pada window tersebut dan pada kolom
Display pilih nilai-nilai yang ingin ditampilkan. (Tabel data variabel juga dapat
ditampilkan dalam window worksheet bila Store result diceklis).

Gambar 2.8 Window Tally Individual Variables

28
3. Klik OK pada window sehingga tabel dengan nilai yang telah ditentukan
sebelumnya ditampilkan dalam window Session.

Gambar 2.9 Tabel Frekuensi Data

Dari tabel ini kita dapat melihat frekuensi setiap nilai sekaligus frekuensi
kumulatif. Selain itu, tabel ini juga menunjukkan persen frekuensi setiap nilai dan
persen frekuensi kumulatif.

29
BAB III UJI KENORMALAN DATA
3.1. Distribusi Normal

Distribusi peluang kontinu yang paling penting adalah distribusi normal. Grafik dari suatu
distribusi normal disebut kurva normal. Suatu peubah acak X yang distribusinya memiliki
penunjaman sama besar ke kanan dan ke kiri disebut peubah acak normal seperti pada
gambar 3.1. Persamaan matematika dari distribusi peluang peubah acak normal kontinu
bergantung pada dua parameter yaitu (rataan) dan (simpangan baku). Dengan demikian
fungsi densitas X dapat dinyatakan oleh

1 − 12  x −  
2

f ( x) = e   , −  x  
2   

Gambar 3.1 Kurva Distibusi Normal

Sifat-sifat distibusi normal :



1. 
−
f ( x)dx = 1

2. f ( x)  0, x
3. lim f ( x) = 0 dan lim f ( x) = 0
x →− x →

4. Nilai maksimum dari f terjadi pada x = 


5. Titik belok dari f terjadi pada x =   

30
3.2. Statistik Uji Kenormalan

Dalam statistika parametrik, distribusi normal mendasari beberapa uji statistik. Misal statistik
t-student, Fisher, Khai Square, dll. Sehingga dalam pengolahan data statistik, biasanya
diasumsikan data berasal dari populasi yang berdistribusi normal. Ada dua cara untuk melihat
kenormalan data yaitu secara visual dan dengan uji statistik. Secara visual dengan
menggunakan histogram, dahan daun, box plot, tetapi cara ini bersifat subyektif. Biasanya
dengan uji statistik, akan lebih obyektif untuk mengatakan data berdistribusi normal.

Ada beberapa statistik uji kenormalan data antara lain :

1. Statistik Shapiro-Wilk W
Statistik ini dikembangkan oleh Shapiro dan Wilk tahun 1965. Statistik ini merupakan
rasio antara dua penduga ragam. Statistik ujinya dinamakan statistik W. Statistik W
ini mengukur straightness dari plot quantil-quantilnya. Bila nilai dari W ≤ 1, maka
data dikatakan normal.

2. Statistik Anderson-Darling

Statistik ini dikembangkan oleh Anderson dan Darling tahun 1954. Statistik Anderson
Darling berdasarkan pada fungsi distribusi empirik. Statistik ujinya dinamakan
statistik yang merupakan kuadrat dari selisih antara luas histogram dengan luas daerah
di bawah kurva normal. Bila nilai P-value ≥ α , maka data berdistribusi normal.
Metode uji kenormalan ini biasanya digunakan untuk data berukuran besar.

3. Statistik Kolmogorov-Smirnov

Statistik ini menggunakan fungsi distribusi kumulatif dan berdasarkan pada


maksimum perbedaan antara dua distribusi, yaitu distribusi normal dengan distribusi
data yang diamati. Biasanya digunakan untuk data berukuran ≤ 30. Bila nilai P-value
≥ α, maka data berdistribusi normal.

31
3.3. Uji Kenormalan Data Dengan Minitab 18
Contoh kasus dalam hal ini adalah data produksi minyak bumi periode 10 bulan dari 8 lokasi
sumur pengeboran seperti dalam tabel berikut :
Tabel 3.1 Data Produksi Minyak Bumi Dalam 10 Periode

Periode Well 56 Well 59 Well 66 Well 68 Well 70 Well 77 Well 87 Well 99


1 507 468 500 498 449 513 558 486
2 677 763 738 608 433 460 485 552
3 633 661 420 425 451 345 377 455
4 503 573 571 534 414 575 635 443
5 477 498 466 588 589 547 499 503
6 636 672 597 597 521 576 568 485
7 402 365 582 351 585 622 685 736
8 464 504 501 526 414 471 527 508
9 309 463 390 413 393 581 590 486
10 495 519 482 468 489 392 510 542

Langkah-langkah untuk menguji kenormalan data tersebut dalam minitab adalah :


1. Input data dari tabel tersebut ke dalam kolom C1.

Gambar 3.2 Input Data


2. Kemudian pilih menu Stat → Basic Statistics → Normality Test. Muncul window
Normality Test.

32
Gambar 3.3 Menu Normality Test
3. Pada window Normality Test, isi box variables dengan kolom C1 lalu pilih metode
normality test.

Gambar 3.4 Window Normality Test

4. Klik OK pada window yang akan menampilkan grafik distibusi peluang normal
dengan metode Anderson-Darling.

33
Gambar 3.5 Grafik Distribusi Normal Anderson-Darling

5. Ulangi langkah ke-4 untuk metode Ryan-Joiner (Shapiro-Wilk) dan Kolmogorov-


Smirnov.

34
Gambar 3.6 Grafik Distribusi Normal Ryan-Joiner

Gambar 3.7 Grafik Distribusi Normal Kolmogorov-Smirnov

35
Pada metode Anderson-Darling, nilai P-value yang diperoleh sebesar 0.286. Nilai ini lebih
besar dari nilai α = 0.05 dengan Confidence Level 95%. Untuk metode Ryan-Joiner diperoleh
nilai RJ = 0.992 dengan pendekatan P-value > 0.1 sehingga dapat dikatakan bahwa data
berdistribusi normal. Begitupula dengan metode Kolmogorov-Smirnov yang menunjukkan
nilai P-value = 0.118 yang artinya lebih besar daripada nilai α = 0.05.

Berdasarkan nilai-nilai di atas yang didapat dari metode-metode berbeda, dapat dikatakan
bahwa data yang diolah memiliki distribusi normal. Hal ini juga ditunjukkan dengan plot-plot
data pada grafik berhimpit atau hampir mengikuti garis kenormalan. Dari ketiga nilai dengan
metode yang berbeda di atas, terlihat bahwa statistik Anderson-Darling lebih powerfull untuk
digunakan ukuran data yang besar.

36
BAB IV TRANSFORMASI DATA
4.1. Transformasi Satu Angkatan Data

Dalam ilmu statistik sering kali digunakan asumsi dari bentuk data yang akan di analisa.
Asumsi yang lazim digunakan adalah distribusi Normal. Bentuk data yang berdistribusi
Normal dengan mean ( ) dapat digambarkan seperti grafik berikut:

Gambar 4.1 Grafik Simetris Distribusi Normal

Bila dilihat, data yang berdistribusi Normal akan simetris terhadap dan sebagaian besar data
akan mengelompok di tengah. Dalam kenyataannya seringkali bentuk data yang diperoleh
tidak berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan seperti gambar
berikut:

Gambar 4.2 Grafik Menjulur Ke Kanan

Bentuk data yang lainnya adalah menjulur ke kiri yang dapat dilihat pada gambar berikut :

37
Gambar 4.3 Grafik Menjulur Ke Kiri

Agar asumsi bahwa data berdistribusi Normal tetap dipenuhi, maka perlu dilakukan suatu
transformasi terhadap data asli. Transformasi dilakukan untuk satu angkatan data bila data
yang akan ditransformsi hanya satu angkatan data.

Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi Tukey yang
digambarkan sebagai berikut :

Gambar 4.4 Fungsi Urutan Transformasi Tukey

Transformasi 10x akan membuat bentuk distribusi data menjadi menjulur ke kanan secara
kuat, sedangkan transformasi − 12 akan membuat bentuk distribusi data menjadi menjulur ke
kiri secara kuat. Sebagai contoh bila data yang dimiliki menjulur ke kanan secara lemah maka
gunakan transformasi √ agar data dapat menjadi Normal. Sebaliknya bila data menjulur
kekanan secara sedang maka transformasi x 3 agar data menjadi Normal. Penentuan bahwa
suatu data menjulur secara lemah, sedang atau kuat besifat subyektif sehingga akan lebih baik
bila digunakan beberapa transformasi sekaligus kemudian dibandingkan hasilnya. Penentuan
hasil kenormalan transformasi dilakukan melalui uji kenormalan.

38
4.2. Transformasi Beberapa Angkatan Data

Ketika memiliki beberapa angkatan data, biasanya ingin dilakukan pembandingan antara
angkatan satu dengan angkatan lainnya. Proses membandingkan ini lebih mudah ketika
semua angkatan data memiliki :

1. Bentuk distribusi baku


2. Sebaran data yang sama
Ketika persyaratan di atas terpenuhi, untuk membandingkan angkatan-angkatan tersebut
cukup dengan masing masing tarafnya ( nilai Median ) saja. Dalam penyamaan sebaran
semua angkatan (membuat sebaran hampir sama), digunakan transformasi seperti pada tangga
transformasi Tukey tetapi dengan acuan yang sedikit berbeda. Sebaran masing masing
angkatan diukur dengan dQ = Q3 - Q1 yaitu simpangan kuartil.
Penentuan transformasi yang tepat dilakukan adalah sebagai berikut:
1. Hitung taraf dari setiap angkatan.
2. Hitung sebaran dari setiap angkatan.
3. Tentukan Taraf Terbesar (TA), Taraf Terkecil (TB), Sebaran yang bersesuaian
dengan TA(=SA) dan Sebaran yang bersesuaian dengan TB(=(SB) dari seluruh
angkatan.
4. Hitung koefisien arah b yang memiliki rumus
log( S A ) − log( S B )
b=
log(TA ) − log(TB )
Berdasarkan nilai b, pilihlah transformasi yang tepat sesuai dengan tabel berikut.

Tabel 4.1 Transformasi Beberapa Angkatan Data

Transformasi yang Keterangan


Nilai b (disekitar) dipilih
Jika b semakin kecil,
Negatif xk maka k semakin besar
(k:bulat)

0.5 x
1 Log x

39
1.5 1

x
2 1

x2

4.3. Transformasi Data Dengan Minitab 18


Berikut ini merupakan contoh data yang digambarkan dengan histogram menjulur ke kanan
Tabel 4.1 Data Untuk Transformasi Data
7.2 2 9.6 2.1 2.4 3.6 9.1 3.6 2.9 15.3
5.6 1.7 4.8 3.1 2.3 4.4 1.7 3.6 2.3 3.4
9.7 1.9 10.4 4.8 2.1 4.6 2.1 1.9 5.3 6.3
2.9 8.8 3.7 4.9 5.2 3.4 3 1.7 8 1.5
2.3 4.8 7.5 1.5 2.9 3.4 5.7 11.9 6.4 1.3
14.3 5.5 8.3 7.6 3.2 3.4 11.4 4.9 3.8 15.3
2.6 3.6 4 4.4 4.1 17.3 8.1 1.9 13.7 1.8
6.8 6.5 2.4 12 3.5 3.8 3.7 3.4 4.6 5.9
1.8 10.9 1.7 3.7 0.5 2.4 0.9 2.5 2.9 2.8
3 3.7 5.8 5.5 5.9 6.9 6.5 8.3 9.3 4.9

40
Langkah-langkah dalam mentransformasikan data adalah sebagai berikut:

1. Input data ke dalam kolom C1.

Gambar 4.5 Input Data

2. Buat histogram dengan kurva kenormalan dari menu Graph → Histogram → pilih
tipe histogram With Fit, lalu klik OK.

Gambar 4.6 Menu Histogram

41
Gambar 4.7 Tipe Histogram

3. Kemudian akan muncul histogram dengan kurva distribusi.

Gambar 4.8 Histogram Data

42
4. Kemudian lakukan uji kenormalan dengan metode Anderson-Darling dengan cara
seperti pada bab sebelumnya. Dari ujia kenormalan ini diperoleh nilai P-value <
0.005. Hal ini menunjukkan data yang kita miliki belum berdistribusi normal.

Gambar 4.9 Uji Kenormalan Data C1

5. Agar data dapat berdistribusi normal, dapat dilakukan transformasi data dengan

fungsi selanjutnya, yaitu √ urutan melalui menu Calc Calculator. Lalu pada
Calculator isikan setiap box window seperti gambar di bawah ini dan klik OK.

43
Gambar 4.10 Menu Calculator

Gambar 4.11 Window Calculator


6. Ulangi langkah 2-4 untuk data kolom C2. Dari hasil transformasi √ , diperoleh kurva
distribusi dan nilai P-value < 0.005 yang menunjukkan masih belum memiliki
distribusi normal.

Gambar 4.12 Histogram dan Kurva Kenormalan Data C2

44
7. Kemudian dapat dilakukan transformasi data C1 dengan urutan transformasi
selanjutnya, yaitu log sama seperti langkah 3-6. Dari transformasi ini didapatkan nilai
P-value = 0.813 yang menunjukkan data berdistribusi normal karena nilai P-value
lebih dari 0.005.

Gambar 4.13 Histogram dan Kurva Kenormalan Data C3

Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya menjulur kekanan
secara sedang, dengan transformasi √ bentuk data menjadi menjulur ke kanan secara lemah,
sedangkan dengan transformasi log data menjadi normal. Nantinya yang diolah dengan
statistik adalah data log bukan data aslinya.
Sebagai eksperimen lainnya, lakukan tranformasi x 2 dan x3, simpan datanya masing-masing
pada C4 dan C5 kemudian buat histogram maka diperoleh bentuk data akan semakin
menjulur kekanan seperti ditunjukkan dari histogram berikut.

Gambar 4.14 Histogram Data C4 dan C5

45
BAB V HIPOTESIS DAN PROPORSI

5.1. Hipotesis Statistik

Hipotesis statistik merupakan hal sangat penting dalam statistika inferensia. Hipotesis
statistik yaitu suatu anggapan atau pernyataan yang mungkin benar atau tidak mengenai satu
populasi atau lebih. Suatu hipotesis dianggap benar atau salah, tidak bias diketahui dengan
pasti kecuali dilakukan pemeriksaan terhadap seluruh populasi. Tetapi hal tersebut tidak
efisien. Untuk mengatasi hal tersebut dilakukan pengambilan sampel secara acak.

Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis yang
dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar dan jika ditolak
maka berlaku sebaliknya. Dari hal tersebut, dapat dikatakan bahwa perumusan suatu hipotesis
sering dipengaruhi oleh bentuk peluang dari kesimpulan yang salah. Hipotesis yang
dirumuskan dengan harapan akan ditolek disebut hipotesi nol. Penolakan terhadap hipotesis
nol tersebut akan mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut
hipotesis alternatif.

Prosedur pengambilan kesimpulan kadangkadang dapat membawa pada kesimpulan yang


salah. Dalam pengujian hipotesis statistik, ada dua jenis kesalahan yaitu:

1. Galat/kesalahan jenis pertama, yaitu penolakan hipotesis nol, padahal hipotesis nol
benar. Peluang galat jenis I disebut taraf nyata yang dinotasikan dengan α. Biasanya
taraf nyata disebut dengan ukuran wilayah kritis.

2. Galat/kesalahan jenis kedua, yaitu penerimaan hipotesis nol, padahal hipotesis nol
salah. Peluang galat jenis II dinotasikan dengan β. Nilai dari β tidak mungkin
dihitung, kecuali bila hipotesis alternatifnya lebih spesifik.

46
Tabel 5.1 Kesalahan Dalam Pengujian

Kesimpulan Pengujian H0 Benar H0 Salah

Keputusan Tepat Kesalahan Type II


Terima H0
(1-α) = Confident Interval β

Kesalahan Type I Power Pengujian


Tolak H0
α (1- β)

Kesalahan type I dan II memiliki hubungan terbalik, menurunnya peluang yang satu akan
menaikkan peluang yang lain.

Dalam kesalahan type I, yaitu α dapat disebut sebagai taraf (derajat) signifikansi yang
nilainya ditentukan oleh peluang diambilnya. Semakin kecil tingkat peluang kemelesetannya,
semakin tinggi keberartiannya. Contohnya, niai α = 0.05 menunjukkan kemelesetan atau
kekeliruan yang terjadi hanya sebanyak 5 kali dalam 100 kali pengamatan.

Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu :
1. Hipotesis alternatif yang bersifat dua arah
H0 : θ = θ0
H1 : θ θ0
Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yaitu wilayah yang
letaknya pada masing-masing ujung dari sebaran statistik ujinya.
2. Hipotesis alternatif yang bersifat satu arah
a. H0 : θ ≤ θ0
H1 : θ > θ0
b. H0 : θ ≥ θ0
H1 : θ < θ0
Wilayah kritis untuk poin a terletak seluruhnya di ekor sebelah kanan dari sebaran statistik
ujinya. Sedangkan untuk poin b sebaliknya.

47
Gambar 5.1 Pengujian Hipotesis

Dalam menentukan keputusan akhir untuk menerima atau menolak H0, didasarkan pada
wilayah kritis α dengan P-value yang mendukung keberartian suatu uji dalam bentuk
peluang.

48
P-value adalah taraf keberartian terkecil, sehingga nilai suatu uji statistik yang diamati masih
berarti.Bila P-value ≤ α, maka H0 ditolak.
Prosedur pengujian hipotesis dapat mengikuti langkahlangkah berikut :
1. Merancang hipotesis nol dan hipotesis alternatif.
2. Memilih taraf keberartian α.
3. Menentukan dan menghitung nilai statistik uji yang sesuai.
4. Menentukan daerah kritis dan membuat keputusan apakah menerima atau menolak H0
(di mana pengambilan keputusan dapat didasarkan pada tiga hal yaitu nilai kristis dari
statistik uji, selang kepercayaan, atau P-value).
5. Membuat kesimpulan akhir mengenai sampel yang diambil.

5.2 Pengujian Hipotesis Untuk Mean

Menurut Walpole statistik inferensial yaitu metode yang berhubungan dengan analisis data
untuk peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya.
Sedangkan menurut Subana statistik inferensial adalah statistic yang berhubungan dengan
penarikan kesumpulan yang bersifat umum dari data yang telah disusun dan diolah. Dengan
kata lain statistik inferensial yaitu statistic yang digunakan untuk menggeneralisasikan data
sampel terjadap populasi.
Ada dua macam statistik inferensial, yaitu:
1. Statistik Parametrik

Yaitu metode statistk inferensial yang digunakan untuk menganalisis data interval dan
rasio dan mensyaratkan data harus berdistribusi normal, homogeny, linier dan data random
sampling. Beberapa uji statistic yang masuk dalam statistik parametric adalah t-test (uji-t),
Anova, korelasi, regresi, dan lain-lain.
2. Statistik Non Parametrik

Sebaliknya statistik non parametric adalah statistic inferensial yang datanya tidak
mengikuti distribuai normal sehingga diperlukan metode yang lebih pas dalam pengambilan
keputusan.
Dalam hal ini yang dipelajari dalam praktikum ini adalah statistik parametrik yaitu
statistik inferensi yang mensyaratkan datanya mengikuti distribusi tertentu. Sebagai contoh

49
umum yang paling sering yang menjadi asumsi dalam analisis data adalah data mengikuti
distribusi normal.
Penggunaan SPSS pada tema ini (uji rata-rata) hanya mengakomodir uji hipotesis
dengan H 0 :  = 0 dan H1 :   0 untuk uji rata-rata satu populasi/kelompok dan

H 0 : 1 = 2 dan H1 : 1  2 untuk uji rata-rata dua populasi/kelompok.

1. Uji Rata-Rata Satu Populasi

Pengujian Untuk Sampel besar ( n  30 )

1. Uji rata-rata dimana  2 diketahui

Untuk uji rata-rata dimana  2 (variansi populasi) diketahui maka langkah-langkah uji
hipotesis dapat diuraikan dalam tabel berikut ini:

Level signikan
Hipotesis Statistik hitung Daerah Kritis Kesimpulan
( )
H 0 ditolak jika
H 0 :  = 0
zhit  − z /2 atau Kesimpulan
H1 :   0
zhit  z /2 diambil dengan
Misal diambil x − 0 melihat apakah
H 0 :   0 zhit = H 0 ditolak jika
0,05 / n zhit masuk pada
H1 :   0 zhit  − z
daerah kritis
H 0 :   0 H 0 ditolak jika atau tidak
H1 :   0 zhit  z

Tabel 4.1
Contoh:
Secara teknis populasi yang terdiri dari seluruh plat baja yang dihasilkkan oleh sebuah
perusahaan industry besi baja memiliki rata-rata panjang 80 cm dengan standard deviasi
sebesar 7 cm. Sesudah berselang 3 tahun teknisi perusahaan meragukan hipotesis
tentang rata-rata panjang pelat baja diatas. Guna menyakinkan kebenaran hipotesisi
diatas sebuah sampel random yang terdiri dari 100 unit pelat baja dipilih dari opulasi
diatas dan hasil pengukuran panjang rata-ratanya sebesar 83 cm. teknisi masih percaya
bahwa standard deviasinya sama. Apakah ada alas an guna meragukan bahwa rata-rata
panjang pelat baja yang dihasilkan pabrik tersebut tidak sama dengan 80 cm?

50
Langkah-langkah uji hipotesis dilakukan sebagai berikut:
1. H 0 :  = 80

H 0 :   80

2. Ambil level signifkansi  = 0, 05 . Dengan melihat pada tabel normal diperoleh

z /2 = 1,96
3. Statistik hitung
x − 0
zhit =
/ n
83 − 80
=
7 / 100
= 4, 2857
4. Daerah kritis :
H 0 ditolak jika zhit  − z /2 atau zhit  z /2

5. Karena zhit  z /2 (4,2857>1,96) maka H 0 ditolak yang artinya rata-rata panjang

pelat baha yang dihasilkan pabrik tersebut tidak sama dengan 80 cm.
2. Uji rata-rata dimana  2 tidak diketahui

Perbedaan yang mendasar untuk kasus variansi populasi  2 tidak diketahui adalah
dengan menduganya dengan menghitung variansi sampel s 2 . Pengguanan penduga s 2
ini tetap akan memberikan hasil yang cukup memuaskan. Sedemikian sehingga
langkah-langkah uji hipotesis dapat diadaptasi dan disesuaikan dari tabel sebelumnya,
yaitu
Level signikan
Hipotesis Statistik hitung Daerah Kritis Kesimpulan
( )
H 0 ditolak jika
H 0 :  = 0
zhit  − z /2 atau Kesimpulan
H1 :   0
zhit  z /2 diambil dengan
Misal diambil x − 0 melihat apakah
H 0 :   0 zhit = H 0 ditolak jika
 = 0, 05 s/ n zhit masuk pada
H1 :   0 zhit  − z
daerah kritis
H 0 :   0 H 0 ditolak jika atau tidak
H1 :   0 zhit  z

Tabel 4.2

51
Contoh: memodifikasi kasus diatas
Secara teknis populasi yang terdiri dari seluruh plat baja yang dihasilkkan oleh sebuah
perusahaan industri besi baja memiliki rata-rata panjang 80 cm. Sesudah berselang 3 tahun
teknisi perusahaan meragukan hipotesis tentang rata-rata panjang pelat baja diatas. Guna
menyakinkan kebenaran hipotesisi diatas sebuah sampel random yang terdiri dari 100 unit
pelat baja dipilih dari populasi diatas dan hasil pengukuran panjang rata-ratanya sebesar 83
cm. Apakah ada alasan guna meragukan bahwa rata-rata panjang pelat baja yang dihasilkan
pabrik tersebut tidak sama dengan 80 cm?

Pengujian Untuk Sampel Kecil ( n  30 )

Pengujian rata-rata untuk sampel kecil adalah dengan menggunakan statistic thit dengan

asumsi bahwa thit mengikuti distribusi student-t dengan derajat bebas n-1. Sedemikian

sehingga langkah-langkah uji hipotesis dapat dilakukan dengan tabel berikut ini :
Level signikansi
Hipotesis Statistik hitung Daerah Kritis Kesimpulan
( )
H 0 ditolak jika
H 0 :  = 0
thit  −t( /2;n −1) atau Kesimpulan
H1 :   0
thit  t( /2;n −1) diambil dengan
Misal diambil x − 0 melihat apakah
H 0 :   0 thit = H 0 ditolak jika
 = 0, 05 s/ n zhit masuk pada
H1 :   0 thit  −t( ;n −1)
daerah kritis
H 0 :   0 H 0 ditolak jika atau tidak
H1 :   0 thit  t( ;n−1)

Tabel 4.3
Contoh kasus:
Secara hipotesis mesin stensil “Rodeo”dapat menstensil 6.500 helai perjam. Sebuah
perusahaan perstensilan ingin membuktikan kebenaran hipotesis diatas. Perusahaan
mengadakan observasi secara empiris dengan menggunakan 12 mesin Rodeo dan hasi
lobservasi sedemikian itu diberikut oleh data berikut ini:

52
Mesin Jumlah lembar yang dihasilkan
Mesin 1 6000
Mesin 2 5900
Mesin 3 6200
Mesin 4 5500
Mesin 5 6100
Mesin 6 5800
Mesin 7 6400
Mesin 8 6500
Mesin 9 5400
Mesin 10 6200
Mesin 11 6700
Mesin 12 6100
Tabel 4.4
Secara manual permasalah ini dapat diselesaikan dengan langkah-langkah uji hipotesis
sebagaimana dijelaskan sebelumnya:
1. Hipotesis
H 0 :  = 0

H1 :   0

2. Level signifikansi  = 0, 05 . Dengan melihat pada tabel t diperoleh


t( /2;n−1) = 2, 201

3. Statistik hitung
Dari data diatas diperoleh x = 6066,67 dan s = 382,179 sehingga dapat dicari
statistik hitung:
x − 0
thit =
s/ n
6500 − 6066, 67
=
382,179 / 12
= −3,92
4. Daerah kritis
H 0 ditolak jika thit  −t( /2;n−1) atau thit  t( /2;n−1)

53
5. Kesimpulan
Karena thit  −t( /2;n −1) (-3,92<-2,201) maka H 0 ditolak. Artinya rata-rata mesin

penstensil itu tidak memproduksi sejumlah lembar stensil yang diduga yaitu 6500,
bisa jadi jadi kurang dari 6500 tetapi tidak sama dengan 6500.

Gambar 4.3.3

2. Uji Rata-Rata Dua Populasi

Sebagaimana para uji rata-rata satu populasi ada beberapa kasus dalam langkah-langkah uji
hipotesis, yaitu dengan memperhatikan apakah sampel yang diperoleh besar atau kecil (n<30).
Namun jika menggunakan SPSS maka akan terhitung jumlah sampel adalah kecil. Dalam
membedakan penggunaan kasus jumlah sampel besar atau kecil lebih dikaji dalam teori. Dalam
praktiknya kita akan mengandalakan p-value dalam uji hipotesis. Namun dari jenis dependensi dua
populasi ini dapat dibedakan antara dua populasi yang independend dan dua populasi yang saling
bergantung (dependen)

54
Uji-T Dua Populasi Independen (Independen Sample T-Test)
Independen dalam hal ini memiliki makna tidak ada hubungan antara dua kelompok sampel
yang sedang diuji. Beberapa syarat yang perludilakukan sebelum melakukan Uji Independen Sampel
T-Test adalah :

1. Data yang diuji adalah data kuantitatif (data interval atau data rasio)
2. Data berdistribusi normal
3. Data harus sejenis
4. Jumllah sampel kecil (n<30)
Selain itu ada satu hal lagi yang harus diperhatikan yaitu apakah variansi dari kedua
kelompok ini sama atau tidak yang dapat diketahui dengan uji variansi.

Uji independen t-test ini memiliki beberapa kriteria, yaitu:

1. Jika  12 dan  22 diketahui maka statistik hitung:


Hipotesis Level signikan (  ) Statistik hitung Daerah Kritis Kesimpulan

H 0 : 1 = 2 H 0 ditolak jika
zhit  − z /2 atau
H1 : 1  2 zhit  z /2 Kesimpulan
diambil dengan
x1 − x2
H 0 : 1  2 Misal diambil zhit = melihat apakah
 12  22 H 0 ditolak jika
 = 0, 05 + zhit masuk pada
H1 : d  0 n1 n2 zhit  − z
daerah kritis atau
tidak
H 0 : d  0 H 0 ditolak jika

H1 : d  0 zhit  z

2. Jika  12 dan  22 tidak diketahui, dan diasumsikan  12   22


Maka uji-t menggunakan statistik hitung:

Hipotesis Level signikan (  ) Statistik hitung Daerah Kritis Kesimpulan

H 0 ditolak jika Kesimpulan


H 0 : 1 = 2 x1 − x2
Misal diambil thit = thit  −t( /2;n1 +n2 −2) diambil dengan
s12 s22
 = 0, 05 + melihat apakah
H1 : 1  2 n1 n2
atau
thit masuk pada
thit  −t( /2;n1 +n2 −2)
daerah kritis atau

55
H 0 : 1  2 H 0 ditolak jika
tidak

H1 : d  0 thit  −t( ;n1 + n2 −2)

H 0 : d  0 H 0 ditolak jika

H1 : d  0 thit  t( ;n1 + n2 −2)

3. Jika  12 dan  22 tidak diketahui, dan diasumsikan  12 =  22


Maka uji-t menggunakan statistik hitung:

Level signikan
Hipotesis Statistik hitung Daerah Kritis Kesimpulan
( )

H 0 ditolak jika
H 0 : 1 = 2
thit  −t( /2;n1 +n2 −2)
H1 : 1  2 x1 − x2
atau
Kesimpulan
thit = thit  −t( /2;n1 +n2 −2)
1 1 diambil dengan
s 2p +
Misal diambil n1 n2 melihat apakah
H 0 : 1  2
 = 0, 05 H 0 ditolak jika thit masuk
H1 : d  0
Dengan : thit  −t( ;n1 + n2 −2) pada daerah
kritis atau tidak
(n1 − 1) s12 + (n2 − 1) s22
H 0 : d  0 s 2p =
n1 + n2 − 2 H 0 ditolak jika

H1 : d  0 thit  t( ;n1 + n2 −2)

Sedangkan penggunaan SPSS hanya mengakomodir kondisi 2 dan 3, dimana  12 dan  22


tidak diketahui dan diestimasi dengan s12 dan s22 dengan hipotesis H 0 : 1 = 2 . Dengan
demikian kondisi 1 hanya bisa dilakukan dengan manual atau mungkin software yang lain.
Sedangkan mengetahui apakah variansi dari kedua kelompok itu sama atau tidak makan dapat
dilakukan inferensi perbandingan dua variansi.
Misalkan x11 , x12 ,..., x1n1 dan x21 , x22 ,..., x2 n1 adalah dua kelompok sampel random yang
saling independen satu sama lain yang berdistribusi normal dengan mean 1 dan 2 serta variansi
 12 dan  22 maka langkah-langkah uji hipotesis untuk perbandingan variansi dapat dilakukan
sebagai berikut:
1. Hipotesis

H 0 : 12 =  22

56
H1 : 12   22

2. Level signifikansi  = 0, 05 .
3. Statistik hitung:

s12
Fhit =
s22

Dengan F F
( ; n1 −1, n2 −1)
2

4. Daerah kritis

H 0 ditolak jika Fhit  F  atau Fhit  1/ F 


( ; n1 −1, n2 −1) ( ; n1 −1, n2 −1)
2 2

5. Kesimpulan

Sebagai contoh kasus adalah Dua jenis pupuk buatan telah dipergunakan diatas tanah
pertanian padi yang memiliki tingkat kesuburan maupun kondisi iklim yang kurang lebih sama.
Tujuan penggunaan puuk buatan diatas ialah untuk menguji apakah daya hasil salah satu jenis pupuk
buatan tersebut betl-betul berbeda dari pada yang lain. Penyelidik memilih secara random 12 petak
tanah pertanian dan memberinya dengan puuk buatan X 1 dan 12 petak tanah pertanian lainnya
untuk diberi pupuk buatan X 2 . Hasil pertambahan padi dalam kg diberikan sebagai berikut:

X1 31 34 29 26 32 35 38 34 30 29 32 31
X2 26 24 28 29 30 29 32 26 31 29 32 28

Langkah pertama yang harus kita kerjakan adalah menyiapkan data . Pada jendela variabel view bisa
diinputkan 2 variabel, yaitu Y: Hasil penambahan berat padi, dan Pupuk: jenis pupuk yang digunakan.
Pada pekerjaan ini Pupuk yang digunakan ada dua jenis, yaitu X1 dan X2, oleh sebab itu perlu
dideklarasikan pada value labels, yaitu 1 untuk Pupuk X1 dan 2 untuk Pupuk X2.

Mendahului uji hipotesisi untuk mean maka dilakukan uji kesamaan variansi yang dapat
dilakukan uji F dengan langkah-langkah sebagai berikut:

1. Hipotesis

H 0 : 12 =  22
H1 : 12   22

2. Level signifikansi  = 0, 05 .
3. P-value = 0,462
4. Daerah kritis

H 0 ditolak jika p − value  

57
5. Kesimpulan

Karena p − value   maka H 0 tidak ditolak yang berarti variansi kelompok pertama sama
dengan variansi kelompok kedua.

Dengan dipenuhinya asumsi kedua kelompok memiliki variansi yang sama maka uji hipotesis
perbedaan rata-rata kedua kelompok dapat dilakukan dengan langkah-langkah yang datanya diambil
dari baris Equal variances assumed.

1. Hipotesis

H 0 : 1 = 2
H1 : 1  2
2. Level signifikansi  = 0, 05 .
3. P-value = 0,015
4. Daerah kritis

H 0 ditolak jika p − value  


5. Kesimpulan

Karena p − value   (0,015<0,05) maka H 0 ditolak. Artinya rata-rata penambahan berat

padi menggunakan pupuk X1 tidak sama dengan rata-rata penambahan berat padi menggunakan
pupuk X2.

5.4. Aplikasi Uji Satu Nilai Proporsi Dengan Minitab 18

Contoh kasus :
Obat untuk ketegangan syaraf selama ini memiliki kefektifan 60%. Sebuah obat baru diuji
terhadap 100 pasien, 70 orang sembuh sehingga tingkat keefektifannya 70%. Apakah obat
baru tersebut bisa dikatakan lebih efektif dari obat lama?
Langkah-langkah :
1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60% atau tidak,
maka uji hipotesis yang dipilih adalah
H0 : p = 0.6 Taraf = 5% = 0,05
H1 : p > 0.6

2. Untuk menguji pilih menu Stat → Basic Statistics → 1 Proportion

58
Gambar 5.2 Menu 1 Proportion

3. Kemudian dialog box One-Sample Proportion seperti pada gambar. Dan pada dialog
box options pilih Proportion > Hypothesized Proportion dalam Alternative
Hypothesis dan metode yang digunakan mendekati distribusi normal.

Gambar 5.3 Window One-sample Proportion

59
Gambar 5.4 Window One-sample Proportion : Options
4. Output dari analisis ini terdapat pada window session seperti sebagai berikut.

Dari hasil yang telah didapat menunjukkan nilai z masuk ke dalam wilaya kritik karena P-
value = 0.021 < 0.05 sehingga dapat disimpulkan bahwa tingkat kefektifan obat baru lebih
tinggi dari obat lama.

60
61
5.5. Pengujian Perbandingan Dua
Proporsi
Contoh Kasus :
Suatu penelitian dilakukan untuk melihat proporsi lulusan SMA kotamadya Bandung (p1)
yang akan melanjutkan ke PT (Perguruan Tinggi) lebih tinggi dari lulusan SMA kabupaten
Bandung (P2) yang akan melanjutkan ke PT dengan taraf 2,5%. Dari sampel acak yang
diambil, diperoleh hasil bahwa dari 200 lulusan asal kotamadya, 120 orang akan melanjutkan
ke PT. Sedangkan dari 500 lulusan asal kabupaten, 240 orang akan melanjutkan ke PT.

Langkah-langkah :

1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya Bandung(p1) yang
akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan smu
kabupaten Bandung(p2), maka uji hipotesis yang dipilih adalah
H0 : p1 = p2 atau H0 : p1 – p2 = 0
H1 : p1 > p2 atau H0 : p1 – p2 > 0
Taraf = 5% = 0,025 → selang kepercayaan = 97,5 %
2. Pilih menu Stat→ Basic Statistic→ s 2 Proportions, lalu akan menampilkan kota
dialog seperti pada gambar.

Gambar 5.5 Window Two Sample Proportions

3. Klik box Options dan ubah Confidence Level menjadi 97.5% karena harga taraf
dalam kasus sebesar 2.5% serta alternative hypothesis menjadi difference >
hypothesized difference.
62
Gambar 5.6 Two Saple Proportions Options

4. Klik OK pada setiap window dan akan menujukkan output sebagai berikut.

Pada output yang dihasilkan menunjukkan nilai P-value = 0.002 < 0.025 sehingga H0
tidat tertolak. Dengan kata lain, proporsi lulusan siswa SMA Kotamadya yang
melanjutkan ke PT lebih tinggi daripada luluasan siswa SMA Kabupaten.

63
BAB VI ANALISIS KORELASI

Koefisien korelasi Pearson berguna untuk mengukur tingkat keeratan hubungan linear antara
dua variable. Nilai korelasi berkisar antara -1 samapai +1. Nilai korelasi negatif berarti
hubungan antara 2 variabel adalah negatif. Artinya, bila salah satu variable menurun, maka
variable lainnya akan meningkat. Sebaliknya, nilai korelasi positif berarti hubungan antara
kedua variable adalah positif. Artinya bila salah satu variable meningkat, maka variable
lainnya meningkat pula. Suatu hubungan antara 2 variabel dikatakan berkorelasi kuat apabila
makin mendekati 1 atau (-1). Sebaliknya, suatu hubungan dikatakan lemah apabila semakin
mendekati 0 (nol). Hipotesis uji korelasi ini adalah sebagai berikut:
H0 :  = 0
H1 :   0
Dengan adalah korelasi antara 2 variabel.
Sedangkan daerah penolakannya adalah:
P-value < 
Untuk membuat interpretasi analisis korelasi, ada beberapa hal yang harus diingat, yaitu:
1. Koefisien korelasi hanya mengukur hubungan linear. Jika ada hubngan nonlinear,
maka koefisien korelasi akan bernilai 0.
2. Koefisien korelasi sangat sensitif terhadap nilai ekstrim.
3. Hanya untuk variabel yang memiliki hubungan sebab akibat.
Dalam contoh analisis korelasi ini menggunakan data karbon monoksida yang dihasilkan dari
nikotin suatu rokok untuk mengetahui hubungan kedua variabel tersebut. Langkah-langkah
menghitung korelasi antara dua variabel dengan menggunakan Minitab 18 adalah sebagai
berikut:
1. Pilih Stat > Basic Statistics > Correlation
2. Pada kotak dialog, letakkan variabel karbon monoksida dan nikotin per bulan pada
kolom di bawah Variables.

64
Gambar 8.1 Dialog Box Correlation
3. Untuk menampilakn nilai correlation dan P-value, pilih Display p-value, klik OK.
Selanjutnya output analisis korelasi yang akan ditampilkan dalam windows session. Output
ini menunjukkan nilai korelasi antara karbon monoksida dan nikotin sebesar 0.926. Seperti
yang telah dijelaskan, bila nilai korelasi Pearson semakin mendekati 1 atau (-1), berarti
hubungan antara kedua variabel semakin erat. Karena nilai korelasi antara karbon monoksida
dan nikotin bernilai 0.926, maka hubungan antara kedua variabel diduga erat.

Correlations

Pearson correlation 0.926

P-value 0.000

Hal tersebut dapat dibuktikan pula dengan uji hipotesis yang sebelumnya menyatakan bahwa
korelasi antara dua variabel dalam hipotesis awal tidak memiliki nilai sehingga tidak ada
hubungan antar variabel. Sedangkan pada hipotesis alternatif, korelasi antara dua variabel
tidak bernilai nol sehingga dapat dikatakan antar variabel memiliki hubungan. Hal ini dapat
dindikasikan dengan P-value untuk menentukan hipotesis awal tertolak atau tidak. Seperti
yang telah dikatakan sebelumnya, bila P-value berada di bawah α maka berada dalam area
penolakan.

Berdasarkan hasil analisis korelasi juga memperlihatkan bahwa nilai P-value adalah 0 yang
artinya P-value jatuh di daerah penolakan sehingga keputusannya adalah menolak hipotesis
awal yang mengatakan bahwa tidak ada korelasi antara karbon monoksida dan nikotin.
Dengan kata lain, menerima hipotesis alternatif. Oleh karena itu, kesimpulan yang didapat
dari uji hipotesis adalah antara karbon monoksida dengan nikotin ada hubunggan erat, yaitu
sekitar 92.6%
65
BAB VII ANALISIS REGRESI LINEAR SEDERHANA

6.1. Regresi
Dalam pembahasan masalah penelitian biasanya dapat dijelaskan oleh dua atau lebih variabel
yang saling berhubungan satu sama lain. Variabel-variabel yang saling berhubungan tersebut
membentuk suatu persamaan matematis yang dapat digunakan untuk menentukan nilai
sebuah variabel yang bergantung pada nilai variabel yang lain. Dalam statistika, hubungan
fungsional antara variabel respons ( dinotasikan Y ) dengan variabel prediktor ( dinotasikan
X ) disebut regresi antara Y dan X. Dengan demikian analisis regresi berguna dalam berbagai
penelitian antara lain :

• Model regresi dapat digunakan untuk mengukur kekuatan hubungan antara variabel
respons dan variabel prediktor.
• Model regresi dapat digunakan untuk mengetahui pengaruh suatu atau beberapa
variabel prediktor terhadap variabel respons.
• Model regresi berguna untuk memprediksi pengaruh suatu variabel atau beberapa
variabel prediktor terhadap variabel respons.

6.2. Model Regresi Linear Sederhana

Persamaan matematika regresi linear sederhana adalah sebagai berikut :


y = 0 + 1 x + 

 0 dan 1 merupakan parameter model dan adalah residual model


Nilai ԑ selalu berubah-ubah pada setiap x sehingga sulit untuk ditebak, model ini kemudian
diprediksi oleh y = b0 + b1 x dengan metode kuadrat terkecil yaitu untuk meminimasi jumlah

kuadrat error (( y − y) )


i
2

Selain itu, nilai koefisien korelasi determinasi R 2 yang memiliki nilai 0 sampai 1 juga dapat
digunakan untuk melihat seberapa baik model regresi yang akan diperoleh dengan persamaan
sebagai berikut :

( y − y )
2

R 2
=
( y − y )
2

66
6.3. Aplikasi Regresi Linear Dalam Minitab 18

Untuk memahami analisis regresi linear sederhana, contoh kali ini menggunakan data dalam
tabel 6.1 yang merupakan hasil penelitian mengetahui pengaruh kandungan nikotin suatu
rokok terhadap kesehatan manusia. Berikut adalah data mengenai jumlah nikotin dalam
rokok dan karbon monoksia yang dihasilkan pada 25 merk rokok.
Tabel 6.1 Kandungan Nikotin dan Karbon Monoksida Dalam Rokok
Karbon Karbon
Nikotin Nikotin
Monoksida Monoksida
(mg) (mg)
(mg) (mg)
13.6 0.86 10.2 0.78
16.6 1.06 9.5 0.74
23.5 2.03 1.5 0.13
10.2 0.67 18.5 1.26
5.4 0.4 12.6 1.08
15 1.04 17.5 0.96
9 0.76 4.9 0.42
12.3 0.95 15.9 1.01
16.3 1.12 8.5 0.61
15.4 1.02 10.6 0.69
13 1.01 13.9 1.02
14.4 0.9 14.9 0.82
10 0.57

Dalam penaksiran garis regresi linear ini, kandungan nikotin dalam rokok digunakan untuk
mengukur karbon monoksida. Dengan kata lain, nikotin merupakan variabel prediktor (x)
sedangkan karbon monoksida sebagai variabel respons (y).
Agar model yang dibuat tidak menyimpang jauh, hal pertama yang dilakukan untuk
melakukan analisis regresi adalah memprediksi model.
1. Sebelumnya input data tersebut ke dalam dua kolom, yaitu C1 dan C2 seperti pada
gambar.

67
Gambar 6.1 Input Data

2. Langkah untuk menaksir garis regresi dimulai pada menu Stat → Regression →
Fitted
Line Plot.

Gambar 6.2 Menu Fitted Line Plot

68
3. Kemudian isi kan box pada window Fitted Line Plot seperti di bawah ini.

Gambar 6.3 Window Fitted Line Plot

4. Selanjutnya akan muncul ouput grafik Fitted Line Spot dan Regression Analysis
pada window Session.

Gambar 6.4 Output Prediksi Model Regresi

69
Pada grafik Fitted Line Spot menjunjukkan taksiran garis regresi untuk model regresi linear.
Selain itu, pada window Session juga ditampilkan hasil taksiran parameter model regresi
linearnya, yaitu : = 1.665 + 12.40 . Kemudian, Standar Deviasi model (S) dan Koefisien
Determinasi (R2) masing-masing sebesar 1.83 dan 85.7%.

Selain itu, output ini juga menunjukkan ANOVA yang berguna untuk memeriksa kecukupan
model regresi linear yang telah dibuat. Suatu model regresi dikatakan sudah mewakili data
apabila P-value model regresi dalam ANOVA tidak melebihi level toleransi (α) yan telah
ditetapkan.

6.4. Analisis Regresi Linear Sederhana Dalam Minitab

Setelah mengetahui taksiran model yang tepat digunakan adalah regresi linear, kita dapat
melakukan analisis regresi secara memperdalam dengan jalan sebagai berikut:

1. Pilih menu Stat → Regression → Regression → Fit Regression Model akan


menampilkan window Regression. Dalam box Response isikan variabel Karbon
monokisida dan variabel Nikotin pada box Predictors.

Gambar 6.5 Window Regression

70
2. Kemudian klik Graphs, select Regular pada Residual for plots, dan Normal
probability plot of residuals pada Residual plots untuk menampilkan grafik residual.
Lalu klik OK.

Gambar 6.6 Window Regression Graph

3. Selanjutnya untuk menampilkan model regresi, ANOVA, dan unsual observation, klik
Results pada window Regressions. Kemudian select output yang diinginkan seperti
pada gambar di bawah ini.

71
Gambar 6.7 Window Regression Results

4. Kemudian klik Storage pada window Regression, ceklis Fits dan Residuals seperti
pada gambar.

Gambar 6.8 Window Regression Storage

72
5. Lalu klik OK pada setiap window. Output dari langkah-langkah ini berupa grafik
residual dan tabel ANOVA, Regression Equation, Unsual Observsation pada window
Session.

Gambar 6.9 Grafik Regresi

73
74
Dari persamaan regresi yang di dapat, yaitu: = 1.665 x + 12.4 memperlihatkan b0 sebesar
1.665 dan taksiran parameter dari b1 sebesar 12.3. Hal ini berarti kandungan nikotin dalam
rokok memperngaruhi peningkatan pengaruh karbonmoksida yang diahasilkan sebesar 12.4
kali. Angka 1.665 menunjukkan bahwa besar kandungan karbonmonoksida ketika kandungan
nikotin bernilai 0 (nol).
Pada model regresi, ada asumsi bahwa distribusi residual mengikuti distribusi normal
dengan rata-rata dan standar deviasi sekecil mungkin. Semakin kecil standar deviasi residual
berarti nilai taksiran model makin mendekati nilai sebenarnya.
Dalam regresi ada pula istilah Mean Square Error (MSE) yang merupakan carian
residual (s2). Perlu diingat bahwa varian residual adalah kuadrat standar deviasi. Dari nilai
MSE untuk model yang telah dibuat adalah 3.34 sehingga nilai standar deviasinya adalah:
s = 3.34 = 1.83
Nilai 1.83 berarti bahwa sebagian besar kandungan nikotin dalam suatu rokok akan jatuh di
sekitar 2s = 3.66. ANOVA sebenarnya merupakan uji hipotesis kesesuaian model dengan
data yang ada. Dalam hal ini, hipotesisnya adalah:

H0 : Ada salah satu parameter model (β0 atau β1) bernilai nol.
H1 : Parameter model (β0 atau β1) tidak nol.

Hipotesis awal menandakan model yang dibuat tidak sesuai dengan data. Sebaliknya,
hipotesis alternatif berarti model yang dibuat sesuai dengan data.
Uji kesesuaian model menggunakan P-value memiliki daerah penolakan pada :
p − value  
Pada analisis regresi ini, kita menentukan level toleransi (  ) sebesar 0.005.
Selain itu, uji kesesuaian model dapat juga menggunakan statistik F yang daerah
penolakannya adalah sebagai berikut:
Fhit  F( ;v1 ,v2 )

Pada tabel ANOVA menunjukkan statistik F sebesar 138.27. Bila digunakan α sebesar 5%,
maka nilai F(5%,1,23) = 4.28 yang ditunjukkan dari tabel (F)... yang ada di dalam lampiran.
Sehingga nilai statistik F memenuhi daerah penolakan. Dengan kata lain menolak hipotesis
awal.

Berarti hasil analisis secara statistis tidak ada parameter model bernilai nol yang
menunjukkan bahwa model regresi linear sederhana ini bisa dikatakan telah mewakili data.

75
6.5. Memeriksa Utilitas Model

Hubungan kandungan nikotin dalam suatu rokok dengan karbon monoksida yang dihasilkan
rokok perlu diperiksa secara statistik. Oleh karena itu, parameternya perlu diuji dan
dibandingkan dengan level toleransi ( ) yang ditentukan.

Kali ini uji parameter model dilakukan dengan menggunakan statistic t. Adapun hipotesis
dalam melaksanakan uji parameter ini adalah:
H 0 : 1  0

H1 : 1  0

Hipotesis awal (H0) pada hipotesis adalah parameter 1 ( 1 = 0) tidak ada dalam model

regresi dan hipotesis aleternatif adalah parameter β1 ada dalam model. Nilai statistic t juga
dapat dikonversikan ke dalam P-value. Bila menggunakan P-value, maka daerah
penolakannya adalah P-value < level toleransi (α).

Untuk daerah penolakannya sendiri adalah:


t | t( /2;df ) |

Dalam hal ini:


df = n − (k + 1)
df: degree of freedom/ derajat bebas
n : banyaknya pengamatan
k : banyaknya parameter

Output yang ditampilkan pada tabel Coefficient menunjukkan bahwa statistik t untuk variabel
kandungan nikotin dalam rokok adalah 11.76 dan P-value bernilai 0. Derajat bebas pada
analisis ini sebesar 23. Dari tabel T ..., kita dapat mengetahui statisik t untuk level toleransi
0.05 dan derajat bebas sebesar 23 (t (0.05,23) adalah 1.714. Hal ini menandakan nilai t-value
lebih besar dari (t (0.05,23) sehingga dapat disimpulkan menolak hipotesis awal pada level
toleransi 0.05. Oleh karena itu, dugaan adanya pengaruh kandungan nikotin dalam rokok
terhadap karbon monoksida yang dihasilkan oleh suatu rokok dapat diterima.

76
6.6. Memeriksa Ukuran Kecukupan Model

Untuk mengukur kecukupan regresi, dapat dilihat pada koefisien determinasi (R 2). Koefisien
determinasi menjelaskan besarnya variasi respons yang dapat dipengaruhi oleh prediktor.
Nilai ini dapat dilihat pada tabel Model Summary.

Nilai koefisien determinasi model regresi adalah 85.74% yang artinya sebanyak 85.74%
variasi sample jumlah karbon monoksida yang dihasilkan oleh suatu rokok dipengaruhi oleh
kandungan nikotin dalam rokok. Koefisien korelasi, R, merupakan akar koefisien determinasi
yang menjelaskan hubungan linear antara variabel respons dan prediktor. Nilai R berkisar 0
sampai dengan 1 yang besarnya semakin mendekati 1 berarti hubungan antarvariabel makin
kuat. Dalam hal ini, koefisien korelasinya sebesar:
r = 0.8674 = 0.926

Dari sini dapat diketahui bahwa ada hubungan linear yang kuat antara kandungan nikotin
dalam rokok dengan jumlah karbon monoksida yang dihasilkannya.

Makin banyak variabel yang dimasukkan dalam model, makin meningkat nilai R 2. Di sisi
lain, semakin banyaknya variabel ini menyebabkan model menjadi tidak efisien. Untuk itu,
R2 perlu ditingkatkan sensifitasnya, dalam hal ini ditunjukkan pada nilai R2 adjusted. R2
adjusted disesuaikan dengan jumlah variabel yang dimasukkan ke dalam model pada kasus
ini sebesar 85.12%. perbedaan angka antara R2 dan R2 adjusted tidak berbeda jauh karena
jumlah variabel dalam model hanya ada 1.

6.7. Membuat Nilai Taksiran

Pada window Worksheet terdapat nilai taksiran dan residual model data pengamatan yang
masing-masing ditampilkan dalam kolom C3 dan C4 seperti pada gambar.

Output tersebut memperlihatkan bahwa untuk kandungan nikotin 0.86 mg, perkiraan jumlah
karbon monoksida yang dihasilkan suatu rokok sebesar 12.32 mg begitu pula seterusnya.
Nilai-nilai taksiran dapat digunakan untuk menghitung nilai residual, sedangkan nilai residual
digunakan untuk mendiagnosis model regresi.

77
Gambar 6.10 Fits and Residual

Diagnosis model dilakukan dengan memeriksa kesesuaian residual dengan asumsi yang
disyaratkan. Untuk mendiagnosis model, diperlukan pemeriksaan distribusi residual beserta
parameter-parameternya. Dalam hal ini, distribusi yang diinginkan adalah distribusi normal.

6.8. Interpretasi Gambar

Pada plot kenormalan residual, bila titik yang dihasilkan telah sesuai atau mendekati garis
lurus yang ditentukan berdasarkan data (residual), maka residual dapat dikatakan telah
mengikuti distribusi normal. Namun hal ini hanya sebatas keputusan secara visual sehingga
dibutuhkan bukti secara statistis dengan melakukan uji kenormalan data secara kuantitatif.
Dengan kata lain, residual model regresi linear sederhana yang dibuat telah mengiktui
distribusi normal yang diinginkan sesuai dengan asumsi model regresi.

Data residual model yang akan diuji berada pada kolom C3. Residual ini merupakan hasil
analisis regresi yang telah dilakukan sebelumnya. Langkah-langkan untuk melakukan uji
tersebut adalah sebagai berikut:

1. Pilih Stat → Basic Statistics → Normality Test. Kemudian akan muncul dialog box
dan isikan setiap kolom seperti pada gambar ....

78
Gambar 6.11 Window Normality Test

2. Selanjutnya klik OK dan akan menampilkan grafik uji kenormalan residual seperti
pada gambar di bawah ini.

Gambar 6.12 Grafik Regresi Dengan Nilai Statistik

79
Pada plot residual kali ini ditampilkan hasil perhitungan statistik uji yang terletak di pojok
kanan atas. Hipotesis dalam uji kali ini adalah:
H0 : Residual berdistribusi normal
H1 : Residual tidak berdistribusi normal

Daerah penolakan KS > KS1-α pada sejumlah pengamatan (n) tertentu. Bila statistik
Kolmogorov-Smirnov dikonversikan ke dalam P-value, maka daerah penolakannya adalah P-
value < α.

Level toleransi (α) yang digunakan pada uji Kolmogorov-Smirnov sebesar 0.05. Dari sini
dapat diketahui bahwa nilai statistik yang ditunjukkan pada tabel KM .... senilai 0.264 untuk
α = 0.05 dan jumlah pengamatan sebanyak 25. Nilai ini yang selanjutnya dijadikan sebagai
patokan terhadap nilai statistik uji Kolmogorov-Smirnov dan P-value yang diperoleh masing-
masing 0.137 dan > 0.15.

Berdasarkan nilai yang didapat menunjukkan bahwa nilai dari pengamatan kurang dari nilai
statistik Kolmogorov-Smirnov pada tabel .... Oleh karen itu, kesimpulan yang dapat ditarik
dari uji kenormalan ini adalah residual model regresi linear yang dibuat telah mengikuti
distribusi normal sehingga asumsi kenormalan residual pada model ini telah terpenuhi.

80
BAB VIII REGRESI LINIER BERGANDA (MULTIPLE LINEAR
REGRESSION)

Berikut kekuatan ikatan kawat dalam proses pembuatan semikonduktor, panjang kawat, dan
tinggi cetakan logam untuk menggambarkan membangun model empiris. Digunakan data yang
sama, diulangi untuk memudahkan dalam tabel di bawah, dan menunjukkan detail estimasi
parameter model. Plot tiga dimensi dari data disajikan berikut menunjukkan matriks dua dimensi
sebar plot data. Tampilan ini dapat membantu dalam memvisualisasikan hubungan antar variabel
dalam set data multivariabel.
Tarikan Panjang kawat Tinggi cetakan logam
No y x1 x2
1 9.95 2 50
2 24.45 8 110
3 31.75 11 120
4 35 10 550
5 25.02 8 295
6 16.86 4 200
7 14.38 2 375
8 9.6 2 52
9 24.35 9 100
10 27.5 8 300
11 17.08 4 412
12 37 11 400
13 41.95 12 500
14 11.66 2 360
15 21.65 4 205
16 17.89 4 400
17 69 20 600
18 10.3 1 585

81
19 34.93 10 540
20 46.59 15 250
21 44.88 15 290
22 54.2 16 510
23 56.63 17 590
24 22.13 6 100
25 21.15 5 400

Tahapan yang akan dilakukan dalam model regresi berganda adalah sebagai berikut :
1. Analisis data
2. Uji asumsi yang harus dipenuhi
3. Kesimpulan

8.1 Analisis Data


A. Melihat scatter plot

Graph – Scatter plot – Simple

82
Scatterplot of y (tarikan) vs x1 (panjang kawat)
70

60

50
y (tarikan)

40

30

20

10

0 5 10 15 20
x1 (panjang kawat)

Scatterplot of y (tarikan) vs x2 (Tinggi cetakan logam)


70

60

50
y (tarikan)

40

30

20

10

0 100 200 300 400 500 600


x2 (Tinggi cetakan logam)

Perhatiakan grafik plot variabel independent X1 dan X2 masing-masing terhadap variabel


dependen Y. Untuk X1 dan Y tampak terdapat korelasi linier yang kuat, sedangkan X2 dan Y
tidak begitu kuat secara parsial.
B. Cek Korelasi

Stat-Basic Statistics – Correlation


Masukkan semua variabel ke dalam box, pilih pearson correlation, ok

83
Dapat dilihat bahwa besaran korelasi antara Y dan X1 sebesar 0.982. Hal ini menunjukkan
korelasi yang sangat kuat antara Y dan X1. Sebalikanya angka korelasi X1 dan Y adalah 0.493
yang dikatakan cukup. Untuk itu selanjutnya dilakukan analisi regresi dan dilihat apakah kedua
variabel ini baik dalam membentuk persamaan regresi secara Bersama-sama terhadap variabel Y.

C. Buat Persamaan Regresi

Pilih Stat – Regression-Fit Regression Model-

Masukkan Y ke dalam variable respon

84
Pilih graphs, Cek list Histogram of residual, dan residual versus fits.
Pastikan semua di cek list di bagian result

Pilih storage, cek list Fits dan Residual. Kemudian OK.


D. Analisis Output

Penggunaan Uji-F bertujuan mengetahui apakah variabel-variabel bebas (X1 dan X2 ) secara
signifikan bersama-sama berpengaruh terhadap variable tak bebas Y.

85
Pada tabel ini kita ingin melihat apakah kedua variable X1 dan X2 secara bersama-sama
mempengaruhi nilai Y. Kurang lebih kita ingin melihat apakah persamaan regresi yang telah
dibangun X1 dan X2 ini memiliki makna. Uji hipotesis yang dilakukan pada output ini adalah
sebagai berikut :
1. H0 : 1 = 2 = 0 (Semua beta/koefisien regresi dari X1 dan X2 bernilai 0)

H1 : ada i  0 (Minimal ada satu  yang tidak bernilai 0)

2. Tingkat signifikansi  = 0.05


3. Statistik hitung
p-value = 0.00
4. Daerah kritis
H0 ditolak jika p-value < 
5. Kesimpulan
Karena p-value <  maka H0 ditolak, maka berlaku minimal ada satu i  0 .

Apa yang terjadi jika p-value >  ??

R-sq ( r 2 ) adalah koefisien determinasi yang berarti prosentase pengaruh variable-variable X1


dan X2 terhadap variable Y digunakan. Apabila r 2 bernilai 0 , maka dalam model persamaan
regresi yang terbentuk, variasi variable tak bebas Y tidak sedikitpun dapat dijelaskan oleh variasi
variable-variable bebas X1 dan X2. Apabila r 2 bernilai 1, maka dalam model persamaan regresi
yang terbentuk, variable tak bebas Y secara sempurna dapat dijelaskan oleh variasi
variablevariable bebas X1 dan X2.

Pada tabel ini kita menganalisis signifikansi peran variable X1 dan X2 dengan menguji koefisien
X1 dan X2 sekaligus intercept-nya . Hal ini merupakan kelanjutan dari analisis variansi yang

86
menguji model regresi secara keseluruhan dimana hasil analisis sebelumnya menunjukkan bahwa
minimal ada i  0 . Maka kita akan menguji  0 , 1 dan  2 .

Contoh untuk uji hipotesis untuk 1

1. H0 : 1 = 0 (Koefisien regresi dari X1/ 1 bernilai 0)

H1 : 1  0 (Koefisien regresi X1 / 1 bernilai tidak 0)

2. Tingkat signifikansi  = 0.05


3. Statistik hitung
p-value = 0.00
4. Daerah kritis
H0 ditolak jika p-value < 
5. Kesimpulan
Karena p-value <  maka H0 ditolak, maka berlaku 1  0 atau koefisien regresi 1

bernilai tidak 0 yang artinya variable independent X1 (Panjang kawat) signifikan


berpengaruh pada Y ( kekuatan kawat).

Hal yang sama kita lakukan untuk  0 dan  2 dengan hasi kesimpulan yang sama yaitu

dengan diperolah p_value <  . Apabila dalam analisis ini terdapat koefisien i yang tidak

signifikan (p_value >  ) maka lakukan regresi ulang dengan mengeluarkan variabel koefisien
tersebut. Jika ada beberapa i yang tidak signifikan maka dikeluarkan variabel i dengan
angka p_value paling besar.
Dalam hal interpretasi  0 memiliki deskripsi yang berbeda.  0 hanya berarti bahwa

dalam kondisi X1 dan X2 sama dengan 0 maka Y akan bernilai sebesar  0 . Dalam garis regresi

nilai  0 merupakan intercept atau titik awal.

Pada output ini kita melihat bahwa masing-masing 0 = 2.26 , 1 = 2.7450 dan
2 = 0.01254 sedemikian sehingga persamaan regresi yang terbentuk adalah

y = 2.26 + 2.745x1 + 0.01254 x2 yang masing  0 , 1 dan  2 telah diuji signifikansinya.

87
8.2 Uji Asumsi
Beberapa asumsi meliputi normalitas regresi linear berganda adalah
1. Residual/eror berdistribusi normal.
2. Tidak ada autokorelasi antar eror.
3. Residual homogen
4. Tidak terjadi multikolinieritas atau dengan kata lain tidak ada hubungan linier antar
variable independent.

Jika salah satu asumsi diatas tidak terpenuhi maka harus ditangani terlebih dahulu. Masing-
masing pelanggaran pada asumsi diatas ditangani dengan metode yang berbeda-beda. Dalam hal
ini kita hanya membahas bagaimana cara mengecek bahwa model kita telah memenuhi asumsi-
asumsi diatas.
A. Residual/eror berdistribusi normal.

Untuk melihat apakah residual/ eror telah berdistribusi normal atau tidak maka kita telah
menyimpan dan memberikan perintah pada minitab untuk mengeluarkan histogram dari
resiudual dan menyimpan eror pada kertas kerja minitab.

Bentuk histogram dari angka residual diatas adalah sebagai berikut:

88
Histogram
(response is y (tarikan))

Frequency 5

0
-4 -2 0 2 4 6
Residual

Dengan demikian kita bisa menganalisis RESI (residual) dengan memberikan perintah uji
normalitas seperti yang kita bahas sebelumnya. Kita bisa mengguanakan (Anderson Darling atau
Kolmogorov Smirnov), stat -Basic Statistics -Normality Test, masukkan RESI pada kolom
‘variabel’, pilih metode yang diambil dan OK.

Maka diperoleh output sebagai berikut :

89
Dengan melakukan langkah-langkah uji hipotesis normalitas metode Anderson Darling sebagai
berikut:
1. H0 : Residual/eror berdistribusi normal
H1 : Residual/ eror tidak berdistribusi normal
2. Tingkat signifikansi  = 0.05
3. Statistik hitung
Diperoleh p_value  
4. Daerah kritis
H0 ditolak jika p_value < 
5. Kesimpulan
Karena p_value   maka H0 tidak ditolak. Artinya residual berdistribusi normal.
Dari Langkah uji hipotesis diatas persaamaan regresi yang dibentuk telah memenuhi asumsi
pertama, yaitu residual berdistribusi normal.
B. Tidak ada autokorelasi antar eror.

Asumsi yang kedua adalah tidak ternyadi autokorelasi ada eror yang artinya angka eror pada titik
tertentuk tidak mempengaruhi atau tidak berpengaruh pada eror sebelum atau sesudahnya.
Asumsi ini bisa dicek dengan melihat angka Durbin-Watson. Asumsi ini digunakan apabila data
yang digunakan dalam analisis adalah data time series (runtun waktu).
Dalam kasus ini data kita bukanlah data time series sedemikian sehingga uji asumsi ini tidak
diperlukan dalam analisis data ini. Sebagai pengetahuan untuk membaca angka durbin Watson
berikut diberikan angka durbin Watson dari analisis data:

90
Awal mula tentuka beberapa hal sebagai berikut.
n : Jumlah sampel (n)
K : Jumlah variabel
dL : Batas Bawah Durbin Watson (lihat tabel)
dU : Batas Atas Durbin Watson (lihat tabel)

Deteksi Autokorelasi Positif:


Jika d < dL maka terdapat autokorelasi positif,
Jika d > dU maka tidak terdapat autokorelasi positif,
Jika dL < d < dU maka pengujian tidak meyakinkan atau tidak dapat disimpulkan.

Deteksi Autokorelasi Negatif:


Jika (4 – d) < dL maka terdapat autokorelasi negatif,
Jika (4 – d) > dU maka tidak terdapat autokorelasi negatif,
Jika dL < (4 – d) < dU maka pengujian tidak meyakinkan atau tidak dapat disimpulkan

Untuk n=25, dengan K=2 diperoleh dL = 1.28791 dan dU = 1.45371. Sedangkan dari analisis
diperoleh angka durbin Watson d = 2.09776 maka d > dU sehingga tidak terdapat autokorelasi
positif, dan (4 – d) > dU maka tidak terdapat autokorelasi negative.

d dU dL 4-d
2.09776 1.28791 1.45371 1.90224
KesimpulanTidak ada
Autokorelasi Tidak ada
positif autokorelasi negatif

91
C. Residual Homogen

Untuk melihat homogenitas pada residual telah terpenuhi atau belum secara visual dapat
dilihat pada grafik nilai prediksi (FIT/ y ) terhadap residual. Dalam minitam ditampilkan dari
analisis sebagai berikut:

Secara visual titik-titik plota berada disekitar garis lurus. Hal ini menggambarkan bahwa
homogenitas pada residual telah terpenuhi atau dengan kata lain tidak terjadi heterogenitas pada
residual. Secara inferensial statistik uji homogenitas dalam dilakukan dengan uji Glejser yang
dilakukan secara manual, yaitu dengan meregresikan nilai predisksi (FIT ) terhadap nilai mutlak
residual.
Untuk itu kita perlu memutlakkan residual dengan menggunakan fungsi kalkulator sebagai
berikut :

Maka nilai absolut dari residual (RESI) diperoleh dalam bentuk variabel |resi|. Langkah
selanjutnya adalah meregresikan nilai prediksi (FIT) dengan |resi|. Lakukan Langkah-langkah
seperti meregresikan data biasa pada minitab lalu perhatikan hasil pada tabel koefisien.

92
Lalu perhatikan apakah koefisien |resi| dan juga angka prediksi FIT. Jika angka koefisien
signifikan maka telah terjadi heterogenitas dan sebaliknya jika angka koefisien tidak signifikan
artinya tidak terjadi heteroskedastisitas atau homogenitas residual terpenuhi. Uji hipotesisnya
diuraikan sebagai berikut :
1. H0 : Tidak terjadi heteroskedastisitas
H1 : Terjadi heteroskedastisitas.
2. Tingkat signifikansi  = 0.05
3. Statistik hitung
P_value = 0.929
4. Daerah kritis
H0 ditolak jika p_value < 
5. Kesimpulan
Karena p_value >  maka H0 tidak ditolak. Artinya tidak terjadi heteroskedastisitas.
Dengan kata lain homogenitas pada residual telah terpenuhi.

D. Tidak terjadi multikolinieritas antar variabel independent

Asumsi ke empat yang harus dipenuhi pada regresi adalah tidak ada hubungan linier antar
variable independent atau tidak terjadi multikolinieritas antar variabel independent. Dalam hal ini
Anda dapat melihat pada nilai VIF yang muncul pada tabel koefisien regresi apakah melibihi 10
atau tidak. Pada kasus analisis data ini tabel koefisien regresi diperoleh sebagai berikukt :

93
Pada tabel diatas kita melihat bahwa angka VIF kurang dari 10, oleh sebab itu tidak terjadi
korelasi linier antara X1 dan X2 . jika variabel independent lebih dari 2 maka disebut tidak
terjadi multikolinieritas.
Penanganan multikolinieritas pada model regresi berganda dilakukan dengan mengeluarkan
variabel independent dengan angka VIF paling tinggi, kamudian dilakukan regresi ulang
sedemikian sehingga keseluruhan variabel independent tidak saling terikat.
Uji Asumsi Cek list
Residual normal √
Tidak terjadi heteroskedastis √
Tidak terjadi autokorelasi antar √
residual
Tidak terjadi multikolinieritas √

KESIMPULAN
Model regresi yang terbentuk y = 2.26 + 2.745x1 + 0.01254 x2 telah memenuhi kaidah model
regresi dan juga telah memenuhi uji asumsi yang diperlukan pada regresi berganda. Untuk itu
model regresi ini dapat digunakan untuk memodelkan data kekuatan kawat sedemikian bisa
dimanfaatkan untuk mengestimasi atau meramal sejauh mana kekuatan kawat yang digunakan
pada produksi semikonduktor dengan diketahui Panjang kawat dan juga tinggi cetak logamnya.

94

Anda mungkin juga menyukai