Oleh :
1.3. Data
Data adalah sejumlah informasi yang dapat memberikan gambaran tentang suatu keadaan atau
masalah baik yang berupa angka maupun kategori seperti : baik buruk, tinggi, rendah dan
sebagainya.
Syarat data antara lain :
1. Objektif yang berarti data tersebut menggambarkan keadaan sebenarnya.
2. Relevan dengan permasalahn yang diteliti.
3. Sesuai jaman (up to date) sebab perubahan waktu dan teknologi dapat mengakibatkan
kejadian mengalami perubahan dengan cepat.
4. Representative terhadap populasinya
5. Sumbernya tepat dan dapat dipercaya.
Selanjutnya data dapat diklasifikasikan berdasarkan sifat, cara memperoleh, dan skala
pengukuran sebagai berikut :
Sampel adalah sebagian dari jumlah dan karakteristik yang dimiliki oleh polulasi tersebut.
Pada laman awal minitab terdapat dua window, yaitu session dan worksheet. Session
merupakan tempat untuk menampilkan semua perintah (command) yang telah dilakukan dalam
bentuk program dan hasil dari pengolahan data yang tidak dapat ditampilkan dalam worksheet.
Sedangkan worksheet sendiri adalah tempat untuk menginput data serta menampilkan hasil
pengolahan data.
Kegunaan Minitab:
1. Mengelola data dan file - spreadsheet untuk analisa data yang lebih baik.
2. Analisa regresi
3. Power dan ukuran sampel
Dalam minitab ini terdapat 11 menu bar beserta submenu diantaranya adalah :
1. File
Dalam menu file terdapat submenu file yang digunakan untuk membuka file, menginput data,
menyimpan pekerjaan, dan lainnya seperti berikut ini.
Worksheet Memindahkan data yang telah disalin baik dari sel, atau
Link file minitab atau word, excel, dan lain-lain.
Transpose Columns Mengubah data kolom menjadi baris dan juga sebaliknya.
Mengurutkan data (mengurutkan suatu kolom berdasarkan kolom
Sort
lainnya).
Rank Merangking data (membuat rangking suatu kolom).
Delete Rows Menghapus baris.
Erase Variables Menghapus variabel-variabel.
Recode Mengkonversi data (numerik ke numerik, numerik ke teks dsb).
Change Data Type Mengubah tipe data.
Date/Time Menginput data waktu.
Menggabung dua atau lebih kolom yang berisi data text menjadi satu
Concatenate
kolom, syarat penjang kolom sama.
Display Data Menampilkan data.
Submenu Fungsi
Untuk melakukan perhitungan (penjumlahan, perkalian,
Calculator
pembagian, sinus, maksimum, eksponen, dan lain-lain)
Columns
Menghitung ukuran-ukuran statistik dari suatu kolom
Statistics
Row Statistics Menghitung ukuran-ukuran statistik dari suatu baris
Standardize Menormalisasikan data
Make Patterned
Membuat suatu kolom(data) dengan pola tertentu
Data
Membuat sebuah fungsi dua dimensi seperti permukaan
Make Mesh Data
berdasarkan pasangan nilai x dan y
Make Indicator
Membuat variabel dummy untuk data kualitatif
Variables
Menetapkan titik awal untuk pembangkitan data acak. Bila kita
Set Base tidak mengeset titik tersebut, maka titik tersebut akan ditentukan
oleh minitab.
Random Data Membangkitkan data acak dari berbagai distribusi
Probability Menghitung peluang dan distribusi kumulatif peluang dan
Distributions inversnya dari berbagai distribusi peluang.
Matrices Menghitung matriks dan operasi-operasinya
Submenu Fungsi
Cascade Memunculkan setiap window yang aktif per layer.
Tile Memuncuklkan keseluruhan window yang aktif.
Minimize All Menutup tampilan window yang terbuka.
Restore Icons Membuka semua window yang telah ditutup.
Arrange Icons Menyusun tampilan icon di dasar window.
Refresh Menyegarkan semua window yang terbuka.
Close All Graphs Menutup semua window grafik.
Update All Graphs Now Memperbarui window grafik yang datanya diubah.
11. Assistant
Submenu dalam ini menu Assistant memudahkan user untuk memilih metode analisis yang
tepat dalam pengaplikasiannya terhadap data yang dimiliki user. Pemilihan metode-metode
tersebut sangat informatif dan mudah dipahami karena dalam bentuk flow chart.
Dalam penyajian statistika deskriptif terdapat beberapa ukuran statistik seperti ukuran
pemusatan, ukuran penyebaran, dan ukuran letak. Selain itu cara menyajikan data juga dapat
dilakukan dalam bentuk grafik histogram, box plot, stem and leaf diagram, beserta analisis
hasilnya.
1. Mean adalah rata-rata dari data dan dinotasikan dengan 𝑋̅ atau dimana menyatakan
rata-rata sampel dan menyatakan rata-rata populasi. Secara umum mean memiliki
rumusan sebagai berikut.
2. Median adalah nilai yang membagi suatu gugus data yang telah terurut menjadi 2
bagian yang sama. Median memiliki sifat bahwa di bawah nilai median terdapat 50%
data. Cara menentukan median sebagai berikut :
Misal X1, X2, …, Xn adalah data yang sudah terurut dari kecil ke besar;
maka untuk n ganjil, 𝑀𝑒𝑑 = 𝑋𝑛+1
2
1
dan untuk n genap, 𝑀𝑒𝑑 = 2 ( 𝑋𝑛 + 𝑋𝑛+1 )
2 2
3. Modus yaitu nilai yang paling sering muncul dalam suatu gugus data
Dalam penggunaannya, mean lebih sering digunakan dari pada ukuran pemusatan lainnya
karena keakuratannya dalam menentukan nilai tengah suatu gugus data, walaupun ada
beberapa kasus yang membuat nilai tengah menjadi kurang tangguh, misalkan ada nilai yang
dianggap ekstrim.
Σ(𝑋𝑖 − 𝑋̅)2
𝑆=√ , 𝑑𝑖𝑚𝑎𝑛𝑎 𝑛 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑠𝑎𝑚𝑝𝑒𝑙
𝑛−1
Σ(𝑋𝑖 − 𝑋̅)2
𝜎=√ , 𝑑𝑖𝑚𝑎𝑛𝑎 𝑁 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑝𝑜𝑝𝑢𝑙𝑎𝑠𝑖
𝑁
2.3. Ukuran Letak
Kuartil menyatakan nilai nilai yang membagi gugus data menjadi empat bagian yang sama
besar. Q1 menyatakan kuartil 1 yang memiliki sifat bahwa ¼ data terletak di bawah Q1. Q2
sama dengan median. Sedangkan Q3 memiliki sifat bahwa ¾ data terletak di bawah Q3. Untuk
ukuran letak yang lainnya adalah desil, persentil dll.
Dari ketiga bentuk penyajian data di atas, dapat dilihat bentuk distribusi data dapat berupa
simetri, menjulur ke kiri, atau ke kanan.
Pengolahan data dalam Minitab bisa dilakukan melalui menu Stat. Menu stat menyediakan
beberapa metode analisa statistik. Apabila membutuhkan analisa data melalui grafik, kita dapat
melakukannya melalui Graph dalam Minitab. Selain kedua menu tersebut, apabila pengguna
Minitab akan melakukan perhitungan matematika atau statistik tertentu atau memanipulasi data
sesuai dengan kebutuhan, maka kita dapat melakukannya melalui menu Data atau Calc. Output
analisa data ditampilkan melalui window session atau disimpan dalam worksheet. Jika
melakukan analisis grafik, maka window graph akan menampilkan outputnya.
Sebagai contoh dalam operasi statistika desktriptif dengan minitab 18, kali ini menggunakan
data score TOEFL dari 100 mahasiswa sebagai berikut :
2. Selanjutnya dari data tersebut kita dapat menyajikan ukuran-ukuran nilai dalam
statistika deskriptif dengan cara pilih menu Stat → Basic Statistics → Display
Descritive Statistics. Lalu akan menampilkan window Display Descriptive Statistics.
3. Select kolom C1 ke dalam kolom Variables dengan cara klik 2x pada C1.
5. Selain itu, dalam window Display Descriptive Statistics juga dapat menampilkan
grafik dengan cara memilih graphs. Kemudian tentukan jenis grafik yang ingin
ditampilkan, lalu klik OK.
Selain bentuk penyajian statistika seperti yang di atas, dapat pula dalam berbagai bentuk grafik
yang terdapat dalam menu Graphs.
Penyajian data dalam bentuk tabel juga dapat dilakukan dalam aplikasi minitab ini dengan cara
sebagai berikut :
1. Pilih menu Stat → Tables → Tally Individual Variables yang akan memunculkan
box Tally Individual Variables.
3. Klik OK pada window sehingga tabel dengan nilai yang telah ditentukan
sebelumnya ditampilkan dalam window Session.
2. Kemudian pilih menu Stat → Basic Statistics → Normality Test. Muncul window
Normality Test.
4. Klik OK pada window yang akan menampilkan grafik distibusi peluang normal dengan
metode Anderson-Darling.
Bila dilihat, data yang berdistribusi Normal akan simetris terhadap dan sebagaian besar data
akan mengelompok di tengah. Dalam kenyataannya seringkali bentuk data yang diperoleh tidak
berbentuk seperti distribusi normal tetapi berbentuk menjulur ke kanan seperti gambar berikut:
Untuk memilih fungsi transformasi yang tepat digunakan tangga transformasi Tukey yang
digambarkan sebagai berikut :
Transformasi 10x akan membuat bentuk distribusi data menjadi menjulur ke kanan secara kuat,
1
sedangkan transformasi − 𝑥 2 akan membuat bentuk distribusi data menjadi menjulur ke kiri
secara kuat. Sebagai contoh bila data yang dimiliki menjulur ke kanan secara lemah maka
gunakan transformasi √𝑥 agar data dapat menjadi Normal. Sebaliknya bila data menjulur
kekanan secara sedang maka transformasi x3 agar data menjadi Normal. Penentuan bahwa
suatu data menjulur secara lemah, sedang atau kuat besifat subyektif sehingga akan lebih baik
bila digunakan beberapa transformasi sekaligus kemudian dibandingkan hasilnya. Penentuan
hasil kenormalan transformasi dilakukan melalui uji kenormalan.
0.5 𝑥
1 log 𝑥
1
1.5 −
𝑥
1
2 − 2
𝑥
2. Buat histogram dengan kurva kenormalan dari menu Graph → Histogram → pilih
tipe histogram With Fit, lalu klik OK.
6. Ulangi langkah 2-4 untuk data kolom C2. Dari hasil transformasi √𝑥, diperoleh kurva
distribusi dan nilai P-value < 0.005 yang menunjukkan masih belum memiliki distribusi
normal.
Dari kedua transformasi diatas dapat dilihat bahwa data yang sebelumnya menjulur kekanan
secara sedang, dengan transformasi √𝑥 bentuk data menjadi menjulur ke kanan secara lemah,
sedangkan dengan transformasi log 𝑥 data menjadi normal. Nantinya yang diolah dengan
statistik adalah data log 𝑥 bukan data aslinya.
Sebagai eksperimen lainnya, lakukan tranformasi x2 dan x3, simpan datanya masing-masing
pada C4 dan C5 kemudian buat histogram maka diperoleh bentuk data akan semakin menjulur
kekanan seperti ditunjukkan dari histogram berikut.
Dalam uji hipotesis sering digunakan istilah menerima atau menolak hipotesis yang
dirumuskan, artinya jika diterima maka hipotesis yang dirumuskan benar dan jika ditolak maka
berlaku sebaliknya. Dari hal tersebut, dapat dikatakan bahwa perumusan suatu hipotesis sering
dipengaruhi oleh bentuk peluang dari kesimpulan yang salah. Hipotesis yang dirumuskan
dengan harapan akan ditolek disebut hipotesi nol. Penolakan terhadap hipotesis nol tersebut
akan mengakibatkan pada penerimaan terhadap suatu hipotesis lain yang disebut hipotesis
alternatif.
Dalam kesalahan type I, yaitu α dapat disebut sebagai taraf (derajat) signifikansi yang nilainya
ditentukan oleh peluang diambilnya. Semakin kecil tingkat peluang kemelesetannya, semakin
tinggi keberartiannya. Contohnya, niai α = 0.05 menunjukkan kemelesetan atau kekeliruan
yang terjadi hanya sebanyak 5 kali dalam 100 kali pengamatan.
Sifat dari pengujian hipotesis nol melawan hipotesis alternatif ada dua yaitu :
1. Hipotesis alternatif yang bersifat dua arah
H0 : θ = θ0
H1 : θ θ0
Pada hipotesis jenis ini, wilayah kritisnya terbagi menjadi dua bagian, yaitu wilayah yang
letaknya pada masing-masing ujung dari sebaran statistik ujinya.
Wilayah kritis untuk poin a terletak seluruhnya di ekor sebelah kanan dari sebaran statistik
ujinya. Sedangkan untuk poin b sebaliknya.
Dalam menentukan keputusan akhir untuk menerima atau menolak H0, didasarkan pada
wilayah kritis α dengan P-value yang mendukung keberartian suatu uji dalam bentuk peluang.
𝑥̅ − 𝜇0 Z < -zα
𝑍= 𝜎 < 0
⁄ 𝑛 Z > zα
√ > 0
Z < -zα/2 dan
diketahui, 0
Z > zα/2
n ≥ 30
= 0
𝑥̅ − 𝜇0
𝑇= 𝑠 T < -tα
⁄ 𝑛 < 0
√ T > tα
> 0 T < -tα/2 dan
db = n – 1 ,
0
diketahui, T > tα/2
n ≥ 30
(𝑥̅1 − 𝑥̅2 ) − 𝑑0 Z < -zα
𝑍= 1 - 2 < d0
√(𝜎1 2 ⁄𝑛1 ) + (𝜎2 2 ⁄𝑛2 ) Z > zα
1 - 2 > d0
Z < -zα/2 dan
1 dan 2 diketahui, 1 - 2 d0
Z > zα/2
n > 30
1 - 0 = d0
(𝑥̅1 − 𝑥̅2 ) − 𝑑0 T < -tα
𝑇= 1 - 2 < d0
T > tα
𝑆𝑃 √(1⁄𝑛1 ) + (1⁄𝑛2 ) 1 - 2 > d0 T < -tα/2 dan
db = n1 + n2 - 2 1 - 2 d0
T > tα/2
1 = 2 tetapi tidak diketahui,
𝑥 − 𝑛𝑝0
𝑍= Z < -zα
√𝑛𝑝0 (1 − 𝑝0 ) P < P0
P = P0 Z > zα
P > P0
Dengan : Z < -zα/2 dan
𝑥 P P0
Z > zα/2
𝑝0 =
𝑛
(𝑝1 − 𝑝2 ) − 𝑑0
𝑍=
√𝑝𝑞(1⁄𝑛1 ) + (1⁄𝑛2 ) Z < -zα
P1 - P2 < d0
Dengan : Z > zα
P1 – P2 = d0 P1 - P2 > d0
𝑥1 𝑥2 Z < -zα/2 dan
𝑝1 = ; 𝑝2 = P1 - P2 d0
𝑛1 𝑛2 Z > zα/2
𝑥1 + 𝑥2
𝑝= ; 𝑞 =1−𝑝
𝑛1 + 𝑛2
Langkah-langkah :
1. Karena yang ingin disimpulkan adalah tingkat keefektifan obat baru > 60% atau tidak,
maka uji hipotesis yang dipilih adalah
H0 : p = 0.6 Taraf = 5% = 0,05
H1 : p > 0.6
3. Kemudian dialog box One-Sample Proportion seperti pada gambar. Dan pada dialog
box options pilih Proportion > Hypothesized Proportion dalam Alternative
Hypothesis dan metode yang digunakan mendekati distribusi normal.
4. Output dari analisis ini terdapat pada window session seperti sebagai berikut.
Dari hasil yang telah didapat menunjukkan nilai z masuk ke dalam wilaya kritik karena P-value
= 0.021 < 0.05 sehingga dapat disimpulkan bahwa tingkat kefektifan obat baru lebih tinggi dari
obat lama.
Langkah-langkah :
1. Karena yang ingin disimpulkan proporsi lulusan smu kotamadya Bandung(p1) yang
akan melanjutkan ke PT(Perguruan Tinggi) lebih tinggi daripada proporsi lulusan smu
kabupaten Bandung(p2), maka uji hipotesis yang dipilih adalah
H0 : p1 = p2 atau H0 : p1 – p2 = 0
H1 : p1 > p2 atau H0 : p1 – p2 > 0
Taraf = 5% = 0,025 → selang kepercayaan = 97,5 %
2. Pilih menu Stat → Basic Statistics → 2 Proportions, lalu akan menampilkan kota
dialog seperti pada gambar.
3. Klik box Options dan ubah Confidence Level menjadi 97.5% karena harga taraf dalam
kasus sebesar 2.5% serta alternative hypothesis menjadi difference > hypothesized
difference.
4. Klik OK pada setiap window dan akan menujukkan output sebagai berikut.
Pada output yang dihasilkan menunjukkan nilai P-value = 0.002 < 0.025 sehingga H0 tidat
tertolak. Dengan kata lain, proporsi lulusan siswa SMA Kotamadya yang melanjutkan ke
PT lebih tinggi daripada luluasan siswa SMA Kabupaten.
6.1. Regresi
Dalam pembahasan masalah penelitian biasanya dapat dijelaskan oleh dua atau lebih variabel
yang saling berhubungan satu sama lain. Variabel-variabel yang saling berhubungan tersebut
membentuk suatu persamaan matematis yang dapat digunakan untuk menentukan nilai sebuah
variabel yang bergantung pada nilai variabel yang lain. Dalam statistika, hubungan fungsional
antara variabel respons ( dinotasikan Y ) dengan variabel prediktor ( dinotasikan X ) disebut
regresi antara Y dan X. Dengan demikian analisis regresi berguna dalam berbagai penelitian
antara lain :
• Model regresi dapat digunakan untuk mengukur kekuatan hubungan antara variabel
respons dan variabel prediktor.
• Model regresi dapat digunakan untuk mengetahui pengaruh suatu atau beberapa
variabel prediktor terhadap variabel respons.
• Model regresi berguna untuk memprediksi pengaruh suatu variabel atau beberapa
variabel prediktor terhadap variabel respons.
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝜀
β0 dan β1 merupakan parameter model dan 𝜀 adalah residual model
Nilai ԑ selalu berubah-ubah pada setiap x sehingga sulit untuk ditebak, model ini kemudian
diprediksi oleh 𝑦̂ = 𝑏0 + 𝑏1 𝑥 dengan metode kuadrat terkecil yaitu untuk meminimasi jumlah
kuadrat error (Σ(𝑦𝑖 − 𝑦̂)2 ).
Selain itu, nilai koefisien korelasi determinasi R2 yang memiliki nilai 0 sampai 1 juga dapat
digunakan untuk melihat seberapa baik model regresi yang akan diperoleh dengan persamaan
sebagai berikut :
2
2
Σ(𝑦̂ − 𝑦 )
𝑅 = 2
Σ(𝑦 − 𝑦 )
Dalam penaksiran garis regresi linear ini, kandungan nikotin dalam rokok digunakan untuk
mengukur karbon monoksida. Dengan kata lain, nikotin merupakan variabel prediktor (x)
sedangkan karbon monoksida sebagai variabel respons (y).
Agar model yang dibuat tidak menyimpang jauh, hal pertama yang dilakukan untuk melakukan
analisis regresi adalah memprediksi model.
1. Sebelumnya input data tersebut ke dalam dua kolom, yaitu C1 dan C2 seperti pada
gambar.
2. Langkah untuk menaksir garis regresi dimulai pada menu Stat → Regression → Fitted
Line Plot.
4. Selanjutnya akan muncul ouput grafik Fitted Line Spot dan Regression Analysis pada
window Session.
Pada grafik Fitted Line Spot menjunjukkan taksiran garis regresi untuk model regresi linear.
Selain itu, pada window Session juga ditampilkan hasil taksiran parameter model regresi
linearnya, yaitu : 𝐾𝑎𝑟𝑏𝑜𝑛 𝑚𝑜𝑛𝑜𝑘𝑠𝑖𝑑𝑎 = 1.665 + 12.40 𝑁𝑖𝑘𝑜𝑡𝑖𝑛. Kemudian, Standar
Deviasi model (S) dan Koefisien Determinasi (R2) masing-masing sebesar 1.83 dan 85.7%.
2. Kemudian klik Graphs, select Regular pada Residual for plots, dan Normal
probability plot of residuals pada Residual plots untuk menampilkan grafik residual.
Lalu klik OK.
3. Selanjutnya untuk menampilkan model regresi, ANOVA, dan unsual observation, klik
Results pada window Regressions. Kemudian select output yang diinginkan seperti
pada gambar di bawah ini.
5. Lalu klik OK pada setiap window. Output dari langkah-langkah ini berupa grafik
residual dan tabel ANOVA, Regression Equation, Unsual Observsation pada window
Session.
Dari persamaan regresi yang di dapat, yaitu: 𝐾𝑎𝑟𝑏𝑜𝑛 𝑚𝑜𝑛𝑜𝑘𝑠𝑖𝑑𝑎 = 1.665 + 12.4 𝑁𝑖𝑘𝑜𝑡𝑖𝑛
memperlihatkan b0 sebesar 1.665 dan taksiran parameter dari b1 sebesar 12.3. Hal ini berarti
kandungan nikotin dalam rokok memperngaruhi peningkatan pengaruh karbonmoksida yang
diahasilkan sebesar 12.4 kali. Angka 1.665 menunjukkan bahwa besar kandungan
karbonmonoksida ketika kandungan nikotin bernilai 0 (nol).
Dalam regresi ada pula istilah Mean Square Error (MSE) yang merupakan carian residual (s2).
Perlu diingat bahwa varian residual adalah kuadrat standar deviasi. Dari nilai MSE untuk model
yang telah dibuat adalah 3.34 sehingga nilai standar deviasinya adalah:
𝑠 = √3.34 = 1.83
Nilai 1.83 berarti bahwa sebagian besar kandungan nikotin dalam suatu rokok akan jatuh di
sekitar 2s = 3.66. ANOVA sebenarnya merupakan uji hipotesis kesesuaian model dengan data
yang ada. Dalam hal ini, hipotesisnya adalah:
H0 : Ada salah satu parameter model (β0 atau β1) bernilai nol.
H1 : Parameter model (β0 atau β1) tidak nol.
Hipotesis awal menandakan model yang dibuat tidak sesuai dengan data. Sebaliknya, hipotesis
alternatif berarti model yang dibuat sesuai dengan data.
Pada analisis regresi ini, kita menentukan level toleransi (𝛼) sebesar 0.005.
Selain itu, uji kesesuaian model dapat juga menggunakan statistik F yang daerah penolakannya
adalah sebagai berikut:
𝐹 > 𝐹(𝛼,𝑣1 ,𝑣2 )
Pada tabel ANOVA menunjukkan statistik F sebesar 138.27. Bila digunakan α sebesar 5%,
maka nilai 𝐹(5%,1,23) = 4.28 yang ditunjukkan dari tabel (F)... yang ada di dalam lampiran.
Sehingga nilai statistik F memenuhi daerah penolakan. Dengan kata lain menolak hipotesis
awal.
Berarti hasil analisis secara statistis tidak ada parameter model bernilai nol yang menunjukkan
bahwa model regresi linear sederhana ini bisa dikatakan telah mewakili data.
Kali ini uji parameter model dilakukan dengan menggunakan statistic t. Adapun hipotesis
dalam melaksanakan uji parameter ini adalah:
H0 : β1 = 0
H1 : β1 0
Hipotesis awal (H0) pada hipotesis adalah parameter β1 (β1 = 0) tidak ada dalam model regresi
dan hipotesis aleternatif adalah parameter β1 ada dalam model. Nilai statistic t juga dapat
dikonversikan ke dalam P-value. Bila menggunakan P-value, maka daerah penolakannya
adalah P-value < level toleransi (α).
𝑡 > |𝑡(𝛼,𝑑𝑓) |
df : derajat bebas
n : banyaknya pengamatan
k : banyaknya parameter
Output yang ditampilkan pada tabel Coefficient menunjukkan bahwa statistik t untuk variabel
kandungan nikotin dalam rokok adalah 11.76 dan P-value bernilai 0. Derajat bebas pada
analisis ini sebesar 23. Dari tabel T ..., kita dapat mengetahui statisik t untuk level toleransi
0.05 dan derajat bebas sebesar 23 (𝑡(0.05,23 ) adalah 1.714. Hal ini menandakan nilai t-value
lebih besar dari (𝑡(0.05,23 ) sehingga dapat disimpulkan menolak hipotesis awal pada level
toleransi 0.05. Oleh karena itu, dugaan adanya pengaruh kandungan nikotin dalam rokok
terhadap karbon monoksida yang dihasilkan oleh suatu rokok dapat diterima.
Nilai koefisien determinasi model regresi adalah 85.74% yang artinya sebanyak 85.74% variasi
sample jumlah karbon monoksida yang dihasilkan oleh suatu rokok dipengaruhi oleh
kandungan nikotin dalam rokok. Koefisien korelasi, R, merupakan akar koefisien determinasi
yang menjelaskan hubungan linear antara variabel respons dan prediktor. Nilai R berkisar 0
sampai dengan 1 yang besarnya semakin mendekati 1 berarti hubungan antarvariabel makin
kuat. Dalam hal ini, koefisien korelasinya sebesar:
𝑟 = √0.8574 = 0.926
Dari sini dapat diketahui bahwa ada hubungan linear yang kuat antara kandungan nikotin dalam
rokok dengan jumlah karbon monoksida yang dihasilkannya.
Makin banyak variabel yang dimasukkan dalam model, makin meningkat nilai R2. Di sisi lain,
semakin banyaknya variabel ini menyebabkan model menjadi tidak efisien. Untuk itu, R2 perlu
ditingkatkan sensifitasnya, dalam hal ini ditunjukkan pada nilai R2 adjusted. R2 adjusted
disesuaikan dengan jumlah variabel yang dimasukkan ke dalam model pada kasus ini sebesar
85.12%. perbedaan angka antara R2 dan R2 adjusted tidak berbeda jauh karena jumlah variabel
dalam model hanya ada 1.
Output tersebut memperlihatkan bahwa untuk kandungan nikotin 0.86 mg, perkiraan jumlah
karbon monoksida yang dihasilkan suatu rokok sebesar 12.32 mg begitu pula seterusnya. Nilai-
nilai taksiran dapat digunakan untuk menghitung nilai residual, sedangkan nilai residual
digunakan untuk mendiagnosis model regresi.
Diagnosis model dilakukan dengan memeriksa kesesuaian residual dengan asumsi yang
disyaratkan. Untuk mendiagnosis model, diperlukan pemeriksaan distribusi residual beserta
parameter-parameternya. Dalam hal ini, distribusi yang diinginkan adalah distribusi normal.
Data residual model yang akan diuji berada pada kolom C3. Residual ini merupakan hasil
analisis regresi yang telah dilakukan sebelumnya. Langkah-langkan untuk melakukan uji
tersebut adalah sebagai berikut:
1. Pilih Stat → Basic Statistics → Normality Test. Kemudian akan muncul dialog box
dan isikan setiap kolom seperti pada gambar ....
2. Selanjutnya klik OK dan akan menampilkan grafik uji kenormalan residual seperti pada
gambar di bawah ini.
Daerah penolakan KS > KS1-α pada sejumlah pengamatan (n) tertentu. Bila statistik
Kolmogorov-Smirnov dikonversikan ke dalam P-value, maka daerah penolakannya adalah P-
value < α.
Level toleransi (α) yang digunakan pada uji Kolmogorov-Smirnov sebesar 0.05. Dari sini dapat
diketahui bahwa nilai statistik yang ditunjukkan pada tabel KM .... senilai 0.264 untuk α = 0.05
dan jumlah pengamatan sebanyak 25. Nilai ini yang selanjutnya dijadikan sebagai patokan
terhadap nilai statistik uji Kolmogorov-Smirnov dan P-value yang diperoleh masing-masing
0.137 dan > 0.15.
Berdasarkan nilai yang didapat menunjukkan bahwa nilai dari pengamatan kurang dari nilai
statistik Kolmogorov-Smirnov pada tabel .... Oleh karen itu, kesimpulan yang dapat ditarik dari
uji kenormalan ini adalah residual model regresi linear yang dibuat telah mengikuti distribusi
normal sehingga asumsi kenormalan residual pada model ini telah terpenuhi.
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑥 2
𝑦 = 𝛽0 + 𝛽1 𝑥 + 𝛽2 𝑥 2 + 𝛽3 𝑥 3
15
10
0
0.0 0.5 1.0 1.5 2.0
Nikotin
15
10
0
0.0 0.5 1.0 1.5 2.0
Nikotin
Kriteria yang digunakan untuk melihat model regresi yang paling baik bagi data biasanya R 2,
R2 adjusted, dan S. R2 adalah koefisien determinasi yang bila dalam suatu model nilainya
semakin besar, maka model semakin baik. S merupakan standar deviasi model yang bila
nilainya semakin kecil, maka model semakin kurang baik. R2 adjusted digunakan dengan
mempertimbangkan jumlah parameter dalam model sehingga dalam pengaplikasiannya nilai
ini lebih sering digunakan mengingat lebih sensitif terhadap pertambahan model.
Koefisien korelasi Pearson berguna untuk mengukur tingkat keeratan hubungan linear antara
dua variable. Nilai korelasi berkisar antara -1 samapai +1. Nilai korelasi negatif berarti
hubungan antara 2 variabel adalah negatif. Artinya, bila salah satu variable menurun, maka
variable lainnya akan meningkat. Sebaliknya, nilai korelasi positif berarti hubungan antara
kedua variable adalah positif. Artinya bila salah satu variable meningkat, maka variable lainnya
meningkat pula. Suatu hubungan antara 2 variabel dikatakan berkorelasi kuat apabila makin
mendekati 1 atau (-1). Sebaliknya, suatu hubungan dikatakan lemah apabila semakin mendekati
0 (nol). Hipotesis uji korelasi ini adalah sebagai berikut:
H0 : = 0
H1 : 0
Dengan adalah korelasi antara 2 variabel.
Untuk membuat interpretasi analisis korelasi, ada beberapa hal yang harus diingat, yaitu:
1. Koefisien korelasi hanya mengukur hubungan linear. Jika ada hubngan nonlinear, maka
koefisien korelasi akan bernilai 0.
2. Koefisien korelasi sangat sensitif terhadap nilai ekstrim.
3. Hanya untuk variabel yang memiliki hubungan sebab akibat.
Dalam contoh analisis korelasi ini menggunakan data karbon monoksida yang dihasilkan dari
nikotin suatu rokok untuk mengetahui hubungan kedua variabel tersebut. Langkah-langkah
menghitung korelasi antara dua variabel dengan menggunakan Minitab 18 adalah sebagai
berikut:
1. Pilih Stat > Basic Statistics > Correlation
2. Pada kotak dialog, letakkan variabel karbon monoksida dan nikotin per bulan pada
kolom di bawah Variables.
Selanjutnya output analisis korelasi yang akan ditampilkan dalam windows session. Output ini
menunjukkan nilai korelasi antara karbon monoksida dan nikotin sebesar 0.926. Seperti yang
telah dijelaskan, bila nilai korelasi Pearson semakin mendekati 1 atau (-1), berarti hubungan
antara kedua variabel semakin erat. Karena nilai korelasi antara karbon monoksida dan nikotin
bernilai 0.926, maka hubungan antara kedua variabel diduga erat.
Correlations
Hal tersebut dapat dibuktikan pula dengan uji hipotesis yang sebelumnya menyatakan bahwa
korelasi antara dua variabel dalam hipotesis awal tidak memiliki nilai sehingga tidak ada
hubungan antar variabel. Sedangkan pada hipotesis alternatif, korelasi antara dua variabel tidak
bernilai nol sehingga dapat dikatakan antar variabel memiliki hubungan. Hal ini dapat
dindikasikan dengan P-value untuk menentukan hipotesis awal tertolak atau tidak. Seperti
yang telah dikatakan sebelumnya, bila P-value berada di bawah α maka berada dalam area
penolakan.
Berdasarkan hasil analisis korelasi juga memperlihatkan bahwa nilai P-value adalah 0 yang
artinya P-value jatuh di daerah penolakan sehingga keputusannya adalah menolak hipotesis