Anda di halaman 1dari 20

LAPORAN PRATIKUM ANALISIS DATA STATISTIK

(UJI HIPOTESIS)

OLEH:

ROBERTUS KARLIUS LAIA

122410012

PROGRAM STUDI SAINS AKTUARIA

JURUSAN SAINS

INSTITUT TEKNOLOGI SUMATERA

2023
DAFTAR ISI

DAFTAR ISI.................................................................................................................ii
BAB 1 LATAR BELAKANG.......................................................................................1
1.1 PERMASALAHAN.......................................................................................1
1.2 TUJUAN PRATIKUM...................................................................................1
BAB 2 TINJAUAN PUSTAKA...................................................................................3
2.1 PENGUJIAN HIPOTESIS.............................................................................3
2.2 PENGGUNAAN P-VALUE UNTUK PENGAMBILAN KEPUTUSAN......4
BAB 3 PERMASALAHAN..........................................................................................7
BAB 4 PENYELESAIAN............................................................................................9
4.1 PERMASALAHAN A....................................................................................9
4.2 PERMASALAHAN B..................................................................................14
BAB 5 KESIMPULAN...............................................................................................17
DAFTAR PUSTAKA..................................................................................................18

ii
BAB 1 LATAR BELAKANG

1.1 PERMASALAHAN
Dalam kehidupan sehari-hari, seringkali kita melakukan perkiraan dari
sebuah data yang kita peroleh, lalu memutuskan sebuah kesimpulan dari data
tersebut. Misalnya, kita ingin memperkirakan apakah ada peningkatan jumlah
produksi jagung setiap musimnya dalam setahun terakhir, memperkirakan jumlah
peserta yang mengikuti pemilu pada tahun 2024, ataupun membandingkan apakah
ada perbedaan jumlah barang yang terjual dengan menggunakan beberapa teknik
penjualan.Tentu hal ini sangat menyulitkan apabila kita menggunakan perkiraan
secara manual, apalagi jika data yang kita teliti berskala besar hingga ribuan
bahkan jutaan data. Oleh karena itu, para ahli statistika memunculkan sebuah cara
yang cukup mudah dalam menyimpulkan sebuah data dengan menggunakan uji
hipotesis.

Awal sejarah dari perkembangan uji hipotesis terkait dengan adanya


revolusi ilmiah yang terjadi sekitar abad ke-17. Ilmuwan-ilmuwan seperti Galileo
Galilei dan Isaac Newton sudah menggunakan uji hipotesis ini untuk membantu
mereka melakukan metode ilmiah dan statistik dalam penelitian.

Jadi, uji hipotesis diartikan sebagai suatu metode statistik yang digunakan
untuk menguji klaim atau hipotesis yang dibuat mengenai suatu populasi. Uji
hipotesis ini sangat penting karena dapat digunakan sebagai alat dalam melakukan
penelitian ilmiah dan pengambilan keputusan berdasarkan data sampel. Dalam uji
hipotesis, kita mencoba menguji apakah data yang kita miliki secara signifikan
mendukung atau menolak hipotesis yang diajukan.

1.2 TUJUAN PRATIKUM


Pada pratikum kali ini, kita akan mencoba menggunakan alat bantu yakni
R atau R-Studio dalam melakukan uji hipotesis 1 sampel, 2 sampel bebas dan 2
sampel berpasangan. Selain itu juga, setelah mengikuti praktikum ini, kita
diharapkan mampu :

1
a. Menguji hipotesis rataan satu sampel jika variansi populasi diketahui dan
tidak diketahui
b. Menguji hipotesis rataan dua sampel bebas jika variansi populasi diketahui
dan tidak diketahui
c. Menguji hipotesis rataan dua sampel berpasangan jika variansi populasi
diketahui dan tidak diketahui
d. Menguji hipotesis variansi satu dan dua sampel

2
BAB 2 TINJAUAN PUSTAKA

2.1 PENGUJIAN HIPOTESIS


Untuk melakukan pengujian hipotesis kita memerlukan beberapa langkah
yaitu (Mustofa, 2013):

a. Menentukan formulasi hipotesis


Ada dua hipotesis dalam suatu pengujian yaitu hipotesis nol (H 0) atau
hipotesis yang akan diuji. Hipotesis ini berisi anggapan bahwa suatu
pernyataan tidak berbeda dengan pernyataan yang lainnya. Hipotesis yang
kedua adalah hipotesis alternatif (H 1) yang merupakan kebalikan dari H 0.
Hipotesis ini (H1) dapat berupa 3 alternatif yaitu:
- Harga parameter lebih besar dari harga yang dihipotesiskan. Pengujian
ini merupakan pengujian dari arah atau sisi kanan.
- Harga parameter lebih kecil dari harga yang dihipotesiskan. Pengujian
ini merupakan pengujian dari arah atau sisi kiri.
- Harga parameter tidak sama dengan harga yang dihipotesiskan.
Pengujian ini merupakan pengujian dari dua arah atau dua sisi.

H0 dan H1 dapat diformulasikan dalam bentuk:

H0 : µ = µ0 H1 : µ < µ0

H1 : µ > µ0 H1 : µ ≠ µ0

b. Menentukan taraf signifikansi uji hipotesis


Taraf signifikansi merupakan besarnya batas toleransi dalam menerima
kesalahan hasil hipotesis terhadap nilai parameter populasinya. Taraf
signifikansi dilambangkan dengan α. Semakin tinggi taraf signifikansi
yang digunakan maka semakin rendah penolakan terhadap hipotesis nol.
Besar taraf signifikansi ini bergantung pada keberanian pembuat
keputusan terhadap besar toleransi kesalahan. Biasanya taraf signifikansi
yang sering digunakan adalah sebesar 1% (0,01), 5% (0,05), dan 10% (0,1)

3
c. Menentukan kriteria pengujian
Dalam membuat keputusan apakah H 0 diterima atau ditolak maka nilai α
dibandingkan dengan nilai uji statistiknya atau nilai P-Values. Kriteria
penerimaan atau penolakan H0 adalah H0 diterima jika nilai uji statistik
lebih kecil atau lebih besar dari nilai positif atau negatif dari α atau nilai
uji statistik berada di luar nilai kritis. H 0 ditolak jika nilai uji statistik lebih
besar atau lebih kecil dari nilai positif atau negatif dari α atau nilai uji
statistik berada di dalam nilai kritis.

2.2 PENGGUNAAN P-VALUE UNTUK PENGAMBILAN KEPUTUSAN


Dalam menguji hipotesis yang statistik ujinya bersifat diskrit, wilayah
kritis dapat dipilih secara acak dan ukurannya ditentukan. Jika α terlalu besar,
maka dapat dikurangi dengan melakukan penyesuaian pada nilai kritisnya.
Mungkin perlu menambah ukuran sampel untuk mengimbangi penurunan yang
terjadi secara otomatis pada kekuatan pengujian (Walpole, Myers, Myers, & Ye,
2012)

Selama beberapa generasi analisis statistik, sudah menjadi kebiasaan untuk


memilih α sebesar 0,05 atau 0,01 dan memilih wilayah kritis yang sesuai. Tentu
saja, penolakan atau penolakan tegas terhadap H 0 akan bergantung pada wilayah
kritis tersebut. Misalnya, jika pengujian dilakukan dua sisi dan α ditetapkan pada
tingkat signifikansi 0,05 dan statistik pengujian melibatkan, katakanlah, distribusi
normal standar, maka nilai z diamati dari data dan wilayah kritisnya adalah:

z > 1,96 atau z < −1,96

dimana nilai 1,96 ditemukan sebagai z 0,025 pada Tabel A.3. Nilai z di wilayah kritis
memunculkan pernyataan “Nilai statistik pengujian signifikan,” yang kemudian
dapat kami terjemahkan ke dalam bahasa pengguna. Misalnya, jika hipotesis
diberikan oleh

H0: = 10

H1: ≠ 10

seseorang mungkin mengatakan, “Mean berbeda secara signifikan dari nilai 10.”

4
Pemilihan Tingkat Signifikansi

Pemilihan awal tingkat signifikansi α ini berakar pada filosofi bahwa


risiko maksimum terjadinya kesalahan tipe I harus dikendalikan. Namun,
pendekatan ini tidak memperhitungkan nilai statistik uji yang “mendekati”
wilayah kritis. Misalkan pada ilustrasi dengan H 0 : μ = 10 versus H1: μ = 10, nilai
z = 1,87 teramati; sebenarnya, dengan α = 0,05, maka nilainya tidak signifikan.
Namun resiko terjadinya kesalahan tipe I jika menolak H 0 dalam hal ini hampir
tidak bisa dianggap parah. Faktanya, dalam skenario dua sisi, satu dapat
mengukur risiko ini sebagai

P = 2P(Z > 1,87 ketika μ = 10) = 2(0,0307) = 0,0614

Hasilnya, 0,0614 adalah peluang diperolehnya nilai z sama besar atau lebih besar
(dalam besarnya) dari 1,87 padahal sebenarnya μ = 10. Meskipun bukti ini
bertentangan dengan H0 tidak sekuat penolakan pada tingkat α = 0,05 adalah
informasi penting bagi pengguna. Memang, penggunaan lanjutan α = 0,05 atau
0,01 adalah hanya hasil dari standar yang telah diwariskan dari generasi ke
generasi. Pendekatan P-value telah diadopsi secara luas oleh pengguna aplikasi
statistik. Pendekatan ini dirancang untuk memberikan pengguna alternatif (dalam
istilah suatu kemungkinan) menjadi sekedar kesimpulan “tolak” atau “jangan
tolak”. P-Value komputasi juga memberikan informasi penting kepada pengguna
ketika nilai z turun dengan baik ke wilayah kritis biasa. Misalnya, jika z adalah
2,73, maka ini informatif untuk pengguna untuk mengamati itu:

P = 2(0,0032) = 0,0064

dan dengan demikian nilai z signifikan pada tingkat kurang dari 0,05. Penting
untuk diketahui bahwa pada kondisi H 0, nilai z = 2,73 adalah suatu kejadian yang
sangat langka. Artinya, nilai yang setidaknya besarnya hanya akan sebesar itu
terjadi 64 kali dalam 10.000 percobaan.

Demonstrasi Grafis dari P-Value

Salah satu cara yang sangat sederhana untuk menjelaskan P-Value secara
grafis adalah dengan mempertimbangkan dua hal yang berbeda sampel. Misalkan
ada dua bahan yang dipertimbangkan untuk melapisi bahan tertentu jenis logam

5
untuk menghambat korosi. Spesimen diperoleh, dan satu koleksi dilapisi bahan 1
dan satu koleksi dilapisi bahan 2. Ukuran sampel adalah n1 = n2 = 10, dan korosi
diukur dalam persen permukaan daerah yang terkena dampak. Hipotesisnya
adalah sampel berasal dari distribusi umum dengan mean μ = 10. Misalkan
varians populasi adalah 1,0. Lalu kita menguji

H0: μ1 = μ2 = 10

Gambar 1 mewakili plot titik data; data ditempatkan pada distribusi yang
dinyatakan dengan hipotesis nol. Mari kita asumsikan bahwa data “x” mengacu
pada materi 1 dan data “◦” mengacu pada materi 2. Sekarang tampak jelas bahwa
data tersebut merujuk pada materi 2 menyangkal hipotesis nol. Tapi bagaimana ini
bisa diringkas dalam satu angka? P-Value dapat dilihat hanya sebagai probabilitas
memperoleh data ini mengingat kedua sampel berasal dari distribusi yang sama.
Jelas sekali, ini probabilitasnya cukup kecil, katakanlah 0,00000001. Dengan
demikian, P-Value yang kecil jelas terbantahkan H 0, dan kesimpulannya mean
populasi berbeda nyata.

Gambar 1 Data yang kemungkinan dihasilkan dari dua populasi yang berbeda cara

Penggunaan pendekatan P-Value sebagai bantuan dalam pengambilan keputusan


adalah hal yang wajar, dan hampir semua paket komputer yang menyediakan
cetakan komputasi pengujian hipotesis keluar P-Value bersama dengan nilai
statistik uji yang sesuai. Berikut ini adalah definisi formal dari P-Value:

“P-Value adalah tingkat (signifikansi) terendah di mana nilai yang diamati


statistik uji signifikan”.

6
BAB 3 PERMASALAHAN

a. Jika diketahui data hasil observasi sebagai berikut:

Analisis statistik apa yang akan anda gunakan untuk memperoleh


informasi dari data terkait hasil produksi kopi di atas.

7
b. Diperoleh data mengenai kandungan nutrisi sebuah produk daging
kemasan sebelum dan setelah dikemas selama 1 bulan.

Seorang peneliti menduga bahwa kandungan nutrisi akan berkurang


setelah proses pengemasan. Buktikan dugaan tersebut dengan taraf
kepercayaan 90%!

8
BAB 4 PENYELESAIAN

4.1 PERMASALAHAN A
Berdasarkan data pada soal pertama, kita menggunakan uji hipotesis dua
sampel berpasangan yang menggunakan statistik uji t dalam pengujiannya. Oleh
karena itu, perintah yang digunakan sama dengan perintah untuk menguji rataan
dua populasi jika variansi tidak diketahui. Terlebih dahulu kita buka R-Studio dan
mengunduh packages stats. Perintah yang digunakan untuk menguji dua sampel
berpasangan yaitu:

t.test(x, y, alternative = "two.sided", mu = 0, paired =


TRUE, var.equal = False, conf.level = 0,95)
FALSE, conf.level = 0.95)

Adapun informasi yang akan kita dapatkan berdasarkan data tabel produksi kopi
yaitu membandingkan apakah ada perbedaan hasil produksi kopi setiap lahan pada
tahun 2019 dan 2020. Taraf signifikansi yang kita gunakan adalah α = 5%.

a. Perbandingan hasil produksi kopi lahan A pada tahun 2019 dan 2020
- Terlebih dahulu, kita input data produksi lahan A pada excel.
Kemudian simpan file dengan nama dengan nama LAHAN A

- Pada R-Studio, import file LAHAN A


- Masukkan perintah untuk mendefinisikan data dan menguji hipotesis
dua sampel berpasangan.

9
- Hasil

- Interpretasi hasil
H0 (Terdapat perbedaan hasil produksi kopi lahan A pada tahun 2019
dan 2020)
H1 (Hasil produksi kopi lahan A pada tahun 2019 dan 2020 sama)
Taraf signifikansi : α = 5%
P-Value : 0,5542
Daerah kritis : H0 ditolak jika nilai P-Value < α
Keputusan : H0 tidak ditolak karena nilai P-Value (0,5542) > α (0,05)
Kesimpulan :
Pada taraf signifikansi α 5%, diperoleh kesimpulan bahwa terdapat
perbedaan hasil produksi kopi antara tahun 2019 dan 2020 pada lahan
A dengan perbedaan rata-rata sebesar 2,433333.

b. Perbandingan hasil produksi kopi lahan B pada tahun 2019 dan 2020
- Terlebih dahulu, kita input data produksi lahan B pada excel.
Kemudian simpan file dengan nama dengan nama LAHAN B

- Pada R-Studio, import file LAHAN B


- Masukkan perintah untuk mendefinisikan data dan menguji hipotesis
dua sampel berpasangan.

10
- Hasil

- Interpretasi hasil
H0 (Terdapat perbedaan hasil produksi kopi lahan B pada tahun 2019
dan 2020)
H1 (Hasil produksi kopi lahan B pada tahun 2019 dan 2020 sama)
Taraf signifikansi : α = 5%
P-Value : 0,6178
Daerah kritis : H0 ditolak jika nilai P-Value < α
Keputusan : H0 tidak ditolak karena nilai P-Value (0,6178) > α (0,05)
Kesimpulan :
Pada taraf signifikansi α 5%, diperoleh kesimpulan bahwa terdapat
perbedaan hasil produksi kopi antara tahun 2019 dan 2020 pada lahan
B dengan perbedaan rata-rata sebesar 2,591667.

c. Perbandingan hasil produksi kopi lahan C pada tahun 2019 dan 2020
- Terlebih dahulu, kita input data produksi lahan C pada excel.
Kemudian simpan file dengan nama dengan nama LAHAN C

- Pada R-Studio, import file LAHAN C

11
- Masukkan perintah untuk mendefinisikan data dan menguji hipotesis
dua sampel berpasangan.

- Hasil

- Interpretasi hasil
H0 (Terdapat perbedaan hasil produksi kopi lahan C pada tahun 2019
dan 2020)
H1 (Hasil produksi kopi lahan C pada tahun 2019 dan 2020 sama)
Taraf signifikansi : α = 5%
P-Value : 0,4444
Daerah kritis : H0 ditolak jika nilai P-Value < α
Keputusan : H0 tidak ditolak karena nilai P-Value (0,4444) > α (0,05)
Kesimpulan :
Pada taraf signifikansi α 5%, diperoleh kesimpulan bahwa terdapat
perbedaan hasil produksi kopi antara tahun 2019 dan 2020 pada lahan
C dengan perbedaan rata-rata sebesar 2,816667.

d. Perbandingan hasil produksi kopi lahan D pada tahun 2019 dan 2020
- Terlebih dahulu, kita input data produksi lahan D pada excel.
Kemudian simpan file dengan nama dengan nama LAHAN D

12
- Pada R-Studio, import file LAHAN D
- Masukkan perintah untuk mendefinisikan data dan menguji hipotesis
dua sampel berpasangan.

- Hasil

- Interpretasi hasil
H0 (Terdapat perbedaan hasil produksi kopi lahan D pada tahun 2019
dan 2020)
H1 (Hasil produksi kopi lahan D pada tahun 2019 dan 2020 sama)
Taraf signifikansi : α = 5%
P-Value : 0,2474
Daerah kritis : H0 ditolak jika nilai P-Value < α
Keputusan : H0 tidak ditolak karena nilai P-Value (0,2474) > α (0,05)
Kesimpulan :
Pada taraf signifikansi α 5%, diperoleh kesimpulan bahwa terdapat
perbedaan hasil produksi kopi antara tahun 2019 dan 2020 pada lahan
D dengan perbedaan rata-rata sebesar 5,841667.

13
4.2 PERMASALAHAN B
Sama halnya dengan permasalahan pertama, kita juga akan melakukan uji
hipotesis dua sampel berpasangan pada permasalahan kedua. Pastikan kita sudah
mengunduh packages stats pada R-Studio. Perintah yang digunakan untuk
menguji dua sampel berpasangan yaitu:

t.test(x, y, alternative = "two.sided", mu = 0, paired =


4.3 var.equal = False, conf.level = 0,95)
TRUE,
FALSE, conf.level = 0.95)
Pada uji hipotesis ini, kita akan menguji apakah dugaan seorang peneliti benar
bahwa kandungan nutrisi akan berkurang setelah proses pengemasan. Dugaan
peneliti tersebut menggunakan taraf kepercayaan 90% (α = 10% atau α = 0,1).
- Terlebih dahulu, kita input data mengenai kandungan nutrisi sebuah
produk daging kemasan sebelum dan setelah dikemas selama 1 bulan
pada excel. Kemudian simpan file dengan nama dengan nama
KANDUNGAN NUTRISI.

- Pada R-Studio, import file KANDUNGAN NUTRISI


- Masukkan perintah untuk mendefinisikan data dan menguji hipotesis
dua sampel berpasangan.

14
- Hasil

- Interpretasi hasil
H0 (Tidak terjadi penurunan kandungan nutrisi pada produk daging
kemasan setelah pengemasan)
H1 (Terjadi penurunan kandungan nutrisi pada produk daging kemasan
setelah pengemasan)
Taraf signifikansi : α = 10%
P-Value : 0,001222
Daerah kritis : H0 ditolak jika nilai P-Value < α
Keputusan : H0 ditolak karena nilai P-Value (0,001222) < α (0,1)
Kesimpulan :
Pada taraf signifikansi α 10%, diperoleh kesimpulan bahwa terjadi
penurunan kandungan nutrisi pada produk daging kemasan setelah
pengemasan dengan perbedaan rata-rata sebesar 0,576.

Selain itu juga dapat menguji apakah ada perbedaan variansi pada
kandungan nutrisi sebuah produk daging kemasan sebelum dan setelah
pengemasan. Pengujian ini masih menggunakan pengujian t untuk dua sampel
berpasangan dengan packages yang sama yaitu stats. Perintah yang kita gunakan
yaitu:

var.test(x, y, alternative = "two.sided", conf.level = 0.95)

- Karena sebelumnya kita sudah input data kandungan nutrisi sebelum


dan setelah pengemasan pada excel dan mengimpor ke R-Studio, maka
kita langsung saja mengikuti perintah untuk pengujian variansinya.

15
- Hasil

- Interpretasi hasil
H0 (Variansi antara kandungan nutrisi sebelum dan sesudah
pengemasan sama)
H1 (Variansi antara kandungan nutrisi sebelum dan sesudah
pengemasan berbeda)
Taraf signifikansi : α = 10%
P-Value : 0,01565
Daerah kritis : H0 ditolak jika nilai P-Value < α
Keputusan : H0 ditolak karena nilai P-Value (0,01565) < α (0,10)
Kesimpulan :
Pada taraf signifikansi α 5%, diperoleh kesimpulan bahwa variansi
antara kandungan nutrisi sebelum dan sesudah pengemasan berbeda
dengan rasio variansi sebesar 3,904148.

16
BAB 5 KESIMPULAN

Berdasarkan pengujian yang kita lakukan pada kedua permasalahan diatas,


maka kita dapat menyimpulkan bahwa pada permasalahan pertama mengenai data
hasil produksi kopi di setiap lahan pada tahun 2019 dan 2020 ternyata memiliki
hasil yang berbeda. Contohnya, pada tahun 2020 lahan A mengalami peningkatan
hasil produksi kopi dengan rata-rata peningkatan sebesar 2,43 dibandingkan hasil
produksi kopi pada tahun 2019. Hal ini terjadi juga pada lahan C dengan rata-rata
peningkatan sebesar 2,81. Sedangkan, pada tahun 2020 lahan B mengalami
penurunan hasil produksi kopi dengan rata-rata penurunan sebesar 2,59
dibandingkan hasil produksi kopi pada tahun 2019. Hal ini terjadi juga pada lahan
D dengan rata-rata penurunan sebesar 5,84.

Pada permasalahan kedua, kita menguji dugaan seorang peneliti yang


mengatakan bahwa ada pengurangan kandungan nutrisi pada sebuah produk
daging kemasan sebelum dan setelah pengemasan. Berdasarkan hasil yang
diperolah, maka dapat kita simpulkan bahwa ternyata dugaan seorang peneliti
tersebut benar. Hal ini dapat kita lihat dari hasil uji yang menyatakan adanya
pengurangan kandungan nutrisi sebesar 0,57 setelah produk daging dikemas.
Selain itu, kita juga menguji apakah ada perbedaan variansi kandungan nutrisi
pada produk daging kemasan sebelum dan setelah pengemasan. Berdasarkan hasil
uji tersebut, maka dapat disimpulkan bahwa ternyata ada perbedaan variansi
dengan rasio variansi sebesar 3,90.

17
DAFTAR PUSTAKA

Mustofa, A. (2013). UJI HIPOTESIS STATISTIK. Yogyakarta: Gapura Publishing.com.

Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2012). Probability & Statistics for
Engineers & Scientists Ninth Edition. United States of America: Pearson.

18

Anda mungkin juga menyukai