Anda di halaman 1dari 31

5 The t Test for Two Related

Samples
Anggota Kelompok :
FILZA FIVEBRIAN TARISZAKI (21050874003)
EKO SATRIA RAHMAT DANI (21050874007)
TRI REJEKI ANDANI (21050874017)
M. YUSUF ISBAKHTIAR (21050874020)
ACHMAD BAHTIAR ABDILLAH (21050874021)
AHMAD RIZAL AGUSTIAN (21050874036)
01
PENGANTAR DESAIN
PENGUKURAN
BERULANG
Desain pengukuran berulang, atau desain dalam subjek, adalah desain di mana variabel terikat diukur
dua kali atau lebih untuk setiap individu dalam satu Sampel. Kelompok subjek yang sama digunakan dalam
semua kondisi perawatan.

Keuntungan utama dari studi pengukuran berulang adalah bahwa studi tersebut menggunakan ukuran
yang sama persis individu dalam semua kondisi pengobatan. Dengan demikian, tidak ada risiko bahwa peserta
dalam satu perlakuan secara substansial berbeda dari peserta lain. Dengan desain pengukuran independen, di
sisi lain, selalu ada risiko bahwa hasilnya bias karena individu dalam satu sampel berbeda secara sistematis
(lebih pintar, lebih cepat, lebih banyak) ekstrovert, dan sebagainya) daripada individu dalam sampel lainnya.

Misalnya, seorang peneliti yang mempelajari pembelajaran verbal mungkin ingin memastikan bahwa
keduanya sampel dicocokkan dalam hal IQ dan jenis kelamin. Dalam hal ini, peserta laki-laki dengan IQ 120
dalam satu sampel akan dicocokkan dengan pria lain dengan IQ 120 in sampel lainnya. Meskipun peserta
dalam satu sampel tidak identik dengan peserta dalam sampel lainnya, desain subjek yang cocok setidaknya
memastikan bahwa keduanya sampel setara (atau cocok) sehubungan dengan beberapa variabel tertentu.
Dalam desain subjek yang cocok, setiap individu dalam satu sampel dicocokkan dengan individu dalam sampel lainnya.
Pencocokan dilakukan agar kedua individu setara (atau hampir setara) sehubungan dengan variabel tertentu yang peneliti ingin
mengontrol.
Sebagai contoh, seorang peneliti dapat mencocokkan pasangan subjek berdasarkan usia, jenis kelamin, ras, dan IQ.
Dalam hal ini, untuk contoh, seorang wanita kulit putih berusia 22 tahun dengan IQ 115 yang ada dalam satu sampel akan
menjadi dicocokkan dengan wanita kulit putih 22 tahun lainnya dengan IQ 115 pada sampel kedua. Semakin banyak variabel
yang digunakan, semakin sulit untuk menemukan pasangan yang cocok. Tujuan dari proses pencocokan adalah untuk
mensimulasikan desain pengukuran berulang sedekat mungkin bisa jadi. Dalam desain pengukuran berulang, pencocokan
sempurna karena individu yang sama digunakan dalam kedua kondisi. Namun, dalam desain subjek yang cocok, yang terbaik
yang bisa Anda dapatkan adalah tingkat kecocokan yang terbatas pada variabel yang digunakan untuk proses pencocokan. Dalam
desain pengukuran berulang atau desain subjek yang cocok membandingkan dua perlakuan kondisi, data terdiri dari dua set skor,
yang dikelompokkan menjadi dua set, sesuai dengan dua skor yang diperoleh untuk setiap individu atau setiap pasangan mata
pelajaran yang cocok (Tabel 11.1). Karena skor dalam satu set berhubungan langsung, satu lawan satu, dengan skor di set kedua,
dua desain penelitian secara statistik setara dan berbagi nama umum desain sampel terkait (atau desain sampel berkorelasi).
02
Statistik t untuk Desain Penelitian
Pengukuran Berulang
Statistik t untuk desain pengukuran berulang secara struktural mirip
dengan statistik t lain. Perbedaan utama dari sampel terkait t adalah
bahwa ini didasarkan pada skor perbedaan daripada skor mentah (nilai
X).
Desain penelitian ini di mana setiap subjek berpartisipasi dalam semua
kondisi eksperimen (yaitu, pengukuran diulang pada subjek yang sama).
sensitivitas. penelitian yang melibatkan beberapa ukuran variabel yang
sama yang diambil pada subjek yang sama atau cocok baik dalam
kondisi yang berbeda atau selama dua periode waktu atau lebih.
Misalnya, pengukuran berulang dikumpulkan dalam studi longitudinal di
mana perubahan dari waktu ke waktu dinilai.
• Contoh Perbedaan Skor: Data untuk sebuah Studi Pengukuran
Berulang
Banyak obat flu yang dijual bebas termasuk peringatan "dapat
menyebabkan kantuk."
Tabel 11.2 menunjukkan contoh data dari penelitian. Perhatikan bahwa
ada satu sampel n = 4 peserta, dan setiap individu diukur dua kali. Skor
pertama untuk setiap orang (X1 ) adalah pengukuran waktu reaksi
sebelum obat telah diberikan. Skor kedua (X2 ) mengukur waktu reaksi 1
jam setelah mengambil obat. Pada bagaimana obat mempengaruhi reaksi
waktu, dapat dihitung perbedaan antara skor pertama dan skor kedua
untuk setiap individu. Skor perbedaan, atau nilai D, ditampilkan di kolom
terakhir. Perhatikan bahwa skor perbedaan mengukur jumlah perubahan
waktu reaksi untuk setiap orang. Biasanya, selisih skor diperoleh dengan
mengurangkan yang pertama skor (sebelum perawatan) dari skor kedua
(setelah perawatan) untuk setiap orang:
selisih skor = D = X2 – X1
Pengukuran waktu reaksi diambil sebelum dan sesudah mengambil over-the-counter obat
flu.
Perhatikan bahwa MD adalah mean untuk contoh skor D.
Orang Sebelum Pengobatan Sesudah Pengobatan Selisih D
(X1) (X2)
A 215 210 -5
B 221 242 21
C 196 219 23
D 203 228 25
∑𝐷 = 64
∑𝐷 64
MD = = = 16
𝑛 4
Perhatikan bahwa tanda setiap skor D memberi tahu adanya perubahan. Orang A, misalnya,
menunjukkan penurunan waktu reaksi setelah minum obat (negatif berubah), tetapi orang
B menunjukkan peningkatan (perubahan positif). Sampel nilai selisih (nilai D) berfungsi
sebagai data sampel untuk uji hipotesis dan semua perhitungan dilakukan dengan
menggunakan nilai D.
Hipotesis untuk Studi Terkait –
Sampel
Seperti biasa, hipotesis nol menyatakan bahwa, untuk populasi umum, tidak ada efek,
tidak ada perubahan, atau tidak ada perbedaan. Untuk studi pengukuran berulang,
hipotesis nol menyatakan bahwa perbedaan rata-rata untuk populasi umum adalah
nol. Dalam simbol: H0 :µD
Hipotesis ini mengacu pada rata-rata untuk seluruh populasi perbedaan skor. Gambar
11.1(a) menunjukkan contoh populasi skor perbedaan dengan rata-rata µ D = 0.
Meskipun rata-rata populasi adalah nol, skor individu dalam populasi tidak
semuanya sama dengan nol.
Hipotesis alternatif menyatakan bahwa ada pengaruh perlakuan yang menyebabkan
skor dalam satu kondisi perawatan menjadi lebih tinggi (atau lebih rendah) secara
sistematis daripada skor dalam kondisi lain. Dalam simbol : H 1 :µD ≠ 0
a. Suatu populasi dengan skor perbedaan yang rata-ratanya adalah µD = 0. Perhatikan bahwa perbedaan tipikalnya skor (nilai D)
tidak sama dengan nol.
b. Suatu populasi dengan skor selisih yang rata-ratanya adalah lebih besar dari nol. Perhatikan bahwa sebagian besar skor
perbedaan juga lebih besar dari nol.

Menurut H1 , perbedaan skor untuk individu dalam populasi cenderung secara sistematis positif (atau
negatif), menunjukkan perbedaan yang konsisten dan dapat diprediksi antara kedua perlakuan.

Gambar 11.1(b) menunjukkan contoh populasi skor perbedaan dengan perbedaan rata-rata positif, µD > 0.
Saat ini, sebagian besar individu dalam populasi memiliki selisih skor yang lebih besar dari nol. Sampel yang
dipilih dari populasi ini akan mengandung skor perbedaan terutama positif dan mungkin akan memiliki
perbedaan rata-rata yang lebih besar dari nol, MD > 0.

 
•Statistik t untuk Sampel Terkait
Rumus t-statistik ini digunakan lagi di sini untuk
mengembangkan uji t pengukuran berulang. statistik t sampel
tunggal didefinisikan dengan rumus

Dalam rumus ini, mean sampel, M, dihitung dari data, dan


nilai untuk mean populasi, m, diperoleh dari hipotesis nol.
Estimasi kesalahan standar, SM, juga dihitung dari data dan
memberikan ukuran seberapa besar perbedaannya masuk akal
untuk mengharapkan antara rata-rata sampel dan rata-rata
populasi jika tidak ada efek pengobatan.
Untuk desain pengukuran berulang, data sampel adalah skor
selisih dan diidentifikasi dengan huruf D, bukan X. Oleh
karena itu, rumus t dengan menambahkan D untuk
menekankan bahwa kita berhadapan dengan skor perbedaan
sebagai gantinya dari nilai-nilai X. Secara khusus,
menggunakan mean untuk sampel perbedaan skor, MD, untuk
menguji hipotesis tentang rata-rata untuk populasi perbedaan.
Gambar 11.3 menunjukkan situasi umum yang ada untuk uji hipotesis
pengukuran berulang.

Sampel sebanyak n = 4 orang dipilih dari populasi. Setiap individu


adalah diukur dua kali, sekali dalam pengobatan I dan sekali
dalam perlakuan II, dan skor perbedaan, D, dihitung untuk setiap
individu. Ini contoh skor selisih dimaksudkan untuk mewakili
populasi. Perhatikan gambar diatas menggunakan sampel
perbedaan skor untuk mewakili populasi skor perbedaan.
Perhatikan juga bahwa mean untuk perbedaan populasi skor tidak
diketahui. Itu hipotesis nol menyatakan bahwa, untuk masyarakat
umum, tidak ada perbedaan yang konsisten atau sistematis antara
kedua perlakuan tersebut, sehingga perbedaan rata-rata populasi
adalah µD = 0
skor µD. Dengan perubahan sederhana ini, rumus t untuk pengukuran
berulang desain menjadi
MAYBE YOU NEED TO DIVIDE
THE CONTENT

Dalam rumus ini, galat standar yang


diperkirakan untuk MD,SMD , dihitung
dengan tepat dengan cara yang sama Estimasi kesalahan standar kemudian
seperti yang dihitung untuk statistik t dihitung menggunakan varians
sampel tunggal. Langkah pertama sampel (atau sampel simpangan
adalah menghitung varians (atau baku) dan ukuran sampel, n
standar deviasi) untuk sampel skor D
Perhatikan bahwa semua perhitungan dilakukan dengan menggunakan skor
selisih (skor D) dan hanya ada satu nilai D untuk setiap mata pelajaran.
Dengan sampel n mata pelajaran, maka tepat n skor D, dan statistik t memiliki
df = n – 1. Ingat bahwa n mengacu pada jumlah skor D, bukan jumlah skor X
dalam data asli. Anda juga harus mencatat bahwa statistik t pengukuran
berulang secara konseptual mirip dengan statistik t yang telah kita periksa
sebelumnya.
Dalam hal ini, data sampel diwakili oleh rata-rata sampel dari perbedaan skor
(MD), parameter populasi adalah nilai yang diprediksi oleh H0 (µD = 0), dan
estimasi standar error dihitung dari data sampel menggunakan Persamaan :
03
UJI HIPOTESIS DAN UKURAN
PENGARUH UNTUK DESAIN
PENGUKURAN BERULANG
Dalam studi pengukuran berulang, setiap individu
PENGUKURAN diukur dalam dua perlakuan yang berbeda kondisi
dan kami tertarik pada apakah ada perbedaan

BERULANG sistematis antara skor dalam kondisi treatment


pertama dan skor dalam kondisi treatment kedua.
Skor perbedaan (D value) dihitung untuk setiap
orang dan uji hipotesis menggunakan perbedaan
skor dari sampel untuk mengevaluasi perbedaan
rata-rata keseluruhan, µD, untuk seluruh populasi.
Uji hipotesis dengan statistik t pengukuran
berulang berikut proses empat langkah yang sama
yang telah kami gunakan untuk pengujian
lainnya :
Ada suatu teknik yang berguna untuk mengatur phobia
seseorang. Peneliti yang meneliti tentang phobia
ini memberikan suatu gambar yang paling ditakuti
oleh pasiennya, pasien disuruh tenang melihat
gambar tersebut dan diharapkan setelah diberikan
BOOM! gambar, pasien dapat mengurangi kephobiaannya.
STEP 1
H0: µD = 0 (tidak ada perubahan dalam phobia)
H1: µD ≠ 0 (ada perubahan)
a = .01
Time
Patient Before Time After D D2
Imagination Imagination
A 15 24 9 81
B 10 23 13 169
C 7 11 4 16
D 18 25 7 49
E 5 14 9 81
F 9 14 5 25
G 12 21 9 81

SD = 56 SD2 = 502 SS = SD2 – [(SD)2 / n]


= 502 – [(56)2 / 7]
MD = SD / n = 502 – 448
= 56 / 7 = 54
= 8.00
STEP 2 STEP 3
Menentukan critical region. Dalam contoh ini,
Menghitung perhitungan statistiknya
n=7, maka df= 7–1= 6. Lihatlah di tabel dan cari
- menghitung sampel variance:
nilai critical utnuk df=6 dan a=.01 maka didapat
S2 = SS / (n-1)
± 3.707. = 54 / 6
=9
- menghitung estimated standard error
SMD = √s² / n
= √9.00 / 7
= 1.134
- menghitung t statistic
t = (MD - µD) / SMD
= (8.0 – 0) / 1.134
= 7.05
STEP 4
Buat kesimpulan. Nilai t jatuh di daerah critical region, hal ini berarti H0
ditolak dan memberikan gambar yang paling ditakuti ke orang phobia
bisa mengurangi rasa phobia itu sendiri.

MEASURING EFFECT SIZE FOR THE REPEATED


–MEASURES t
Seperti yang kami catat dengan tes hipotesis lainnya, setiap kali efek
pengobatan ditemukan signifikan secara statistik, Anda
disarankan juga melaporkan ukuran absolut
besarnya efek. Ukuran efek yang paling umum digunakan adalah
Cohen's d dan r2, persentase varians dicatat. Ukuran treatment effect
juga
dapat digambarkan dengan interval kepercayaan yang memperkirakan
perbedaan rata-rata populasi, µD.
untuk mengukur dan menggambarkan ukuran efek.
Untuk menghitung besarnya efek dari treatment, kita menggunakan estimated d = sample mean difference / sample
standard deviation
= MD / s
Untuk contoh yang tadi,
Estimated d = MD / s
= 8.00 / √Ö9
= 8.00 / 3
= 2.67
Untuk menghitung r2, kita masih sama menggunakan rumus:
r2 = t2 / (t2+df)
= (7.05)2 / [(7.05)2 +6]
= 49.70 / 55.70
= 0.892 (89.2%)
Dari data tersebut, 89.2% variancenya menggambarkan efek dari therapy melihat gambar.
Interval kepercayaan untuk memperkirakan µD:
Seperti disebutkan dalam dua bab sebelumnya, itu
adalah mungkin untuk menghitung interval
kepercayaan sebagai metode alternatif untuk
mengukur dan menggambarkan ukuran efek
pengobatan. Untuk pengukuran berulang t, kami
menggunakan sampel perbedaan rata-rata, MD,
untuk memperkirakan perbedaan rata-rata populasi,
µD. Dalam hal ini,interval kepercayaan secara
harfiah memperkirakan ukuran efek pengobatan
dengan memperkirakan perbedaan rata-rata populasi
antara dua kondisi perlakuan. Seperti statistik t
lainnya, langkah pertama adalah menyelesaikan
persamaan t untuk yang tidak diketahui parameter.
Untuk statistik t pengukuran berulang, kami
memperoleh
Dalam persamaan, nilai MD dan sMD diperoleh dari data sampel.
Meskipun nilai statistik t tidak diketahui, kita dapat menggunakan
derajat kebebasan untuk statistik t dan tabel distribusi t untuk
mengestimasi nilai t. Menggunakan perkiraan t dan nilai yang
diketahui dari sampel, kita kemudian dapat menghitung nilai µD.
Untuk contoh tadi:
µD= MD ± tsMD
=8.00 ± 3.707(1.134)
=8.00 ± 4.204
Ini menghasilkan interval nilai mulai dari 8 – 4.204 = 4.204 hingga
8+4.204= 12.204
HIPOTESIS TEST
Dalam bab sebelumnya, kami mengidentifikasi beberapa faktor yang dapat
mempengaruhi hasil uji hipotesis dengan statistik t. Faktor yang sama berlaku untuk
tindakan berulang t. Faktor yang paling jelas adalah ukuran sampel perbedaan yang
berarti. Perbedaan rata-rata yang lebih besar meningkatkan kemungkinan menolak
hipotesis nol dan meningkatkan ukuran efek. Dua faktor lainnya adalah variabilitas
skor dan ukuran sampel, yang keduanya mempengaruhi besarnya galat standar yang
diestimasi dalam penyebut statistik t. Secara khusus, kesalahan standar berbanding
terbalik dengan ukuran sampel (ukuran yang lebih besar mengarah ke yang lebih kecil
kesalahan) dan secara langsung terkait dengan varians sampel (varian yang lebih
besar mengarah ke lebih besar kesalahan). Akibatnya, sampel yang lebih besar
menghasilkan nilai statistik t yang lebih besar (lebih jauh dari nol) dan meningkatkan
kemungkinan menolak H0. Varians yang lebih besar, di sisi lain menghasilkan nilai
yang lebih kecil untuk statistik t (mendekati nol) dan mengurangi kemungkinan
menemukan hasil yang signifikan. Meskipun varians dan ukuran sampel keduanya
mempengaruhi uji hipotesis, hanya varians memiliki pengaruh besar pada ukuran
ukuran efek seperti Cohen's d dan r2 ; varians yang lebih besar menghasilkan ukuran
efek yang lebih kecil. Ukuran sampel, di sisi lain, tidak berpengaruh pada nilai
Cohen's d dan hanya berpengaruh kecil pada r2.
06
PENGUNAAN DAN
ASUMSI T TEST
Pengertian Singkat
Perbedaan Paired T test dengan
Independent T test
T Test merupakan alat analisis statistik
yang digunakan untuk
membandingkan rata-rata (mean)
dari sekelompok data atau dua Independent T test
kelompok data. Independent Sample T Test adalah uji komparatif
(uji beda) yang bertujuan untuk menguji
apakah terdapat perbedaan rata-rata (mean)
signifikan antara 2 sample Bebas atau Tidak
Berpasangan. 2 Kelompok bebas maksudnya
adalah 2 kelompok data tidak berpasangan
Paired T test yang bisa berasal dari subjek yang berbeda.
Sementara itu, Paired Sample T-Test adalah metode analisis uji
beda (komparasi) yang bertujuan untuk mengetahui
apakah terdapat perbedaan rata-rata antara 2 sample yang
saling Berpasangan.
Perbedaan antara Independent dan Paired Sample T-Test
terdapat pada data yang akan di analisis. Independent
Samplet T-Test menggunakan data tidak berpasangan.
Sementara Paired Sample T-Test menggunakan data
Berpasangan.
TABLE OF CONTENTS

Coba fokus ke Table Independent T-Test. Tabel


itu bertujuan membandingkan Kolom Data 1 dengan
Kolom Data 2. Tapi jumlah (banyak) data tidak sama.
Data 1 terdapat 10 sample, sementara Data 2 sebanyak
7 sample.
Nah, kondisi inilah yang disebut dengan
sample bebas / tidak berpasangan / independent.
Selanjutnya, coba lihat table Paired Sample T-
Test, jumlah data kedua Sample (Data 1 dan Data 2)
sama banyak. Inilah yang di sebut dengan sample
berpasangan / paired.
 
Penting! Independent maupun Paired
Sample T-Test sama-sama
membandingkan 2 data yang berbeda.
Jika penelitian Anda hanya memiliki 1
kelompok data dan membandingkan
dengan 1 data khusus (seperti nilai rata-
rata umum), lebih baik gunakan
Student T-Test
Contoh Independent Sample T-Test

Sebelumnya sudah Saya jelaskan bahwa untuk Independent Sample T-Test, jumlah (banyak) antara kedua kelompok
data yang akan dibandingkan tidak sama. Misalnya Saya melakukan penelitian dengan judul Komparasi Penerapan
Metode Pembelajaran 1 dan Metode Pembelajaran 2 di SMAN 2 Kota Jambi.
Penelitian dilakukan terhadap 2 kelas yaitu Kelas A dan B. Pada penelitian ini, Saya menerapkan Metode Pembelajaran
1 ke kelas A dan Metode Pembelajaran 2 ke kelas B.
Kemudian, dari metode pembelajaran pada masing-masing kelas tersebut, Saya akan membandingkan Prestasi belajar
siswa antara kedua kelas (A dan B).
Sejauh ini yang sudah kita ketahui adalah:

1. Penerapan Metode Pembelajaran yang berbeda (ada 2)


2. Penerapan pada kelas yang berbeda (ada 2).
3. bertujuan membandingkan hasil penerapan dari 2 kelompok data (yaitu kelas A dan Kelas B).

Apakah Anda sudah bisa menentukan menggunakan Independent Sample T-Test ? Tentu Belum Bisa. Kenapa ? Karena
jumlah sample belum kita ketahui. Karena penelitian ini diterapkan pada Siswa Kelas A dan Kelas B, maka Anda harus
tahu berapa jumlah siswa masing-masing kelas yang akan dijadikan sample penelitian. Katakanlah jumlah siswa pada
Kelas A sebanyak 10 siswa. Sedangkan kelas B sebanyak 7 Siswa. Nah jika begini, Anda bisa menggunakan
Independent Sample T-Test Namun, beda ceritanya jika jumlah siswa (sample) masing-masing kelas sama banyak.
Contoh Paired Sample T-Test

Sebagai contoh, Saya melakukan penelitian


dengan judul “Analisis Perbedaan Return IHSG Tahun
2018 dan Tahun 2019” menggunakan data bulanan.
Karena saya akan menggunakan data bulanan,
maka 1 tahun = 12 bulan. Jadi data kelompok pertama
(2018) berjumlah 12 data.
Sedangkan data kelompok kedua (2019)
berjumlah 12 data juga. Untuk contoh ini, gunakanlah
Paired Sample T-Test karena jumlah data pada ke dua
kelompok (berdasarkan tahun) sama banyak.
ASUMSI T TEST

Distribusi populasi nilai


selisih (nilai D) harus
Perhatikan bahwa normal. Seperti sebelumnya,

01 02
asumsi independensi asumsi normalitas tidak perlu
mengacu pada skor dikhawatirkan kecuali ukuran
dalam setiap perlakuan. sampelnya relatif kecil.
Di dalam setiap Dalam kasus penyimpangan
perlakuan, skor yang parah dari normalitas,
diperoleh dari individu validitas uji i dapat
yang berbeda dan harus dikompromikan dengan
independen satu sama sampel kecil. Namun,
lain. dengan sampel yang relatif
besar
(n > 30), asumsi ini dapat
diabaikan.
THANK YOU

Anda mungkin juga menyukai