net/publication/337153473
CITATION READS
1 2,367
1 author:
Hendi Pratama
Universitas Negeri Semarang
48 PUBLICATIONS 88 CITATIONS
SEE PROFILE
All content following this page was uploaded by Hendi Pratama on 10 November 2019.
iii
Hak Cipta © pada penulis dan dilindungi Undang-Undang Penerbitan.
Hak Penerbitan pada UNNES PRESS.
Dicetak oleh UNNES Press.
Jl. Kelud Raya No. 2 Semarang 50237 Telp./Tax. (024) 8415032.
Dilarang mengutip sebagian atau seluruh isi buku ini dalam bentuk
apapun tanpa izin dari penerbit.
ISBN 978-602-285-217-9
iv
PRAKATA
v
Saya mengakui buku ini memiliki kelemahan. Buku ini
dibuat bukan sebagai buku referensi namun dibuat sebagai sebuah
buku ajar. Artinya buku ini banyak menyederhanakan aspek teori
dan mengutamakan aspek praktis dan empiris. Banyak analogi
matematis yang mungkin kurang akurat atau banyak contoh yang
terlalu disederhanakan. Itu semua untuk memudahkan mahasiswa
belajar. Jika pembaca merasa ada beberapa hal yang bisa
ditingkatkan, penulis dengan senang hati menerima kritik yang
membangun. Semoga ke depan, penulis diberikan kesempatan untuk
memperbaiki buku ajar ini menjadi sumber belajar yang jauh lebih
baik. Akhir kata, semoga buku ini bermanfaat bagi yang
menggunakan dan menjadi ladang amal bagi penulisnya.
vi
DAFTAR ISI
Prakata ......................................................................................... v
Daftar Isi ..................................................................................... vii
Rencana Pembelajaran Semester (RPS) ...................................... viii
Bab 1. Konsep Dasar Statistika ................................................... 1
Bab 2. Skala dalam Operasi Statistika ........................................ 15
Bab 3. Peran Statistika dalam Penyusunan Tugas Akhir ............ 19
Bab 4. Analisis Frekuensi dan Distribusi Normal ....................... 37
Bab 5. Uji Beda ........................................................................... 52
Bab 6. Uji Korelasi dan Regresi ................................................. 89
Bab 7. Skala Likert .....................................................................101
Bab 8. Analisis Statistik Kosakata Menggunakan Lextutor ........107
Daftar Pustaka ............................................................................. 110
Lampiran ..................................................................................... 111
vii
viii
ix
x
xi
xii
BAB 1
KONSEP DASAR
STATISTIKA
Sumber Pengetahuan
Salah satu aspek kehidupan manusia yang cukup penting
adalah pendidikan. Dalam dunia pendidikan terdapat suatu proses
penting yaitu penciptaan ilmu pengetahuan dan transfer ilmu
pengetahuan dari pengajar kepada peserta ajar. Statistika adalah
salah satu sumber pengetahuan yang dapat digunakan secara
konsisten dalam penelitian atau metode ilmiah. Berikut adalah
beberapa alternatif sumber ilmu pengetahuan.
(1) Pengetahuan yang berasal dari otoritas. Pada banyak
kesempatan kita bisa melihat bahwa ilmu pengetahuan
muncul dari pihak yang lebih berkuasa dan diperuntukkan
untuk pihak yang tidak terlalu berkuasa. Ada pengetahuan
yang bersifat tradisi. Diturunkan dari orang tua kepada
anaknya. Pengetahuan akan bahaya panasnya sebuah kompor
dapat diturunkan dari orang tua ke anak tanpa penjelasan
apapun. Kebetulan pengetahuan ini sama dengan
pengetahuan yang disimpulkan melalui metode ilmiah.
Namun pada kesempatan lain, seorang bapak menasehati
anak untuk tidak keluar di senja hari karena ada hantu yang
1. Populasi
Populasi adalah seluruh individu, objek atau skor yang
sedang dipelajari atau diinvestigasi. Jika saya ingin mengetahui
kemampuan bahasa Inggris seluruh mahasiswa Universitas Negeri
Semarang, maka saya dapat mendownload semua nilai Mata Kuliah
2. Sampel
Penelitian yang sempurna dan ideal adalah melibatkan semua
individu yang ada di sebuah populasi. Sayangnya, penelitian
biasanya memiliki keterbatasan logistik. Ada keterbatasan biaya,
waktu dan tenaga. Ketika saya ingin menginterview seluruh
penduduk Indonesia maka saya harus mengeluarkan dana yang
sangat besar dan saya tidak punya. Ketika saya diharuskan
mengetahui trend makanan favorit orang Indonesia maka saya
menggunakan sampling. Sampling adalah proses menentukan
sampel penelitian yang bisa mewakili populasi penelitian. Dengan
dana yang tersedia saya akan melakukan random sampling dari
penduduk Indonesia untuk saya interview atau saya berikan
kuisioner. Dalam statistika, sampling sangat diperbolehkan karena
sampel dapat mewakili populasi jika sampel diambil dengan cara
yang benar. Berikut adalah ilustrasi dari logika pengambilan sampel.
3. Variabel
Istilah variabel adalah istilah yang sangat ambigu. Namun
begitu ada baiknya kita tetap berusaha memahami istilah ini.
4. Data
Variabel adalah konstruksi abstrak dan sulit diukur. Tanpa
bantuan data, variabel sangat sulit dilogika dan dioperasionalkan.
Data adalah angka atau pengukuran yang diambil di lapangan.
Variabel "penggunaan media sosial" harus diukur dengan data.
Jumlah jam pemakaian media sosial dapat digunakan sebagai data.
Jenis media sosial yang digunakan juga data. Aktivitas apa yang
dilakukan oleh siswa saat menggunakan media sosial juga bisa
dijadikan data. Demikian juga dengan variabel "kemampuan
writing" harus diukur untuk dijadikan data. Cara yang paling umum
untuk mendapatkan data kemampuan writing adalah dengan
memberikan tes tulis kepada siswa dan kemudian dinilai. Sejumlah
skor terkumpul dan skor tersebut dapat dijadikan data. Jika ingin
5. Statistika
Mengapa data yang diambil dari lapangan harus berupa
angka? Karena memang statistika hanya akan berhasil digunakan
dengan baik jika datanya berupa angka. Oleh karena itu teknik
statistika paling cocok digunakan pada penelitian kuantitatif. Pada
penelitian kualitatif yang berbasis data non-angka, teknik statistika
kurang begitu bermanfaat. Oleh karena itu terkadang, data yang
berupa non-angka "dipaksa" diubah menjadi angka agar bisa diolah
menggunakan statistik. Contohnya, pada jenis media sosial yang
digunakan oleh siswa dapat berupa: Facebook, Instagram, Youtube
dan Twitter. Agar dapat diolah secara statistik maka data tersebut
harus diubah menjadi angka Facebook=1, Instagram=2, Youtube=3
dan Twitter=4. Atau misalnya pernyataan peserta penelitian dapat
juga diubah menjadi angka. Misalnya, apakah anda setuju jika
mahasiswa kuliah harus diwajibkan memakai seragam? Jawabannya
harus diubah menjadi angka: sangat setuju=5, setuju=4, netral=3,
tidak setuju=2 atau sangat tidak setuju=1. Proses yang demikian
sangat dibutuhkan karena statistik hanya bisa mengolah angka.
Program SPSS yang nantinya akan kita gunakan untuk mengolah
data juga hanya bisa mengolah data angkat. Secara singkat, teknik
statistika adalah proses kuantifikasi data dan cara menyajikan data
berupa angka.
1. Skala nominal
Skala nominal adalah skala yang paling lemah dalam teknik
statistika. Dikatakan sebagai skala yang paling lemah karena data ini
paling sulit dipakai. Jika kita masih ingat dengan contoh pada Bab 1
yang menggunakan jenis media sosial sebagai data angka. Maka
itulah salah satu contoh penggunaan skala nominal. Jika ada peserta
penelitian menjawab bahwa media sosial yang paling sering mereka
pakai maka mereka ditandai dengan angka 1, jika instagram 2, jika
youtube 3 dan jika twitter 4. Bahkan kita masih bisa menambah satu
kategori lagi misalnya media sosial lainnya dengan angka 5.
2. Skala Ordinal
Skala ordinal adalah skala yang cukup bersahabat dalam
teknik statistika. Skala ordinal merupakan skala urutan yang tidak
berinterval sama. Mari kita contohkan skor TOEFL sebagai skala
ordinal. Skor tersebut bisa menentukan mana individu yang tinggi
skornya dan mana yang lebih rendah skornya. Seseorang dengan
skor TOEFL 507 tentu lebih tinggi dari seseorang dengan skor 407.
Tapi skor ini tetap tidak bisa dioperasikan secara matematika. Nilai
TOEFL tidak bisa dikalikan dua ataupun dikalikan tiga. Demikian
juga dengan skor IQ, skor IQ tidak bisa dikalikan dua atau dibagi
tiga untuk mendapatkan hasil secara matematis.
Pada contoh di bab 1. ketika jawaban responden diberikan
kode: sangat setuju (5), setuju (4), netral (3), tidak setuju (2) atau
sangat tidak setuju (1) maka hasil tersebut dapat digunakan sebagai
skala ordinal. Artinya peserta dengan skor 4 pasti lebih setuju
daripada peserta yang mengisi skor 2. Sayangnya, jika anda tidak
setuju sebanyak dua kali maka bukan berarti anda menjadi setuju.
Pada skala ordinal, 2x2 tidak bisa menjadi 4.
3. Skala interval
Skala interval adalah skala yang bermanfaat bagi statistika
tapi jarang ditemui pada data yang dibutuhkan di bidang pendidikan
bahasa. Contoh klasik untuk skala interval adalah suhu. Jarak antara
4. Skala Rasio
Skala rasio adalah skala yang paling ideal digunakan untuk
operasi statistika. Sifat skala rasio hampir sama dengan skala
interval. Dari poin satu ke poin yang lain jaraknya selalu sama dan
stabil. Terlebih lagi skala rasio memiliki nilai 0 absolut.
Contoh dari skala rasio adalah pengukuran tinggi badan.
Tinggi badan memiliki nilai 0. Selisih dari seorang anak dengan
tinggi 80 cm dengan seorang dewasa dengan tinggi 160 cm adalah
80 cm. Karena memiliki nilai 0 absolut maka dapat dikatakan bahwa
orang dewasa tersebut dua kali lebih tinggi dari pada anak tadi. Pada
skala interval hal ini tidak bisa diperlakukan sama. Pengukuran berat
badan juga dapat dikatakan sebagai skala rasio. Berat badan
OLAP Cubes
Case Summaries
Dengan Case summaries, kita bisa mengontrol data apa
yang ingin kita tampilkan dan mana yang tidak. Case summaries
akan menghasilkan output yang lebih panjang dari OLAP Cubes.
Lakukanlah langkah-langkah latihan menggunakan Case
Summaries sebagai berikut.
(1) Lakukan langkah seperti langkah 1 sampai dengan 5
pada OLAP Cubes
(2) Selanjutnya klik Analyse – Reports – Case
Summaries pada SPSS. Masukkan data-data
berikut.
Gambar 4.2. Contoh Area Ekor Kanan dan Kiri pada Kurva
Normal
Dari 100 orang tersebut kebanyakan orang akan berada pada zona
"normal" antara 160 sampai dengan 180 cm. Dengan demikian
wajar jika dalam kurva normal bagian yang menggunung adalah
bagian tengah. Misalkan digambarkan secara ideal maka orang
dengan tinggi 150-155 cm adalah 3 orang, kemudian tinggi 155-
160 adalah 7 orang, tinggi 160-170-40 orang, tinggi 170-180
adalah 40 orang, 180-185 adalah 7 orang, dan tinggi 185-190 cm
adalah 3 orang.
Kurva yang sama akan ditemukan pada berbagai
pengukuran. Misalnya ada 100 orang diajari cara bermain piano
setiap hari oleh seorang ahli pengajar piano. Semua 100 orang
tersebut belum pernah bermain piano sama sekali. Maka segelintir
dari mereka akan menguasai piano dalam waktu 1 bulan.
Kebanyakan sejumlah 40 orang akan menguasai piano dalam waktu
2 tahun atau 3 tahun. Sejumlah 40 orang lainnya akan menguasai
Standar Deviasi
Setelah memahami konsep kurva distribusi normal yang
berbentuk seperti lonceng tertelungkup, sudah saatnya kita
memahami konsep standar deviasi (Leech et al, 2005: 19) . Masih
menggunakan kurva yang sama mari kita pahami apa yang
dimaksud dengan standar deviasi.
Analisis Frekuensi
Frekuensi sangat sering dipakai untuk menyajikan data.
Masih menggunakan contoh 100 orang yang tingginya bervariasi
antara 145 cm sampai dengan 191 cm. Karena ini pengukuran yang
mendekati nilai asli maka agak susah untuk benar-benar pas sesuai
keinginan distribusi normal kita. Berikut adalah data riil
pengukuran tinggi badan ke 100 orang tersebut.
Pada output akan keluar angka yang kita cari. Mean atau rata-
rata tinggi badan dari 100 orang tersebut adalah 168.74. Nilai tengah
atau mean adalah 169 dan nilai yang paling muncul (modus) adalah
174. Pada output gambar akan muncul gambar berikut.
Paired-Samples T-TEST
Mari kita berlatih untuk menggunakan uji beda paired
samples. Data paired samples adalah data yang didapat dari pre-test
dan post-test. Dianggap paired atau berpasangan karena setiap siswa
selalu memiliki dua nilai yaitu nilai pre test dan nilai post test. Siswa
yang bolos pada salah satu test terpaksa dikeluarkan dari dataset dan
tidak memenuhi syarat untuk diuji dalam test ini. Uji beda paired-
samples yang paling populer digunakan adalah paired samples T-
TEST. T-TEST ini tidak boleh sembarang dipakai karena test ini
tergolong test parametrik. Harus ada beberapa prasyarat yang harus
dipenuhi. Contohnya, sebelum menggunakan T-TEST kita harus
menguji bahwa dataset yang digunakan adalah data yang
terdistribusi secara normal. Jika tidak terdistribusi secara normal
maka kita harus menggunakan uji beda jenis lain yang tidak harus
menggunakan prasyarat ini. Kita bisa menggunakan Wilcoxon
misalnya untuk pengganti T-TEST jika ternyata data yang dipakai
tidak terdistribusi secara normal. Wilcoxon termasuk test
nonparametrik (Griffith, 2007).
Berikut adalah data yang bisa kita gunakan untuk berlatih T-
TEST. Berikut adalah data dari SMP 2 Konoha.
ID Pre-test Post-test
1 56 57
2 61 60
3 65 53
4 73 77
5 72 73
6 72 52
7 56 57
8 57 56
9 63 63
10 53 69
11 56 72
12 71 72
13 68 59
14 75 57
15 62 72
16 59 70
17 66 73
18 65 80
19 67 53
20 59 67
21 51 62
22 61 65
Nilai Asymp. Sig (2-tailed) harus lebih besar dari 0.05 untuk
membuktikan bahwa distribusi data normal. Pada tabel di atas nilai
Asymp. Sig (2-tailed) untuk pre-test 0.945 dan post-test 0.741 (pada
SPSS versi terbaru angka ini bisa berbeda, yang penting di atas 0.05
sudah aman). Terlihat jelas bahwa dua angka tersebut lebih besar
dari 0.05. Maka dapat disimpulkan dari gambar grafik dan hasil
Kolmogorov Smirnov bahwa data yang kita uji memenuhi distribusi
T-TEST. Maka T_TEST dapat dilanjutkan.
Selanjutnya klik analyze - compare means - paired
samples t-test. Jika sudah diklik akan keluar dialog sebagai berikut.
Nilai Asymp. Sig (2-tailed) harus lebih besar dari 0.05 untuk
membuktikan bahwa distribusi data normal. Pada tabel di atas nilai
Asymp. Sig (2-tailed) untuk pre-test 0.591 dan post-test 0.428 (pada
SPSS versi terbaru angka ini bisa berbeda, yang penting di atas 0.05
sudah aman). Terlihat jelas bahwa dua angka tersebut lebih besar
dari 0.05. Maka dapat disimpulkan dari gambar grafik dan hasil
Kolmogorov Smirnov bahwa data yang kita uji memenuhi distribusi
T-TEST. Maka T_TEST dapat dilanjutkan.
Angka yang paling penting pada tabel di atas adalah Sig. (2-
tailed) dengan nilai 0.275. Ingat bahwa SPSS tidak menuliskan
angka 0 di depan koma. Cara membaca tabel T-TEST ini
berkebalikan dengan cara baca Kolmogorov Smirnov. Pada T-TEST
kita mencari angka Sig yang lebih kecil dari 0.05. Kalau di
Kolmogorov Smirnov kita mencari angka Sig lebih besar dari 0.05.
Untuk hasil perhitungan kita di atas, kita dapat lihat Sig 0.275 adalah
lebih besar dari 0.05. Ini adalah hasil yang kurang untuk T-TEST,
yang artinya perbedaan skor antara pretest dan postest tidak
signifikan. Karena tidak signifikan perbedaan skor antara pre test
dan post test maka kemungkinan besar metode pengajaran reading
yang diujikan diduga tidak efektif menaikkan skor.
Kasus pada SMP 2 Konoha dan SMP 3 Konoha memberikan
pembelajaran pada kita bahwa walaupun nilai post test lebih tinggi
dari pre test pada kedua sekola,h namun ternyata setelah dihitung
menggunakan teknik statistika T-TEST, perbedaan skor pada SMP
2 terbukti signifikan dan pada SMP 3 terbukti tidak signifikan. Tidak
semua post-test yang nilainya lebih bagus dari pre-test memiliki
kekuatan yang sama di mata statistika. Walaupun hasil penelitian di
SMP 3 Konoha menunjukkan hasil yang tidak signifikan dan metode
Siswa 1 56 57 Siswa 1
Siswa 2 61 60 Siswa 2
Siswa 3 65 53 Siswa 3
Siswa 4 73 77 Siswa 4
Siswa 5 72 73 Siswa 5
Siswa 6 72 52 Siswa 6
Siswa 7 56 57 Siswa 7
Siswa 8 57 56 Siswa 8
Siswa 9 63 63 Siswa 9
Siswa 10 53 69 Siswa 10
Siswa 11 56 72 Siswa 11
Siswa 12 71 72 Siswa 12
Siswa 13 68 59 Siswa 13
Siswa 14 75 57 Siswa 14
Siswa 15 62 72 Siswa 15
Siswa 16 59 70 Siswa 16
Siswa 17 66 73 Siswa 17
Siswa 18 65 80 Siswa 18
Siswa 19 67 53 Siswa 19
Siswa 20 59 67 Siswa 20
Siswa 21 51 62 Siswa 21
Siswa 22 61 65 Siswa 22
Siswa 23 66 63 Siswa 23
Siswa 24 55 74 Siswa 24
Siswa 25 74 61 Siswa 25
Siswa 26 50 68 Siswa 26
Siswa 27 74 60 Siswa 27
Siswa 28 57 67 Siswa 28
Siswa 29 74 73 Siswa 29
Siswa 30 62 52 Siswa 30
Siswa 31 51 62 Siswa 31
Siswa 32 61 80 Siswa 32
56 Siswa 33
62 Siswa 34
Rata2 62,88 64,62
Gambar 6.1 Ilustrasi Data Sederhana IQ, IPK dan Uang Jajan
IPK
3,8
3,6
3,4 IPK
3,2
90 110 130 150
Uang Jajan
900.000
700.000
500.000 Uang
Jajan
300.000
90 110 130 150
Nilaibahas Nilaimatem
a atika
Nilaibahasa Pearson
1 .552**
Correlation
Sig. (2-tailed) .000
N 527 527
Nilaimatematik Pearson
.552** 1
a Correlation
Sig. (2-tailed) .000
N 527 527
**. Correlation is significant at the 0.01 level (2-tailed).
Mari kita baca tabel dan angka yang penting penting saja.
Pada tabel model summary, R menunjukkan koefisien korelasi.
0.552 masuk di antara rentang 0.5-0.8. Artinya korelasi yang ada
memang kuat antara matematika dan bahasa. Kolo, R Square
menunjukkan angka 0.304, artinya pengaruh nilai matematika ke
nilai bahasa hanya menjelaskan 30.4% populasi yang ada. 69.6%
fenomena disebabkan oleh pengaruh lain. Pada tabel ANOVA, sig
.000 menunjukkan pembacaan test ini boleh dilanjutkan ke tabel
selanjutnya karena .000 lebih kecil dari 0.05. Pada tabel coefficient
terdapat angka 176.054 dan koefisien matematika adalah 0.564.
Angka-angka ini digunakan untuk memprediksi skor bahasa jika
nilai matematika diketahui. Rumusnya menjadi seperti ini
Nilaibahasa = (0.564 x nilaimatematika) + 176.054.
Contohnya, jika seorang mahasiswa nilai matematikanya
adalah 400 maka nilai bahasanya adalah 401.654. Seberapa akurat
Pada bab 7 ini, kita akan bahas skala likert yang sangat sering
digunakan dalam riset atau survei. Skala Likert adalah solusi kita
untuk memberikan skor pada persepsi ataupun sikap. Mungkin
beberapa dari kita pernah menjadi peserta dalam penelitian.
Kemudian kita diminta mengisi survei. Salah satu pertanyaannya
adalah sebagai berikut. "Apakah anda setuju jika mahasiswa
diperbolehkan memakai sandal di kampus?" Kemudian anda diminta
untuk memilih: Sangat Setuju, Setuju, Tidak Setuju, Sangat Tidak
Setuju. Skala yang demikian disebut sebagai Skala Likert. Skala ini
pertama kali dirancang dan digunakan oleh Rensis Likert seorang
psikolog dari Amerika.
Dengan skala Likert, kita mendapatkan skor dari sebuah
pertanyaan kualitatif. Pada pertanyaan "Apakah anda setuju jika
mahasiswa diperbolehkan memakai sandal di kampus?" maka
seorang responden bisa menjawab dengan kalimat bebas. Namun
kalimat bebas itu tidak dapat diubah menjadi angka. Dengan skala
Likert, jawaban responden diarahkan menjadi angka. Sangat Setuju
diubah menjadi angka 4. Setuju diubah menjadi angka 3. Tidak
Setuju diubah menjadi angka 2. Sangat Tidak Setuju diubah menjadi
angka 1. Setelah menjadi angka, skor tersebut dapat dimasukkan
tabel dan kemudian diolah menggunakan SPSS. Ada beberapa
peneliti yang masih menggunakan pilihan Netral. Namun saya
sendiri sudah menghindari kategori netral karena memancing
responden untuk memilih Netral. Dengan budaya ketimuran yang
menghindari konflik, banyak responden menjawab Netral karena
nyaman tidak perlu memihak (Fink, 2002).
2. Saya selalu menegur orang lain yang tidak tertib saat mengantri.
a. Sangat Setuju b. Setuju
c. Tidak Setuju d. Sangat Tidak Setuju
Apakah anda
sering terlibat
pecakapan
Tidak sangat sangat
6 menggunakan jarang sering
pernah jarang sering
bahasa Inggris
dengan teman
anda?
Berapa kali anda
pernah menjadi 4 kali
7 peserta lomba 0 kali 1 kali 2 kali 3 kali atau
menggunakan lebih
bahasa Inggris?
Apakah ada
anggota keluarga
Ada Ada
anda yang dapat Tidak
8 tapi dan
berkomunikasi ada
pasif Aktif
dengan bahasa
Inggris?
Berapa jumlah film
bahasa Inggris
4 film
yang anda tonton
9 0 film 1 film 2 film 3 film atau
dalam satu bulan
lebih
menurut perkiraan
anda?
Berapa kali anda 4 kali
10 pernah berkunjung 0 kali 1 kali 2 kali 3 kali atau
ke luar negeri? lebih