BAB I
PENDAHULUAN
A. Latar belakang
Statistik memegang peranan yang penting dalam penelitian, baik dalam
penyusunan model, perumusan hipotesa, dalam pengembangan alat dan instrumen
pengumpulan data, dalam penyusunan desain penelitian, dalam penentuan sampel dan
dalam analisa data. Dalam banyak hal, pengolahan dan analisa data tidak luput dari
penerapan teknik dan metode statistik tertentu, yang mana kehadirannya dapat
memberikan dasar bertolak dalam menjelaskan hubungan-hubungan yang terjadi.
Statistik dapat digunakan sebagai alat untuk mengetahui apakah hubungan kausalitas
antara dua atau lebih variabel benar-benar terkait secara benar dalam suatu kausalitas
empiris ataukah hubungan tersebut hanya bersifat random atau kebetulan saja.
Statistik telah memberikan teknik-teknik sederhana dalam mengklasifikasikan
data serta dalam menyajikan data secara lebih mudah, sehingga data tersebut dapat
dimengerti secara lebih mudah. Statistik telah dapat menyajikan suatu ukuran yang
dapat menyifatkan populasi ataupun menyatakan variasinya, dan memberikan
gambaran yang lebih baik tentang kecenderungan tengah-tengah dari variabel.
Statistik dapat menolong peneliti untuk menyimpulkan apakah suatu
perbedaan yang diperoleh benar-benar berbeda secara signifikan. Apakah kesimpulan
yang diambil cukup refresentatif untuk memberikan inferensi terhadap populasi
tertentu.
Teknik-teknik statistik juga dapat digunakan dalam pengujian hipotesa,
mengingat tujuan penelitian pada umumnya adalah untuk menguji hipotesa-hipotesa
yang telah dirumuskan, maka statistik telah banyak sekali menolong peneliti dalam
mengambil keputusan untuk menerima atau menolak suatu hipotesa. Statistik juga
dapat meningkatkan kecermatan peneliti dalam rangka mengambil keputusan terhadap
kesimpulan-kesimpulan yang ingin ditarik.
Penarikan kesimpulan secara statistik memungkinkan peneliti melakukan
kegiatan ilmiah secara lebih ekonomis dalam pembuktian induktif. Tetapi harus
disadari bahwa statistik hanya merupakan alat dan bukan tujuan dari analisa. Karena
1
itu, janganlah dijadikan statistik sebagai tujuan yang menentukan komponen-
komponen peneliti yang lain.
B. Rumusan masalah
Untuk menjawab latar belakang yang ada, maka kita harus tahu “Konsep Dasar
Statistik” yang meliputi :
1. Apa pengertian statistik dan statistika?
2. Apa pengertian hipotesis penelitian dan cara membuat hipotesis penelitian?
3. Apa macam – macam statistik?
4. Apa pengertian populasi dan sampel beserta contohnya?
5. Apa macam – macam populasi dan sampel?
C. Tujuan penulisan
1. Untuk mengetahui pengertian statistik dan statistika.
2. Untuk mengetahui pengertian hipotesis penelitian dan cara membuat hipotesis
penelitian.
3. Untuk mengetahui macam – macam statistik.
4. Untuk mengetahui pengertian populasi dan sampel beserta contohnya.
5. Untuk mengetahui macam – macam populasi dan sampel.
D. Manfaat
Manfaat dari kita mempelajari “Konsep Dasar Statistik” adalah dapat
membantu kita dalam kehidupan sehari – hari dan manfaatnya sangat beragam.
Sebagai contoh sederhana yakni bagi ibu rumah tangga, bagi mahasiswa, dalam dunia
bisnis serta dalam bidang industri. Jadi, statistika sebenarnya sangat penting bagi kita,
dapat berguna dalam menentukan keputusan meskipun kadangkala penggunaannya
tidak kita sadari.
2
Kelompok 2
BAB II
PEMBAHASAN
3
Sedangkan, pengertian statistika inferensi adalah ilmu mengenai penarikan
kesimpulan dan pengambilan keputusan tentang makna statistik yang telah dihitung.
Pengertian statistik adalah hasil-hasil pengolahan dan analisis data. Statistik
dapat berupa mean, modus, median, dan sebagainya. Statistik dapat digunakan untuk
menyatakan kesimpulan data berbentuk bilangan yang disusun dalam bentuk tabel
atau diagram yang menggambarkan karakteristik data.
4
B. Pengertian Hipotesis Penelitian dan Cara Membuat Hipotesis Penelitian
Hipotesis berasal dari bahasa Yunani, yaitu hypo yang artinya di bawah dan
thesis yang berarti pendirian/pendapat/kepastian. Jadi bisa disimpulkan hipotesis
adalah jawaban sementara terhadap suatu masalah yang sifatnya masih praduga
karena harus dibuktikan terlebih dahulu.
Jenis-jenis Hipotesis
Dilihat dari rumusnya,hipotesis dapat dibagi menjadi dua:
1. Hipotesis kerja atau alternatif (Ha)
Dalam hipotesis ini dinyatakan bahwa antara variabel X dan Y saling
berhubungan atau adanya perbedaan antara dua kelompok.
Rumus hipotesa kerja:
Jika…Maka…
Ada perbedaan antara…dan….dalam…
5
Ada pengaruh….terhadap….
2. Hipotesis nol (null hypotheses) disingkat Ho
Dalam hipotesis ini dinyatakan bahwa antara variabel X dan Y tidak ada
perbedaan , atau tidak adanya pengaruh variabel X terhadap Y.
Atau bisa dikatakan selisih variabel pertama dengan variabel kedua adalah nol.
Hipotesis ini sering disebut dengan hipotesis statistik, karena biasa dipakai dalam
sebuah penelitian yang sifatnya statistik.
1. Hipotesis induktif
2. Hipotesis deduktif
Adalah jenis hipotesis yang perumusannya berdasarkan teori ilmiah yang telah
sebelumnya telah ada.
6
Terdapat dua pilihan yang bisa dibuat oleh peneliti sesuai dengan dasar teori yang
digunakan, yaitu:
atau
2. Hipotesis komparatif
Bentuk hipotesis ini bisa diartikan sebagai dugaan terhadap rumusan masalah
yang isinya mempertanyakan perbandingan terhadap dua variabel.
Contoh:
Seorang peneliti ingin mengetahui tingkat kepedulian sosial
masyarakat A dengan masyarakat B. Apakah keduanya memiliki kepedulian
sosial yang sama atau berbeda.
Di dalam penelitian ini
, variabel yang dipakai adalah variabel jamak. Variabel pertama adalah
tingkat kepedulian sosial masyarakat A, dan variabel yang kedua adalah
tingkat kepedulian sosial masyarakat B.
Dalam kasus ini, maka hipotesis yang dipakai adalah hipotesis
komparatif, karena isinya mempertanyakan perbandingan antar dua variabel.
Maka hipotesis yang bisa dibuat adalah:
atau
3. Hipotesis asosiatif
Hipotesis asosiatif adalah jawaban sementara terhadap rumusan masalah yang
mempertanyakan hubungan antar dua variabel.
Contoh:
Seorang peneliti ingin mengetahui apakah jam belajar mempengaruhi
prestasi anak.
7
Rumusan masalah yang bisa dibuat adalah;-Apakah jam belajar bisa
berpengaruh terhadap prestasi anak?
Dalam contoh tersebut, variabel yang dipakai adalah jamak. Variabel
pertama “jam belajar” dan variabel kedua adalah “prestasi anak”.
Di dalam contoh tersebut, hipotesis yang digunakan adalah hipotesis
asosiatif, karena rumusan masalahnya mengandung pertanyaan hubungan dari
dua variabel. Maka hipotesis yang bisa dibuat adalah:
atau
Syarat-syarat Hipotesis
Walaupun masih pernyataan praduga, hipotesis memiliki kedudukan yang
penting dalam sebuah penelitian. Oleh karena itu, peneliti diharapkan merumuskan
hipotesisnya dengan jelas.
Menurut Borg dan Gall, syarat-syarat dari hipotesis adalah sebagai berikut.
Sebuah hipotesis harus dirumuskan dengan singkat,padat dan jelas.
Sebuah hipotesis harus menunjukkan adanya hubungan antara dua atau lebih variabel.
Sebuah hipotesis harus berdasarkan pendapat/teori-teori para ahli atau hasil penelitian
yang relevan.
8
Cara Merumuskan Hipotesis
Setiap orang bisa membuat hipotesis, namun untuk menghasilkan hipotesis
yang baik, perlu mengikuti langkah-langkah tertentu. Dengan mengikuti langkah yang
baik dan benar, maka sebuah hipotesis akan mempermudah jalannya penelitian.
Hipotesis adalah dugaan atau terkaan, namun dalam pembuatannya tetap harus
didasari teori dan fakta ilmiah.
1. Teori Ilmiah
Untuk mempermudah proses pembuatan hipotesis, seorang peneliti biasanya akan
menjabarkan sebuah teori menjadi pendapat dan prostulat. Pendapat-pendapat
tersebut bisa dikatakan sebagai anggapan yang mendasari lahirnya hipotesis. Yang
selanjutnya bisa diuji menggunakan data untuk menarik sebuah kesimpulan.
2. Fakta Ilmiah
Yang kedua untuk merumuskan hipotesis adalah dengan menggunakan fakta.
Secara umum, fakta diartikan sebagai kebenaran yang bisa diterima oleh nalar
manusia serta sesuai kenyataan yang ada.
Selain dari dua sumber data di atas, perumusan hipotesis juga bisa diperoleh
dari sumber lain, yaitu:
a. Kebudayaan
b. Ilmu yang menghasilkan teori yang sesuai
c. Analogi
d. Reaksi orang terhadap sesuatu dan pengalaman
9
Dalam perkembangan untuk menyelesaikan suatu masalah dapat digunakan
beberapa pendekatan antara lain statistika dalam arti sempit/ statistik Deskriptif dan
statistik dalam arti luas/ statistik Inferensial (Sutrisno Hadi, 1994;221)
1. Statistik Deskriptif
Menurut Sugiyono (2016) Statistik Deskriptif adalah statistik yang digunakan
untuk menggambarkan atau menganalisis suatu statistik hasil penelitian, tetapi
tidak digunakan untuk membuat kesimpulan yang lebih luas (generalisasi atau
inferensi).
Penelitian yang tidak menggunakan sampel, analisisnya akan menggunakan
statistik deskriptif. Demikian juga penelitian yang menggunakan sampel, tetapi
peneliti tidak bermaksud untuk membuat kesimpulan terhadap populasi dari mana
sampel diambil, maka statistik yang digunakan adalah statistik deskriptif. Dalam
hal ini Teknik Korelasi dan Regresi juga dapat berperan sebagai Statistik
Deskriptif.
Statistik deskriptif adalah statistik yang berfungsi untuk mendeskripsikan atau
memberi gambaran terhadap objek yang diteliti melalui data sampel atau populasi
sebagaimana adanya, tanpa melakukan analisis dan membuat kesimpulan yang
berlaku untuk umum.
2. Statistik Inferensial
Statistik dalam arti luas disebut juga dengan statistika inferensial atau
statistika induktif/statistic probabilitas ialah suatu alat pengumpulan data,pengolah
data, menarik kesimpulan, membuat tindakan berdasarkan analisis data yang
dikumpulkan atau statistika yang digunakan menganalisis data sampel dan
hasilnya dimanfaatkan (generalisasi) untuk populasi.
Menurut Sugiyono (2016)Statistik inferensial adalah statistik yang digunakan
untuk menganalisis data sampel, dan hasilnya akan digeneralisasikan
(diinferensikan) untuk populasi di mana sampel diambil.
Statistik Inferensial dapat dibedakan menjadi dua yaitu Statistik Parametris
dan Statistik Non Parametris.
a. Statistik Parametris
Statistik paramentris digunakan untuk menguji hipotesis asosiatif (hubungan antar
variable) meliputi: korelasi product, korelasi ganda dan korelasi parsial.
Menurut sugiyono (2016) Statistik parametris digunakan untuk menganalisis data
interval atau rasio, yang diambil dari populasi yang berdistribusi normal.
10
b. Statistik Non Parametris adalah digunakan untuk menganalisis data nominal dan
ordinal dari populasi yang bebas distribusi. Jadi tidak harus normal. Dalam hal ini
Teknik Korelasi dan Regresi dapat berperan sebagai Statistik Inferensial.
11
binatang, tumbuh-tumbuhan dan sejenisnya. Sedangkan sampel dalam penelitian
kualitatif bukan dinamakan responden, tetapi sebagai nara sumber, partisipan,
informan, teman dan guru dalam penelitian. Sampel dalam penelitian kualitatif, juga
bukan disebut sampel statistik, tetapi sampel teoritis, karena tujuan penelitian
kualitatif adalah untuk menghasilkan teori.
Populasi adalah wilayah generalisasi yang terdiri atas : obyek atau subyek
yang mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti
untuk dipelajari dan kemudian ditarik kesimpulannya. Jadi populasi tidak hanya
orang, tetapi juga obyek dan benda-benda alam yang lain. Populasi juga bukan
sekedar jumlah yang ada pada obyek atau subyek yang dipelajari, tetapi meliputi
seluruh karakteristik atau sifat yang dimiliki oleh subyek atau obyek itu.
Populasi terbatas atau populasi terhingga, yakni populasi yang memiliki batas
kuantitatif secara jelas karena memiliki karakteristik yang terbatas. Misalnya
5.000.000 orang guru SMA pada awal tahun 1985, dengan karakteristik; masa kerja 2
tahun, lulusan program Strata 1, dan lain-lain.
12
Populasi tak terbatas atau populasi tak terhingga, yakni populasi yang tidak
dapat ditemukan batas-batasnya, sehingga tidak dapat dinyatakan dalam bentuk
jumlah secara kuantitatif. Misalnya guru di Indonesia, yang berarti jumlahnya harus
dihitung sejak guru pertama ada sampai sekarang dan yang akan datang.
Dalam keadaan seperti itu jumlahnya tidak dapat dihitung, hanya dapat
digambarkan suatu jumlah objek secara kualitas dengan karakteristik yang bersifat
umum yaitu orang-orang, dahulu, sekarang dan yang akan menjadi guru. populasi
seperti ini disebut juga parameter.
Jenis-Jenis Populasi
Macam-macam populasi dilihat dari penentuan sumber data :
a. Populasi terbatas, yaitu populasi yang memiliki sumber data yang jelas batas-
batasnya secara kuantitatif. Misalnya, jumlah murid SLTA di Surabaya pada
tahun 2004 sebanyak 150.000 siswa terdiri dari 78.000 murid putra dan 72.000
murid putri.
b. Populasi tak terhingga, yaitu populasi yang memiliki sumber data yang tidak
dapat ditentukan batas-batasnya secara kuantitatif. Oleh karenanya, luas populasi
bersifat tak terhingga dan hanya dapat dijelaskan secara kualitatif. Misalnya,
jumlah gelandangan di Indonesia. Ini berarti harus dihitung jumlah gelandangan
di Indonesia dari tahun ke tahun, dan tiap kota. Tidak saja perhitungan terhadap
jumlah gelandangan yang ada sekarang, tetapi juga dilakukan penafsiran jumlah
gelandangan di waktu yang akan datang.
Macam-macam populasi dilihat dari kompleksitas objek populasi Margono
(2004: 119-120) :
Populasi homogen, yaitu keseluruhan individu yang menjadi anggota populasi,
memiliki sifat-sifat yang relatif sama satu sama lainnya. Sifat populasi seperti ini
banyak dijumpai pada medan eksakta, misalnya air. Ciri yang menonjol dari
populasi homogen, tidak ada perbedaan hasil tes dari jumlah tes populasi yang
berbeda. Maksudnya adalah gejala yang timbul pada satu kali percobaan atau tes
merupakan gejala yang timbul pada seratus kali atau lebih tes terhadap populasi
yang sama.
Populasi heterogen, yaitu keseluruhan individu anggota populasi relatif
memiliki sifat-sifat individual, dimana sifat tersebut membedakan individu
anggota populasi yang satu dengan yang lainnya. Dengan kata lain bahwa
13
individu anggota populasi memiliki sifat yang bervariasi sehingga memerlukan
penjelasan terhadap sifat-sifat tersebut baik secara kuantitatif maupun kualitatif.
Pada penelitian sosial, populasi heterogen menjadi tidak asing lagi dalam setiap
penelitian. Hal ini disebabkan semua penelitian sosial berobjekkan manusia atau
gejala-gejala dalam kehidupan manusia yang bersifat amat unik dan kompleks
Selain pembedaan-pembedaan di atas, populasi juga dapat dibedakan antara
populasi sampling dan populasi sasaran. Misalnya, apabila kita mengambil rumah
tangga sebagai sampel sedangkan yang diteliti hanyalah rumah tangga yang
bekerja sebagai petani, maka keseluruhan rumah tangga dalam wilayah penelitian
disebut populasi sampling, sedangkan seluruh petani dalam wilayah penelitian
disebut populasi.
Menurut Margono (2004: 119) populasi dapat dibedakan ke dalam hal berikut
ini:
a. Populasi teoretis (teoritical population), yakni sejumlah populasi yang
batas-batasnya ditetapkan secara kualitatif. Kemudian agar hasil penelitian
berlaku juga bagi populasi yang lebih luas, maka ditetapkan terdiri dari
guru; berumus 25 tahun sampai dengan 40 tahun, program S1, jalur
skripsi, dan lain-lain.
b. Populasi yang tersedia (accessible population),
Yakni sejumlah populasi yang secara kuantitatif dapat dinyatakan dengan
tegas. Misalnya, guru sebanyak 250 di kota Bandung terdiri dari guru yang
memiliki karakteristik yang telah ditetapkan dalam populasi teoretis.
14
dapat menggunakan sampel yang diambil dari populasi itu. Apa yang
dipelajari dari sampel itu, kesimpulannya akan diberlakukan untuk populasi.
Untuk itu sampel yang diambil dari populasi harus betul-betul representatif.
15
Penelitian bermaksud mengadakan generalisasi dari hasil-hasil
kepenelitiannya, dalam arti mengenakan kesimpulan-kesimpulan kepada
objek, gejala, atau kejadian yang lebih luas.
a. Ukuran populasi
Dalam hal populasi tak terbatas (tak terhingga) berupa parameter yang
jumlahnya tidak diketahui dengan pasti, pada dasarnya bersifat konseptual.
Karena itu sama sekali tidak mungkin mengumpulkan data dari populasi
seperti itu. Demikian juga dalam populasi terbatas (terhingga) yang
jumlahnya sangat besar, tidak praktis untuk mengumpulkan data dari
populasi 50 juta murid sekolah dasar yang tersebar di seluruh pelosok
Indonesia, misalnya.
b. Masalah biaya
Besar - kecilnya biaya tergantung juga dari banyak sedikitnya objek yang
diselidiki. Semakin besar jumlah objek, maka semakin besar biaya yang
diperlukan, lebih-lebih bila objek itu tersebar di wilayah yang cukup luas.
Oleh karena itu, sampling ialah satu cara untuk mengurangi biaya.
c. Masalah waktu
Penelitian sampel selalu memerlukan waktu yang lebih sedikit daripada
penelitian populasi. Sehubungan dengan hal itu, apabila waktu yang
tersedia terbatas, dan kesimpulan diinginkan dengan segera, maka
penelitian sampel, dalam hal ini, lebih tepat.
d. Percobaan yang sifatnya merusak
Banyak penelitian yang tidak dapat dilakukan pada seluruh populasi
karena dapat merusak atau merugikan. Misalnya, tidak mungkin
mengeluarkan semua darah dari tubuh seseorang pasien yang akan
dianalisis keadaan darahnya, juga tidak mungkin mencoba seluruh neon
untuk diuji kekuatannya. Karena itu penelitian harus dilakukan hanya pada
sampel.
16
e. Masalah ketelitian
Masalah ketelitian adalah salah satu segi yang diperlukan agar kesimpulan
cukup dapat dipertanggungjawabkan. Ketelitian, dalam hal ini meliputi
pengumpulan, pencatatan, dan analisis data. Penelitian terhadap populasi
belum tentu ketelitian terselenggara. Boleh jadi peneliti akan bosan dalam
melaksanakan tugasnya. Untuk menghindarkan itu semua, penelitian
terhadap sampel memungkinkan ketelitian dalam suatu penelitian.
f. Masalah ekonomis
Pertanyaan yang harus selalu diajukan oleh seorang peneliti; apakah
kegunaan dari hasil penelitian sepadan dengan biaya, waktu dan tenaga
yang telah dikeluarkan? Jika tidak, mengapa harus dilakukan penelitian?
Dengan kata lain penelitian sampel pada dasarnya akan lebih ekonomis
daripada penelitian populasi.
17
BAB III
PENUTUP
A. Simpulan
Definisi statistik adalah kumpulan data yang bisa memberikan gambaran
tentang suatu keadaan atau fenomena. Sedangkan, statistika adalah ilmu yang
mempelajari bagaimana caranya mengumpulkan data, mengolah data, menyajikan
data, menganalisis data, membuat kesimpulan dan hasil analisis data dan mengambil
keputusan berdasarkan hasil kesimpulan.
Ada tiga hal penting dari statistika , yaitu : (1). Data yang tersedia/data
historis; (2). Kriteria keputusan; (3). Ada keputusan sebagai hasil akhir.
Hipotesis berasal dari bahasa Yunani, yaitu hypo yang artinya di bawah dan
thesis yang berarti pendirian/pendapat/kepastian. Jadi bisa disimpulkan hipotesis
adalah jawaban sementara terhadap suatu masalah yang sifatnya masih praduga
karena harus dibuktikan terlebih dahulu.
Populasi adalah wilayah generalisasi yang terdiri atas : obyek atau subyek
yang mempunyai kualitas dan karakteristik tertentu yang ditetapkan oleh peneliti
untuk dipelajari dan kemudian ditarik kesimpulannya. Jadi populasi tidak hanya
orang, tetapi juga obyek dan benda-benda alam yang lain. Populasi juga bukan
sekedar jumlah yang ada pada obyek atau subyek yang dipelajari, tetapi meliputi
seluruh karakteristik atau sifat yang dimiliki oleh subyek atau obyek itu.
Sampel adalah jumlah dan karakteristik yang dimiliki oleh populasi tersebut.
Bila populasi besar dan peneliti tidak mungkin mempelajari semua yang ada pada
populasi, misalnya karena keterbatasan dana, tenaga dan waktu, maka peneliti dapat
menggunakan sampel yang diambil dari populasi itu.
B. Saran
Inilah yang diwacanakan pada penulisan kali ini, meskipun penulisan ini jauh
dari kata sempurna, minimal kita bisa mengimplementasikan tulisan ini. Akhir kata,
18
kami sebagai penulis menyadari akan kekurangan kami untuk itu, kami membutuhkan
kritik dan saran yang membangun guna menjadi motivasi bagi kami ke depannya.
19
BAB I
PENDAHULUAN
A. LATAR BELAKANG
Menurut berbagai kamus bahasa inggris/indonesia, data di terjemahkan sebagai istilah
yag berasal dara kata” datum” yang berarti fakta atau bahan-bahan keterangan. Data
adalaha kenyataan yang menggambarkan suatu kejadian-kejadian dan kesatuan nyata.
Data merupakan keterangan-keterangan tentang suatu hal, dapat berupa sesuatu yang
dapat diketahui atau yang anggapan atau suatu fakta yang digambarkan lewat angka,
simbol, kode dan lain-lain.
Setiap kali kita melakukan kegiatan pengumpulan dan statistik, maka pada
umumnya kegiatan tersebut akan menghasilkan kumpulan data angka yang keadaanya
tidak teratur, berserak dan masih merupakan bahan keterangan yang sifatnya kasar
dan mentah. Dikatakan kasar atau mentah, sebab kumpulan angka dengan kondisi
yang disebutkan diatas belmu dapat memberikan informasi secara ringkas dan jelas.
Mengenai ciri atau sifat yang dimiliki oleh kumpulan angka-angka tersebut. Oleh
karena itu, agar data angka yang telah berhasil di himpun itu “dapat bericara” dan
dapat memberikan informasi yang berarti, diperlukan adanya tindakan lanjut salah
satunya adalah pengajian data.
Tidak terlepas dengan pernyataan diatas, maka salah satu tugas statistik
sebagai ilmu pengetahuan adalah mengajikan atau mendeskripsikan data angka yang
telah dikumpulkan mejadi lebih terarut, ringkas dan lebih dapat memberikan
gambaaran yang jelas. Salah satu pengajian data adalah tabel. Dengan adanya data
yang disajikan menggunakan tabel, sebuah informasi dapat dipahami dengan mudah
tanpa menggunakan kalimat-kalimat penjabaran.
2. RUMUSAN MASALAH
1.Apa itu data?
2. Apa saja jenis-jenis data?
3. Bagaimana cara pengajian data?
3. TUJUAN
Untuk dapat mengetahui pengertian data, apa saja jenis-jenis data dan
bagaimana cara melakukan pengajian data.
20
BAB II
PEMBAHASAN
1. PENGERTIAN DATA
A. PENGERTIAN DATA MENURUT BEBERAPA PARA AHLI
- Menurut Kuswadidan E. Mutiara
Data adalah kumpulan informasi yang diperoleh dari suatu pengamatan,
dapat berupa angka, lambang, atau sifat.
- Menurut H. J. Sriyanto
Data adalah suatu keterangan atau informasi tentang objek penelitian.
- Menurut The Liang Gie
Mendefiniskan data dalam 2 pengertian, yaitu
→ Data merupakan hal, peristiwa atau kenyataan apapun yang
mengandung sesuatu pengetahuan untuk dijadikan sebagai dasar untuk
penyusunan keterangan, pembuatan kesimpulan atau penerapan keputusan.
→ Data merupakan sebuah ibarat mentah yang melalui pengolahan
tertentu lalu menjadi keterangan (informasi).
- Menurut Selamet Riyadi
Data merupakan kumpulan informasi yang diperoleh dari pengamatan
dimana data bisa berupa angka-angka atau lembang-lambang
- Istilah Data Lainnya.
- Data adalah fakta berupa angka, karakter, symbol, gambar, tanda-tanda,
isyarat, tulisan, suara, bunyi yang merepresentasikan keadaan sebenarnya
yang selanjutnya digunakan sebagai masukan suatu Sistem Informasi.
B. PENGERTIAN DATA MENURUT BAHASA
Pengertian Data. Menurut bahasa, data merupakan bentuk jamak dari kata
datum (bahasa latin) yang berarti sesuatu yang
diberikan. Menurut istilah,pengertian data adalah kumpulan informasi atau
keterangn-keterangan yang diperoleh dari pengamatan, informasi itu bisa
berupa angka, lambang atau sifat.
Kesimpulan Data adalah kumpuan keterangan atau fakta tntang suatu keadaan,
kejadian, atau gejala tertentu, baik berupa angka-angka maupun bukan angka-
angka. Sedangkan Data statistik adalah kumpulan keterangn tentang suatu
keadaan, kejadian, atau gejala tertentu yang hanya berupa angka-angka saja.
Namun tidak semua angka-angka disebut data statistik, karena suatu angka
21
disebut data statistik apabila data tersebut bersifat agregattif dan
mencerminkan satu kegiatan dalam suatu bidang atau lapangan tertentu.
2. JENIS-JENIS DATA
Data statistik pada umumnya dapat digolongkan atas beberapa jenis, sebagai
berikut :
1. Berdasarkan sumber dan cara perolehannya, data statistik terdiri dari:
a. Data primer, yaitu data yang diperoleh secara langsung dari lapangan oleh
peneliti. Dalam jenis ini biasanya sumbernya tidak langsung yang berupa
arsip-arsip resmi.
b. Data sekunder, yaitu data yang diperoleh dalam bentuk yang sudah jadi,
yang sudah dikumpulkan oleh pihak lain dan siap untuk dianalisis.
biasanya berupan observasi atau interview.
2. Berdasarkan waktu pengumpulannya, data statistik terdiri atas:
a. Data seketika, yaitu data yang diperoleh dalam satu waktu tertentu.
b. Data berkala, yaitu data yang dikumpulkan dari waktu ke waktu yang
menggambarkan perkembangan dari satu kejadian.
3. Berdasarkan sifatnya, data statistik terdiri atas:
a. Data kualitatif adalah data yang berbentuk kata-kata, bukan dalam bentuk
angka. Data kualitatif diperoleh melalui berbagai macam teknik
pengumpulan data misalnya wawancara, analisis dokumen, diskusi
terfokus, atau observasi yang telah dituangkan dalam catatan lapangan
(transkrip). Bentuk lain data kualitatif adalah gambar yang diperoleh
melalui pemotretan atau rekaman video.
b. Data kuantitatif adalah data yang berbentuk angka atau bilangan. Sesuai
dengan bentuknya, data kuantitatif dapat diolah atau dianalisis
menggunakan teknik perhitungan matematika atau statistika. Berdasarkan
proses atau cara untuk mendapatkannya, data kuantitatif dapat
dikelompokkan dalam dua bentuk yaitu sebagai berikut:
Data diskrit adalah data dalam bentuk angka (bilangan) yang
diperoleh dengan cara membilang. Karena diperoleh dengan cara
membilang, data diskrit akan berbentuk bilangan bulat (bukan
bilangan pecahan).
Data kontinum adalah data dalam bentuk angka/bilangan yang
diperoleh berdasarkan hasil pengukuran. Data kontinum dapat
22
berbentuk bilangan bulat atau pecahan tergantung jenis skala
pengukuran yang digunakan.
4. Jenis data berdasarkan sumbernya, terdiri dari:
a. Data internal, yaitu Merupakan sebuah data dari suatu organisasi yang
menggambarkan sebuah keadaan organisasi tersebut.
b. Data ekstrernal, yaitu sebuah data yang didapatkan dari luar organisasi
yang menggambarkan faktor-faktor yang mempengaruhi hasil kerja suatu
organisasi.
5. Jenis data berdasarkan skala pengukurannya, terdiri dari:
a. Data nominal, yaitu data statistik yang disusun berdasarkan kategori
tertentu tanpa memperhatikan urutannya. Misalnya: kategori suku, agama,
jenis kelamin
b. Data ordinal, yaitu data statistik yang disusun berdasarkan kategori
tertentu dengan memperhatikan urutannya. Misalnya: data tentang
klasifikasi prestasi kelas.
c. Data interval, yaitu data statistik yang disusun dengan jarak sama antara
satu kategori dengan kategori lainnya. Misalnya : kategori umur satu
penduduk dikelurahan
d. Data ratio, yaitu data statistik yang angkanya diperoleh dengan
membandingkan nilai variabel yang satu dengan nilai absolut variabel
lainnya sebagai variabel perbandingan (standar) misalnya : tabel berat
badan seseorang
3. PENYAJIAN (PRESENTASI) DATA STATISTIK
Penyajian data merupakan salah satu kegiatan dalam pembuatan laporan hasil
penelitan yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan
tujuan yang diinginkan. Data yang disajikan harus sederhana dan jelas agar muda
dibaca. Penyajian data juga dimaksudkan agar para pengamat dapat dengan
mudah memahami apa yang kita sajikan untuk selanjutnya dilakukan penilaian
atau perbandingan, dan lain-lain.
Tujuan Penyajian adalah: Memberi gambaran yang sistematis tentang peristiwa-
peristiwa yang merupakan hasil penelitian atau observasi, Data lebih cepat
ditangkap dan dimengerti, Memudahkan dalam membuat analisis data, dan
Membuat proses pengambilan keputusan dan kesimpulan lebih tepat, cepat, dan
akurat.
Cara penyajian data ada tiga macam, yaitu :
- Narasi, yaitu penyajian data hasil penelitian dalam bentuk kalimat.
23
Penyajian secara teks adalah penyajian data hasil penelitian dalam bentuk
kalimat. Misalnya, penyebaran penyakit malaria di daerah pedesaan pantai
lebih tinggi bila dibandingkan dengan penduduk pedesaan pedalaman.
Peyajian data dalam bentuk teks merupakan gambaran umum tentang
kesimpulan tentang hasil pengamatan. Dalam bidang kesehatan, penyajian
dalam bentuk teks hanya digunakan untuk member informasi. Penyajian
dalam bentuk teks banyak digunakan dalam bidang sosial, ekonomi,
psikologi dan lain-lain, dan berperan sebagai laporan hasil penelitian
kualitatif, misalnya, untuk mengetahui persepsi masyarakat tentang suatu
produk yang telah dipasarkan atau penerimaan, pendapat serta
kepercayaan masyarakat terhadap suatu program pemerintah atau program
pelayanan kesehatan pada masyarakat atau keberadaan petugas kesehatan
yang terdapat didaerah.
- Tabel, yaitu kumpulan angka-angka yang disusun menurut kategori-
kategori. Misalnya berat badan menurut jenis kelamin, jumlah pegawai
menurut pendidikan, jumlah penjualan menurut jenis barang dan daerah
penjualan, dll. Ada berbagai bentuk tabel:
1. Tabel satu arah (one way table) Yaitu tabel yang memuat keterangan
mengenai satu hal atau satu karakteristik saja. Misalnya data indeks
prestasi dari 10 mahasiswa
2. Tabel dua arah (two way table) Yaitu tabel yang menunjukkan
hubungan dua hal atau dua karakteristik yang berbeda. Misalnya data
indeks prestasi mahasiswa yang dipengaruhi oleh partisipasi didalam
kelas.
3. Tabel tiga arah (three way table) Yaitu tabel yang menunjukkan
hubungan tiga hal atau tiga karakteristik yang berbeda. Misalnya data
indeks prestasi dan partisipasi didalam kelas yang dipengaruhi oleh
status social.
- Grafik atau Diagram, yaitu gambar-gambar yang menunjukkan secara
visual data berupa angka atau simbol-simbol yang biasanya dibuat
berdasarkan data dari tabel yang telah dibuat. Grafik data dibedakan atas
beberapa jenis, yaitu :
1. Grafik garis (line chart)
24
Adalah grafik berupa garis, diperoleh dari beberapa ruas garis yang
menghubungkan titik-titik pada bidang bilangan. Pada grafik garis
digunakan dua garis yang saling berpotongan. Pada garis horizontal
(sumbu-X) ditempatkan bilangan-bilangan yang sifatnya tetap, seperti
tahun dan ukuran-ukuran. Pada garis tegak (sumbu-Y) ditempatkan
bilangan-bilangan yang sifatnya berubah-ubah. Contohnya tentang
perkembangan volume jumlah kendaraan yang melintasi jalan A dalam
kurun waktu pukul 0.00 s/d 19.12
2. Grafik Batangan (Bar chart)
Adalah grafik data berbentuk persegi panjang yang lebarnya sama dan
dilengkapi dengan skala atau ukuran sesuai dengan data yang
bersangkutan. Setiap batang tidak boleh saling menempel atau melekat
antara satu dengan lainnya dan jarak antara setiap batang yang
berdekatan harus sama. Ada berbagai bentuk, yaitu : Grafik batangan
tunggal (single bar chart), Yaitu grafik yang terdiri dari satu batangan
untuk menggambarkan perkembangan (trend) dari suatu karakteristik.
Grafik batangan berganda (multiple bar chart), Yaitu grafik yang
terdiri dari beberapa garis untuk menggambarkan beberapa
hal/kejadian sekaligus.
3. Grafik Lingkaran (Pie chart)
25
Yaitu grafik yang menggambarkan perbandingan nilai-nilai dari suatu
karakteristik. Untuk mengetahui perbandingan suatu data terhadap
keseluruhan, suatu data lebih tepat disajikan dalam bentuk diagram
lingkaran. Grafik data berupa lingkaran yang telah dibagi menjadi
juring-juring sesuai dengan data tersebut. Bagian-bagian dari
keseluruhan data tersebut dinyatakan dalam persen atau derajat.
26
Kelompok III
BAB I
PENDAHULUAN
A. Latar Belakang
Masalah pada era globalisasi ini, hampir semua kegiatan yang dilakukan oleh setiap orang
tidak akan lepas dari angka, Data, dan Fakta. Hal ini menunjukan bahwa pembelajaran
statistik sangat dibutuhkan sebagai sarana pengembangan pola pikir yang logis dan ilmiah
supaya mampu merencanakan penyelidikan, menyimpulkan dan membuat keputusan denga
teliti dan cermat.
Statistik sebagai salah satu ilmu pasti dalam dunia pendidikan masih dianggap sebagai suatu
mata kuliah yang sulit dan rumit oleh sebagian orang yang belum mengetahui asal mulanya.
Pola pikir ini membuat mereka enggan untuk mencoba dan melatih kemampuan menghitung
dan berpikir secara cermat. Dengan hal ini perlu adanya pengenalan dan latihan hitung
menghitung dengan bantuan rumus-rumus yang telah ditetapkan dalam satuan mata pelajaran,
supaya mampu memahami dan menerapkan rumus yang telah dipelajari untuk menghitung
angka yang telah di tetapkan.
B. Rumusan Masalah
Bagaimana cara menghitung Ukuran Kecenderungan Sentral dan ukuran Variabilitas ?
27
BAB II
PEMBAHASAN
A. Tabel Distribusi Frekuensi
a. Pengertian
Data yang telah diperoleh dari suatu penelitian yang masih berupa data acak atau data
mentah dapat dibuat menjadi data yang berkelompok, yaitu data yang telah disusun kedalam
kelas-kelas tertentu. Daftar yang memuat data berkelompok disebut Distributuf Frekuensi
atau Tabel Frekuensi. Jadi, distributif frekuensi adalah susunan data menurut kelas-kelas
interval tertentu atau menurut kategori tertentu dalam sebuah daftar.
Dari distribusi frekuensi, dapat diperoleh keterangan atau gambaran sederhana dan
sistematis dari data yang diperoleh.
b. Bagian-bagian Distribusi Frekuensi
1. Kelas-kelas (Class)
Kelas adalah kelompok nilai data atau variabel
2. Batas Kelas (Class Limits)
Batas kelas adalah nilai-nilai yang membatasi kelas yang satu dengan kelas yang lain.
Terdapat dua batas kelas, yaitu :
Batas kelas bawah (lower class limits), terdapat di deretan sebelah kiri setiap kelas
Batas kelas atas (upper class limits), terdapat di deratan sebelah kanan setiap kelas
3. Tepi kelas (class boundary/real limits/true class limits)
Tepi kelas di sebut juga batas nyata kelas, yaitu batas kelas yang tidak memiliki lubang
untuk angka tertentu antara kelas yang satu dengan kelas yang lain. Terdapat dua tepi
kelas yaitu :
Tepi kelas bawah atau batas kelas bawah sebenarnya.
Tepi atas kelas atau batas kelas atas sebenarnya
Penentuan tepi bawah kelas dan tepi atas kelas bergantung pada keakuratan pencatatan
data.
4. Titik tengah kelas atau tanda kelas (class mid point, classmarks)
Titik tengah kelas adalah angka atau nilai data yang tepat terletak di tengah suatu kelas.
Titik tengah kelas merupakan nilai yang mewakili kelasnya.
5. Interval kelas (class interval)
Interval kelas adalah selang yang memisahkan kelas yang satu dengan kelas yang lain.
6. Panjang interval kelas atau luas kelas (interval size)
Panjang interval kelas adalah jarak antara tepi atas kelas dan tepi bawah kelas
7. Frekuensi kelas (class frequency)
Frekuensi kelas adalah banyaknya data yang termasuk ke dalam kelas tertentu.
28
Contoh :
Tabel 3.1 MODAL PERUSAHAAN “X”
50-59 16
60-69 32
70-79 20
80-89 17
90-99 15
Jumlah 100
29
Mean adalah teknik penjelasan kelompok yang didasarkan atas nilai rata-rata dari kelompok
tersebut. Rata-Rata (mean) ini didapat dengan menjumlahkan data seluruh individu dalam
kelompok itu, kemudian dibagi dengan jumlah individu yang ada pada kelompok tersebut.
Jika suatu data terdiri atas n datum, yaitu x1, x2, ... xn, mean dari data tersebut dirumuskan
sebagai berikut.
2. Rata-rata nilai ulangan Geografi 10 orang siswa adalah 7,0. Jika nilai Rino
dimasukkan, nilai rata-rata tersebut berubah menjadi 6,8. Tentukan nilai ulangan
Geografi Rino.
Jawab:
30
Jadi, nilai ulangan Geografi Rino adalah 4,8
tabel frekuensi
1. Hasil pengukuran berat badan 10 siswa SMP disajikan di dalam tabel distribusi
frekuensi seperti pada gambar di bawah ini.
31
Tentukan mean dari data tersebut.
Jawab:
Jadi, mean dari data tersebut adalah 43,7 kg
b. Setelah delapan kali ulangan Fisika, Budhi memperoleh nilai sebagai berikut.
7, 7, 10, 8, 6, 6, 7, 8. Tentukan median dari data tersebut.
Jawab:
32
Setelah diurutkan, data nilai Fisika Budhi akan tampak seperti berikut.
6, 6, 7, 7, 7, 8 8, 10 (banyaknya datum = 8 (genap)).
33
Modus untuk data kelompok
Keterangan :
Mo : modus
Tb : tepi bawah kelas modus
p : panjang kelas
d1 : selisih frekuensi kelas modus dengan kelas sebelumnya
d2 : selisih frekuensi kelas modus dengan kelas sesudahnya
34
Jawab:
Karena kelas dengan frekuensi terbanyak 9 maka modus terletak diantara kelas 51-60; tb=51-
0,5=50,5; p=10(11-20); di=9-4=5; F=16.
Penyelesaian:
1. Kuartil
Kuartil adalah nilai yang menandai batas interval dari sebaran frekuensi yang berderet
dalam empat bagian sebaran yang sama.
Kuartil dialmbangkan dengan Q . Jenis kuartil ada 3, yaitu kuartil pertama (Q1) , kuartil
kedua (Q2), dan kuartil ketiga (Q3).
35
Kuartil untuk Data Tunggal
Keterangan :
Q1 =kuartike ke-i
n = banyaknya data
Contoh soal
Tentukan Q1 ,Q2 dan Q 3 dari data : 7,3,8,5,9,4,8,3,10,2,7, 6,8,7,2,6,9,
Jawab :
Data terurut : 2,2,3,3,4,5,6,6,7,7,7,8,8,8,9,9,10
n=17
36
Menentukan letak kuartil untuk data berkelompok
Keterangan :
Qi = kuartil ke-i
Tb = tepi bawah kelas kuartil
p = panjang kelas
n = banyak data
F = frekuensi kumulatif sebelum kelas kuartil
f = frekuensi kelas kuartil
Tentukan Qi dari data berikut:
Jawab :
37
2. Desil
Desil merupakan nilai yang membagi data menjadi sepuluh bagian sama besar. Desil sering
dilambangkan dengan D. jenis ada 6, yairu D1 , D2 , D3, ….,…,…,D9.
Keterangan :
Di = desilk e-i
n = banyaknya data
38
Contoh soal data tunggal
Tentukan desil ke-8 dari data : 6,3,8,9,5,9,9,7,5,7,4,5,8,3,7,6,.
Jawab:
n = 16
data terurut = 3,3,4,5,5,5,6,6,7,7,7,8,8,9,9,9.
Keterangan :
D1 = desil ke-i
Tb = tepi bawah kelas kuartil
p = panjang kelas
n = banyak data
F = frekuensi kumulatif sebelum kelas kuartil
f = frekuensi kelas kuartil
Tentukan nilai D6 dari data berikut
39
Jadi, nilai D6 adalah 21,9
3. Persentil
Persentil merupakan nilai yang membagi data menjadi serratus bagian sama besar. Persentil
sering dilambangakan dengan P. jenis persentil ada 99, yaitu P1, P2, P3 … P99.
Data tunggal
40
Keterangan :
Pi = pesentil ke-i
n = banyaknya data
Contoh soal :
Tentukan persentil ke-65 dari data : 6,5,8,7,9,4,5,8,4,7,8,5,8,4,5.
Jawab:
n = 15
data terurut : 4,4,4,5,5,5,5,6,7,7,8,8,8,8,9.
Keterangan :
Pi = persentil ke-i
Tb = tepi bawah kelas persentil
p = panjang kelas
n = banyak data
F = frekuensi kumulatif sebelum kelas persentil
f = frekuensi kelas persentil
Contoh soal
41
D. Ukuran Variabilitas (Simpangan Baku dan Varian)
1. Simpangan Baku
Simpangan baku adalah salah satu teknik statistik yang lazim digunakan untuk
menjelaskan homogenitas kelompok. Simpangan baku merupakan nilai statistik yang biasa
digunakan untuk nmenentukan bagaimana sebaran data dalam sampel, serta seberapa dekat
titik data individu ke mean atau rata-rata nilai sampel.
42
Keterangan:
s2 : Varian
s : Simpangan baku
xi : Nilai x ke-i
: Rata-rata
n : Ukuran sampel
Agus menjadikan tinggi badan beberapa siswa di SD Suka Maju sebagai sampel. Di bawah
ini adalah data sampel yang berhasil dikumpulkan oleh Agus:
172, 167, 180, 170, 169, 160, 175, 165, 173, 170
Jawab:
Dari soal di atas, diketahui bahwa jumlah data (n) = 10 dan (n-1) = 9. Setelah itu kita cari
variannya. Untuk memudahkan dalam menghitung, Anda juga bisa menyusun tabel seperti
gambar di bawah ini.
Dari tabel di atas, langkah selanjutnya adalah menghitung seperti di bawah ini.
43
Setelah itu masukkan ke dalam rumus varian. Maka akan menjadi seperti berikut.
Dari sini kita sudah mengetahui bahwa nilai varian adalah 30,32. Maka dari itu untuk cara
menghitung simpangan baku kita hanya perlu akar kuadrat nilai dari varian tersebut.
s = √30,32 = 5,51
Dalam mencari simpangan baku data berkelompok, secara garis besar alur menghitungnya
tidak berbeda jauh. Kita perlu menghitung varian terlebih dahulu baru menghitung simpangan
baku. Sedangkan rumus yang dipakai untuk menghitung simpangan baku data kelompok
sedikit berbeda.
Rumus Simpangan Baku Data Berkelompok
Sekelompok mahasiswa melakukan penelitian terhadap tinggi badan anak di SMP Tanjung
Harapan. Berdasarkan hasil penelitian, diperoleh data sebagai berikut.
44
Hitunglah varian dan simpangan baku dari data di atas.
Jawab:
Dari kasus di atas, kita dapat mengetahui interval dan frekuensi tiap kelas interval (fi). Maka
langkah berikutnya adalah menyusun tabel kembali untuk mengetahui banyaknya data, titik
tengah, fixi dan fixi^2. Di bawah ini adalah tabel yang bisa Anda simak.
Kemudian kita dapat mengetahui varian data berkelompok dengan rumus varian. Seperti
berikut cara menghitungnya.
45
Dari perhitungan di atas, kita dapatkan bahwa varian contoh di atas adalah 60,83. Sementara
untuk cara mencari simpangan baku tinggal mengakarkuadratkan angka varian.
s = √60,83 = 7,8
Jadi sudah diketahui bahwa simpangan baku dari data berkelompok di atas adalah 7,8.
2. Varian
Varian merupakan jumlah kuadrat semua deviasi nilai-nilai individual terhadap rata-rata
kelompok. Varian merupakan konsep yang cukup penting dalam statistik, karena merupakan
dasar dari banyak metode statistik inferensial.
Keterangan:
s2 : Varian
s : Simpangan baku
xi : Nilai x ke-i
: Rata-rata
n : Ukuran sampel
46
Rumus Varian data berkelompok
1. Input data, analisis data menggunakan program SPSS, terlebih dahulu harus
mempersiapkan data yang akan di analisis
2. Setelah data ter-input kemudian Klik Analyze pada menu SPSS. Kemudian
klikDescriptive Statistics, lalu klik Frequencies seperti di bawah ini. Klik Analyze pada
menu SPSS. Kemudian klikDescriptive Statistics, lalu klik Frequencies seperti di bawah
ini:
3. Setelah melakukan instruksi di atas maka akan muncul tampilan seperti ini:
47
Dalam kotak sebelah kiri ada dua variabel, yang dianalisis adalah variabel dengan data
interval, dalam hal ini adalah variabel nilai. Kemudian blok variabel nama, lalu klik kotak
di tengah yang ada tanda panahnya. Sehinngga variabel yang di blok pindah ke
kotak Variables (s). kemudian klik statistics.
4.
48
Pengerjaan ukuran pemusatan dan keberagaman data menggunakan SPSS
49
Deskripsikan tentang mean, median, modus, varian, standar deviasi, nilai maksimum, nilai
minimum, kuartil, persentil pada 20, 40, 60, 80, rentang, dan histogramnya!
Nah, bagaimana cara menghitung ukuran pemusatan dan keragaman data menggunakan
SPSS? Berikut langkah-langkahnya.
Pertama, buka program SPSS. SPSS yang saya gunakan disini adalah IBM Statistics 19.
Kemudian akan muncul lembar kerja, klik Variable View, sehingga akan muncul seperti
gambar di bawah ini.
50
Buat variabel baru dengan nama Tinggi_Badan. Nama variabel tidak boleh menggunakan
karakter spasi. Variabel Tinggi_Badan menggunakan Type Numeric, karena karakter yang
digunakan angka.
51
klik untuk memperbesar gambar
Pada opsi Statistics, beri tanda cek pada pilihan yang diperlukan, kemudian klik Continue.
52
klik untuk memperbesar gambar
53
klik untuk memperbesar gambar
Nah, dari output tersebut kita bisa melihat mean, median, modus, varian, standar deviasi, nilai
maksimum, nilai minimum, kuartil, persentil pada 20, 40, 60, 80, rentang, dan histogramnya.
54
55
Kelompok IV
BAB I PENDAHULUAN
56
1.2 RUMUSAN MASALAH
1. Apa yang dimaksud kurva normal ?
2. Bagimana mencari luas daerah kurva normal?
3. Bagaimana menguji normalitas?
4. Bagaimana cara pengerjaan SPSS?
57
BAB II
PEMBAHASAN
2.1 Kurva Normal
Kurva normal adalah satu model distribusi dari sejumlah kemungkinan distribusi.
Hal ini disebabkan karena penggunaan konsep kurva normal sangat luas dan dijadikan
sebagai alat yang sangat penting dalam pengembangan suatu teori, konsep kurva normal
juga memberikan status khusus dalam pengembangan kaidah-kaidah ilmiah. Kurva
normal bukan hanya satu kurva, melainkan mempunyai sejumlah kurva yang tidak
terbatas yang mungkin dapat dibuat, dan semua itu dideskripsikan dengan suatu
persamaan aljabar berikut.
Persamaan di atas dapat membuat para pelajar menjadi panik dan/atau mengalami
kesulitan untuk memahami konsep kurva normal. Secara umum, pemahaman atas
persamaan aljabar ini tidak menjadi kebutuhan atau diperlukan untuk mengapresiasi
dan menggunakan kurva normal. Namun demikian persamaan ini perlu dijelaskan
untuk memahami bagaimana konsep dan aplikasi suatu kurva normal.
Pertama, penggunaan simbol-simbol dalam persamaan ini dimaksudkan untuk
menyederhanakan proses perhitungan. Simbol-simbol itu termasuk “2″. “p”, dan “e”.
Lambang “e” untuk menunjukkan adanya perhitungan dengan bilangan irasional atau
untuk menunjukkan batasan yang sangat panjang. Hal ini dimungkinakn untuk
menunjukkan “sejumlah keunikan”, dalam kasus “e” ini, yang menunjukkan “kekuatan
khusus”.
Kedua, adanya sekumpulan simbol yang menjadi kepedulian termasuk simbol “X”,
yaitu melambangkan variabel responden untuk suatu skor nilai. Tinggi dari suatu kurva
pada satu titik merupakan fungsi dari X (fx). Ketiga, dua simbol terakhir dalam
persamaan adalah “mu (μ) lambang dari rata-rata ” dan “sigma (σ) lambang dari stadar
deviasi” kedua lambang ini disebut dengan parameter atau nilai-nilai. Kedua parameter
ini memberikan kemungkinan pembuatan kurva normal menjadi tidak terbatas, yaitu
dengan menghubungkan kedua parameter ini. Dalam hal ini konsep parameter menjadi
sangat penting dan perlu diperhatikan secara sungguh-sungguh.
Keluarga Distribusi
58
Kurva normal merupakan salah satu bentuk (anggota keluarga) dari sekian banyak
(tidak terbatas) pola distribusi. Model setiap anggota keluarga ditentukan oleh
seperangkat parameter (μ dan σ) dengan nilai (perhitungan) khusus. Sebab parameter σ
dapat ditempatkan pada suatu nilai, posisitf atau negatif, dan parameter μ mempunyai
nilai posisitf, hubungan dari kedua parameter ini membuat keluarga kurva normal
menjadi luas sekali yang mempunyai anggota anggota tidak terbatas. Atas dasar itu,
kurva normal diusulkan menjadi suatu model umum, karena asumsi kurva normal
mampu menjelaskan sejumlah besar fenomena yang terjadi secara alami, mulai dari
skor tes sampai ke fenomena bintang-bintang di langit.
Kesamaan Anggota Keluarga Kurva Normal
Anggota keluarga kurva normal sangat bervariasi mempunyai perbedaan, akan tetapi
mempunyai sejumlah sifat-sifat umum yang sama, sifat-sifat umum ini disebut juga
dengan kesamaan anggota keluarga kurva normal. Kesamaan (sifat-sifat umum ini)
mencakup: bentuk simetri, mendekat ke ujung tetapi tidak pernah bersentuhan dengan
sumbu X (asimtot), dan mempunyai wilayah di bawah kurva.
Dalam hal bentuk, semua anggota keluarga kurva normal mempunyai kesamaan
yaitu berbentuk “lonceng”, kemudian sumbu X mempunyai kesamaan skala yang
tepat. Sebagian besar wilayah di bawah kurva berada di sekitar titik tengan atau rata-
rata. Ujung garis distribusi mendekat ke sumbu X tetapi tidak pernah menyentuh, dan
luas wilayah di bawah kurvanya sangat kecil.
Kesamaan dalam hal simetris, semua anggota keluarga kurva normal berada pada
dua sisi sejajar dan simetris. Artinya, jika satu kurva normal digambarkan pada
permukaan kertas dua dimensi, maka jika kertas itu dilipat pada garis tengahnya (garis
rata-rata) maka kedua sisi kurva normal itu harus tepat sama. Keadaan simetris ini juga
tergambar dalam struktur tubuh manusia, secara umum dalam posisi sejajar atau
mendekati simetris antara sisi kiri dan kanan. Begitu juga dalam perkembangan
kehidupan manusia baik individual maupun sosial.
Semua keluarga kurva normal mempunyai ekor mendekati sumbu X, tetapi tidak
pernah menyentuhnya. Implikasinya, dibagian manapun suatu titik yang berada pada
kurva (arah positif atau negatif) tetap saja mempunyai wilayah yang berada di bawah
kurva normal. Oleh karena itu, gambar dari satu kurva normal harus mempunyai
panjang garis yang tidak berhingga. Sehingga untuk mengeahui luas wilayah yang
berada di bawah kurva normal harus dilihat dari suatu rentang yang dibatasi oleh
sejumlah garis, hanya sebagaian kecil dari segmen garis yang digambarkan untuk
kurva normal khusus.
Semua anggota keluarga kurva normal mempunyai total wilayah di bawah kurva
sama dengan satu (1.00) , seperti yang terjadi pada model-model kemungkinan atau
distribusi frekuensi. Sifat ini, menjadi tambahan pada sifat simetri, implikasinya bahwa
wilayah pada setiap setengah dari distribusi adalah 0,50 atau setengah.
2.2 Menghitung Luas Area dengan Menggunakan Tabel Z Distribusi Normal Baku
59
Distribusi normal baku (normal standar) adalah distribusi normal yang telah
ditransformasi sehingga memiliki rata-rata sama dengan 0 dan varian sama dengan 1.
Variable random distribusi normal baku dilambangkan dengan Z.
Kurva distribusi normal maupun distribusi normal baku bersifat simetris dimana garis
simetrisnya berada pada Z = 0. Sedangkan luas area keseluruhan di bawah kurva normal
adalah 1.Luas area di bawah kurva normal sangat sulit dihitung dengan menggunakan
rumus peluang distribusi normal. Oleh karena itu untuk mempermudah penghitungan
dibuatlah tabel Z distribusi normal baku. Ada dua tabel Z distribusi normal baku yang
disajikan oleh buku-buku statistik. Dua tabel tersebut adalah tabel distribusi normal
baku yang menentukan luas area di antara -∞ < Z < Z1 dan tabel distribusi normal baku
yang menentukan luas area di antara 0 < Z < Z1.
Tabe
l dist
ribus
i
nor
mal
baku
yang
men
entu
kan
luas
area
di
antar
a -∞
<Z
< Z1
60
Tabel distribusi normal baku yang menentukan luas area di antara 0 < Z < Z 1
Pada pembahasan kali ini, tabel Z distribusi normal baku yang digunakan adalah tabel Z
distribusi normal baku yang menentukan luas area di antara -∞ < Z < Z1.
Untuk pemahaman lebih lanjut mengenai luas area tersebut, diberikan beberapa contoh
sebagai berikut.
CONTOH 1
Misalkan Z adalah variabel random yang berdistribusi normal baku (normal standar).
Hitunglah luas wilayah pada Z < 1,24 atau peluang P(Z < 1,24)!
Jawab:
Sebelum menjawab persoalan di atas, perlu dipahami bahwa P(Z < 1,24) sama juga dengan
P(Z ≤ 1,24). Hal ini karena Z adalah variabel random kontinu dimana P(Z = 1,24) = 0,
sehingga P(Z < 1,24) sama saja dengan P(Z ≤ 1,24).
Area Z < 1,24 pada kurva distribusi normal baku dapat dilihat pada gambar berikut.
61
Untuk mengetahui luas area kurva normal pada Z < 1,24 atau peluang P(Z < 1,24),
kita bisa akan menggunakan tabel Z distribusi normal baku.
Tabel Z yang ada pada link di atas terdiri dari dua bagian, yaitu bagian tabel Z negatif
dan bagian tabel Z positif. Karena Z = 1,24 adalah bilangan yang positif maka bagian
tabel yang digunakan adalah bagian tabel Z positif.
Pada tabel Z, kolom pertama menunjukkan nilai Z yang memiliki satu angka di
belakang koma, sedangkan angka kedua di belakang koma terletak pada baris
pertama. Untuk menentukan luas wilayah Z < 1,24, kita harus menentukan terlebih
dahulu letak 1,2 pada kolom pertama kemudian diarahkan ke kanan. Selanjutnya
menentukan letak 0,08 pada baris pertama kemudian diarahkan ke bawah. Coba
perhatikan ilustrasi pada gambar di bawah ini.
Titik pertemuan keduanya merupakan luas wilayah Z < 1,24 atau P(Z < 1,24), yaitu
0,8925.
CONTOH 2
62
Berapakah luas area kurva normal pada Z > 1,24 atau P(Z > 1,24)?
Jawab:
Dari contoh pertama telah diketahui bahwa P(Z < 1,24) adalah 0,8925. Karena luas
area keseluruhan di bawah kurva normal adalah 1, maka
Dengan demikian luas area kurva normal pada Z > 1,24 atau P(Z > 1,24) adalah 0,1075.
Kita bisa juga menggunakan cara lain yaitu dengan menentukan P(Z < -1,24). Hal ini
didasarkan pada kurva normal yang bersifat simetris, sehingga P(Z > 1,24) = P(Z < -1,24).
Area P(Z < -1,24) dapat dilihat pada gambar berikut.
Dengan meggunakan tabel Z distribusi normal baku maka dapat diketahui P(Z < -1,24).
63
Dari tabel di atas diperoleh nilai P(Z < -1,24) = 0,1075.
CONTOH 3
Berapakah luas area kurva normal antara -1,12 < Z < 0,92 atau P(-1,12 < Z < 0,92)?
Jawab:
Area kurva normal -1,12 < Z < 0,92 dapat kita lihat pada gambar berikut
Area -1,12 < Z < 0,92 pada kurva distribusi normal baku
Dari ilustrasi di atas dapat kita ketahui bahwa ternyata luas area kurva normal -1,12 <
Z < 0,92 adalah luas area kurva normal Z < 0,92 dikurangi luas area kurva normal Z <
-1,12. Penyelesaiannya dapat kita tulis menjadi
P(-1,12 < Z < 0,92) = P(Z < 0,92) – P(Z < -1,12).
Nilai P(Z < 0,92) dan P(Z < -1,12) dapat diperoleh dari tabel distribusi normal baku.
Dengan menggunakan tabel Z dapat diketahui bahwa P(Z < 0,92) = 0,8212 dan P(Z <
-1,12) = 0,1314, sehingga
64
P(-1,12 < Z < 0,92) = 0,8212 – 0,1314
P(-1,12 < Z < 0,92) = 0,6898
Kolmogrov smirnov
Kriteria Pengujian
Data berupa
1. Tinggi Badan
2. Berat Badan
65
No Tinggi badan Berat badan
1 165 52
2 164 53
3 165 54
4 166 55
5 159 48
6 160 49
7 161 50
8 162 50
9 162 51
10 163 51
11 164 53
12 165 55
13 165 54
14 164 54
15 163 52
Hasil pengujian
66
NPAR TESTS /K-S(NORMAL)=tinggi_badan berat_badan /MISSING ANALYSIS.
NPar Tests
Notes
Comments
Filter <none>
Weight <none>
Missing Value Handling Definition of Missing User-defined missing values are treated
as missing.
/K-S(NORMAL)=tinggi_badan
berat_badan
/MISSING ANALYSIS.
[DataSet0]
One-Sample Kolmogorov-Smirnov Test
67
tinggi_badan berat_badan
N 15 15
Diketahui nilai signifikan untuk tinggi badab adalah 0,679 > 0,05 dan nilai
signifikan untuk berat badan adalah 0,911 >0,05
Maka, dapat disimpulkan data untuk tinggi badan dan berat badan
berdistribusi normal
68
Kelompok V
BAB I
PENDAHULUAN
A. Latar Belakang
Regresi linear adalah alat statistik yang dipergunakan untuk mengetahui pengaruh
antara satu atau beberapa variabel terhadap satu buah variabel.Variabel yang
mempengaruhi sering disebut variabel bebas, variabel independen atau variabel
penjelas.Variabel yang dipengaruhi sering disebut dengan variabel terikat atau variabel
dependen.Regresi linear hanya dapat digunakan pada skala interval dan ratio.
Secara umum regresi linear terdiri dari dua, yaitu regresi linear sederhana yaitu
dengan satu buah variabel bebas dan satu buah variabel terikat; dan regresi linear
berganda dengan beberapa variabel bebas dan satu buah variabel terikat.Analisis regresi
linear merupakan metode statistik yang paling jamak dipergunakan dalam penelitian-
penelitian sosial, terutama penelitian ekonomi. Program komputer yang paling banyak
digunakan adalah SPSS (Statistical Package For Service Solutions)
B. Rumusan Masalah
1. Apa yang dimaksud dengan uji regresi?
2. bagaimana mencari persamaan regresi?
3. bagaimanauji regresi sederhana?
C. Tujuan
Berdasarkan latar belakang diatas maka tujuan dalam penulisan makalah ini adalah
1. untuk mengetahui pengertian regresi
2. untuk mengetahui dan mencari persamaan dari uji regresi
3. untuk mengetahui uji regresi sederhana
69
70
BAB II
PEMBAHASAN
71
Dalam bentuk yang paling sederhana yaitu satu peubah bebas (X) dengan satu peubah
tak bebas (Y) mempunyai persamaan:Y =a +bxDisini a disebut intersep dan b adalah
koefisien arah atau koefisien beta.Dalam pengertian fungsi persamaan garis Y + a + bx
hanya ada satu yang dapat dibentuk dari dua buah titik dengan koordinat yang berbeda
yaitu ( X1, Y1) dan X2,Y2). Hal ini berarti kita bisa membuat banyak sekali persamaan
garis dalam bentuk lain melalui dua buat titik yang berbeda koordinatnya/tidak berimpit.
Analisis Regresi
Sebagai contoh misalnya titik A (1,3) dan titik B ($,9) maka persamaan garis
linear yang dapat dibuat adalah:
72
Matrix Regresi Linear
Penulisan pengamatan
73
Dengan notasi matriks dapat ditulis sebagai berikut:
Jadi kita peroleh matrik Y,X,β dan ε dengan dimensi sebagai berikut :
74
Jadi β=(X’X)-1X’Y
Tabel 1 jumlah cacing dan jumlah telurnya pada usus ayam buras.
75
Dari data diatas kita bisa menghitung:
Bila kita duga bentuk hubungan antara jumlah cacing (X) dan jumlah telurnya
(Y) adalah:
76
Jadi Ŷ=-2,442 + 4,103 Xi,
Analisis regresi linear berganda sebenarnya sama dengan analisis regresi linear
sederhana, hanya variabel bebasnya lebih dari satu buah. Persamaan umumnya adalah:
77
Interpretasi terhadap persamaan juga relatif sama, sebagai ilustrasi, pengaruh antara
motivasi (X1), kompensasi (X2) dan kepemimpinan (X3) terhadap kepuasan kerja (Y)
menghasilkan persamaan sebagai berikut:
Keterangan :
X1, X2, ..., Xk : Variabel independen
Y : Variabel dependen
a : Konstanta
b : Koefisien regresi
Pada analisis regresi linier ganda ada enam uji pokok, yaitu:
1. Uji Kelinieran
Hipotesis:
H0 : Persamaan regresi tidak linier
H1 : Persamaan regresi linier
Berdasarkan pengolahan data dengan SPSS, jika nilai sig pada
output ANOVA lebih dari α (5%) maka H0 diterima (Trihendradi 2006: 157).
79
2. Uji Koefisien
Hipotesis:
H0 : Koefisien regresi tidak signifikan
H1 : Koefisien regresi signifikan
Berdasarkan pengolahan data dengan SPSS, jika nilai sig pada
output Coefficients lebih dari α (5%) maka H0 diterima (Trihendradi 2006: 158).
3. Uji Normalitas Data
Berdasarkan teori statistika model linier hanya variabel dependen yang
mempunyai distribusi diuji normalitasnya, sedangkan variabel independen
diasumsikan bukan merupakan fungsi distribusi, jadi tidak perlu diuji normalitasnya.
Salah satu cara untuk menguji kenormalan data yaitu dengan uji Kolmogorov-
Smirnov.
Hipotesis:
H0 : Variabel adalah normal
H1 : Variabel adalah tidak normal
Berdasarkan pengolahan data dengan SPSS, jika nilai sig pada output NPar
Tests lebih dari α (5%) maka H0 diterima.
Selain itu kenormalan data dapat juga dideteksi dari penyebaran data (titik)
pada sumbu diagonal dari grafik atau melihat grafik histograf dari residualnya.
4. Uji Multikolinearitas
Uji multikolinearitas bertujuan untuk menguji apakah model regresi ditemukan
adanya korelasi antara variabel bebas.Jadi uji multikolinearitas terjadi hanya pada
regresi ganda.Model regresi yang baik seharusnya tidak terjadi korelasi tinggi diantara
variabel bebas. Gejala multikolinearitas dapat dideteksi dengan melihat nilai Variance
Inflasi Factor (VIF) dan tolerance pada output Coefficients. Multikolinearitas terjadi
jika VIF berada di atas 10 dan nilai tolerance di atas 1 (Sukestiyarno 2008: 14).
5. Uji Autokorelasi
Uji autokorelasi bertujuan menguji apakah dalam model regresi linier ada
korelasi antar error satu dengan error yang lainnya. Gejala autokorelasi dapat
dideteksi dengan menggunakan uji Durbin Watson (DW) pada output Model
Summary. Ketentuan jika -2 < DW < 2 berarti tidak terjadi autokorelasi (Sukestiyarno
2008: 14).
80
6. Uji Heteroskedastisitas
Heteroskedastisitas terjadi apabila error atau residual dari model yang diamati
tidak memiliki varian yang konstan dari satu observasi ke observasi lainnya.
Pengujian heteroskedastisitas dilakukan dengan melihat diagram residual terhadap
variabel bebas pada output Scatterplot. Jika nilai error membentuk pola tertentu tidak
bersifat acak terhadap nol maka dikatakan terjadi heteroskedasti (Sukestiyarno 2008:
14).
Model persamaan regresi linier ganda dapat dilihat pada output Coefficients.
Sedangkan untuk mengetahui besarnya nilai kontribusi variabel bebas secara
bersama-sama terhadap variabel terikat dapat dilihat pada output Model
Summary (Sukestiyarno 2008: 19).
cara uji regresi sederhana dengan spss tutorial analisis data ini kami buat terkait dengan
perimintaan beberapa klien yang menghubungi kami karena telah menonton beberapa video
kami di youtube (silahkan lihat channel youtube kami). pada kesempatan kali ini kita akan
membahas bagaimana caranya menganalisis atau menguji regresi sederha dengan program
SPSS.
regresi sederhana digunakan apabila variabel independen dan variabel dependen masing-
masing hanya 1 ( X dan Y). pada kasus ini contoh variabel yang akan kita uji adalah variabel
pelayanan (X) dan kepuasan (Y). pengujian dilakukan untuk mengetahui pengaruh variabel
pelayanan terhadap variabel kepuasan. ikuti langkah-langkah berikut:
81
2 Klik menu Analyze => Regression => Linear, sehingga tampak seperti gambar berikut:
82
4 maka akan keluar output SPSS nya seperti gambar berikut:
5 Langkah-langkah penyelesaian
A rumusan masalah
Ho: Tidak ada pengaruh yang signifikan pelayanan terhadap kepuasan pelanggan
C Kriteria pengujian
D Kesimpulan
berdasarkan hasil pengujian yang tertera pada output SPSS pada tabel Coofficients diketahui
nilai t sebesar 5,764 dengan nilai Sig. sebesar 0,000 (artinya nilai Sig tersebut < 0,05) maka
dapat disimpulkan Ho ditolak dan Ha diterima, artinya ada pengaruh yang signifikan
pelayanan terhadap kepuasan pelanggan.
83
Catatan: terkait penyelasaian poin C tentang kriteria pengujian, masih ada cara lain selain
melihat nilai Sign, cara tersebut adalah dengan membandingkan nilai T hitung dengan t tabel
(cara ini akan kami bahas pada artikel selanjutnya).
Awalnya, tulisan ini dibuat untuk menunjang modul Mata Kuliah Praktikum Statistik Industri
di Program Studi Teknik Industri, Universitas Mercu Buana Jakarta.Namun belakangan,
permintaan tidak hanya datang dari peserta praktikum, tapi juga dari teman-teman yang
sedang mengerjakan Tugas Akhir/ Skripsi. Saya berpikir: mungkin di luar sana, ada banyak
orang yang membutuhkan tulisan ini.
Adapun beberapa hal yang dibutuhkan untuk analisis regresi dalam tulisan ini adalah:
Seperangkat komputer + sistem operasi + software SPSS. Dalam tulisan ini, saya
menggunakan SPSS 14.0 for Windows Evaluation Version.
Pengetahuan entry data pada SPSS, lihat posting berjudul Dasar-Dasar SPSS.
Tabel distribusi F (di buku-buku statistik) untuk F-test.
Sebelum masuk aplikasi SPSS, ada baiknya kita memahami analisis regresi. Selanjutnya akan
diberikan contoh ilustrasi sederhana dan nyata untuk memahami analisis regresi.
Ketika saya menanyakan harga sebuah perangkat komputer di toko komputer WTC Serpong,
ternyata harga barang tersebut sekarang (November 2008) jauh lebih mahal dari bulan-bulan
lalu, tanpa saya menanyakan kenapa harganya naik, sang penjaga toko langsung bilang:
“dollar sekarang naik, Mas…!”.Di sini saya mengambil kesimpulan bahwa naik-turun harga
barang dependent (bergantung) pada kurs dollar.
Dalam analisis regresi, variabel dependent (harga barang) dinotasikan dengan Y, sedang
variabel independent (kurs dollar) dinotasikan dengan X.
Jika benar naik-turun harga barang (Y) hanya bergantung pada kurs dollar (jumlah X = 1)
maka hubungannya dalam istilah statistik disebut: Linear Regression (regresi linear
sederhana). Artinya harga barang ”berjalan–beriringan” (linear) dengan kurs dollar.
Namun, jika harga barang (Y) tidak saja bergantung pada kurs dollar (X1) tapi juga dengan
variabel lain, misal: harga BBM (X2 , atau jumlah X = lebih dari 1) maka hubungannya
dalam istilah statistik disebut: Multiple Linear Regression (regresi linear berganda). Artinya
harga barang ”berjalan–beriringan” (linear) dengan kurs dollar dan harga BBM.
Yang menjadi pertanyaan sekarang, apakah benar harga barang linear dengan kurs dollar?
(jangan-jangan itu hanya alasan sang penjaga toko). Untuk membuktikannya, kita harus
mengumpulkan harga-harga barang dan nilai-nilai kurs dollar pada bulan-bulan
lalu.Kemudian, kita melakukan Uji Keberartian dan Uji Signifikansi.
84
Uji Keberartian dapat dengan dua cara, yaitu:
Scatterplot ‘diagram pencar’, di mana secara kasat mata akan tampak kecenderungan
hubungan linear antara nilai-nilai statistik tersebut.
Correlation Coefficient (R) dalam istilah SPSS, di mana kemungkinan
”kecenderungan hubungan tidak linear” didefinisikan apabila hasil R sama dengan
nol, atau mendekati nol.
Uji Signifikansi adalah dengan t-Test, di mana nilai “t hitung” dibandingkan dengan nilai “t
tabel”.Untuk pengujian terhadap Multiple Linear Regression dapat digunakan F-test.
Nah, apabila harga-harga barang bulan lalu (Y) dinyatakan “linear” dengan nilai-nilai kurs
dollar bulan lalu (X), maka “benarlah” apa yang dibilang oleh si penjaga toko.
Dan apabila kita mengetahui (atau dapat meramalkan) nilai-nilai kurs dollar di bulan-bulan
depan, maka kita dapat meramalkan harga-harga barang di bulan-bulan depan ( Ŷ atau Y-
circumflex untuk membedakan dengan Y-biasa) dengan menggunakan persamaan:
Koefisien a adalah nilai penaksir regresi (Y-intercept) dan koefisien b adalah nilai
kemiringan (slope) garis regresi. Koefisien-koefisien ini merupakan bilangan-bilangan tetap
yang harus kita cari dengan (n = jumlah observasi):
Analisis regresi bermanfaat untuk menghitung: (a) linear regression dan multiple linear
regression, (b) asosiasi statistik beserta scatterplot, (c) diagnosa kolinearitas, (d) harga
prediksi, dan (e) residual.
Jenis data yang cocok untuk analisis regresi adalah data rasio (baik untuk variabel dependent
maupun independent). Namun dapat juga dengan data berbentuk kualitatif (kategori), tetapi
harus dibantu dengan ”variabel boneka” (dummy variable). Contoh ”variabel boneka” adalah
seperti pendefinisian value untuk variabel Gender, yang mana Laki-laki diberi kode angka
“1” dan Perempuan diberi kode angka “2”.
Selanjutnya akan diberikan contoh aplikasi analisis regresi dalam SPSS, di mana yang
menjadi penekanan pembahasan adalah pada saat Uji Keberartian dan Uji Signifikansi.
85
Contoh yang akan ditampilkan adalah analisis Multiple Linear Regression menggunakan
SPSS, adapun kasusnya adalah sebagai berikut:
Harga suatu produk pada beberapa minggu mengalami fluktuasi, diperkirakan kondisi ini
mempengaruhi tingkat penjualan/ tingkat daya beli konsumen. Di sisi lain banyaknya iklan
telah mendongkrak tingkat penjualan. Bagaimana pengaruh harga produk dan iklan terhadap
penjualan suatu produk?
Dari kondisi ini, penjualan dapat diartikan sebagai variabel dependent–yang dinotasikan
dengan Y–terhadap variabel independent berupa harga dan iklan–yang dinotasikan dengan X.
Pengamatan akan dilakukan dengan mengambil secara random data 10 minggu penjualan,
data berupa: (a) jumlah unit penjualan mingguan, (b) harga rupiah produk pada minggu
bersangkutan, dan (c) banyaknya iklan yang ditandai dengan besarnya rupiah biaya iklan
yang dikeluarkan pada minggu bersangkutan.
Dari kasus di atas, didapatkan Data Jumlah Penjualan (Y), Data Harga Produk (X1), dan Data
Biaya Iklan (X2) sebagai berikut:
Setelah kita mengisi data pada SPSS Data Editor, ikuti langkah berikut:
86
Langkah ke-3: Klik Statistics, muncul dialog box Linear Regression: Statistics, dalam hal
ini dicentang: Estimates, Model fit, Descriptives, dan Durbin-Watson.
87
CATATAN:
Dialog box Linear Regression: Statistics digunakan untuk menampilkan berbagai nilai
statistik yang diinginkan, antara lain Regression Coefficient dan nilai statistik lainnya.Pada
Regression Coefficient terdapat pilihan Estimates, Confidence intervals, dan Covariance
matrix.
Sedang untuk nilai statistik lainnya terdapat pilihan, seperti: Model fit, R Square change
(untuk mengukur persentase besarnya pengaruh variabel independent terhadap variabel
dependent), Descriptive, Part and partial correlation, dan Colinearity diagnostics.
Pada form Residuals, terdapat pilihan Durbin-Watson (digunakan untuk menentukan ada
tidaknya korelasi residual atau autokorelasi dari model regresi yang dihasilkan) dan Casewise
diagnostics dengan pilihan Standard Deviations.
Langkah ke-4: Pada dialog box Linear Regression, klik Plots, muncul dialog box Linear
Regression: Plots
88
CATATAN:
Pada dialog box Linear Regression: Plots terdapat beberapa pilihan yang disediakan, yaitu:
Pada form Standardized Residual Plots terdapat dua pilihan plot, yakni: Histogram,
berguna untuk menampilkan distribusi dari residual yang terstandarisasi. Normal probability
plot, berguna untuk membandingkan distribusi residual yang terstandarisasi dengan distribusi
normal.
Untuk check box Produce all partial plots digunakan untuk menghasilkan diagram-diagram
pencar dari residual pada masing-masing variabel independent dengan residual variabel
dependent.
89
Langkah ke-5: Pada dialog box Linear Regression, klik Save.
Muncul dialog box Linear Regression: Save, pilih Unstandardized pada form Predicted
Values dan form Residuals.
CATATAN:
Pilihan Save digunakan untuk menyimpan dan membuat file baru dari nilai-nilai prediksi,
residual, dan statistik lainnya.
Pada dialog Save terdapat banyak pilihan statistik yang dapat disimpan pada file kerja (data
editor), yaitu: Predicted values, Residuals, Distances, Influence statistics, dan Prediction
intervals. Kita tinggal memilih yang dikehendaki.
90
Muncul dialog box Linear Regression: Option, lalu klik saja Continue (berarti memilih
setting default), dan kembali ke dialog box Linear Regression.
CATATAN:
Pilihan Option berguna untuk menampilkan analisis statistik dengan menggunakan kriteria
metode Stepwise, Backward, dan Forward.
1. Use Probability of F. Jika memilih pilihan ini, kita harus memasukkan harga Entry
dan harga Removal pada form yang disediakan. Harga Entry selalu lebih rendah dari
harga Removal. Melalui pilihan ini, suatu variabel akan dimasukkan jika tingkat
signifikansi dari F lebih kecil dari harga Entry, dan akan dikeluarkan jika tingkat
signifikansinya lebih besar dari harga Removal.
2. Use F value. Jika memilih pilihan ini, kita harus memasukkan harga Entry dan harga
Removal. Harga Entry selalu lebih besar dari harga Removal. Melalui pilihan ini,
suatu variabel akan dimasukkan jika tingkat signifikansi dari F lebih besar dari harga
Entry, dan akan dikeluarkan jika tingkat signifikansinya lebih kecil dari harga
Removal.
Pilihan Include constant in equation berfungsi untuk menampilkan nilai kostanta dalam
persamaan regresi.Dalam keadaan default, pilihan ini diaktifkan. Jika kita tidak mengaktifkan
pilihan ini, berarti kita akan mendapatkan regresi orisinil tanpa konstanta regresi. Namun, R
kuadrat yang dihasilkan tidak dapat digunakan untuk memprediksi pengaruh variabel
independent terhadap variabel dependent.
91
1. Exclude cases listwise. Menganalisis cases-case yang hanya memiliki harga valid
dari semua variabel.
2. Exclude cases pairwise. Menganalisis koefisien korelasi dari seluruh cases yang
berharga valid dari dua variabel yang dikorelasikan.
3. Replace with mean. Menggantikan missing value dengan mean variabel.
Pada keadaan default, yang diaktifkan adalah pilihan Exclude cases listwise.
Langkah ke-7: Terakhir pada dialog box Linear Regression, klik OK.
Hasil lengkap SPSS dijadikan dalam satu file output dengan tersusun rapi sesuai dengan
ketentuan yang dikehendaki di atas.
1. Descriptive Statistics
Hasil analisis data deskriptif di bawah merupakan hasil dari pemilihan check box Descriptive
pada dialog box Statistics. Didapatkan nilai rata-rata serta standar deviasi untuk semua
variabel, baik independent maupun dependent.
Matriks Koefisien Korelasi (Pearson Correlations) juga didapat dari pilihan Descriptive pada
dialog box Statistics. Kita dapat melihat koefisien korelasi antar semua variabel.
92
Pada matriks korelasi tersebut, didapatkan angka signifikansi untuk hubungan antar seluruh
variabel independent dengan variabel dependent bernilai di bawah 0,05 (<0,05), sehingga
dapat disimpulkan bahwa memang terdapat hubungan yang signifikan dan korelasi yang erat
antara semua variabel independent dengan variabel dependent.
3. Variabel Entered/Removed
Hasil variabel Enter/Removed merupakan penentuan pilihan Enter (default) pada form
Method, dialog box Option.
4. Model Summary
Pada bagian ini terdapat nilai koefisien determinasi R-Square = 0.932 (93,2%). Ini
menunjukkan bahwa sebesar 93,2% variasi variabel dependent (Y) dapat dijelaskan oleh 2
variabel independent (X1 dan X2), artinya pengaruh variabel independen terhadap perubahan
variabel dependen adalah 93,2%, sedangkan sisanya sebesar 6,8% dipengaruhi oleh variabel
lain selain variabel independen X1 dan X2.
5. Anova
Pada bagian ini ditampilkan tabel analisis varian (Anova). Dari tabel di bawah didapat nilai F
= 47,917 yang dapat digunakan untuk melakukan uji hipotesis atau F-test dalam memprediksi
kontribusi variabel-variabel independent (X1 dan X2) terhadap variabel dependent (Y).
93
Hypothesis:
H0: β1 = β2 = 0
H1: Minimal satu dari dua variabel tidak sama dengan nol
Dengan menentukan level of significant = 5% (0,05) dan degree of freedom untuk df1 = 2
dan df2 = 7, maka didapat dari tabel (dalam buku statistik) F-tabel = 4,74.
Oleh karena F-hitung = 47,917> F-tabel (0,05) = 4,74, maka H0 ditolak dan H1 diterima.
Kesimpulannya, bahwa variabel independent (X1 dan X2) dengan signifikan memberikan
kontribusi terhadap variabel dependent.
6. Coefficients
Pada bagian ini ditampilkan nilai koefisien regresi (lihat: nilai-nilai pada kolom B pada
Unstandardized Coefficients di bawah ini) sehingga terbentuk persamaan regresi:
Pada bagian Unstandardized Coefficients ini ditampilkan juga Standard Error dari masing-
masing variabel.Nilai pada kolom Beta, ditampilkan Z-score.Pada kolom berikutnya
ditampilkan nilai t dari masing-masing variabel, yang dapat dimanfaatkan untuk menguji
keberartian (t-Test) koefisien regresi yang didapatkan. Proses pengujiannya menyerupai F-
test, yaitu “t hitung” dibandingkan dengan nilai “t tabel”.
7. Residual Statistics
94
8. Histogram
9. Normal Plot
Analisis regresi sangat membantu untuk mendapatkan bukti ilmiah dari suatu hubungan
antara variabel-variabel sekaligus meramalkannya. Dalam ilmu eksakta hubungan antara
variabel-variabel mudah dibuktikan karena sudah tegas dan diketahui, akan tetapi dalam
kajian ilmu sosial, hubungan antara variabel-variabel pada umumnya masih belum tegas dan
95
sering tidak diketahui. Oleh karena itu, SPSS (Statistical Product and Service Solution) pada
awal berdirinya memiliki kepanjangan Statistical Package for the Social Science untuk
menegaskan bahwa SPSS dapat membantu segala kesulitan dalam kajian ilmu sosial.
96
Kelompok VI
BAB II
PEMBAHASAN
UJI KORELASI
1. Pengertian
Korelasi adalah istilah statistik yang menyatakan derajat hubungan linear
antara dua variabel atau lebih yang ditemukan oleh Karl Pearson pada awal 1900.
Oleh sebab itu terkenal dengan sebutan Korelasi Pearson Product Moment (PPM).
Dua variabel dikatakan berkorelasi apabila perubahan pada variabel yang satu akan
diikuti perubahan pada variabel yang lainnya secara teratur dengan arah yang sama
(korelasi positif) atau berlawanan (korelasi negarif)
korelasi adalah salah satu teknik analisis statistik yang paling banyak
digunakan oleh para peneliti. Karena peneliti semuanya tertarik terhadap peristiwa-
peristiwa yang terjadi dan mencoba untuk menghubungkannya.
Pada bab ini akan dibahas analisis korelasi sederhana dengan metode Pearson atau
sering disebut Product Moment Pearson. Nilai korelasi (r) berkisar antara 1 sampai -1, nilai
semakin mendekati 1 atau -1 berarti hubungan antara dua variabel semakin kuat, sebaliknya
nilai mendekati 0 berarti hubungan antara dua variabel semakin lemah. Nilai positif
menunjukkan hubungan searah (X naik maka Y naik) dan nilai negatif menunjukkan
hubungan terbalik (X naik maka Y turun).
97
Menurut Sugiyono (2007) pedoman untuk memberikan interpretasi koefisien korelasi
sebagai berikut:
0,20 - 0,399 = rendah
0,40 - 0,599 = sedang
0,60 - 0,799 = kuat
Contoh kasus:
1 33 58
2 32 52
3 21 48
4 34 49
5 34 52
6 35 57
7 32 55
8 21 50
98
9 21 48
10 35 54
11 36 56
12 21 47
99
Dari hasil analisis korelasi sederhana (r) didapat korelasi antara kecerdasan dengan
prestasi belajar (r) adalah 0,766. Hal ini menunjukkan bahwa terjadi hubungan yang kuat
antara kecerdasan dengan prestasi belajar. Sedangkan arah hubungan adalah positif karena
nilai r positif, berarti semakin tinggi kecerdasan maka semakin meningkatkan prestasi belajar.
1) Menentukan Hipotesis
Ho : Tidak ada hubungan secara signifikan antara kecerdasan dengan
prestasi belajar
100
signifikan, jika 1 sisi digunakan untuk mengetahui hubungan lebih kecil atau
lebih besar).
Tingkat signifikansi dalam hal ini berarti kita mengambil risiko salah dalam
mengambil keputusan untuk menolak hipotesa yang benar sebanyak-banyaknya 5%
(signifikansi 5% atau 0,05 adalah ukuran standar yang sering digunakan dalam penelitian)
3) Kriteria Pengujian
Ho diterima jika Signifikansi > 0,05
4) Membandingkan signifikansi
Nilai signifikansi 0,004 < 0,05, maka Ho ditolak.
5) Kesimpulan
Oleh karena nilai Signifikansi (0,004 < 0,05) maka Ho ditolak, artinya bahwa
ada hubungan secara signifikan antara kecerdasan dengan prestasi belajar.
Karena koefisien korelasi nilainya positif, maka berarti kecerdasan
berhubungan positif dan signifikan terhadap pretasi belajar. Jadi dalam kasus
ini dapat disimpulkan bahwa kecerdasan berhubungan positif terhadap prestasi
belajar pada siswa SMU Negeri XXX
Ry1.2 =
Keterangan :
101
- ry2 : koefisien korelasi variabel y dan X2
dimana :
ry1 =
ry2 =
r1.2 =
Ry1.2 =
Contoh Soal :
RUMAH TANGGA
VARIABEL
I II III IV V VI VII
102
Pengeluaran (Y) 3 5 6 7 4 6 9
Pendapatan (X1) 5 8 9 10 7 7 11
Pertanyaan :
Penyelesaian :
1 3 5 4 9 25 16 15 12 20
2 5 8 3 25 64 9 40 15 24
3 6 9 2 36 81 4 54 12 18
4 7 10 3 49 100 9 70 21 30
5 4 7 2 16 49 4 28 8 14
6 6 7 4 36 49 16 42 24 28
7 9 11 5 81 121 25 99 45 55
∑ 40 57 23 252 103
489 83 348 137 189
104
Berdasarkan hasil perhitungan diperoleh nilai Korelasi (R) = 0,9686 atau 0,97.
Nilai Korelasi (R) = 0,97 bermakna bahwa hubungan kedua variabel X (X1 dan X2) s
angat kuat karena nilai R mendekati 1.
ry1.2 =
ry2.1 =
r2.1Y =
105
Menurut Sugiyono (2007) pedoman untuk memberikan interpretasi
koefisien korelasi sebagai berikut:
0,20 - 0,399 = rendah
0,40 - 0,599 = sedang
0,60 - 0,799 = kuat
Contoh kasus:
1 33 58 25
2 32 52 28
3 21 48 32
4 34 49 27
5 34 52 27
106
6 35 57 25
7 32 55 30
8 21 50 31
9 21 48 34
10 35 54 28
11 36 56 24
12 21 47 29
Dari hasil analisis korelasi parsial (ry.x1x2) didapat korelasi antara kecerdasan
dengan prestasi belajar dimana tingkat stress dikendalikan (dibuat tetap) adalah
107
0,4356. Hal ini menunjukkan bahwa terjadi hubungan yang sedang atau tidak
terlalu kuat antara kecerdasan dengan prestasi belajar jika tingkat stress tetap. Sedangkan
arah hubungan adalah positif karena nilai r positif, artinya semakin tinggi kecerdasan
maka semakin meningkatkan prestasi belajar.
3. Kriteria Pengujian
Berdasar probabilitas:
4. Membandingkan probabilitas
Nilai P value (0,181 > 0,05) maka Ho diterima.
108
5. Kesimpulan
Oleh karena nilai P value (0,181 > 0,05) maka Ho diterima, artinya
bahwa tidak ada hubungan secara signifikan antara kecerdasan dengan
prestasi belajar jika tingkat stress dibuat tetap. Hal ini dapat berarti terdapat
hubungan yang tidak signifikan, artinya hubungan tersebut tidak dapat
berlaku untuk populasi yaitu seluruh siswa SMU Negeri XXX, tetapi hanya
berlaku untuk sampel. Jadi dalam kasus ini dapat disimpulkan bahwa
kecerdasan tidak berhubungan terhadap prestasi belajar pada siswa SMU
Negeri XXX.
Contoh:
109
5. Kriteria Pengujian Hipotesis
Ho ditolak bila harga ρ hitung > dari ρ table
Ho diterima bila harga ρ hitung ≤ dari ρ tabel
Penyajian data
1 9 8
2 6 7
3 5 6
4 7 8
5 4 5
6 3 4
7 2 2
8 8 9
9 7 8
10 6 6
110
N = total pengamatan
Bila terdapat nilai yang sama, maka cara membuat peringkatnya adalah: Misalnya
pada Xi nilai 9 adalah peringkat ke 1, nilai 8 pada peringkat ke 2, selanjutnya disini ada
nilai 7 jumlahnya dua. Mestinya peringatnya kalau diurutkan adalah peringkat 3 dan 4.
tetapi karena nilainya sama, maka peringkatnya dibagi dua yaitu: (3 + 4) : 2 = 3,5.
akhirnya dua nilai 7 pada Xi masing-masing diberi peringkat 3,5. Selanjutnya pada Yi
disana ada nilai 8 jumlahnya tiga. Mestinya peringkatnya adalah 2, 3 dan 4. Tetapi
karena nilainya sama maka peringkatnya dibagi tiga yaitu: (2 + 3 + 4) : 3 = 3. Jadi nilai
8 yang jumlahnya tiga masing-masing diberi peringkat 3 pada kolom Yi. Selanjutnya nilai
7 diberi peringkat setelah peringkat 4 yaitu peringkat 5. Lanjutkan saja.
1 9 8 1 3 -2 4
5 4 5 8 8 0 0
6 3 4 9 9 0 0
7 2 2 10 10 0 0
8 8 9 2 1 1 1
111
10 6 6 5,5 6,5 -1 1
0 7
Kesimpulan :
5% 1% 5% 1%
112
7 0,786 0,929 20 0,450 0,591
Kelompok VII
113