Dosen Pembimbing
KHOTIBUL UMAM
MODUL 1
DATA STATISTIK
A. PENGERTIAN STATISTIK
Statistik adalah kumpulan angka angka mengenai suatu masalah , sehingga dapat memberikan
gambaran mengenai masalah tersebut. Biasanya kumpulan data tersebut sudah disusun dalam sebuah
tabel. Sudjana (2005), menyampaikan bahwa statistik adalah menyatakan kumpulan data, bilangan
maupun non bilangan yang disusun dalam tabel dan atau diagram, yang melukiskan atau
menggambarkan suatu persoalan. Statistika adalah metode ilmiah yang mempelajari pengumpulan,
pengaturan, perhitungan, penggambaran dan penganalisisan data serta penarikan kesimpulan yang
valid berdasarkan penganalisisan yang dilakukan dan pembuatan keputusan yang rasional.
Statistika menurut fungsinya dibagi menjadi dua bagian yaitu:
1. Statistika deskriptif atau statistika dedukatif adalah statistika yang hanya menggambarkan dan
menganalisis kelompok data yang diberikan tanpa penarikan kesimpulan mengenai kelompok data
yang lebih besar.
Statistika Deskriptif yaitu statistika yang menggunakan metode numerik dan grafik untuk mencari
pola dalam suatu kumpulan data, meringkas informasi yang terkandung dalam kumpulan data,
dan menghadirkan informasi dalam bentuk yang diinginkan (Santosa, 2004).
2. Statistika inferensial atau statistika induktif adalah statistika yang menyangkut kesimpulan yang
valid biasanya memasukkan unsur peluang dalam menarik kesimpulannya.
Statistika Inferensi yaitu statistik yang menggunakan data sampel untuk membuat estimasi,
keputusan, prediksi, dan generalisasi terhadap kumpulan data yang lebih besar (Santoso, 2004).
B. MACAM MACAM DATA
1. Menurut sifatnya data dibagi dua bagian yaitu:
a. Data kualitatif adalah data yang berbentuk kategori atau atribut
Contoh : Harga emas hari ini mengalami kenaikan.
b. Data kuantitatif adalah data yang berbentuk bilangan
Contoh : Banyak perguruan tinggi dikota “B” ada 4 buah.
Data kuantitatif dibagi menjadi dua bagian yaitu
1). Data diskrit adalah data yang diperoleh dengan cara menghitung atau membilang.
Contoh : jumlah siswa yang mengikuti mata kuliah ini mencapai 110 orang.
2). Data kontinu adala data yang diperolah dengan cara mengukur.
Contoh: jarak antara kota Bandung dengan kota Cirebon adalah 130 km.
2. Menurut cara memperolehnya dibagi menjadi dua yaitu:
a. Data primer adala data yang dikumpulkan dan diolah sendiri oleh suatu organisasi serta
diperoleh langsung dari objeknya
b. Data sekunder adalah data yang diperoleh dalam bentuk sudah jadi , sudah dikumpulkan dan
diolah oleh pihak lain, biasanya data itu dicatat dalam bentuk publikasi – publikasi.
C. PENGUMPULAN DATA
Dalam statistika proses pengumpulan data ada dua yaitu :
a. Sensus adalah cara pengumpulan data jika setiap anggota populasi diteliti satu persatu
b. Sampling adalah cara pengumpulan data jika hanya sebagian anggota populasi saja yang diteliti.
D. ELEMEN DASAR STATISTIKA
Dalam pembelajaran statistik, terdapat elemen-elemen dasar statistika yaitu:
a. Populasi adalah keseluruhan obyek yang akan diteliti. Contoh : Seluruh mahasiswa Universitas
Muhammadiyah Sidoarjo
b. Sampel adalah bagian dari populasi. Contoh : Mahasiswa Fakultas Teknik Universitas
Muhammadiyah Sidoarjo.
c. Data adalah sesuatu yang diketahui meskipun belum tentu benar, dimana data dapat digunakan
untuk menggambarkan suatu keadaan.
d. Informasi adalah daya yang telah diolah.
e. Variabel adalah karakteristik atau sifat dari unit individual populasi
Untuk memilih sampel dari suatu populasi dapat dilakukan dalam dua cara adalah :
1. Cara Acak
Cara acak adalah cara pemilihan sejumlah anggota dari populsi yang dilakukakan sedemikian rupa
sehingga anggota – anggota populasi itu mempunyai peluang yang sama untuk terpilih menjadi
anggota sampel. Penialian dengan cara seperti ini bersifat objektif. Cara acak bisa dilakukan
dengan dua cara yaitu undian dan tabel bilanga acak
2. Cara Tidak Acak
Cara tidak acak adalah cara pemilihan sejumlah anggota dari populsi dengan setiap anggotanya tidak
mempunyai peluang yang sama untuk terpilih menjadi anggota sampel. Penialian dengan cara
seperti ini bersifat subjektif.
MODUL 2
Pada perusahaan “X”, telah dilakukan transaksi pembelian barang-barang oleh unit A.
Pembelian barang-barang dalam ribuan unit dan jutaan rupiah pada tahun 2013-2015
2.
2013 2014 2015
Barang
3. Banyak Harga Banyak Harga Banyak Harga
A 8,3 234,4 12,7 307,8 11,0 290,4
B 10,8 81,4 9,4 80,5 13,0 92,0
Jumlah 19,1 315,8 22,1 388,3 24,0 382,4
2.Distribusi kontingensi
Untuk data yang terdiri atas dua faktor atau dua variabel, dimana faktor yang satu terdiri atas b kategori
dan lainnya terdiri atas k kategori, dapat dibuat daftar kontingensi berukuran bxk dengan b menyatakan
baris dan k menyatakan kolom. Banyak Murid Sekolah di Daerah A menurut Tingkat Sekolah dan Jenis
Kelamin pada
tahun 2013-2015
Dalam tabel distribusi frekuensi ada beberapa istilah yang digunakan didalamnya, antara lain:
1. Kelas interval adalah kelompok nilai data yang berupa interval
2. Ujung bawah adalah bilangan yang terdapat disebelah kiri interval nilai data untuk setiap kelas
interval
3. Ujung atas adalah bilangan yang terdapat disebelah kanan interval nilai data untuk setiap kelas
interval.
4. Batas bawah adalah bilangan yang diperoleh dengan cara ujung bawah dikurangi ketelitian data
yang digunakan.
5. Batas atas adalah bilangan yang diperoleh dengan cara ujung atas ditambah ketelitian data yang
digunakan.
6. Titik tengah (tanda kelas) adalah bilangan yang diperoleh dengan cara ujung bawah ditambah
ujung atas , kemudian hasilnya dibagi dua untuk setiap kelas interval.
7. Panjang kelas adalah bilangan yang diperoleh dari jarak / selisih antara ujung bawah dan ujung
atas, dengan ujung bawahnya termasuk dihitung.
Untuk menyusun sekumpulan data ke dalam tabel distribusi frekuensi dengan panjang kelas yang
sama untuk setiap kelas interval diperlukan Langkah –langkah sebagai berikut:
R = Xmax -Xmin
2. Tentukan banyak kelas yang digunakan
K= 1 + (3, 3log n)
K = banyak kelas interval
n = banyak data yang digunakan
3. Tentukan panjang kelas
P= R
k
4. Tentukan nilai ujung bawah kelas interval pertama
5. Masukkan semua data ke dalam interval kelas.
MODUL 3
PENYAJIAN DATA DALAM BENTUK DIAGRAM
1. MACAM – MACAM BENTUK DIAGRAM UNTUK DATA TIDAK BERKELOMPOK
2. Diagram Baris
Untuk menggambarkan yang serba terus atau berkesinambungan. Diperlukan sumbu tegak
dan sumbu datar yang saling tegak lurus. Sumbu datar menyatakan waktu, sedangkan
sumbu tegaknya menyatakan kuantum data tiap waktu.
3. Diagram Lingkaran
Diagram lingkaran diartikan sebagai cara penyajian sekumpulan data kedalam lingkaran. Untuk
membuat diagram lingkaran gambarkan sebuah lingkaran kemudian dibagi menjadi beberapa
sektor. Tiap sektor melukiskan kategori data yang terlebih dahulu diubah kedalam derajat.
Dianjurkan untuk pembagian mulai dari titik tertinggi lingkaran. Diagram digunakan untuk
melukiskan data atribut.
4. Diagram Lambang
Diagram lambang adalah suatu cara penyajian data dalam menggunakan lambang-
lambang. Dipakai untuk mendapatkan gambaran kasar sesuatu hal dan sebagai alat visual
bagi orang awam. Kesulitannya adalah menggambarkan bagian simbul untuk satuan yang
tidak penuh.
5. Diagram Peta
Diagram ini disebut juga kartogram. Dalam pembuatannya digunakan peta geografis tempat
data terjadi. Sehingga, diagram ini melukiskan keadaan dihubungkan dengan tempat
kejadiannya. Contoh : Pembagian wilayah pelayanan PLN di Surabaya.
Ukuran pemusatan atau disebut dengan tendensi sentral adalah penjabaran data yang
berulang atau berpusat pada nilai-nilai tertentu secara kuantitatif . Ukuran pemusatan adalah cara
untuk mencari nilai tengah dari satu gugus data, yang telah diurutkan dari nilai yang terkecil sampai
yang terbesar atau sebaliknya dari nilai terbesar sampai yang terkecil. Sedangkan ukuran
penyimpangan data atau disebut juga ukuran dispersi adalah ukuran yang menyatakan seberapa
jauh penyimpangan nilai-nilai data dari nilai pusatnya. Ukuran pemusatan dan penyimpangan data
dibagi atas dua jenis, yaitu ukuran pemusatan dan penyimpangan data untuk data yang tidak
dikelompokkan serta ukuran pemusatan dan penyimpangan data untuk data yang dikelompokkan.
A. Jenis- jenis Ukuran Pemusatan Data
1. Rata-rata (mean)
Rata-rata (mean) dapat didefinisikan sebagai jumlah seluruh nilai data dibagi dengan jumlah data
yang digunakan. Menurut Supranto (2008), persamaan untuk menghitung nilai rata-rata data yang
tidak dikelompokkan dan data yang dikelompokkan secara berurutan dinyatakan sebagaimana
persamaan sebagai berikut.
1) Data tidak dikelompokkan
Xi
i 1
di mana :
i = 1,2,3,..., n
n = banyaknya data
2) Data dikelompokkan
fi X i
i 1
fi
I=i
di mana :
i = 1,2,3,..., k
k = banyaknya kelas
2. Median
Median dapat didefinisikan sebagai nilai tengah yang memisahkan data yang tinggi dan data yang
rendah. Menurut Supranto (2008), persamaan untuk menghitung median data yang tidak
dikelompokkan dan data yang dikelompokkan secara berurutan dinyatakan sebagaimana
persamaansebagai berikut.
1). Data tidak dikelompokkan
(n / 2) (n/ 2 1)
untuk n Me
genap
di mana :
i = 1,2,3,..., n
n = banyaknya data
2). Data dikelompokkan
(0, 5 ft fsm )
Me Bb I
fm
di mana :
1
Bb = batas kelas terendah, dimana terletak median yaitu pada frekuensi kumulatif ke- n
ft = frekuensi total
I = interval kelas
3. Modus
Modus dapat didefinisikan sebagai nilai yang paling sering muncul. Untuk
menghitung nilai modus pada data tidak dikelompokkan tidak sulit yaitu dengan menghitung
secara manual berapa banyak nilai pengamatan yang paling sering muncul, sedangkan untuk
menghitung nilai modus pada data tidak dikelompokkan menurut Supranto (2008), dinyatakan
sebagaimana persamaan sebagai berikut.
1) Data dikelompokkan
Mo Bb
a b
Dimana :
Bb = batas bawah kelas dengan frekuensi tertinggi
a = selisih frekuensi tertinggi dengan frekuensi kelas sebelumnya
b = selisih frekuensi tertinggi dengan frekuensi kelas sesudahnya
I = Interval kelas
4. Kuartil
Kuartil atau disebut perempatan,artinya nilai nilai kuartil akan membagi 4 bagian yang sama
banyak terhadap seluruh data yang sudah diurutkan. Dengan demikian kita kenal kuartil
pertama(k1), kuartil kedua (k2), dan kuartil ketiga (k3).
Letak Ki = data ke I/4 ( n+1) , I = 1,2,3 .
Menurut Yitnosumarto (2010), persamaan untuk menghitung kuartil sebagai berikut :
p
ft sp
Kp Bb
fp
di mana :
p =1, 2 atau 3 (yaitu perempatan ke-1, ke-2 atau ke-3)
Bb = batas bawah kelas terendah pada kelas dimana terletak kuartil ke-p
ft = frekuensi total
I = interval kelas
5. Desil
Desil atau disebut persepuluhan
p
f t sp
Dp Bb 10
fp
di mana :
p 1, 2, 3, ... ,10
Bb batas bawah kelas terendah pada kelas dimana terletak desil ke-p
ft = frekuensi total
fsp = frekuensi kelas sebelum kelas desil
f p = frekuensi kelas dimana terletak desil ke-p
I = interval kelas
6. Persentil
persentil atau disebut perseratusan
t sp
Pp Bb
fp
di mana :
p = 1, 2, 3,...,100
Bb = batas bawah kelas terendah pada kelas dimana terletak persentil ke-p
ft = frekuensi total
fsp = frekuensi kelas sebelum kelas persentil
f p = frekuensi kelas dimana terletak persentil ke-p
I = interval kelas
B. UKURAN DISPERSI.
Dalam suatu kelompok data kuantitatif mempunyai nilai data minimum dan nilai data maksimum. Jarak
antara kedua nilai ekstrim itu disebut rentang ( range). yang diberi simbol dengan huruf “ R “.
Selisih antara nilai K3 dengan K1 disebut RAK. Secara umum dapat ditulis dalam bentuk :
RAK = K3 - K1
Selain RAK ada dispersi lain yang dinamakan “ rentang semi kuartil” atau ditulis RSK.
di mana :
Xmaks = nilai pengamatan tertinggi
X2
i1 i1
s2
di mana :
i = 1,2,3,..., n
n = banyaknya data
2. Data dikelompokkan
fi X 2i fi X i / f
i1 i1 i1
2
s
n1
di mana :
Simpangan baku atau standart deviasi adalah akar dari ragam (variance). Sehingga untuk
menghitung nilai sangat mudah yaitu dengan mengakarkan nilai ragam (variance).
Data tidak dikelompokkan
a. Range b. Ragam c. Simpangan Baku
X2
R Xmax -Xmin X2
i1 i1 s i1 i 1
s2
n 1
Data dikelompokkan
a. Range b. Ragam c. Simpangan Baku
2 k
k
2
R Xmax -Xmin f X fi X i / fi
i 1 i 1 i 1
s2 s
n 1
n 1
MODUL 5
UKURAN KEMIRINGAN DAN UKURAN KERUNCINGAN DARI KURVA NORMAL
A. UKURAN KEMIRINGAN
Ukuran kemiringan adalah ukuran yang menyatakan sebuah model distribusi yang mempunyai kemiringan
tertentu. Apabila diketahui besarnya nilai ukuran ini maka dapat diketahui pula bagaimana model distribusinya,
apakah distribusi simetrik, positif atau negatif. Untuk mengetahui ini dapat dilihat berdasarkan nilai koefisien
kemiringannya. Ada beberapa jenis rumus untuk menghitung koefisien kemirngan yaitu:
Koefisien kemiringan = x - Mo
K3 - K1
4. Jika menggunakan nilai persentil maka rumusnya adalah
P90 - P10
Jika koefisien kemiringannya lebih kecil dari nol maka bentuk distribusinya negatif, jika sama dengan nol
bentuknya simetrik dan jika lebih besar dari nol maka bentuknya positif
Kurtosis adalah derajat kepuncakan dari suatu distribusi, biasanya diambil relatif terhadap distribusi normal.
Sebuah distribusi yang mempunyai puncak relatif tinggi dinamakan leptokurtik.dan sebuah distribusi yang
mempunyai puncak mendatar disebut platikkurtik dan jika puncaknya tidak mendatar dinamakan mesokurtik.
P90 - p10
Jika koefisien kurtosisnya kurang dari 0,263 maka distribusinya platikurtik, jika sama disebut
mesokurtik dan jika lebih dari 0,263 maka disebut leptokurtik
MODUL 6
A. DISTRIBUSI NORMAL
Distribusi Normal adalah distribusi dari variabel acak kontinyu yang paling sering digunakan
karena distribusi normal adalah distribusi yang paling luas aplikasinya dan merupakan
pendekatan yang baik dari distribusi-distribusi lainnya.
Menurut Walpole dan Myers (1986), variabel acak X dikatakan berdistribusi normal
umum, jika fungsi peluang untuk X diyatakan sebagaimana persamaan sebagai berikut :
f (x) exp
2
Penulisan notasi dari variabel acak yang berdistribusi normal adalah N (x; µ, ),
yang memiliki arti bahwa variabel acak x memiliki distribusi normal dengan rata-rata µ dan
2.
ragam (variance) Variabel acak X yang berdistribusi normal dengan rata-rata µ dan
2. 2
varians (ragam) Juga dapat dituliskan sebagai X ~ NID( , ) , NID berarti normally
independently distributed. Kurva distribusi normal berbentuk lonceng atau genta yang
ditunjukkan sebagaimana gambar sebagai berikut :
Seperti yang sudah di jelaskan pada bagian awal bahwa kurva distribusi normal
berbentuk lonceng atau genta dengan dua paremeter yaitu µ (rata-
(simpangan baku)
b. Kurva distribusi normal berbentuk lonceng (genta) mempunyai sifat setangkup
Sifat setangkup pada distribusi normal berarti bahwa luasan kurva distribusi normal
sisi kiri sama dengan luasan kurva distribusi normal sisi kanan. Luas kurva ditribusi
normal sisi kiri dan sisi kanan yaitu 0,5.
c. Luas daerah yang terletak di bawah kurva tetapi di atas sumbu mendatar x sama
dengan 1 atau dapat dinyatakan sebagai berikut:
f (x)dx 1
f (x)
(Yitnosumarto,1990)
Berikut ini diberikan contoh kasus penggunaan distribusi normal pada perhitungan-
perhitungan nilai peluang untuk lebih mengetahui aplikasi dari distribusi normal yang dijelaskan.
Tinggi laki-laki dikelas tersebar secara normal dengan rata-rata 155 cm dan simpangan baku
7 cm. Apabila di panggil secara acak, seorang laki-laki dikelas maka tentukan berapa peluang:
a. Tinggi laki-laki tersebut kurang dari 150 cm
b. Tinggi laki-laki tersebut lebih dari 170 cm
c. Tinggi laki-laki tersebut antara 140 -160 cm
d. Tinggi laki-laki tersebut tepat 160 cm
Untuk menyelesaikan kasus tersebut, kita misalkan bahwa tinggi badan laki-laki dikelas sebagai variabel acak
X, sehingga notasi variabel acak X dapat dituliskan sebagai berikut :
X ~ NID(155, 49)
Karena luas daerah di bawah kurva fungsi peluang distribusi normal merupakan peluang
maka nilai peluang untuk tinggi laki-laki dikelas adalah :
150
P( x 150) f ( x)dx
150
1 2
x 155
= exp dx
2 (49) 2(49)
P( x 170) f ( x)dx
170
2
= exp x 155 dx
2 (49) 2(49)
170
140
160 1 2
x 155
= exp dx
2 (49) 2(49)
140
160,05
1
= exp x 155 2 dx
159,95 2 (49) 2(49)
3. Transformasi Distribusi Normal
Proses penyelesaian integral fungsi peluang distribusi normal cukup rumit oleh karena
itu, untuk mempermudah proses penyelesaian terdapat transformasi dari distribusi normal ke
distribusi normal baku. Menurut Yitnosumarto (1990), bentuk tranformasi distribusi normal
baku dinyatakan sebagaimana persamaan sebagai berikut :
X
Z
di mana :
µ = rata-rata
Distribusi normal baku adalah distribusi untuk variabel acak normal dengan nilai tengah nol
dan simpangan baku 1. Fungsi peluang distribusi normal baku dinyatakan sebagaimana
persamaan sebagai berikut
1 1
f (x) exp x2
2
MODUL 7
PENGUJIAN HIPOTESIS
A. HIPOTESIS STATISTIK
Hipotesis statistik ialah suatu anggapan atau pernyataan yang mungkin benar atau tidak , mengenai
satu populasi atau lebih. Petunjuk dari sampel yang tidak sesuai dengan hipotesis , menjurus kepada
penolakan hipotesis, sedangkan petunjuk yang mendukung hipotesis menjurus kepada penerima
hipotesis.hipotesis yang dirumuskan dengan harapan untuk ditolak disebut hipotesis nol dan dinyatakan
dengan H0, sedangkan hipotesis yang dirumuskan dengan harapan diterima disebut hipotesis tandingan dan
dinyatakan dengan huruf H1. Kesalahan jenis I adalah penolakan terhadap H0 padahal hipotesis tersebut
benar, sedangkan kesalahan jenis II adalah penerimaan terhadap H0 padahal hipotesis tersebut
salah.pengujian hipotesis dengan tandingan H1 bernilai lebih dari atau kurang dari nilai parameter yang
ditetapkan pada H0 maka dapat dilakukan uji eka arah (one tail), sedangkan pengujian hipotesis dengan
hipotesis tandingan H1 bernilai tidak sama dengan nilai parameter yang ditetapkan pada H0 maka dapat
dilakukan uji dwi arah ( two tail).
Uji normalitas diperlukan untuk mengetahui apakah distribusi dari data sampel yang kita gunakan memenuhi
asumsi berdistribusi normal. Penyimpangan terhadap asumsi kenormalan tersebut dapat berakibat terhadap
keabsahan dalam penarikan kesimpulan, karena statistik hitung yang kita gunakan diturunkan dari fungsi
normal. Apabila suatu penelitian akan membandingkandua gugus data atau lebih maka perlu dilakukan uji
kesamaan keragaman atau variansi antar gugus data atau biasa disebut dengan uji homogenitas. Uji
normalitas yang biasa digunakan adalah uji liliefors, uji kolmogorov-smirnov, uji Anderson-Darling dan uji
Shapiro-Wilks. Uji homogenitas yang biasa digunakan adalah uji F, uji Bartlett, uji Hartley, uji Scheffe dan uji
Levene ( Levene’s test)
Uji beda rataan merupakan salah satu analisis data yang sering dilakukan dalam penelitian yang ingin
mengetahui permasalahan perbandingan dua perlakuan atau pengaruh dari suatu perlakuan yang
dibandingkan dengan unit kontrol. Pada uji beda rataan umumnya digunakan statistik Z dan statistik t
untuk menguji perbedaan parameter tersebut. Statistik z digunakan apabila banyaknya sampel yang
digunakan relatif besar ( n >30 ). statistik t digunakan apabila banyaknya sampel yang digunakan
relatik kecil ( n < 30). asumsi yang harus dipenuhi pada penggunaan statistik z maupun statistik t
adalah distribusi dari data yang akan dianalisis harus menyebar normal dengan rata-rata µ dan
simpanan baku
MODUL 8
Analisis regresi merupakan alat statistik yang memanfaatkan hubungan antara dua atau lebih peubah
kuantitatif sehingga salah satu peubah bisa diramalkan dari peubah-peubah lainnya.
1. Model regresi merupakan suatu cara formal untuk mengespresikan dua unsur penting suatu hubungan
statistik
3. Cakupan model. Cakupan ini ditentukan oleh rancangan penelitian atau oleh jangkauan data yang tersedia