Hand Out Mata Kuliah Pengantar Statistika Untuk Mahasiswa Program Strata 1 Program Studi Ilmu Perpustakaan Dan Informasi
Hand Out Mata Kuliah Pengantar Statistika Untuk Mahasiswa Program Strata 1 Program Studi Ilmu Perpustakaan Dan Informasi
Disusun oleh:
Ir. Anon Mirmani, S.S., MIM-Arc./Rec.
Penilaian: Syarat mutlak kehadiran 80% untuk dapat mengikuti ujian akhir
UTS 25%
Kuis 15%
Tugas pekerjaan rumah 15%
UAS 45%
Rencana Perkuliahan:
Minggu I
Pendahuluan:
Pengenalan berbagai istilah dalam statistik: Pengertian statistik , statistika dan
metode statistik .
Istilah dalam statistik
Pengertian hipotesis statistik
Skala pengukuran
Notasi penjumlahan
Uji parametric dan non parametric
Penelitian dan manfaat statistik
Bahan bacaan:
Carpenter, Ray L. 1978, Statistical methods for librarians, Chicago: ALA.
Hal. 1-8.
Siegel, Sidney, 1990, Statistik Non-Parametrik untuk ilmu-ilmu social
(terjemahan), Jakarta: Gramedia, Hal. 8-19.
Sugiyono, 1997, Statistika untuk penelitian, Bandung: Alfabeta, hal. 1-16.
Walpole, Ronald E, 1987, Pengantar Statistika, Edisi k3-3, Jakarta: Gramedia.
Statistik Deskriptif
1. Penyajian data kuantitatif
2. Pembentukan distribusi frekuensi
3. Penyajian data kualitatif
4. Tabel dan grafik statistik
Bahan bacaan:
Carpenter, Ray L, 1978, Statistical methods for librarians, Chicago: ALA hal.
9-12.
Simpson, IS, 1998, Basic statistics for librarians, 3rd, ed, Chicago: ALA, Hal.
3-14.
Sugiyono, 1997, Statistika untuk penelitian, Bandung: Alfabeta, Hal. 21-40.
Walple, Ronald E, 1987, Pengantar Statistika, Edisi ke-3, Jakarta: Gramedia.
Minggu IV
Minggu V dan VI
Statistik Deskriptif:
1. Ukuran pemusatan: nilai tengah, modus dan median
2. Ukuran keragaman: wilayah, standar deviasi dan varians
3. Desil, kuartil
4. Kegunaan: ukuran-ukuran ii
5. Derajat kemiringan
6. Tugas dan PR
Bahan bacaan:
Simpson, IS, 1998, Basic statistics for librarians, 3rd, ed, Chicago: ALA, Hal.
15-24.
Sugiyono, 197, Statistika untuk penelitian, Bandung: Alfabeta, hal. 41-57.
Walpole, Ronald E, 1987, Pengantar Statitika, Edisi ke-3, Jakarta: Gramedia.
Minggu VII:
Kuis bahan yang sudah diberikan
Minggu XIV dan XV: Aplikasi Perangkat Lunak untuk Statistik : SPSS tidak
terlaksana.
Contoh:
Seorang peneliti ingin mengetahui tingkat kerusakan buku di
perpustakaan suatu perguruan tinggi. Maka yang akan dilakukan peneliti tersebut
adalah menghitung buku yang rusak dari sejumlah contoh yang diambil dari
beberapa perpustakaan yang ada di perguruan tinggi tersebut. Selanjutnya, data
buku rusak yang diperoleh dari masing-masing perpustakaan dirata-ratakan
nilainya. Nilai rata-rata merupakan suatu dugaan (suatu statistik ).
Kemudian timbul pertanyaan apakah ada perbedaan antara statistik ,
statistika dan metode statistik . Dari beberapa definisi yang banyak dikemukakan
untuk menjelaskan tentang ketiga istilah ini, dapat diambil suatu rangkuman atau
kesimpulan istilah-istilah tersebut.
Statistik adalah suatu koleksi metode-metode yang dapat membantu
seseorang dalam membuat keputusan-keputusan dari sejumlah informasi yang
terbatas atau suatu alat untuk mengumpulkan, mengelola/mengatur dan
menganalisa data dari suatu percobaan/survai.
Sedangkan Statistika merupakan cabang dari matematika dan merupakan
ilmu yang mempelajari cara-cara menentukan penduga, serta kemudian bertugas
mengambil kesimpulan berdasarkan nilai pendugaan tersebut. Atau dengan kata
lain statistika merupakan ilmu yang mempelajari statistik . Dengan demikian
antara istilah statistik dan statistika ada perbedaan, statistik merupakan penduga
sedangkan statistika merupakan ilmu yang mempelajari penduga tersebut.
Karena statistika merupakan suatu metodologi ilmiah, yang merupakan
cabang dari matematika terapan. Maka metod-metodenya adalah berbagai macam
tehnik mengumpulkan, mengorganiasikan, mentablasi, menganalisis,
menginterpretasikan, menggambarkan dan menyajikan data dalam bentuk angka-
angka. Oleh karena itu, Metoe Statistik merupakan prosedur-prosedur yang
digunakan dalam mengumpulkan, menyajikan, menganalisis dan menafsirkan
data. Metode statistik dapat mengubah informasi yang sederhana sekalipun
menjadi informasi yang bermakna.
Metoe Statistik dibagi dua, yaitu:
1. Statistik Deskriptif adalah metode-metode yang berkaitan dengan
pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi
yang berguna (Tabel dan Gambar).
2. Statistik Inferensia merupakan semua metode yang berhubungan dengan
analisis sebagian data untuk kemudian asmpai pada peramalan atau penarikan
suatu kesimpulan mengenai keseluruhan gugus data induknya (Pengujian
hipotesis).
a. Variabel Kuantitatif
1. Variabel disket (variabel diskontinu): variabel yang nilainya hanya terdiri
dari bilangan bulat. Contoh: Jumlah penduduk, jumlah anak, jumlah buku
dan sebagainya.
2. Variabel kontinu: variabel yang nilainya dapat berupa pecahan. Contoh:
tinggi badan, berat badan, volume, air dan sebagainya.
b. Variabel Kualitatif
Parameter merupakan karakteristik dari populasi yang dapat diukur dan
dinyatakan dengan bilangan (, x, , S, p, p).
Pengukuran adalah pemberian lambang bilangan atau angka kepada
kejadian yang diamati.
n
2. x
i 1
1
2
= x12 + x22 = … + xn2
n
3. x
i 1
1 y i = x1x2 = x2x2 = … + xnyn
n n n n
4. i 1
(xi + yi + zi ) = x 1 + y 1 + x 1
( C kons tan ta ) i 1 i 1 z 1
i=1 i=1
1. UJI PARAMETRIK
Uji statistik yang memerlukan kondisi/asumsi tertentu dari parameter
populasi dimana sample berasal.
Kondisi/asumsi yang harus dipenuhi untuk uji parametric:
a. Populasi mempunyai distribusi normal
b. Populasi-populasi mempunyai variansi yang sama
c. Rantom sample
d. Ukuran data, paling tidak interval
LATIHAN
1. Jelaskan perbedaan pengertian antara statistik dan statistika !
2. Jelaskan pengertian metode statistik , serta sebutkan dan jelaskan dua jenis
metode statistik !
3. Jelaskan perbedaan pengertian antara populasi, sample, sampling, sample acak
dan berikan contohnya ! Catatan: Pandanglah bahwa populasinya adalah
mahasiswa Semester V Jurusan Ilmu Perpustakan – Universitas Indonesia.
4. Seorang mahasiswa Jurusan Ilmu Perpustakaan – UI ditugaskan untuk
mempelajari factor-faktor yang berpengaruh terhadap prestasi kerja seorang
pustakawan. Sebutkan variable dan parameter dari masalah tersebut !
5. Apa yang dimaksud dengan hipotesis statistik ! Berikan contohnya yang
berkaitan dengan bidang informasi/perpustakaan/dokumentasi minimal 2
macam).
6. Berikan 4 macam skala pengukuran, dan berikang masing-masing contohny !
7. Diketahui nilai ujian statitik dan nilai mutu rata-rata dari 8 orang mahasiswa
Jurusan Ilmu Perpustakaan – UI Tahun 1996 yang diambil secara acak adalah
sebagai berikut:
Mahasiswa 1 2 3 4 5 6 7 8
Nilai Statistik 56 73 84 62 68 45 82 78
(x)
Mutu Rata-rata 2,36 2,83 3,24 2,41 3,14 2,00 3,07 2,65
(y)
Tentukan:
n
a. x
i 1
i
8
b. x
i 1
i
2
8
c. x y
i 1
i i
8
d. (x
i 1
i yi )
8
e. 4y
i 1
i
PENYAJIAN DATA KUANTITATIF DAN KUALITATIF
A. LINIER ARRAY
Penyusunan data secara teratur dari nilai data terkecil sampai dengan nilai data
terbesar (sebaliknya).
Contoh:
Jumlah buku pada 10 (sepuluh) rak berbeda adalah sebagaiberikut:
327 247 262 356 278 280 240 284 304 220
Dalam bentuk array: diurutkan dari nilai terendah ke nilai terbesar:
220 240 247 262 278 280 280 304 329 356
Atau nilai terbesar ke nilai terendah
356 329 304 284 280 278 262 247 240 220
B. DISTRIBUSI FREKUENSI
7–9 2
10 – 12 8
13 – 15 14
16 – 18 19
19 – 21 7
10 – 12 9.5 – 12.5 11 8
13 – 15 12.5 – 15.5 14 14
16 – 18 15.5 – 18.5 17 19
19 – 21 18.5 – 21.5 20 7
k = 1 + 3.322 log n
dimana:
k = jumlah kelas
n = jumlah data
b. Tentukan wilayah datanya
Wilayah = Nilai data terbesar – Nilai data terkecil
Contoh:
Diketahui data umur 40 buah aki mobil yang serupa jenisnya dan dicatat sampai
persepuluhan tahun terdekat adalah sebagai berikut:
2.2 4.1 3.5 4.5 3.2 3.7 3.0 2.6
3.4 1.6 3.1 3.3 3.8 3.1 4.7 3.7
2.5 4.3 3.4 3.6 2.9 3.3 3.9 3.1
3.3 3.1 3.7 4.4 3.2 4.1 1.9 3.4
4.7 3.8 3.2 2.6 3.9 3.0 4.2 3.5
Jawab:
a. Banyaknya kelas (k) : k = 1 + 3.322 log n
= 1 + 3.322 log 40
= 6.322
Maka banyaknya kelas adalah 7
Tabel 5a. Distribusi Frekuensi Komulatip Umur Aki Mobil (“KURANG DARI”)
Batas kelas Frekuensi komulatip Persen komulatip
Kurang dari 1.45 0 0.0
Kurang dari 1.95 2 5.0
Kurang dari 2.45 3 7.5
Kurang dari 2.95 7 17.5
Kurang dari 3.45 22 55.0
Kurang dari 3.95 32 80.0
Kurang dari 4.45 37 92.5
Kurang dari 4.95 40 100.0
Tabel 5a. Distribusi Frekuensi Komulatip Umur Aki Mobil (“LEBIH DARI”)
Batas kelas Frekuensi komulatip Persen komulatip
Kurang dari 1.45 0 100.0
Kurang dari 1.95 2 95.0
Kurang dari 2.45 3 92.0
Kurang dari 2.95 7 82.5
Kurang dari 3.45 22 45.0
Kurang dari 3.95 32 20.0
Kurang dari 4.45 37 7.5
Kurang dari 4.95 40 0.0
C. TABEL STATISTIK
Tabel 7. Penduduk Indonesia yang diklasifikasikan atas daerah dan kelamin, 1962.
Tabel statistik yang baik dan efisien harus bersifat sederhana dan jelas. Judul
Tabel, Judul kolom dan Judul Kompartemen harus diusahakan agar jelas dan
singkat.
Judul
Kompartemen
Kompartimen
(Kotak)
Sumber:
D. GRAFIK STATISTIK
Data statistik dapat disajikan dalam bentuk tabel dan grafik. Penyajian grafik
statistik mempunyai beberapa keuntungan, antara lain:
1. Lebih menarik perhatian pembaca
2. Dapat melukiskan suatu peristiwa secara lebih mengesankan dan tidak
menjemukan
Kelemahan penyajian data dalam bentuk grafik statistik antara lain adalah data
yang disajikan hanya bersifat aproksimatif.
5. Piktograf (Pictograf)
Contoh: Diagram 4.2.8
Diagram 4.2.9
KEGIATAN PRAKTIKUM 3
1. Carilah dan salinlah sebuah tabel referensi tentang pertanian/penyuluhan
pertanian
2. Buatlah dua buah tabel ikhtisar dari tabel referensi tersebut
3. Buatlah tiga macam grafik yang berbeda dari kedua tabel tersebut
A. UKURAN PEMUSATAN
1. NILAI TENGAH
a. Nilai Tengah Populasi ( )
Apabila sekumpulan data x1, x2, …, xn tidak semuanya harus berbeda,
menyusun sebuah populasi terhingga berukuran N, maka nilai populasinya adalah:
x
i 1
i x1 + x2 + … + xN
= =
N N
Contoh:
Diketahui data suatu populasi adalah sebagai berikut:
200 188 196 203 191 176 183 213 196 208
Jawab:
x
i 1
i x1 + x2 + … + xN
x = =
n n
Contoh:
Diketahui data suatu contoh adalah sebagai berikut:
w wi 1
i i w1x1 + w2x2 + … + wkxk
w = xw = =
8
w
i 1
i w1x1 + w2x2 + … + wkxk
Contoh:
Diketahui data suatu populasi adalah sebagai berikut:
Data 65.80 62.03 37.00 48.00 46.97
Frekuensi 20 30 10 5 35
2. Median
Median adalah sekumpulan data yang telah diurutkan dari yang terkecil
sampai terbesar (sebaliknya), adalah pengamatan yang tepat ditengah-tengah bila
pengamatan ganjil, atau rata-rata kedua pengamatan di tengah bila pengamatan
genap.
Contoh:
a. Data: 79 82 86 92 93
Median = 86
b. Data: 4 7 0 7 11 4 1 15 3 5 8 7
c. Array 0 1 3 4 4 5 7 7 7 8 11 15
Median = (5 + 7)/2 = 6
3. Modus
Modus sekumpulan pengamatan adalah nilai yang paling sering terjadi
atau mempunyai frekuensi paling tinggi.
Contoh:
a. Data: 101 125 118 128 106 125 99 118 109 118
Array 99 101 106 109 118 118 118 125 125 128
Modus : 118
b. Data: 5 6 4 5 7 5 8 7 4 7
Array 4 4 5 5 5 6 7 7 7 8
Modus : 5 dan 7 (bimodus/bimodal)
c. Data: 73 77 81 87 88
Modus : tidak ada
LATIHAN:
1. Waktu (jam) yang diperlukan untuk menyelesaikan suatu pekerjaan yang
diambil secara acak tercatat sebagai beriku:
20 15 21 19 20 17 21 22 18 19 20 20 23 20 18
Tentukan: Nilai tengah, median dan modenya !
2. Harga dari koleksi buku yang ada diperpustakaan tercatat sebagai berikut:
Harga (ribuan) 40 45 50 55 60 65 70 75 80 85
Jumlah Buku 1 3 2 7 10 13 6 4 2 1
Tentukan: Nilai tengah, median dan modenya !
1. Range (Wilayah)
Wilayah sekumpulan data adalah beda antara pengamatan terbesar dan
terkecil dalam kumpulan data tersebut.
Contoh:
Data : 61 60 56 63 56 67 59 56 44 61
Wilayah = 67 – 44 = 23
Contoh:
Diketahui data suatu populasi sebagai berikut: 7 5 9 7 8 6
I Xi Xi - (xi - )2
1 7 0 0
2 5 -2 4
3 9 2 4
4 7 0 0
5 8 1 1
6 6 -1 1
42 10
= 42/6 = 7
Ragam = 2 ( xi ) 2
= 10/6 = 1.67
N
Standar Deviasi = 1.67 = 1,29
b. Ragam Contoh
Ragam contoh untuk sebuah cotoh acak x1, x2, …, xN didefinisikan sebagai:
S2 = (x 1 x) 2
, atau S2 =
n x 2 ( x) 2
n 1 n( n 1)
(6)(171) (31) 2
S2 =
6(6 1)
LATIHAN:
Tentukan wilayah, ragam dan standar deviasi dari soal nomor 1 s/d 3!
PEKERJAAN RUMAH:
1. Nilai mutu rata-rata dari 20 contoh mahasiswa tingkat akhir yang diabil secara
acak adalah sebagai berikut:
Tentukan:
a. Mode, median dan nilai tengah
b. Ragam dan simpangan baku
Frekuensi 2 3 7 5 14 11 12 9 6 6 3 2
pengamatan
Tentukan:
a. Mode, median dan nilai tengah
b. Ragam dan simpangan baku
3. Distribusi frekuensi hasil ujian statistik adalah sebagai berikut:
Tembusan:
a. Mode, median dan nilai tengah
b. Ragam dan simpangan baku
PENGUJIAN HIPOTESIS
= 0.05 berarti dalam 100 kali tolak H0, ada 5 kali tola H0 padahal H0 benar atau
mempunyai tingkat kepercayaan 95%.
(1) H0 : = 0 VS H1 : > 0
(2) H0 : = 0 VS H1 : < 0
(3) H0 : = 0 VS H1 : 0
(1) dan (2) : Pengujian eka-arah
(3) : Pengujian dwiarah
Latihan:
1. In Economics abstracts, July 1972, the mean length of abstract is 79.56 words
with a standard deviation of 24.80. A random sample of thirty-two of the
abstracts in German language has a mean length of 67.47 words. Is there any
significant difference between the random sample of abstracts in German and
the whole population.
2. Over a whole year of 52 weeks, the number of issues from a library was
30.000. In 10 weeks during the winter, the number of issues per week were
found to be:
650 693 750 726 804 735 751 751 687 762
3. A random sample of 30 shelves of geography books had amean number of
27.3 books per shelf and a standar deviation of 2.16. A random sample of 40
shelves of books on production had amean number of 32.0 books per shelf and
a standard deviation of 6.04. Use a z-test to decide if the number of geography
books per shelf is significantly less than from the number of books per shelf
on production.
4. The number of issues of junior non-fiction on a random sample of days in
May and November were:
May : 66 58 62 69 57 94 67 97 67 63 87 75
Nov : 64 89 52 74 79 63 78 89 64 52 63 47
Does there appear to be significant difference in demand the two months
REGRESI LINIER DAN KORELASI
A. PENGERTIAN
Regresi Linier: hubungan antara variabel terikat/dependent variable (y)
dengan variabel bebas/independent variable (x) yang dinyatakan dalam bentuk
persamaan matematik yang bentuknya linier.
Kegunaan Regresi Linier: untuk membuat estimasi atau pendugaan nilai
atau harga suatu variabel (variabel terikat) berdasarkan nilai atau harga variabel
yang lain (variabel bebas).
Y = a + b.x
Dimana:
a = y b.x
Contoh:
Tabel 8. Nilai rata-rata tes masuk dan nilai statistik mahasiswa APP Bogor.
Tentukan:
a. Persamaan garis regresinya
b. Dugalah nilai statistik seorang mahasiswa apabila nilai tes rata-rata masuknya
adalah 70
c. Gambarkan diagram pencar dan garis agresinya
nXY ( X )( Y )
b=
n X 2 ( X )2
(12)(61685) (725)(1011)
b= 0.897
(12)(44475) (725) 2
a = y b.x
= 84,250 – (0.897)(60.417) = 30.056
Gambar 4. Diagram pencar dan garis regresi hubungan antara nilai rata-rata tes
masuk dan nilai statistik mahasiswa APP Bogor.
C. KOEFISIEN KORELASI (r)
n. XY ( X )( Y )
r=
n X 2
( X ) 2 n Y 2 ( Y ) 2
KEGIATAN PRAKTIKUM 6
1. Data luas panen (X) dan produksi ubikayu pada 10 kabupaten di Propinsi jawa
timur tahun 1987 – 1988 adalah sebagai berikut:
Kabupaten Luas Panen (Ha) Produksi (ton)
Jombang 1.929 22.765
Mojokerto 2.269 27.977
Nganjuk 5.364 59.778
Tulungagung 6.597 74.136
Blitar 8.190 96.994
Pajuruan 11.600 133.909
Probolinggo 14.096 181.561
Trenggalek 16.038 206.213
Malang 20.545 262.837
Ponorogo 31.165 372.215
Pertanyaan:
a. Tentukan persamaan garis regresinya
b. Dugalah produksi ubikayu Kabupaten Bojonegoro, apabila luas panennya
20.410 ha!
c. Tentukan besarnya koefisien determinasi dan koefisien korelasinya! Jelaskan
arti koefisien determinasi yang diperoleh!
No. X Y
1. 1.09 24
2. 7.42 92
3. 4.20 67
4. 8.25 158
5. 8.81 81
6. 1.62 59
7. 3.84 54
8. 9.40 171
9. 3.63 100
10. 14.10 276
11. 2.50 122
12. 11.47 200
Contoh Tanah 1 2 3 4 5 6 7 8 9
X (ppm) 1 4 5 9 13 13 23 27 28
Y (ppm) 64 70 71 81 93 96 97 115 119
Pertanyaan:
a. Berdasarkan data yang tersedia, berikan persamaan regresi antar Y sebagai
peubah tak bebas dengan X sebagai peubah bebas !
b. Tentukan banyaknya rata-rata kandungan fosfor yang tersedia bagi
tanaman pada suatu tanah yang kandungan fosfor anorganiknya sebesar
7,5 ppm !
c. Gambarkan diagram pencar dan garis regresinya !
LATIHAN:
1. In Economics abstracts, July 1972, the mean length of abstract is 79.56 words
with a standard deviation of 24.80. A random sample of thirty-two of the
abstracts in German language has a mean length of 67.47 words. Is there any
significant difference between the random sample of abstracts in German and
the whole population !
2. Over a whole year of 52 weeks, the number of issues from a library was
30.000. In 10 weeks during the winter, the number of issues per week were
found to be:
650 693 750 726 804 735 751 751 687 762
Perform at-test to determine whether the demand for books is significantly
greater or less during the winter.
3. A random sample of 30 shelves of geography books had a mean number of
27.3 books per shelf and a standard deviation of 2.16. A random sample of 40
shelves of books on production had a mean number of 32.0 books per shelf
and a standard deviation of 6.04. Use a z-test to decide if the number of
geography books per shelf is significantly less than from the number of books
per shelf on production.
4. The number of issues of junior non-fiction on a random sample of days in
May and November were:
May : 66 58 62 69 57 94 67 97 67 63 87 75
Nov : 64 89 52 74 79 63 78 89 64 52 63 47
Does there appear to be significant difference in demand the two months