Penalaran Statistik 1
Penyusun: Penyusun :
Lingkup bahasan
Data dan Sampling Data Organisasi dan Visualisasi Data Distribusi Data
Naskah ini disusun lebih mirip sebagai suatu ringkasan diktat dengan tujuan agar mahasiswa dapat menggunakannya untuk belajar mandiri. Isi naskah berupa kalimat-kalimat pendek sebagai pokok atau kunci materi sehingga mahasiswa dapat cepat mempelajari dan mudah mengingatnya.
2
Jawaban:
Jawaban pertanyaan seperti di atas dapat diselesaikan melalui langkah pengumpulan informasi. Pengumpulan informasi dapat dilakukan dengan cara survei atau eksperimen. Hasil survei atau eksperimen (informasi) yang berupa angka-angka disebut data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 4
Statistik inferensial:
Hasil ini membingungkan, karena terdapat dua survei dengan kesimpulan yang berbeda. Ketika kita menghadapi peryataan statistik seperti ini, perlu ditanyakan:
Apakah surveinya dilakukan pada semua mahasiswa UI (40.000 mahasiswa)? Atau survei hanya dilakukan pada sebagian mahasiswa saja, misalnya hanya 1000 mahasiswa UI. Angka 40.000 ini disebut sebagai populasi, sedangkan Angka 1000 disebut sebagai sampel.
Populasi
Sampel
Mengumpulkan Informasi
Melakukan survei pada 40.000 mahasiswa merupakan pekerjaan yang sangat berat, memerlukan waktu, tenaga, dan biaya yang besar. Terkadang, survei pada populasi tidak mungkin dilakukan.
Contoh 1: Kita ingin menghitung jumlah ikan yang hidup di danau Salam UI.
Statistik pada umumnya mengumpulkan informasi dengan cara sampling, yaitu mengambil informasi dari sebagian elemen di populasi (sampel).
8
Ketika kita mengambil keputusan berdasarkan informasi dari sampel, selalu ada kemungkinan terjadi kesalahan.
Contoh 2: Sebuah toples berisi 100 kelereng berwarna putih dan hitam. Seorang anak ingin memprediksi warna kelereng tsb, karena dia tidak dapat melihat langsung warna kelereng di dalam toples. Untuk itu, dia mengambil 5 kelereng dari dalam toples. Pada kasus ini, 100 kelereng adalah populasi, dan sebagai sampel adalah 5 kelereng.
Jika anak tsb mendapati 5 kelereng yang diambilnya dari toples semua berwarna putih, maka dia dapat mengambil kesimpulan yang salah yaitu semua kelereng di dalam toples berwarna putih. Pada contoh ini anak tersebut membuat prediksi warna kelereng di dalam toples berdasarkan sample 5 kelereng yang diambilnya. Seandainya dia mengambil 15 sampel kelereng, ada kemungkinan akan diperoleh beberapa kelereng berwarna hitam, sehingga akan memberikan kesimpulan yang berbeda. Sudah tentu, percobaan yang paling akurat adalah jika diambil 100 kelereng (seluruh populasi), tetapi hal ini jarang dilakukan pada kasus statistik.
10
Sampling disebut benar jika dapat memberikan prediksi yang akurat pada
populasi.
Prediksi dapat akurat jika sampel yang dipilih merupakan replika atau
gambaran karakteristik dari populasi. Sampel seperti ini disebut sampel representatif (representative sample).
Salah satu teknik agar pengambilan sampel tidak bias adalah Sampling Acak. Sampel Acak (random sample) adalah sampel yang diperoleh dengan cara
tertentu, sehingga setiap elemen populasi mempunyai kesempatan yang sama untuk terpilih sebagai sebuah sampel.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 11
14
Pengorganisasian Data
Data: 0,1,1,2,2,3,4,5,5,6,4,4,0,0,1,1,1,1,2,2,3,3,2,2,0,0,0,1,1,1,2,2,2, 4,4,4,6,6,7,3,3 ,3,2,2,2,2,2,3,0,0,1,1,2,2,2,2,3,3,5,5,3,3,8,9. Di sini terdapat 64 angka. Setiap angka disebut sebagai item data. Pada data tersebut kita jumpai beberapa angka yang sama, misalnya angka 0 muncul delapan kali, angka 1 muncul 11 kali, dst. Agar data terlihat polanya, angka-angka ini dapat disusun berdadasarkan urutannya dari angka terkecil sampai terbesar, sbb: 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 5 5 5 6 6 7 8 8 9 Susunan ini telah mengelompokkan angka-angka yang sama dan ditulis secara berurutan, sehingga terlihat bahwa data menunjukkan suatu pola. Cara lain untuk megorganisir data adalah menggunakan distribusi frekuensi.
16
Distribusi Frekuensi
Distribusi frekuensi adalah suatu daftar data berdasarkan frekuensi kemunculannya. Data jumlah anak sebelumnya dapat dituliskan distribusi frekuensinya seperti tabel di samping. Kolom 1 mengurutkan hasil survei yaitu jumlah anak dari angka terkecil (0) sampai angka terbesar (9). Kolom 2 mengoleksi item data yang muncul untuk jumlah anak yang didaftar. Kolom 3 menghitung jumlah keluarga yang mempunyai jumlah anak seperti yang terdaftar di kolom 1 atau dikenal sebagai frekuensi keluarga dengan jumlah anak tertentu.
Kolom 2
Kolom 3
Tabel 1
Item data
0,0,0,0,0,0,0,0 1,1,1,1,1,1,1, 1,1,1,1 2,2,2,2,2,2,2,2,2,2,2,2, 2,2,2,2,2,2 3,3,3,3,3,3,3,3,3,3,3 4,4,4,4,4,4 5,5,5,5 6,6 7 8,8 9
Kolom 2
Kolom 3
Tabel 1
Item data
0,0,0,0,0,0,0,0 1,1,1,1,1,1,1, 1,1,1,1 2,2,2,2,2,2,2,2,2,2,2,2, 2,2,2,2,2,2 3,3,3,3,3,3,3,3,3,3,3 4,4,4,4,4,4 5,5,5,5 6,6 7 8,8 9
19
Apa yang harus dilakukan jika data sulit dibuat distribusi frekuensinya frekuensinya? ?
Terkadang data yang diperoleh dari survei atau eksperimen terlalu banyak atau angkanya berbeda-beda sehingga sulit untuk dibuat distribusi frekuensinya. Data seperti ini dapat ditata menjadi beberapa kelompok data atau kelas sehingga membentuk Distribusi Frekuensi Kelompok. Meskipun tidak ada cara yang pasti untuk membuat kelas, tetapi panduan berikut sangat bermanfaat:
1. Urutkan data dari angka terkecil sampai angka terbesar. 2. Kelompokkan data hingga terbentuk 5 sampai 12 kelas saja. (Jumlah kelas yang
terlalu sedikit atau terlalu banyak akan menyebabkan pola data tidak tergambarkan dengan baik.)
3. Buatlah setiap kelas mempunyai lebar yang sama. 4. Batas-batas setiap kelas tidak boleh tumpang tindih. 5. Pastikan setiap item data hanya masuk dalam satu kelas saja.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 20
Angka terkecil
10 20 22 23 24
24 25 26 26 29 29 29 30 31 31
32 33 36 36 38 39 40 41 43 44
44 45 47 52 55 55 58 60 62 72
Angka terbesar
22
Tabel 3
Frekuensi (f) Frekuensi Relatif ( f/n )
(1/35) x 100% = 2,9% (11/35) x 100% = 31,4% (9/35) x 100% = 25,7% (7/35) x 100% = 20,0% (4/35) x 100% = 11,4% (2/35) x 100% = 5,7% (1/35) x 100% = 2,9% 23
10 19 20 29 30 39
1 11 9 7 4 2 1 Total: n = 35
40 49 50 59 60 69 70 79
Sumbu tegak menyatakan jumlah keluarga yang memiliki jumlah anak tertentu (frekuensi). Setiap angka di sumbu jumlah anak diberi gambar satu batang. Tinggi batang dari setiap angka jumlah anak menyatakan jumlah keluarga yang memiliki sejumlah anak tsb. Keluarga dengan 2 anak mempunyai jumlah terbesar. Jumlah keluarga yang mempunyai anak lebih dari 2, mempunyai kecenderungan semakin kecil dengan semakin besarnya jumlah anak.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Jumlah keluarga
Keluarga yang disurvei mempunyai 0 9 anak. Angka-angka jumlah anak ini diletakkan di sumbu mendatar.
20 15 10 5 0
3 4 5 6 7 Jumlah anak
25
8 12 16 Jumlah keluarga
20
Grafik batang (kiri) mirip dengan histogram. Pada umumnya grafik batang lebih sering ditampilkan secara mendatar (kanan). Sumbu mendatarnya adalah frekuensi dan sumbu tegaknya adalah angka hasil survei.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
26
Grafik Batang
Distribusi frekuensi untuk jumlah anak per keluarga
3 4 5 6 7 Jumlah anak
Histogram mirip dengan grafik batang yang ditampilkan secara tegak. Sumbu mendatar dan sumbu tegaknya sama. Setiap angka di sumbu mendatar (hasil survei) digambarkan dengan satu batang yang tingginya sama dengan frekuensi (skalanya ada di sumbu tegak). Perbedaan histogram dan grafik batang terletak pada jarak antar batang. Di histogram, tidak ada jarak di antara batang-batangnya, sedangkan di grafik batang antar batang ada jaraknya. Grafik batang dapat digambarkan secara mendatar, sedangkan histogram selalu digambarkan secara tegak.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
27
Sumbu mendatarnya adalah angka hasil survei dan sumbu tegaknya adalah frekuensi. Setiap angka hasil survei (jumlah anak) digambarkan dengan satu titik yang letaknya bersesuaian dengan frekuensi di skala sumbu tegak (jumlah keluarga). Distribusi frekuensi dari data hasil survei dapat dilihat jelas dengan mengamati pola titik dan garis yang menghubungkan setiap titik data.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
28
Histogram Poligon
29
Jumlah anak
2 3 4 5 6 7 8 9
17,2% 28,1%
30
Data dari Tabel 1. Distribusi frekuensi untuk jumlah anak per keluarga
20
Jumlah keluarga
16 12 8 4 0 0 1 2 3 4 5 6 7 8 9
Jumlah anak
31
Grafik Garis
Distribusi frekuensi untuk jumlah anak per keluarga
Jumlah keluarga
16 12 8 4 0 0 1 2 3 4 5 6 7 8 9
Jumlah anak
Poligon dan grafik garis (tipe titik dan garis lurus) mempunyai tampilan yang mirip. Perbedaan dari keduanya terletak pada posisi titik-titik data frekuensi. Di Poligon, titiktitik data frekuensi terletak di tengah daerah skala data sumbu mendatar, sedangkan di grafik garis, titik-titik data frekuensi terletak tepat di atas skala data sumbu mendatar.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
32
Histogram Tabel 3
Distribusi frekuensi kelompok untuk jam belajar mahasiswa per pekan
Sumbu tegak di histogram, poligon, grafik garis, ataupun grafik batang dapat berupa data frekuensi ataupun frekuensi relatif. Kedua histogram di atas menggunakan data frekuensi relatif untuk sumbu tegaknya. Perbedaan tampilan antara distribusi frekuensi dan distribusi frekuensi kelompok terletak di skala sumbu mendatarnya. Angka skala di distribusi frekuensi berupa item data, sedangkan di distribusi frekuensi kelompok berupa kelas.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 33
Distribusi Data
34
35
Titik pusat
Distribusi frekuensi (nilai-nilai frekuensi dari setiap nilai yang diamati) di sebelah kanan titik pusat tidak sama dengan distribusi frekuensi di sebelah kiri titik pusat.
Titik pusat
Distribusi seragam
Distribusi bimodal
38
Distribusi Seragam
Distribusi seragam disebut pula distribusi rektangular. Semua nilai yang diamati memiliki frekuensi yang sama. Contoh: Ketika kita melempar sebuah dadu, angka 1 6 mempunyai kemungkinan yang sama untuk tampil. Dengan demikian frekuensi kemunculan angka 1 6 adalah sama, sehingga histogramnya menampilkan distribusi seragam. Histogram eksperimen ini mempunyai sumbu mendatar angka 1 6 (nilai disetiap sisi dadu) dan sumbu tegaknya adalah frekuensi kemunculan angka 1 6.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
39
Distribusi Normal
Distribusi normal disebut pula distribusi Gaussian. Bentuknya seperti lonceng. Distribusi ini sangat penting sebab banyak kejadian di alam mempunyai bentuk distribusi normal. Contoh: Berat dan tinggi pria. Panjang bayi yang baru lahir. Berat semangka. Waktu hidup baterai. dll.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia 40
41
Distribusi bentuk J
Distribusi bimodal
42
Distribusi Bentuk J
Distribusi bentuk J memberikan nilai frekuensi yang semakin membesar atau semakin mengecil. Contoh: Jam belajar siswa per pekan. Distribusi frekuensi kelompok di Tabel 3, memberikan distribusi bentuk J.
43
Distribusi Miring
Distribusi miring memberikan letak frekuensi puncak yang tidak di tengah-tengah distribusi datanya. Dapat dibedakan menjadi distribusi miring kanan (ekornya di sebelah kanan) dan miring kiri (ekornya di sebelah kiri). Contoh: Jumlah anak per keluarga. Distribusi frekuensi di Tabel 1, memberikan distribusi miring kanan. Jumlah penghasilan per keluarga. Distribusi frekuensinya akan miring kiri. Cacah radioaktif dari ruang angkasa yang sampai di permukaan bumi. Distribusi frekuensinya miring kanan.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
Ekor di kanan
44
45
Kesimpulan
Ilmu yang berkaitan dengan pengumpulan, pengorganisasian, analisis, dan Statistik pada umumnya mengumpulkan informasi dengan cara sampling. Sampel disebut benar jika dapat memberikan prediksi yang akurat pada populasi. Pengorganisasian data dapat menghasilkan distribusi frekuensi atau distribusi frekuensi kelompok. Distribusi frekuensi digunakan untuk mempelajari pola dari data. Data dapat divisuilisasikan dengan grafik. Grafik yang biasa digunakan dalam statistik adalah Histogram, Poligon, Lingkaran (Pie), dan Garis. Distribusi data dapat dibedakan menjadi distribusi simetri dan tak simetri.
MPKT B. Dipergunakan hanya di lingkungan akademik Universitas Indonesia
penyimpulan informasi atau data untuk mengetahui dan memahami dunia di sekitar kita disebut statistik.
46
Daftar Pustaka
Angel, R.A, Abbott, D.C, Runde, C.D. 2009, A Survey of Mathematics with Application, Ed. Ke-8, Boston, Pearson Addison Wesley. Blitzer, R. 2008, Thinking mathematically, Ed. Ke-4, New Jersey, Pearson Addison Wesley. Miller, D.C, Heeren, E.V, Hornsby, J, Morrow, L.M, Newenhizen, V.J, 2008, Mathematical Ideas, Ed. Ke-11, Boston, Pearson Addison Wesley. Pirnot, L.T, 2007, Mathematics All Around, Ed.Ke-3, Boston, Pearson Addison Wesley.
47