Name : Fither NPM : 121210099 Code Class : 131-MA111-M12 Lecturer : Yuliadi, S.Si UNIVERSITAS PUTERA BATAM 2014
Kata Pengantar Saya berterima kasih dan berdoa untuk semua kebaikan dan kasih karunia dari Allah yang diberikanNya. Saya seorang komposer untuk menyelesaikan tugas ini tepat waktu, sesuai dengan materi yang diajarkan dalam semester ini. Tulisan ini memberikan informasi tentang " Membuat makalah tentang statistik " yang terdiri dari penjelasan tentang bagaimana menbuat dan menghitung dalam metode statistik. Banyak kendala yang terjadi ketika saya mengkompilasi tulisan ini, baik dari dalam maupun dari luar. Namun dengan ketekunan dan kesabaran telah konstituen, maka ini dapat diatur dan diselesaikan kertas Saya seorang komposer mengucapkan terima kasih kepada semua orang yang terlibat, didalamnya khususnya teman-teman kuliah yang membantu memberikan referensi serta Mr. Yuliadi, S.Si yang telah memberikan bantuan dan bimbingan. Tulisan ini masih jauh dari sempurna, jika ada kesalahan dan kekurangan sehingga dapat dimengerti, dan mungkin berguna sehingga dapat menjadi referensi bagi pembaca.
BATAM, 2 Desember 2013 Penulis
(FITHER)
i Daftar isi Kata Pengantar i Daftar isi . ii Definisi Statistik .. 1 Sejarah statistic .... 2 Konsep Dasar ... 3 Analisis Regresi dan Korelasi .. 4 Analisis varians (analysis of variance, ANOVA) 5 Metode Statistik ... 7 Tipe Pengukuran .. 7 Distribusi Frekuensi ... 9 Ukuran Statistika .. 22 Referensi .... 31
ii Definisi Statistik Statistik adalah ilmu yang mempelajari bagaimana merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data. Singkatnya, statistik adalah ilmu yang berkenaan dengan data. Istilah 'statistika' bahasa Inggris: statistics berbeda dengan 'statistik' (statistic). Statistik merupakan ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil penerapan algoritma statistik pada suatu data. Dari kumpulan data, statistik dapat digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakan statistik deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas. Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas. Statistik adalah kata yang digunakan untuk menyatakan sekumpulan fakta, umumnya berbentuk angka-angka yang disusun dalam tabel atau diagram yang melukiskan atau menggambarkan suatu kumpulan data yang mempunyai arti. Untuk memudahkan. Berikut ini disampaikan beberapa contoh : "Ada 60 % dari penduduk yang memerlukan air bersih, kata 60 % adalah statistik. Statistik vital pragawati tersebut adalah 38 - 33 - 35, rangkaian angka-angka ini disebut juga "statistik" karena mempunyai arti. Sedangkan statistika menunjukkan suatu pengetahuan yang berhubungan dengan cara- cara pengumpulan fakta, pengolahan, penganalisisan, dan penarikan kesimpulan serta pembuatan keputusan yang cukup beralasan berdasarkan fakta yang ada. Statistik banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu alam misalnya astronomi dan biologi maupun ilmu-ilmu sosial termasuk sosiologi dan psikologi, maupun di bidang bisnis, ekonomi, dan industri. Statistika juga digunakan 1 dalam pemerintahan untuk berbagai macam tujuan; sensus penduduk merupakan salah satu prosedur yang paling dikenal. Aplikasi statistika lainnya yang sekarang popular adalah prosedur jajak pendapat atau polling misalnya dilakukan sebelum pemilihan umum, serta hitung cepat (perhitungan cepat hasil pemilu) atau quick count. Di bidang komputasi, statistik dapat pula diterapkan dalam pengenalan pola maupun kecerdasan buatan. Sejarah statistik Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin modern statisticum collegium ("dewan negara") dan bahasa Italia statista ("negarawan" atau "politikus"). Gottfried Achenwall (1749) menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai "ilmu tentang negara (state)". Pada awal abad ke-19 telah terjadi pergeseran arti menjadi "ilmu mengenai pengumpulan dan klasifikasi data". Sir John Sinclair memperkenalkan nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap saat. Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-bidang dalam matematika, terutama peluang. Cabang statistika yang pada saat ini sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi, dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald Fisher (peletak dasar statistika inferensi), Karl Pearson (metode regresi linear), dan William Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu pengetahuan, mulai dari astronomi hingga linguistika. Bidang-bidang ekonomi, biologi dan cabang- cabang terapannya, serta psikologi banyak dipengaruhi oleh statistika dalam 2 metodologinya. Akibatnya lahirlah ilmu-ilmu gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika. Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika, tetapi sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak terkait dengan matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian statistika sebagian besar masuk dalam fakultas matematika dan ilmu pengetahuan alam, baik di dalam departemen tersendiri maupun tergabung dengan matematika. Konsep Dasar Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau sosial, pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam statistika dapat berarti populasi benda hidup, benda mati, ataupun benda abstrak. Populasi juga dapat berupa pengukuran sebuah proses dalam waktu yang berbeda- beda, yakni dikenal dengan istilah deret waktu. Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan sensus. Sebuah sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu, dalam statistika seringkali dilakukan pengambilan sampel (sampling), yakni sebagian kecil dari populasi, yang dapat mewakili seluruh populasi. Analisis data dari sampel nantinya digunakan untuk menggeneralisasi seluruh populasi. Jika sampel yang diambil cukup representatif, inferensial (pengambilan keputusan) dan simpulan yang dibuat dari sampel dapat digunakan untuk menggambarkan populasi secara keseluruhan. Metode statistika tentang bagaimana cara mengambil sampel yang tepat dinamakan teknik sampling. Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya hal terlihat banyak digunakannya uji statistik yang mengambil dasar pada sebaran peluang. Sedangkan matematika statistika merupakan cabang dari matematika terapan 3 yang menggunakan teori probabilitas dan analisis matematika untuk mendapatkan dasar-dasar teori statistika. Ada dua macam statistik: A. Statistika deskriptif Statistika deskriptif berkenaan dengan deskripsi data, misalnya dari menghitung rata-rata dan varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau grafik sehingga data mentah lebih mudah dibaca dan lebih bermakna dan statistik yang berkenaan dengan bagaimana data dapat digambarkan dideskripsikan atau disimpulkan, baik secara numeric misalnya menghitung rata-rata dan deviasi standar atau secara grafis dalam bentuk tabel atau grafik, untuk mendapatkan gambaran sekilas mengenai data tersebut, sehingga lebih mudah dibaca dan bermakna. B. Statistika inferensial Statistik inferensial lebih dari itu, misalnya melakukan pengujian hipotesis, melakukan prediksi observasi masa depan, atau membuat model regresi dan statistik yang berkenaan dengan permodelan data dan melakukan pengambilan keputusan berdasarkan analisis data, misalnya melakukan pengujian hipotesis, melakukan estimasi pengamatan masa mendatang estimasi atau prediksi, membuat permodelan hubungan korelasi regresi, ANOVA, deret waktu, dan sebagainya.
Analisis Regresi dan Korelasi Analisis regresi dalam statistika adalah salah satu metode untuk menentukan hubungan sebab-akibat antara satu variabel dengan variable yang lain. Variabel "penyebab" disebut dengan bermacam-macam istilah: variabel penjelas, variabel eksplanatorik, variable independen, atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X). Variabel terkena akibat dikenal sebagai variabel yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua variabel ini dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu variabel acak. 4 Analisis regresi adalah salah satu analisis yang paling populer dan luas pemakaiannya. Analisis regresi dipakai secara luas untuk melakukan prediksi dan ramalan, dengan penggunaan yang saling melengkapi dengan bidang pembelajaran mesin. Analisis ini juga digunakan untuk memahami variabel bebas mana saja yang berhubungan dengan variabel terikat, dan untuk mengetahui bentuk-bentuk hubungan tersebut. Analisis varians (analysis of variance, ANOVA) Suatu metode analisis statistika yang termasuk ke dalam cabang statistika inferensi. Dalam literatur Indonesia metode ini dikenal dengan berbagai nama lain, seperti analisis ragam, sidik ragam, dan analisis variansi. Ia merupakan pengembangan dari masalah Behrens-Fisher, sehingga uji-F juga dipakai dalam pengambilan keputusan. Analisis varians pertama kali diperkenalkan oleh Sir Ronald Fisher, bapak statistika modern. Dalam praktik, analisis varians dapat merupakan uji hipotesis lebih sering dipakai maupun pendugaan estimation, khususnya di bidang genetika terapan. Secara umum, analisis varians menguji dua varians (atau ragam) berdasarkan hipotesis nol bahwa kedua varians itu sama. Varians pertama adalah varians antar contoh dan varians kedua adalah varians di dalam masing-masing contoh. Dengan ide semacam ini, analisis varians dengan dua contoh akan memberikan hasil yang sama dengan uji-t untuk dua perata.Supaya sahih dalam menafsirkan hasilnya, analisis varians menggantungkan diri pada empat asumsi yang harus dipenuhi dalam perancangan percobaan: Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh Masing-masing contoh saling bebas, yang harus dapat diatur dengan perancangan percobaan yang tepat. 5 Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah). Analisis varians relatif mudah dimodifikasi dan dapat dikembangkan untuk berbagai bentuk percobaan yang lebih rumit. Selain itu, analisis ini juga masih memiliki keterkaitan dengan analisis regresi. Akibatnya, penggunaannya sangat luas di berbagai bidang, mulai dari eksperimen laboratorium hingga eksperimen periklanan, psikologi, dan kemasyarakatan. Deret Waktu Dalam statistika dan pemrosesan sinyal, deret waktu adalah rangkaian data yang berupa nilai pengamatan (pengamatan) yang diukur selama kurun waktu tertentu, berdasarkan waktu dengan interval yang uniform sama. Beberapa Contoh data deret waktu adalah produksi total tahunan produk pertanian indonesia, harga penutupan harisan sebuah saham di pasar modal untuk kurun waktu satu bulan, suhu udara per jam, dan penjualan total bulanan sebuah pasar swalayan dalam waktu satu tahun. Analisis deret waktu (Bahasa Inggris: time series analysis) merupakan metode yang mepelajari deret waktu, baik dari segi teori yang menaunginya maupun untuk membuat peramalan (prediksi). Prediksi / Peramalan deret waktu adalah penggunaan model untuk memprediksi nilai di waktu mendatang berdasar peristiwa yang telah terjadi. Di dunia bisnis, data deret waktu digunakan sebagai bahan acuan pembuatan keputusan sekarang, untuk proyeksi, maupun untuk perencanaan pada masa depan. Contoh penggunaannya adalah pada harga pembukaan harga saham di bursa efek berdasar performa sebelumnya.
Metode Statistik
Terdapat dua jenis utama penelitian: eksperimen dan survei. Keduanya sama-sama mendalami pengaruh perubahan pada perubah penjelas, perilaku, dan 6 respon akibat perubahan itu. Perbedaan keduanya terletak pada bagaimana kajian dilakukan. Metode Eksperimen Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji, memberi perlakuan terhadap sistem, dan kemudian melakukan pengukuran lagi dengan cara yang sama terhadap sistem yang telah diperlakukan untuk mengetahui apakah perlakuan mengubah nilai pengukuran. Bisa juga perlakuan diberikan secara simultan dan pengaruhnya diukur dalam waktu yang bersamaan pula. Metode statistik yang berkaitan dengan pelaksanaan suatu eksperimen dipelajari dalam rancangan percobaan. Metode Survei Dalam survey, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang dikaji. Data dikumpulkan dan hubungan korelasi antara berbagai peubah diselidiki untuk memberi gambaran terhadap objek penelitian.
Tipe Pengukuran
Ada empat tipe skala pengukuran yang digunakan di dalam statistika, yaitu nominal, ordinal, interval, dan rasio. Keempat skala pengukuran tersebut memiliki tingkat penggunaan yang berbeda dalam pengolahan statistik 1. Skala nominal Skala nominal merupakan skala yang merupakan kategori atau kelompok dari suatub subyek. Misal, variabel jenis kelamin responden dikelompokkan menjadi dua, L/P, masing-masing diberi kode 1 dan 2. Angka ini hanya berfungsi sebagai label kategori, tanpa memiliki nilai instrinsik dan tidak memiliki arti apa pun. Lambang- lambang tersebut tidak memiliki sifat sebagaimana bilangan pada umumnya, sehingga pada variabel dengan skala nominal tidak dapat diterapkan operasi matematika standar: pengurangan, penjumlahan, perkalian, dll. Uji statistik yang 7 sesuai dengan skala nominal adalah uji yang mendasarkan pada jumlah seperti modus dan distribusi frekuensi, dan hanya bisa juga membedakan sesuatu yang bersifat kualitatif atau kategoris, misalnya jenis kelamin, agama, dan warna kulit. 2. Skala ordinal Skala ordinal, lambang-lambang bilangan hasil pengukuran menunjukkan urutan atau tingkatan obyek yang diukur menurut karakteristik yang dipelajari. Misal, kita ingin mengetahui preferensi responden terhadap merek indomie goreng: merek Sarimi, Indomie, Mie Sedap, Gaga Mie kemudian responden diminta untuk melakukan ranking terhadap merek mie goreng dengan memberi angka 1 untuk merek yang paling disukai, angka 2 untuk rangking kedua, dst. Rangkuman hasil sbb:
Tabel ini menunjukkan bahwa merek Indomie lebih disukai daripada Mie Sedap, merek Mie Sedap lebih disukai daripada Sarimi, dsb. Walaupun perbedaan angka antara preferensi satu dengan lainnya sama, namun kita tidak dapat menentukan besarnya nilai preferensi dari suatu merek terhadap merek lainnya. Uji statistik yang sesuai adalah modus, median, distribusi frekuensi dan statistik non- parametrik seperti rank order correlation. Membedakan sesuatu dengan menunjukkan tingkatan, misalnya pendidikan dan tingkat kepuasan pengguna.
3. Skala interval Skala pengukuran mempunyai sifat seperti skala ordinal (memiliki urutan tertentu), ditambah satu sifat khas, yaitu adanya satuan skala (scale unit). artinya, perbedaan karakteristik antara obyek yang berpasangan dengan lambang bilangan satu dengan lambang bilangan berikutnya selalu tetap. 8 Jika dalam pengukuran preferensi responden terhadap merek indomie goreng tersebut diasumsikan bahwa urutan kategori menunjukkan preferensi yang sama, maka kita dapat mengatakan bahwa perbedaan indomie goreng merek urutan ke 1 dengan 2 adalah sama dengan perbedaan merek 2 dengan lainnya. Namun demikian, kita tidak bisa mengatakan bahwa merek yang mendapat ranking 5 nilainya lima kali preferensi daripada merek 1. Uji statistik yang sesuai adalah semua uji statistik kecuali uji yang mendasarkan pada rasio seperti koefisien variasi. Berupa angka kuantitatif namun tidak memiliki nilai nol mutlak sehingga titik nol dapat digeser sesuka orang yang mengukur, misalnya tahun dan suhu dalam Celcius. 4. Skala rasio Skala rasio adalah skala yang menghasilkan data dengan mutu yang paling tinggi. Perbedaan skala rasio dengan skala interval terletak pada keberadaan nilai nol (based value). Pada skala rasio, nilai nol bersifat mutlak, tidak seperti pada skala interval. Data yang dihasilkan oleh skala rasio adalah data rasio. Tidak ada pembatasan terhadap alat uji statistik yag sesuai Berupa angka kuantitatif yang memiliki nilai nol mutlak dan tidak dapat digeser sesukanya, misalnya adalah suhu dalam Kelvin, panjang, dan massa.
Distribusi Frekuensi A. Penyajian Grafik Distribusi frekuensi dapat juga disajikan dalam bentuk grafik. Penyajian grafik yang sangat luas digunakan bagi data numerik adalah diagram balok seperti gambar dibawah ini.
9
Diagram Balok umur Aki
Penyajian data lainnya adalah berbentuk Histogram. Histogram berbeda dengan Diagram Balok dala hal sebagai lebar baloknya digunakan batas kelas bukan limit kelas. Untuk beberapa masalah tertentu akan lebih baik bila sumbu tegaknya menyatakan frekuensi relatif atau persentase. Grafiknya disebut Histogram Frekuensi Relatif atau Histogram Persentase, bentuknya persis dengan histogram frekuensi, hanya skala tegaknya berbeda. 10
Histogram Frekuensi Biasanya ada kecenderungan bahwa yang menjadi patokan adalah luas dari persegi panjang tersebut bukan tingginya. Tetapi untuk lebar kelas yang berbeda, tinggi persegi panjang itu harus dibagi dengan perbandingan lebar yang lebih besar dengan gaya yang lebih kecil. Hal ini dapat dilihat dalam gambar dibawah ini, karena lebar kelas yang dipakai ada dua lebar kelas, maka lebar kelas dari 2.5-3.4, lebar kelasnya harus kita bagi dengan lebar kelas lainnya, yaitu didapat ternyata lebar selang 2.5-3.4 dua kali lebih panjang dari lebar kelas lainnya. Sehingga tinggi dari kelas 2.5-3.4, harus dibagi 2.
11 Histogram Frekuensi yang tidak benar dengan lebar kelas yang tidak sama
Histogram Frekuensi yang benar dengan lebar kelas yang tidak sama
Cara lainnya lagi adalah dalam bentuk poligon frekuensi. Poligon frekuensi dibentuk dengan memplotkan frekuensi kelas terhadap titik tengah kelas dan kemudian menghubungkan titik-titik yang berurutan dengan garis lurus. Dengan kata lain poligon merupakan bangun bersisi banyak yang tertutup. Jika frekuensi yang ada dalam bentuk frekuensi relatif, maka disebut poligon frekuensi relatif atau poligon persentase.
12 Poligon Frekuensi
Ogif atau Poligon Frekuensi Kumulatif
Grafik garis lainnya disebut Poligon Frekuensi Kumulatif atau Ogif, didapat dengan memplotkan frekuensi kumulatif yang lebih kecil daripada batas atas kelas terhadap batas atas kelasnya. B. Distribusi Frekuensi Kumulatif 13 Dalam suatu keadaan yang menjadi titik perhatian mungkin bukan pada banyaknya pengamatan pada kelas tertentu, tetapi pada banyaknya pengamatan yang jatuh di atas atau di bawah sebuah nilai tertentu. Distribusi Frekuensi semacan ini dikenal dengan sebagai Distribusi Frekuensi Kumulatif. Distribusi Frekuensi Kumulatif terdiri dari dua macam, yaitu distribusi kumulatif kurang dari dan distribusi kumulatif lebih dari. Distribusi Frekuensi Kumulatif kurang dari menunjukkan berapa banyaknya frekuensi pengamatan yang menunjukkkan nilai lebih kecil dari sebuah nilai atau nilai-nilai tertentu. Sedangkan Distribusi Frekuensi Kumulatif lebih dari menunjukkan berapa banyaknya frekuensi pengamatan yang menunjukkan nilai yang lebih besar dari sebuah nilai atau nilai-nilai tertentu Tabel Distribusi Frekuensi Kumulatif Kurang Dari
Dari tabel distribusi frekuensi kumulatif diatas, ada 7 pengamatan yang mempunyai nilai kurang dari 3 .
Tabel Distribusi Frekuensi Kumulatif Lebih Dari 14
Dari tabel distribusi frekuensi kumulatif diatas ada 18 pengamatan yang mempunyai nilai lebih dari 3. C. Distribusi Frekuensi Relatif
Distribusi Frekuensi dapat juga berbentuk Distribusi Frekuensi Relatif, yaitu dengan membagi setiap frekuensi kelas dengan total banyaknya data. atau dalam bentuk rumus adalah:
15 Tabel Distribusi Frekuensi Relatif Umur Aki
D. Membentuk Distribusi Frekuensi
Langkah-langkah membuat distribusi frekuensi bagi segugus data kwantitatif adalah: Tentukan banyaknya kelas yang diperlukan Tentukan wilayah data tersebut (Range) Bagilah wilayah tersebut dengan banyaknya kelas untuk menduga lebar selangnya. Tentukan limit bawah kelas bagi selang yang pertama dan kemudian batas bawah kelasnya. Tambahkan lebar kelas pada batas bawah kelas untuk mendapatkan batas atas kelasnya. Daftarkan semua limit kelas dan batas kelas dengan cara menambahkan lebar kelas pada limit dan batas selang sebelumnya. Tentukan titik tengah kelas bagi masing-masing selang dengan merata-ratakan limit kelas atau batas kelasnya. 16 Tentukan frekuensi bagi masing-masing kelas. Jumlahkan kolom frekuensi dan periksa apakah hasilnya sama dengan banyaknya total pengamatan Dalam menentukan berapa buah kelas yang harus dibentuk, hal ini tergantung pada keadaan dan banyaknya data, dimana harus dihindarkan terlalu banyak atau pun terlalu sedikit terbentuknya kelas. Semakin sedikit banyaknya data semakin sedikit pula banyaknya kelas yang diambil. Biasanya banyaknya kelas diambil antara 5 sampai dengan 20. Disamping kebiasaan di atas, ada aturan lain mengenai pembentukan banyaknya kelas, yaitu dengan menggunakan aturan Sturges, yaitu: k = 1 + 3.3 log n (1) dimana : k = banyaknya kelas n = banyaknya pengamatan Wilayah kelas atau range dari data yang dihadapi adalah selisih antara nilai data yang terbesar dengan nilai data yang terkecil. Untuk mengerti apa yang dimaksud dengan limit kelas dan batas kelas dapat dilihat dari keterangan di bawah ini.
Tabel 1. Distribusi frekuensi bilangan
Tabel 1. adalah distribusi frekuensi bobot 50 koper, yang dicatat sampai kilogram terdekat, milik penumpang pesawat pada penerbangan Jakarta ke Padang. 17 Untuk data tersebut diambil 5 selang kelas, 7-9, 10- 12, 13-15, 16-18, dan 19-21. Nilai-nilai terkecil terbesar dalam setiap selang disebut limit kelas. Untuk selang 10- 12, bilangan yang lebih kecil dan yaitu 10, adalah limit bawah kelas sedangkan bilangan yang lebih besar yaitu 12, adalah limit atas kelas. Data aslinya dicatat sampai kilogram terdekat sehingga 7 pengamatan pada selang 10-12 adalah bobot semua koper yang beratnya sama dengan atau lebih dan 9.5 tetapi kurang dari 12.5. Kedua bilangan itu yaitu 9.5 dan 12.5 adalah batas kelas untuk selang kelas 10-12, dimana bilangan 9.5 adalah batas bawah kelas sedangkan bilangan 12.5 adalah batas atas kelas. Tetapi bilangan 12.5 merupakan batas bawah kelas bagi selang kelas 13- 15. Lebar kelas suatu kelas didefinisikan sebagai selisih antara batas atas kelas dengan batas bawah kelas bagi kelas bersangkutan. Dalam prakteknya lebih disukai bila kelas-kelas tersebut memiliki lebar kelas yang sama. Dalam hal demikian lebar kelas tersebut dilambangkan dengan c. Untuk data dalam tabel 1, diperoleh c = 3.
Titik tengah antara batas atas dan batas bawah kelas, yang berarti juga sama dengan antara kedua limit kelas, disebut titikk tengah kelas. Atau dalam bentuk rumus titik tengah kelas didapat dari Ttk=(bak+bbk):2 (2)
dimana : Ttk = Titik tengah kelas bak = batas atas kelas bbk = batas bawah kelas Untuk data pada Label 1. maka titik tengah kelas untuk kelas 10-12 adalah 11. Untuk lengkapnya data dan tabel 1. dapat dilihat pada Label 3. Untuk mengilustrasikan pembuatan suatu distribusi frekuensi, perhatikan data Tabel 4, yang 18 merupakan umur 40 buah aki yang serupa jenisnya dan dicatat sampai persepuluhan terdekat. Aki-aki mobil tersebut dijamin mencapai umur 3 tahun.
Tabel 3. Distribusi Frekuensi bagi bobot 50 potong koper
Tabel 4. Umur Aki Mobil
Langkah pertama adalah ditentukan terlebih dahulu banyaknya kelas yang akan diambil. Untuk menentukan banyaknya kelas dapat digunakan kebiasaan yang ada yaitu banyaknya kelas antara 5 sarnpai dengan 20. Dalam hal ini diambil 7 selang kelas saja. Wilayah kelas atau range dari data di atas adalah 4.7 - 1.6 = 3.1, sehingga lebar kelas tidak boleh kurang dari (3.1)/7 = 0.443. Karena lebar kelas harus memiliki angka nyata yang sama dengan pengamatannya, maka kita ambil c = 0.5. Kemudian ditentukan pada angka berapa dimulai selang dan kelas pertama. Jika diambil angka 1.5 sebagai limit bawah kelas pcrtama, maka batas bawah kelas pertama ini adalah 1.45, sedangkan batas alas kelas pertama adalah dengan menambahkan batas bawah kelas ini dengan lebar kelas, dengan demikian batas atas kelasnya adalah 1.95, dengan limit atas untuk kelas ini adalah 1.9 Titik tengah kelas ini adalah rata-rata batas bawah kelas dan batas atas kelas, (1.45 + 1.95)12 = 1.7. Batas-batas kelas serta selang lainnya dapat diperoleh dengan menambahkan 19 lebar kelas 0.5 pada masing-masing limit kelas dan batas kelas sampai diperoleh selang yang ketujuh. Langkah terakhir adalah memasukkan frekwensi pengamatan yang masuk pada selang-selang tersebut. Distribusi frekuensi bagi data pada tabel 3, disajikan pada label 5.
Tabel 5. Distribusi Frekuensi umur aki
Cara lain dalam menentukan banyaknya kelas adalah dengan menggunakan aturan Sturgess. k = 1 + 3.3 log 40= 6.287, atau dibulatkan 6, sedangkan langkah selanjutnya adalah sama seperti di atas. E. Distribusi Frekuensi
Dalam suatu penelitian biasanya dilakukan suatu kegiatan pengumpulan data. Data-data ini digunakan untuk mendukung penelitian, dimana hasil dari penelitian ini bergantung dari banyak dan ketepatan data-data yang berhasil dikumpulkan. Untuk memudahkan penggunaan data-data itu dalam penelitian, data-data itu dapat diringkaskan atau disusun. Salah satu cara untuk mengatur atau menyusun data adalah dengan mengelompokkan data-data berdasarkan ciri-ciri penting dari sejumlah besar data, ke dalam beberapa kelas dan kemudian dihitung banyaknya pengamatan yang masuk ke dalam setiap kelas. Susunan demikian ini dalam bentuk label, disebut Distribusi 20 frekuensi. Selain itu dapat pula disajikan dalam bentuk diagram dan grafik. Berdasarkan jenis data yang digolongkan didalamnya distribusi frekuensi dibagi menjadi dua yaltu, distribusi frekuensi bilangan (numerical frequency distribution) dan distribusi frekuensi kategoris (categorical frequency distribution).
Tabel 1. Distribusi Frekuensi Bilangan
Distribusi frekuensi bilangan adalah distribusi frekuensi yang berisikan data berupa angka-angka, dimana data itu dibagi atas golongan-golongan yang dinamakan kelas-kelas, menurut besarnya bilangan.
Tabel 2. Distribusi Frekuensi Kategoris
Distribusi frekuensi kategoris adalah distribusi frekuensi yang berisikan data bukan angka, dimana data itu dibagi atas golongan-golongan yang dinamakan kelas- kelas, berdasarkan sifat lain.
21 1) Ukuran Statistika Ukuran Keragaman Ukuran pemusatan data yang dibahas pada bagian ukuran pemusatan, belum memberikan gambaran yang mencukupi bagi pendefinisian segugus data. Masih diperlukan lagi suatu ukuran untuk mengetahui seberapa jauh pengamatan- pengamatan itu menyebar rata-ratanya. Sangat mungkin dapat dimiliki dua kumpulan pengamatan yang mempunyai nilai tengah atau median yang sama, tetapi sangat berbeda keragamannya. Ukuran statistik yang paling penting untuk mengukur keragaman data adalah range (wilayah) dan ragam. Persentile nilai-nilai yang membagi segugus pengamatan menjadi seratus bagian yang sama. Nilai-nilai itu, dilambangkan dengan P1, P2,...P99, mempunyai sifat bahwa 1% data jatuh dibawah P1, 2% data jatuh di bawah P2..., dan 99% data jatuh di bawah P99. Sedangkan untuk menghitung persentile dari data yang telah tersusun dalam bentuk distribusi frekuensi (grouped data), digunakan rumus berikut.
Persentile ke-50, desil ke-5 dan quartil ke-2 suatu distribusi disebut median. Kuartil dan desil juga merupakan persentil. Misalnya, desil ke-7 adalah persentil ke-70, dan kuartil ke-2 adalah juga persentil ke-50. Desile nilai-nilai yang membagi segugus pengamatan menjadi sepuluh bagian yang sama. Nilai-nilai itu, dilambangkan dengan D1, D2, .....D9, mempunyai sifat bahwa 10% data jatuh dibawah D1, 20% data jatuh dibawah D2, ..., dan 90% data jatuh dibawah D9. 22 Contoh : Hitung Desile yang ke-7 D7 untuk data-data yang terdapat pada tabel berikut ini
Jawab : Cara menghitung desile sama persis dengan cara menentukan quartile. Untuk menentukan D7 bagi distribusi umur aki, harus ditemukan nilai yang dibawahnya terdapat (70/100) X 40 = 28 pengamtan. Oleh karena nilai ini dapat berup sembarang nilai antara 3.7 tahun dan 3.8 tahun maka, yang diambil adalah rata-ratanya sehingga D7= 3.75 tahun. Jadi dapat disimpulkan bahwa 70% dari semua aki jenis ini umurnya akan kurang dari 3.75 tahun. Sedangkan untuk menghitung desile dari data yang telah tersusun dalam bentuk distribusi frekuensi (grouped data) digunakan rumus berikut.
Quintile nilai-nilai yang membagi segugus pengamatan menjadi lima bagian sama besar. Nilai-nilai itu, yang dilambangkn dengan Q1, Q2, Q3, dan Q4 mempunyai sifat bahwa 20% data jatuh dibawah Q1, 40% data jatuh dibawah Q2, 60% data jatuh dibawah Q3 dan 80% data jatuh dibawah Q4. Sedangkan untuk menghitung Quintile dari data yang telah tersusun dalam bentuk distribusi frekuensi (grouped data), digunakan rumus berikut:
23
Modus segugus pengamatan adalah nilai yang terjadi paling sering atau yang mempunyai frekuensi paling tinggi. Modus tidak selalu ada, hal ini bila semua pengamatan mempunyai frekuensi terjadi yang sama. Untuk data tertentu, mungkin saja terdapat beberapa dengan frekuensi tinggi, dan dalam hal demikian kita mempunyai lebih dari satu modus. contoh : Sumbangan dari warga Bogor pada hari Palang Merah Nasional tercatat sebagai berikut: Rp 9.000, Rp 10.000, Rp 5.000, Rp 9.000, Rp 9.000, Rp 7.000, Rp 8.000, Rp 6.000, Rp 10.000, Rp 11.000. Maka modusnya, yaitu nilai yang terjadi dengan frekuensi paling tinggi, adalah Rp 9.000.
Dari dua belas pelajar sekolah lanjutan tingkat atas yang diambil secara acak dicatat berapa kali mereka menonton film selama sebulan lalu. Data yang diperoleh adalah 2, 0, 3, 1, 2, 4, 2, 5, 4, 0, 1 dan 4. Dalam kasus ini terdapat dua modu, yaitu 2 dan 4, karena 2 dan 4 terdapat dengan frekuensi tertinggi. Distribusi demikian dikatakan bimodus. Sedangkan untuk mencari modus dari data yang telah disusun dalam bentuk distribusi frekuensi terlebih dahulu ditentukan kelas yang menjadi kelas modus. Kelas Modus adalah kelas yang mempunyai frekuensi paling tinggi, lalu nilai modus ditentukan menggunkan rumus berikut ini : 24
B1 = Batas bawah kelas modus. d1 = Selisih antara frekuensi kelas modus dengan frekuensi kelas yang mendahuluinya. d1 = Selisih antara frekuensi kelas modus dengan frekuensi kelas berikutnya. c = Lebar kelas modus.
Median salah satu ukuran pemusatan yang sering digunakan. Median dari segugus data yang telah diurutkan dari yang terkecil sampai yang terbesar atau dari terbesar sampai terkecil adalah pengamatan yang tepat di tengah-tengah bila banyaknya pengamatan itu ganjil, atau rata-rata kedua pengamatan yang di tengah bila banyaknya pengamatan genap. contoh : Dari lima kali kuiz statistika, seorang mahasiswa memperoleh nilai 82, 93, 86, 92, dan 79. Tentukan median populasi ini. jawab: Setelah data disusun dari yang terkecil sampai terbesar, diperoleh 79 82 86 92 93 Oleh karena itu medianya adalah 86
Kada nikotin yang berasal dari sebuah contoh acak enam batang rokok cap tertentu adalah 2.3, 2.7, 2.5, 2.9, 3.1, dan 1.9 miligram. Tentukan mediannya. jawab: Bila kadar nikotin itu diurutkan dari yang terkecil sampai terbesar, maka diperoleh 25 1.9 2.3 2.5 2.7 2.9 3.1 Maka mediannya adalah rata-rata dari 2.5 dan 2.7, yaitu
Selain itu juga dapat dicari median dari data yang telah tersusun dalam bentuk distribusi frekuensi. Rumus yang digunakan ada dua, yaitu
Dimana : Bbk = batas kelas bawah median c = lebar kelas s = Selisih antara nomor frekuensi median dengan frekuensi kumulatif dari kelas-kelas di muka kelas median fM = frekuensi kelas median
Dimana : Bak = batas kelas atas median 26 c = lebar kelas s' = selisih antara nomor frekuensi median dengan frekuensi kumulatif sampai kelas median fM = frekuensi kelas median Sebelum menggunakan kedua rumus di atas, terlebih dahulu harus ditentukan kelas yang menjadi kelas median. Kelas median adalah kelas yang memuat nomor frekuensi median, dan nomor frekuensi median ini ditentukan dengan membagi keseluruhan data dengan dua. Perhatikan tabel di bawah ini, kita akan cari median dengan kedua cara diatas
Dengan menggunakan kedua rumus di atas didapat:
27 Ukuran Pemusatan Rata-rata Hitung
Didalam bagian ini dibicarakan mengenai harga rata-rata hitung (arithmetic mean), dimana harga rata-rata ini dapat digunakan untuk data yang tak tersusun (ungrouped data), yaitu data yang belum tersusun distribusi frekuensinya, ataupun data yang telah tersusun dalam bentuk distribusi frekuensi (grouped data). Rata-rata hitung dikenal juga sebagai nilai tengah. Selain itu, rata-rata hitung dapat juga dibagi menjadi dua yaitu, rata-rata hitung untuk segugus data yang membentuk populasi, dan data yang merupakan contoh. Bila segugus data X1, X2, ....Xn tidak harus semuanya berbeda, menyusun sebuah populasi terhingga berukuran N, maka nilai rata-rata hitung populasinya adalah:
Banyaknya pegawai di lima apotik adalah 3,4,5,6 dan 6. Dengan memandang data itu adalah sebagai populasi, hitunglah nilai rata-rata hitung banyaknya pegawai bagi lima apotik itu. jawab : Karena datanya merupakan sebuah populasi terhingga, maka
28
Misalkan X1,X2 ,...Xn tidak harus semuanya berbeda, merupakan sebuah contoh terhingga berukuran n, maka nilai rata-rata hitung contohnya adalah :
Seorang petugas memeriksa suatu contoh acak tujuh kaleng ikan tuna merk tertentu untuk diperiksa persentase ketidak murniannya. Data yang diperoleh adalah 1.8, 2.1, 1.7, 1.6, 0.9, 2.7, dan 1.8. Tentukanlah rata-rata hitung contohnya. jawab : Karena data ini merupakan contoh, kita peroleh
Selain rumus diatas dapat juga dengan terlebih dahulu menentukan rata-rata hitung dugaan. Jika M merupakan suatu nilai yang diterka dari harga rata-rata hitung yang dipilih secara sembarang dan jika di=xi - M, maka :
29
Ukuran Statistika Teknologi dan notasi yang digunakan statistikawan dalam mengolah data statistik sepenuhnya bergantung pada apakah data tersebut merupakan populasi atau suatu contoh yang diambil dalam dari suatu populasi. Parameter adalah sembarang nilai yang menjelaskan ciri populasi. Statistik adalah sembarang nilai yang menjelaskan ciri suatu contoh. Kemudian untuk menyelidiki segugus data kwantitatif akan sangat membantu bila ukuran- ukuran numerik yang menjelaskan ciri-ciri data yang penting didefinisikan. Salah satu cara yang dapat ditempuh adalah penggunaan rata-rata, baik terhadap contoh maupun populasi. Pemakaian harga rata-rata banyak sekali dilakukan, bukan saja di dalam pelajaran statistik, akan tetapi dalam perhitungan sehari-hari. Seorang dapat berkata, misalnya : "Rata-rata kelahiran di suatu negara adalah 2.3 persen per tahun". Contoh ini dapat diperbanyak dengan mudah dan dapat diambil dari segala aspek kehidupan. Harga rata-rata adalah harga yang dapat dipakai untuk mewakili sekumpulan data, suatu harga yang representatif. Dapat ditambahkan disini, selain disebut sebagai measure of central tendency (ukuran tendensi pertengahan), dinamakan juga measures of central values (ukuran nilai-nilai pertengahan), atau measures of centarl position (ukuran tempat pertengahan), ketiga nama ini menekankan perkataan central yang berarti pusat atau pertengahan. Sehingga kesemuanya itu dapat disebut sebagai ukuran pemusatan.
30 Referensi Lindley, D. Making Decisions. John Wiley. Second Edition 1985. ISBN 0- 471-90808-8 William H. Kruskal and Judith M. Tanur, ed. (1978), "Linear Hypotheses," International Encyclopedia of Statistics. Free Press, v. 1, Evan J. Williams, "I. Regression," pp. 52341. Julian C. Stanley, "II. Analysis of Variance," pp. 541554. Lindley, D.V. (1987). "Regression and correlation analysis," New Palgrave: A Dictionary of Economics, v. 4, pp. 12023. Birkes, David and Yadolah Dodge, Alternative Methods of Regression. ISBN 0-471-56881-3 Chatfield, C. (1993) "Calculating Interval Forecasts," Journal of Business and Economic Statistics, 11. pp. 121135. Corder, G.W. and Foreman, D.I. (2009).Nonparametric Statistics for Non- Statisticians: A Step-by-Step Approach Wiley, ISBN 978-0-470-45461-9 Draper, N.R. and Smith, H. (1998).Applied Regression Analysis Wiley Series in Probability and Statistics Fox, J. (1997). Applied Regression Analysis, Linear Models and Related Methods. Sage Hardle, W., Applied Nonparametric Regression (1990), ISBN 0-521-42950-1 Meade, N. and T. Islam (1995) "Prediction Intervals for Growth Curve Forecasts," Journal of Forecasting, 14, pp. 413430. N. Cressie (1996) Change of Support and the Modiable Areal Unit Problem. Geographical Systems 3:159180. A.S. Fotheringham, C. Brunsdon, and M. Charlton and Sandt Damanik Witwicky. (2002) Geographically weighted regression: the analysis of spatially varying relationships. Wiley. 31