Anda di halaman 1dari 33

PENGANTAR STATISTIKA By : Yogi Eko Prayitno

Pengolahan informasi statistik mempunyai sejarah jauh ke belakang sejak awal peradaban manusia. Pada awal zaman masehi, bangsa-bangsa mengumpulkan data statistik untuk mendapatkan informasi deskriptif mengenai banyak hal, misalnya pajak, perang, hasil pertanian, dan bahkan pertandingan atletik. Pada masa kini dengan berkembangnya teori peluang kita dapat menggunakan berbagai metode statistik yang memungkinkan kita meneropong jauh di luar data yang kita kumpulkan dan masuk ke dalam wilayah pengambilan keputusan melalaui generalisasi dan peramalan. (Ronald E. Walpole)

Definisi Statistika : a. Statistika yang dalam bahasa Inggris statistics (ilmu statistik), ilmu tentang caracara mengumpulkan, mentabulasi dan menggolongkan, menganalisis dan mencari keterangan yang berarti dari data yang berupa angka. b. Statistika merupakan ilmu pengetahuan yang berhubungan dengan cara-cara mengumpulkan, menabulasi, menggolong-golongkan, menganalisis, dan mencari keterangan yang berarti dari data yang berupa bilangan-bilangan atau angka, sehingga dapat ditarik suatu kesimpulan atau keputusan tertentu. c. Merupakan bagian dari matematika yang membahas rumus untuk mengumpulkan, menggambarkan atau menyajikan, menganalisis, dan menginterpretasikan data kuantitatif [Webster New Collegiate Distionary] d. Merupakan cabang dari metode ilmiah yang menggunakan data didapatkan dengan menghitung atau mengukur bagian populasi [Kendall & Stuart] e. Membahas metode penarikan kesimpulan dari hasil percobaan atau proses [Fraser] f. Sebagai teknologi metoda ilmiah yang membahas rancangan percobaan dan investigasi serta inferensia statistika [Mood] g. Membahas rancangan percobaan atau survai sampling untuk mendapatkan sejumlah informasi tertentu dan penggunaan informasi secara optimal dalam pembuatan inferensia tentang populasi.

Dapat disimpulkan statistika berhubungan dengan mengumpulkan data, menyajikan data, menganalisis data, dan menginterprestasikan hasil analisis. Jadi statistika adalah Ilmu mengumpulkan, menata, menyajikan, menganalisis dan menginterprestasikan data menjadi informasi untuk membantu pengambilan keputusan yang efektif. Definisi Statistik : a. Statistik berasal dari bahasa latin status yang artinya suatu negara. Suatu kegiatan pengumpulan data yang ada hubungannya dengan kenegaraan, misalnya data mengenai penduduk, data mengenai penghasilan dan sebagainya, yang lebih berfungsi untuk melayani keperluan administrasi.

b. Secara kebahasaan, statistik berarti catatan angka-angka (bilangan), perangkaan, data yang berupa angka-angka yang dikumpulkan, ditabulasi, dikelompokkan, sehingga dapat memberi informasi yang berarti mengenai suatu masalah, gejala atau peristiwa (depdikbud, 1994). c. Menurut Sutrisno Hadi (1995) Statistik adalah untuk menunjukkan kepada pencatatan angka-angka dari suatu kejadian atau kasus tertentu. Selaras dengan apa yang didefinisikan oleh Sudjana (1995:2) bahwa statistik adalah kumpulan fakta berbentuk angka yang disusun dalam daftar atau tabel dan atau diagram, yang melukiskan atau menggambarkan suatu persoalan. Dapat disimpulkan statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.

Metode statistic adalah prosedur-prosedur yang digunakan dalam pengumpulan, penyajian, analisis, dan penafsiran data. Kita akan mengelompokkan metode-metode tersebut ke dalam dua kelompok besar, yaitu statistika deskriptif dan statistika inferensia (statistika induktif). a. Statistika deskriptif adalah statistika yang berkaitan dengan metode atau cara medeskripsikan, menggambarkan, menjabarkan atau menguraikan data. Statistika deskripsi mengacu pada bagaimana menata, menyajikan dan menganalisis data, yang dapat dilakukan misalnya dengan menentukan nilai rata-rata hitung, median, modus, standar deviasi atau menggunakan cara lain yaitu dengan membuat tabel distribusi frekuensi dan diagram atau grafik. Menurut E. Walpole, statistika deskriptif adalah metode-metode yangh berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna. b. Statistika inferensia (statistika induktif) adalah statistika yang berkaitan dengan cara penarikan kesimpulan berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik dari suatu populasi. Dengan demikian dalam statistika inferensia data yang diperoleh dilakukan generalisasi dari hal yang bersifat kecil (khusus) menjadi hal yang bersifat luas (umum). Menurut E. Walpole, statistika inferensia mencakup semua metoe yang berhubungan dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan gugus data induknya. Metode ilmiah atau proses ilmiah merupakan proses keilmuan untuk memperoleh pengetahuan secara sistematis berdasarkan bukti fisis. Ilmuwan melakukan pengamatan serta membentuk hipotesis dalam usahanya untuk menjelaskan fenomena alam. Prediksi yang dibuat berdasarkan hipotesis tersebut diuji dengan melakukan eksperimen. Jika suatu hipotesis lolos uji berkali-kali, hipotesis tersebut dapat menjadi suatu teori ilmiah. Langkah-langkah dalam Metode Ilmiah : a. Merumuskan masalah b. Melakukan studi literature c. Membuat dugaan, pertanyaan atau hipotesis d. Mengumpulkan, mengolah data, menguji hipotesis atau menjawab pertanyaan e. Mengambil kesimpulan

Mengumpulkan, mengolah data, menguji hipotesis atau menjawab pertanyaan sangat berhubungan dengan statistika. Peneliti memerlukan data untuk menguji hipotesa. Setelah data terkumpul peneliti menyusun data untuk mengadakan analisa. Setelah data dianalisa maka perlu diberikan tafsiran atau interpretasi terhadap data tersebut. Semua ini memerlukan ilmu statistika untuk memperoleh hasil yang benar-benar akurat. Elemen Statistik : a. Data yaitu bentuk jamak dari datum, yang dapat diartikan sebagai informasi yang diterima yang bentuknya dapat berupa, angka, kata-kata, atau dalam bentuk lisan dan tulisan lainnya. Atau bisa diartikan pula sekumpulan informasi yang diperoleh dari suatu pengamatan. Jenis-jenis data : 1. Data kualitatif yaitu data yang berbentuk kata-kata atau yang berwujud pernyataan-pernyataan verbal, bukan dalam bentuk angka. Nominal : Data yang diperoleh dengan cara kategorisasi atau klasifikasi untuk menyatakan informasi atau keterangan dalam bentuk jawaban yang benar secara tertutup dari dua pilihan atau lebih, untuk kemudian dijadikan sebagai bahan analisis data. Contoh: Jenis kelamin, tanggal dan tempat lahir seseorang. Ordinal : Data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi diantara data tersebut terdapat hubungan. Yang diartikan sebagai urutan simbol atau kode berupa angka dan mempunyai arti urutan jenjang bisa dimulai dari yang paling negatip sampai yang paling positif. Contoh: Sangat setuju, setuju, kurangsetuju, tidaksetuju. 2. Data kuantitatif yaitu data yang dipaparkan dalam bentuk angka-angka. Interval : Data yang diperoleh dengan cara pengukuran, dimana jarak antara dua titik skala sudah diketahui. Contoh: Interval temperatur ruang, a. Cukup panas jika antara 50oC80oC, b. Panas jika antara 80oC-110oC, c. Sangat panas jika antara 110oC-140oC Rasio : Data dalam bentuk angka atau bilangan berdasarkan hasil perbandingan (angka relatif), dalam hal ini skala rasio tidak dimulai dari angka nol dan ditentukan berdasarkan konsep kesebandingan (tidak sembarang). Contoh : gaji, skor ujian, jumlah buku Jenis data berdasarkan sumbernya : 1. Data Primer : Data yang diperoleh secara langsung dari objek yang diteliti, baik dari objek individual (responden) maupun dari suatu instansi yang mengolah data untuk keperluan dirinya sendiri. 2. Data Sekunder : Data yang diperoleh secara tidak langsung untuk mendapatkan informasi (keterangan) dari objek yang diteliti, biasanya data tersebut diperoleh dari tangan kedua baik dari objek secara individual (responden) maupun dari suatu badan (instansi) yang dengan sengaja melakukan pengumpulan data dari instansi-instansi atau badan lainnya untuk keperluan penelitian dari para pengguna.

3. Data tersier : Data yang diperoleh secara tidak langsung dari objek yang diteliti, biasanya data tersebut diperoleh dari pihak ketiga, baik dari objek secara individual (responden) maupun dari suatu Badan yang secara sengaja mengungkapkan fakta kepada pihak kedua untuk kemudian pihak kedua tersebut mengeksploitasi fakta dimaksud pada media masa atau media lainnya, untuk kemudian data (fakta) tersebut digunakan kembali oleh sipeneliti sebagai acuan dalam penulisannya. b. Populasi yaitu sekumpulan objek yang akan dijadikan sebagai bahan penelitian (penelaahan) dengan ciri mempunyai karakteristik yang sama. Keseluruhan pengamatan yang menjadi perhatian kita ( E. Walpole) c. Sampel yaitu yaitu bagian dari populasi (contoh), untuk dijadikan sebagai bahan penelaahan dengan harapan contoh yang diambil dari populasi tersebut dapat mewakili (representative) terhadap populasinya.

Proses pengambilan data dapat dilakukan dengan cara : - melakukan percobaan, - studi lapangan, - survey, - mempelajari dokumentasi terdahulu, - wawancara, atau metode yang lainnya Penyajian data bisa melalui : - Tabel, tujuannya yaitu memberikan informasi secara rinci yang terdiri atas kolom dan baris. - Grafik, tujuannya memberikan informasi dengan benar dan cepat, namun kelemahan grafik tidak begitu rinci seperti tabel. Frekuensi yaitu yang dalam bahasa Inggrisnya adalah frequency berarti: kekerapan, keseimbangan, keseringan, atau jarang-kerap. Dalam statistik, frekuensi mengandung pengertian angka (bilangan) yang menunjukkan seberapa kali suatu variabel (yang dilambangkan dengan angka-angka itu) berulang dalam deretan angka tersebut, atau berapa kalikah suatu variabel (yang dilambangkan dengan angka itu) muncul dalam deretan angka tersebut. Bisa juga dikatakan banyaknya data dalam satu kelompok atau klasifikasi. Distribusi Frekuensi adalah pengelompokkan data interval atau rasio dan perhitungan banyaknya data dalam satu kelompok atau klasifikasi. Rata-rata yaitu setiap bilangan yang bisa dipakai sebagai wakil dari rentetan nilai ratarata itu, wujudnya berupa satu bilangan saja, namun dengan satu bilangan itu akan dapat tercermin gambaran secara umum mengenai kumpula atau deretan bahan keterangan yang berupa angka atau bilangan itu. Median yaitu nilai tengah dari sekumpulan data setela diurutkan yang fungsinya membantu memperjelas kedudukan suatu data. Median dari segugus data yang telah diurutkan dari yang terkecil sampai terbesar atau dari terbesar sampai terkecil adalah pengamatan yang tepat di tengah-tengah bila banyaknya pengamatan itu ganjil, atau ratarata kedua pengamatan yang ditengah apabila banyaknya pengamatan genap ( E. Walpole ).

Modus adalah bilangan yang paling banyak muncul dari sekumpulan bilangan, yang fungsinya untuk melihat kecenderungan dari sekumpulan bilangan tersebut. Modus segugus pengamatan adalah nilai yang terjadi paling sering atau yang mempunyai frekuensi paing tinggi ( E. Walpole).

PANCARAN FREKUENSI Di dalam pembentukan pancaran frekuensi, data yang berupa deretan atau kumpulan bilangan-bilangan itu kita bagi kedalam beberapa golongan, dan kita menentukan aturan tertentu bilangan mana yang masuk kedalam setiap golongan. Ada 2 macam pancaran frekuensi menurut jenis data yang digolongkan didalamnya : 1. Pancaran Frekuensi Bilangan (numerical frequency distribution), maksudnya yaitu pancaran frekuensi yang menunjukkan rentangan bilangan-bilangan, datanya berupa data kuantitatif. contohnya pada tabel dibawah : Tabel hasl nilai ujian SD N Brawijaya 01

2. Pancaran Frekuensi Katagories (categorical Frequency distribution), maksudnya yaitu pancaran frekuensi yang dibuat berdasarkan sifat-sifatnya, datanya berupa data kualitatif. Contohnya pada tabel dibawah ini :

Jika kita membicarakan tentang pancaran frekuensi maka kita tidak terlepas dari sebaran frekuensi, karena pada dasarnya pancaran frekuensi hampir sama dengan sebaran frekuensi. Ciri-ciri penting sejumlah besar data dengan segera dapat diketahui melalui pengelompokan data tersebut kedalam beberapa kelas, dan kemudian dihitung banyaknya pengamatan yang masuk kedalam setiap kelas, susunan demikian ini dalam bentuk tabel disebut Sebaran Frekuensi ( E. Walpole)

Membentuk Pancaran Frekuensi Hasil pengukuran yang kita peroleh disebut dengan data mentah. Besarnya hasil pengukuran yang kita peroleh biasanya bervariasi. Apabila kita perhatikan data mentah tersebut, sangatlah sulit bagi kita untuk menarik kesimpulan yang berarti. Untuk memperoleh gambaran yang baik mengenai data tersebut, data mentah tersebut perlu di olah terlebih dahulu. Pada saat kita dihadapkan pada sekumpulan data yang banyak, seringkali membantu untuk mengatur dan merangkum data tersebut dengan membuat tabel yang berisi daftar nilai data yang mungkin berbeda (baik secara individu atau berdasarkan pengelompokkan) bersama dengan frekuensi yang sesuai, yang mewakili berapa kali nilai-nilai tersebut terjadi. Daftar sebaran nilai data tersebut dinamakan dengan Daftar Frekuensi atau Sebaran Frekuensi (Distribusi Frekuensi). Dengan demikian, distribusi frekuensi adalah daftar nilai data (bisa nilai individual atau nilai data yang sudah dikelompokkan ke dalam selang interval tertentu) yang disertai dengan nilai frekuensi yang sesuai. Pengelompokkan data ke dalam beberapa kelas dimaksudkan agar ciri-ciri penting data tersebut dapat segera terlihat. Daftar frekuensi ini akan memberikan gambaran yang khas tentang bagaimana keragaman data. Sifat keragaman data sangat penting untuk diketahui, karena dalam pengujian-pengujian statistik selanjutnya kita harus selalu memperhatikan sifat dari keragaman data. Tanpa memperhatikan sifat keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sah.

Sebagai contoh, perhatikan contoh data pada Tabel 1. Tabel tersebut adalah daftar nilai ujian Matakuliah Statistik dari 80 Mahasiswa (Sudjana, 19xx). Teknik pembuatan Tabel Distribusi Frekuensi (TDF) Tabel 1. Daftar Nilai Ujian Matakuliah Statistik

Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data tersebut. Secara sepintas, kita belum bisa menentukan berapa nilai ujian terkecil atau terbesar. Demikian pula, kita belum bisa mengetahui dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus mengolah data tersebut terlebih dulu agar dapat memberikan gambaran atau keterangan yang lebih baik. Distribusi frekuensi dibuat dengan alasan berikut:

kumpulan data yang besar dapat diringkas kita dapat memperoleh beberapa gambaran mengenai karakteristik data, dan merupakan dasar dalam pembuatan grafik penting (seperti histogram). Banyak software (teknologi komputasi ) yang bisa digunakan untuk membuat tabel distribusi frekuensi secara otomatis. Meskipun demikian, di sini tetap akan diuraikan mengenai prosedur dasar dalam membuat tabel distribusi frekuensi.

Langkah-langkah yang harus dilakukan untuk membuat tabel distribusi frekuensi adalah sebagai berikut : 1. Urutkan data, biasanya diurutkan dari nilai yang paling kecil

Tujuannya agar range data diketahui dan mempermudah penghitungan frekuensi tiap kelas! 2. Tentukan range (rentang atau jangkauan)

Range = nilai maksimum nilai minimum 3. Tentukan banyak kelas yang diinginkan. Jangan terlalu banyak/sedikit, berkisar antara 5 dan 20, tergantung dari banyak dan sebaran datanya. Cara menentukan jumlah kelas menurut Sturges (1926) K = 1 + 3.33 log n Dengan K : jumlah kelas n : banyaknya data observasi 4. Tentukan panjang/lebar kelas interval (p) 5. 6. Panjang kelas (p) = [range]/[jumlah kelas] Tentukan nilai ujung bawah kelas interval pertama Menyusun data observasi ke dalam tabel distribusi frekuensi

Batas kelas Ada 2 macam : 1. Batas kelas bawah 2. Batas kelas atas

: nilai terendah dalam kelas tersebut : nilai tertinggi pada kelas tersebut

Tepi Kelas Ada 2 macam 1. Tepi kelas bawah Batas kelas bawah tersebut dikurangi 1/2 dari selisih antara batas atas suatu kelas dengan batas kelas sesudahnya. 2. Tepi kelas atas Batas kelas tersebut ditambah 1/2 dari selisih antara batas atas suatu kelas dengan batas bawah kelas sesudahnya. Nilai Tengah Adalah nilai uang berada di tengah antara batas kelas bawah suatu kelas dengan batas kelas atas kelas tersebut. Nilai tengah = B1+B2 2 B1 = Batas kelas bawah B2 = Batas kelas atas Frekuensi Relative Adalah presentase frekuensi suatu kelas terhadap frekuensi total FR1 = Fi X 100% f Dimana FR1 = frekuensi relatife kelas ke i Fi = frekuensi kelas ke i i = 1,2,3. f = frekuensi total

Frekuensi Kumulatif Ada 2 macam : 1. Frekuensi kumulatif kurang dari satu kelas : jumlah frekuensi semua kelas sebelum kelas tersebut. 2. Frekuensi kumulatif lebih dari satu kelas : jumlah frekuensi semua kelas sesudah kelas tersebut.

Contoh: Kita gunakan prosedur di atas untuk menyusun tabel distribusi frekuensi nilai ujian mahasiswa di bawah ini.

Berikut adalah nilai ujian yang sudah diurutkan:

2. Range: [nilai tertinggi nilai terendah] = 99 35 = 64

3. Banyak Kelas: Tentukan banyak kelas yang diinginkan. Apabila kita lihat nilai Range = 64, mungkin banyak kelas sekitar 6 atau 7.

Sebagai latihan, kita gunakan aturan Sturges. banyak kelas = 1 + 3.3 x log(n) = 1 + 3.3 x log(80) = 7.28 7

4. Panjang Kelas: Panjang Kelas = [range]/[banyak kelas] = 64/7 = 9.14 10 (untuk memudahkan dalam penyusunan TDF)

5. Tentukan nilai batas bawah kelas pada kelas pertama. Nilai ujian terkecil = 35 Penentuan nilai batas bawah kelas bebas saja, asalkan nilai terkecil masih masuk ke dalam kelas tersebut. Misalkan: apabila nilai batas bawah yang kita pilih adalah 26, maka interval kelas pertama: 26 35, nilai 35 tepat jatuh di batas atas kelas ke-1. Namun apabila kita pilih nilai batas bawah kelas 20 atau 25, jelas nilai terkecil, 35, tidak akan masuk ke dalam kelas tersebut. Namun untuk kemudahan dalam penyusunan dan pembacaan TDF, tentunya juga untuk keindahan, he2.. lebih baik kita memilih batas bawah 30 atau 31. Ok, saya tertarik dengan angka 31,

sehingga batas bawahnya adalah 31.

Dari prosedur di atas, kita dapat info sebagai berikut: Banyak kelas Panjang kelas Batas bawah kelas : 7 : 10 : 31

Selanjutnya kita susun TDF: Form TDF:

-----------------------------------------------------------Kelas ke- | Nilai Ujian | Batas Kelas | Turus | Frekuensi -----------------------------------------------------------1 2 3 : 6 7 31 41 51 : -

81 91 -

-----------------------------------------------------------Jumlah -----------------------------------------------------------Tabel berikut merupakan tabel yang sudah dilengkapi

Distribusi Frekuensi Relatif dan Kumulatif


Variasi penting dari distribusi frekuensi dasar adalah dengan menggunakan nilai frekuensi relatifnya, yang disusun dengan membagi frekuensi setiap kelas dengan total dari semua frekuensi (banyaknya data). Sebuah distribusi frekuensi relatif mencakup batas-batas kelas yang sama seperti TDF, tetapi frekuensi yang digunakan bukan frekuensi aktual melainkan frekuensi relatif. Frekuensi relatif kadang-kadang dinyatakan sebagai persen.

Frekuensi relatif = Contoh: frekuensi relatif kelas ke-1:

fi = 2; n = 80 Frekuensi relatif = 2/80 x 100% = 2.5%

Distribusi Frekuensi kumulatif


Variasi lain dari distribusi frekuensi standar adalah frekuensi kumulatif. Frekuensi kumulatif untuk suatu kelas adalah nilai frekuensi untuk kelas tersebut ditambah dengan jumlah frekuensi semua kelas sebelumnya. Perhatikan bahwa kolom frekuensi selain label headernya diganti dengan frekuensi kumulatif kurang dari, batas-batas kelas diganti dengan kurang dari ekspresi yang menggambarkan kisaran nilai-nilai baru.

Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala horisontal mewakili nilai-nilai data kelas dan skala vertikal mewakili nilai frekuensinya. Tinggi batang sesuai dengan nilai frekuensinya, dan batang satu dengan lainnya saling berdempetan, tidak ada jarak/ gap diantara batang. Kita dapat membuat histogram setelah tabel distribusi frekuensi data pengamatan dibuat.

Poligon Frekuensi:
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik yang terletak tepat di atas nilai-nilai titik tengah kelas. Ketinggian dari titik-titik sesuai dengan frekuensi kelas, dan segmen garis diperluas ke kanan dan kiri sehingga grafik dimulai dan berakhir pada sumbu horisontal.

Ogive
Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif, seperti daftar distribusi frekuensi kumulatif. Perhatikan bahwa batas-batas kelas dihubungkan oleh segmen garis yang dimulai dari batas bawah kelas pertama dan berakhir pada batas atas dari kelas terakhir. Ogive berguna untuk menentukan jumlah nilai di bawah nilai tertentu. Sebagai contoh, pada gambar berikut menunjukkan bahwa 68 mahasiswa mendapatkan nilai kurang dari 90.5.

1. 2. 3.

Tabel distribusi frekuensi Dalam tabel distribusi frekuensi terdapat beberapa kelas yang masing-masing kelas berisi data observasi Masing-masing kelas mempunyai interval yang besarnya sama untuk suatu kelas dalam suatu tabel distribusi frekuensi. Ada beberapa hal yang perlu diperhatikan agar tabel distribusi frekuensi dapat memberikan informasi yang terbaik : Jumlah kelas pada tabel distribusi frekuensi jangan terlalu banyak dan jangan terlalu sedikit. Hindari adanya suatu kelas yang tidak dapat menampung data observasi (frekuensi kelasnya nol) Semua data harus dapat ditampung dalam tabel distribusi frekuensi tersebut. Frekuensi : banyaknya data yang terdapat dalam suatu kelas pada distribusi frekuensi DISTRIBUSI FREKUENSI Merupakan tabel ringkasan data yang menunjukkan frekuensi/banyaknya item/obyek pada setiap kelas yang ada. Tujuan: mendapatkan informasi lebih dalam tentang data yang ada yang tidak dapat secara cepat diperoleh dengan melihat data aslinya. DISTRIBUSI FREKUENSI RELATIF Merupakan fraksi atau proporsi frekuensi setiap kelas terhadap jumlah total. Distribusi frekuensi relatif merupakan tabel ringkasan dari sekumpulan data yang menggambarkan frekuensi relatif untuk masing-masing kelas.

Penggunaan Rumus Sturges 1.Dapat digunakan sebagai pertimbangan dalam menentukan kelas. 2.Kelemahan Rumus Sturges : a. n >> atau n << dapat menyesatkan b. Interval yang dihasilkan dapat berupa bilangan pecah sehingga kurang praktis.

Walpole, Ronald. 1995. Pengantar Statistika. Jakarta : PT Gramedia Pustaka Utama http://smartstat.wordpress.com/2010/03/29/distribusi-frekuensi/ http://risnastatistika.blogspot.com/2013/01/populasi-sampel-data-dan-pancaran.html http://arjunwiguna.blogspot.com/2012/07/statistika-sma-kelas-xi-ipa.html http://blog.ub.ac.id/eldeahmadakbarr/2012/03/02/sampel-grafik-tabel-dan-pancaranfrekuensi-statistika/ http://blog.ub.ac.id/okkygigihw/2012/03/08/resume-statistik-2-pancaran-frekuensi-dangrafik/ http://www.fe.unpad.ac.id/upload/files/BB079-31-05-2010-f9de3310510DISTRIBUSI_FREKUENSI.pdf http://agus-dwiatmoko.blogspot.com/

Ukuran Tendensi Sentral


Karakteristik penting untuk ukuran tendensi sentral yang baik Ukuran nilai pusat/tendensi sentral (average) merupakan nilai pewakil dari suatu distribusi data, sehingga harus memiliki sifat-sifat berikut: Harus mempertimbangkan semua gugus data Tidak boleh terpengaruh oleh nilai-nilai ekstrim. Harus stabil dari sampel ke sampel. Harus mampu digunakan untuk analisis statistik lebih lanjut.

Dari beberapa ukuran nilai pusat, Mean hampir memenuhi semua persyaratan tersebut, kecuali syarat pada point kedua, rata-rata dipengaruhi oleh nilai ekstrem. Sebagai contoh, jika item adalah 2; 4; 5; 6; 6; 6; 7; 7; 8; 9 maka mean, median dan modus semua bernilai sama, yaitu 6. Jika nilai terakhir adalah 90 bukan 9, rata-rata akan menjadi 14.10, sedangkan median dan modus tidak berubah. Meskipun dalam hal ini median dan modus lebih baik, namun tidak memenuhi persyaratan lainnya. Oleh karena itu Mean merupakan ukuran nilai pusat yang terbaik dan sering digunakan dalam analisis statistik.

Kapan kita menggunakan nilai tendensi sentral yang berbeda? Nilai ukuran pusat yang tepat untuk digunakan tergantung pada sifat data, sifat distribusi frekuensi dan tujuan. Jika data bersifat kualitatif, hanya modus yang dapat digunakan. Sebagai contoh, apabila kita tertarik untuk mengetahui jenis tanah yang khas di suatu lokasi, atau pola tanam di suatu daerah, kita hanya dapat menggunakan modus. Di sisi lain, jika data bersifat kuantitatif, kita dapat menggunakan salah satu dari ukuran nilai pusat tersebut, mean atau median atau modus. Meskipun pada jenis data kuantitatif kita dapat menggunakan ketiga ukuran tendensi sentral, namun kita harus mempertimbangkan sifat distribusi frekuensi dari gugus data tersebut. Bila distribusi frekuensi data tidak normal (tidak simetris), median ataumodus merupakan ukuran pusat yang tepat. Apabila terdapat nilai-nilai ekstrim, baik kecil atau besar, lebih tepat menggunakan median atau modus. Apabila distribusi data normal (simetris), semua ukuran nilai pusat, baik mean, median, atau modus dapat digunakan. Namun, mean lebih sering digunakan dibanding yang lainnya karena lebih memenuhi persyaratanuntuk ukuran pusat yang baik. Ketika kita berhadapan dengan laju, kecepatan dan harga lebih tepat menggunakan rata-rata harmonik. Jika kita tertarik pada perubahan relatif, seperti dalam kasus pertumbuhan bakteri, pembelahan sel dan sebagainya, rata-rata geometrik adalah rata-rata yang paling tepat.

Bila ukuran itu diambil dari sampel disebut statistik dan jika ukuran itu diambil dari populasi disebut parameter. (Hartono Drs. 2004. Statistik Untuk Penelitian. Yogyakarta : Pustaka Pelajar Offset) Pengukuran deskriptif dari data sampel yang sangat berguna bagi keperluan penarikan kesimpulan ialah pengukuran tentang tendensi sentral dan pengukuran tentang dispersi. Pengukuran tentang tendensi sentral dari serangkaian data sampel umumnya dibutuhkan karena pengukuran secara demikian memberi gambaran tentang pemusatan nilai-nilai observasi sampel.

Jika kita melakukan pengamatan terhadap data sampel atau distribusi frekuensinya, maka kita akan memperoleh kesan bahwa sebagian besar data tersebut umumnya terdiri dari nilai-nilai observasi yang bertendensi untuk memusatkan diri sekitar suatu nilai tertentu. Gejala pemusatan demikian, dinamakan tendensi sentral. Adanya tendensi sentral semacam itu berarti bahwa suatu nilai sentral tertentu sebetulnya dapat digunakan untuk menggambarkan nilai-nilai keseluruhan data sampel itu sendiri. Cara pengukuran tendensi sentral yang paling umum seperti misalnya rata-rata hitung, median, dan modus. ( Dajan Anto. 1974. Pengantar Metode Statistik Jilid II. Jakarta : PT Pustaka LP3ES Indonesia.) Rata- rata adalah nilai yang mewakili himpunan atau sekelompok data. Nilai rata- rata umumnya cenderung terletak ditengah suatu kelompok data yang disusun menurut besar kecilnya nilai. Dengan perkataan lain, nilai rata-rata mempunyai kecenderungan memusat, sehingga sering disebut ukuran kecenderungan memusat (measures of central tendency). (Supranto J. 2008. Statistik Teori dan Aplikasi. Jakarta: Erlangga)

Macam tendensi sentral : Mean


1. Rata-rata ukur. Rata Rata ukur serangkaian nilai-nilai observasi X1, X2, ..., Xn , umumnya digunakan untuk mengukur tingat perubahan (rate of change) atau pengrata-rataan ratio, dirumuskan sebagai :

Keterangan: U = rata-rata ukur (rata-rata geometrik) n = banyaknya sampel Rata-rata geometrik sering digunakan dalam bisnis dan ekonomi untuk menghitung rata-rata tingkat perubahan, rata-rata tingkat pertumbuhan, atau rasio rata-rata untuk data berurutan tetap atau hampir tetap atau untuk rata-rata kenaikan dalam bentuk persentase. Rata-rata ukur untuk data tunggal Contoh 1: Berapakah rata-rata ukur dari data 2, 4, 8? Jawab:

atau:

CONTOH KASUS: Rata-rata Ukur Perkembangan jumlah sambungan telepon di Kota Mataram periode 20022009 sbb:

Jawab
Log X1 dari Jumlah sambungan telepon di Kota Mataram:

log Xi = 14.63765
i= 1

n log Gm = 14.63765 log Gm = 14.63765/7 = 2,209109 Gm = 123,336 atau 23,34 % Rata-rata ukur data yang dikelompokkan

Usia Akseptor 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 - 44 Jlh

mi 17 22 27 32 37 42

fi 1 29 43 41 24 12 150

log mi 1,23045 1,34242 1,43136 1,50515 1,56820 1,62325

log mi fi 1,23045 38,93018 61,54848 61,71115 37,63680 19,47900 220,53606

mi. Fi 17 638 1.161 1.312 888 504 4.503

n log Gm = log mi. fi


i= 1

150 log Gm = 220,53606 log Gm = 220,53606/ 150 =1,47024 anti log = 29,52 = Gm = U

Contoh 2: Tentukan rata-rata ukur dari tabel distribusi frekuensi pada Contoh 3 di atas! Jawab: Kelas ke1 2 3 4 5 6 7 8

Nilai Ujian 31 40 41 50 51 60 61 70 71 80 81 90 91 100 Jumlah

fi 2 3 5 13 24 21 12 80

xi 35.5 45.5 55.5 65.5 75.5 85.5 95.5

log xi 1.5502 1.6580 1.7443 1.8162 1.8779 1.9320 1.9800

fi.log xi 3.1005 4.9740 8.7215 23.6111 45.0707 40.5713 23.7600 149.8091

2.

Rata-rata Harmonis. Rata-rata harmonik dari suatu kumpulan data x1, x2, , xn adalah kebalikan dari nilai rata-rata hitung (aritmetik mean). Dipergunakan untuk nilai yang harganya setiap saat selalu berubah & ditujukan pada data yang tidak dikelompokkan. Contoh : Menghitung kecepatan rata-rata. Secara matematis dapat dinyatakan dengan formula berikut:

Secara umum, rata-rata harmonic jarang digunakan. Rata-rata ini hanya digunakan untuk data yang bersifat khusus. Misalnya,rata-rata harmonik sering digunakan sebagai ukuran tendensi sentral untuk kumpulan data yang menunjukkan adanya laju perubahan, seperti kecepatan. a. Rata-rata harmonic untuk data tunggal Contoh 1:Si A bepergian pulang pergi. Waktu pergi ia mengendarai kendaraan dengan kecepatan 10 km/jam, sedangkan waktu kembalinya 20 km/jam. Berapakah rata-rata kecepatan pulang pergi? Jawab:Apabila kita menghitungnya dengan menggunakan rumus jarak dan kecepatan, tentu hasilnya 13.5 km/jam! Apabila kita gunakan perhitungan rata-rata hitung, hasilnya tidak tepat!

Pada kasus ini, lebih tepat menggunakan rata-rata harmonik:

b. Rata-rata Harmonik untuk Distribusi Frekuensi:

Contoh 2: Berapa rata-rata Harmonik dari tabel distribusi frekuensi pada Contoh 3 pada Tendensi Sentral: Mean! Jawab: Kelas ke- Nilai Ujian 1 31 40 2 41 50 3 51 60 4 61 70 5 71 80 6 81 90 7 91 100 8 Jumlah fi 2 3 5 13 24 21 12 80 Xi 35.5 45.5 55.5 65.5 75.5 85.5 95.5 fi/xi 0.0563 0.0659 0.0901 0.1985 0.3179 0.2456 0.1257 1.1000

3. Rata-rata hitung atau arithmetic mean atau sering disebut dengan istilah meansaja merupakan metode yang paling banyak digunakan untuk menggambarkan ukuran tendensi sentral. Mean dihitung dengan menjumlahkan semua nilai data pengamatan kemudian dibagi dengan banyaknya data. Definisi tersebut dapat di nyatakan dengan persamaan berikut:

Keterangan: = lambang penjumlahan semua gugus data pengamatan n = banyaknya sampel data N = banyaknya data populasi = nilai rata-rata sampel = nilai rata-rata populasi Mean dilambangkan dengan (dibaca x-bar) jika kumpulan data ini merupakan contoh (sampel) dari populasi, sedangkan jika semua data berasal dari populasi, mean dilambangkan dengan (huruf kecil Yunani mu). Sampel statistik biasanya dilambangkan dengan huruf Inggris, , sementara parameterparameter populasi biasanya dilambangkan dengan huruf Yunani, misalnya

Tabel berikut ini adalah nilai ujian statistik 80 mahasiswa yang sudah disusun dalam tabel frekuensi. Berbeda dengan contoh 2, pada contoh ke-3 ini, tabel distribusi frekuensi dibuat dari data yang sudah dikelompokkan berdasarkan selang/kelas tertentu (banyak kelas = 7 dan panjang kelas = 10). Kelas ke1 2 3 4 5 6 7 Nilai Ujian 31 40 41 50 51 60 61 70 71 80 81 90 91 100 Jumlah fi 2 3 5 13 24 21 12 80

Jawab:Buat daftar tabel berikut, tentukan nilai pewakilnya (xi) dan hitung fixi. Kelas ke1 2 3 4 5 6 7 Nilai Ujian 31 40 41 50 51 60 61 70 71 80 81 90 91 100 Jumlah fi 2 3 5 xi 35.5 45.5 55.5 fixi 71.0 136.5 277.5 851.5 1812.0 1795.5 1146.0 6090.0

13 65.5 24 75.5 21 85.5 12 95.5 80

Rata-rata = ( 6090 / 80 ) = 76,125

Catatan: Pendekatan perhitungan nilai rata-rata hitung dengan menggunakan distribusi frekuensi kurang akurat dibandingkan dengan cara perhitungan rata-rata hitung dengan menggunakan data aktualnya. Pendekatan ini seharusnya hanya digunakan apabila tidak memungkinkan untuk menghitung nilai rata-rata hitung dari sumber data aslinya. METODE COMPUTING ORIGIN

Contoh sebelumnya dapat dikerjakan dengan metode COMPUTING ORIGIN Pertama menentukan nilai A = 65,5; maka didapat tabel frekuensi sbb :

Jadi rata-rata= 65,5 + (850/80) = 76,125

METODE CODING

X =Nilai rata-rata A = Titik tengah = titik asal baru

n = Jumlah data Ui=Kode ke-I C = interval K = Jumlah kelas fi = Frekuensi kelas ke i

Jadi rata-rata= 65,5 + 10 (1/80) 85 = 76,125

Perbandingan Ketiga Rata-rata (Mean) :

4.

Rata-Rata tertimbang, banyak digunakan dalam dunia pendidikan, misalnya dalam menghirung indeks prestasi.

*Tambahan Salah satu kekurangan rata-rata hitung adalah adanya anggapan bahwa setiap barang mempunyai arti penting yang sama. Dalam kenyataannya barang-barang mempunyai arti penting yang berbeda. Misal, gula, beras dan garam. Meski sama-sama kebutuhan pokok tetapi mempunyai arti penting yang berbeda. Oleh karena itu, masing-masing arti penting barang harus diberi faktor penimbang yang berbeda. Barang yang lebih penting diberi faktor penimbang yang lebih besar. Ada dua cara untuk memberikan faktor penimbang, yaitu : Secara subjektif, adalah pemberian faktor penimbang didasarkan pandangan masing-masing individu. Seseorang akan memberikan faktor penimbang terhadap beras lebih tinggi dari gula dan garam, meski untuk tiap individu berbeda arti pentingnya.

Contoh : berikut perhitungan rata-rata ditimbang untuk 3 macam barang kebutuhan pokok di Blitar tahun 2007.

Rata-rata yang ditimbang dengan rumus sebagai berikut :

= 4100 : 10 = 410 hasil ini menunjukkan bahwa dalam perhitungan ini barang yang menentukan adalah beras, sehingga dikatakan bahwa rata-rata ditimbang haislnya dapat mendekati kenyataan, yakni barang yang penting akan menentukan.Pada perhitungan rata-rata hitung akan diperoleh hasil sebagai berikut X = 1.150 : 3 = 383,3 Hasilnya sangat dipengaruhi nilai yang ekstrem kecil. Dalam hal ini harga garam lebih lebih menentukan. Secara objektif, adalah menentukan faktor penimbang ditentukan berdasarkan jumlah konsumsi barang, barang yang mempunyai arti penting akan dikonsumir dalam jumlah yang besar, sedang barang yang kurang penting dikonsumir dalam jumlah kecil. Kuantitas ini merupakan perbandingan yang menunjukkan arti penting barang yang satu terhadap barang lain. Agar lebih jelas dapat disajikan contoh perhitungan sebagai berikut :

Rata-rata tertimbang untuk rumus sebelumnya menjadi 23.075 : 55,5 = Rp. 415,77 Kelebihan nilai rata-rata : 1. Nilai rata-rata punyai sifat objektif, artinya untuk berbagai perhitungan oleh individu yang berlainan akan dihasilkan nilai yang sama. 2. Nilai rata-rata mudah dimengerti. 3. Nilai rata-rata mudah dihitung 4. Perhitungan rata-rata didasarkan pada data keseluruhan sehingga nilai rata-rata dapat mewakili suatu rangakaian data. 5. Nilai rata-rata mempunyai stabilitas sampel, artinya perhitungan nilai rata-rata berdasarkan berbagai macam sampel, Hasilnya satu dengan yang lain tidak akan berbeda.

6. Nilai rata-rata digunakan untuk perhitungan lebih lanjut, artinya dari berbagai nilai rata-rata dapat dihitung nilai rata-rata keseluruhannya. Kelemahan nilai rata-rata : 1. Nilai rata-rata mudah dipengaruhi oleh nilai ekstrem, baik kecil maupun besar. Artinya apabila pada suatu rangakaian data terdapat nilai ekstrem, maka nilai ekstrem inilah yang sangat menentukan terhadap nilai rata-rata. 2. Pada distribusi yang condong, nilai rata-rata kurang mewakili. Contoh, penghasilan 5 orang mantan kasek sbb : 30 40 35 35 150. gaji rata-rata menjadi 290/5 = 58 ribu. Nilai ini tidak dapat mewakili karena ada gaji yang dibawahnya.

Median

Median atau nilai tengah adalah nilai pengamatan yang terletak di tengah gugus data setelah data tersebut diurutkan. Median membagi himpunan pengamatan menjadi dua bagian yang sama besar, 50% dari pengamatan terletak di bawah median dan 50% lagi terletak di atas median. Median sering dilambangkan dengan (dibaca x-tilde) apabila sumber datanya

berasal dari sampel (dibaca -tilde) untuk median populasi. Median tidak dipengaruhi oleh nilai-nilai aktual dari pengamatan melainkan pada posisi mereka. Prosedur untuk menentukan nilai median, pertama urutkan data terlebih dahulu, kemudian ikuti salah satu prosedur berikut ini: Banyak data adalah ganjil mediannya adalah nilai yang berada tepat di tengah gugus data Banyak data adalah genap mediannya adalah rata-rata dari dua nilai data yang berada di tengah gugus data a. Median data tunggalUntuk menentukan median dari data tunggal, terlebih dulu kita harus mengetahui letak/posisi median tersebut. Posisi median dapat ditentukan dengan menggunakan formula berikut:

dimana n = banyaknya data pengamatan. Median apabila n ganjil: Contoh 1:Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10 Jawab:

data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9; 10

setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9; 10 banyaknya data (n) = 11 posisi Me = (11+1) = 6 jadi Median = 7 (data yang terletak pada urutan ke-6)

Median apabila n genap: Contoh 2: Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9 Jawab: data: 8; 4; 5; 6; 7; 6; 7; 7; 2; 9 setelah diurutkan: 2; 4; 5; 6; 6; 7; 7; 7; 8; 9 banyaknya data (n) = 10 posisi median= (10+1) = 5.5 data tengahnya: 6 dan 7 jadi Median = (6+7) = 6.5 (rata-rata dari 2 data yang terletak pada urutan ke-5 dan ke-6)

b. Median dalam distribusi frekuensi Formula untuk menentukan median dari tabel distribusi frekuensi adalah sebagai berikut:

b = batas bawah kelas median dari kelas selang yang mengandung unsur atau memuat nilai median p = panjang kelas median n = ukuran sampel/banyak data f = frekuensi kelas median F = Jumlah semua frekuensi dengan tanda kelas lebih kecil dari kelas median (fi) Contoh 3:Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 pada Tendensi Sentral: Mean!

Kelas ke- Nilai Ujian fi fkum 1 2 3 4 5 6 7 8 31 40 41 50 51 60 61 70 71 80 81 90 2 2 3 5 5 10 13 23 24 47 letak kelas median 21 68

Jawab:

91 100 12 80 Jumlah 80

Letak kelas median: Setengah dari seluruh data = 40, terletak pada kelas ke-5 (nilai ujian 7180) b = 70.5, p = 10 n = 80, f = 24 f = 24 (frekuensi kelas median) F = 2 + 3 + 5 + 13 = 23 c. Menentukan median dengan cara grafis Dengan menggunakan Ogive

PT : PQ = ST : QR PT : 0,004 = (50-25) : (58,33 -25) PT : 0,004 = 25 : 28,33 PT = (25 x 0,004) / 28,33 = 0,003

Dengan menggunakan Histogram

Modus

Mode adalah data yang paling sering muncul/terjadi. Untuk menentukan modus, pertama susun data dalam urutan meningkat atau sebaliknya, kemudian hitung frekuensinya. Nilai yang frekuensinya paling besar (sering muncul) adalah modus. Modus digunakan baik untuk tipe data numerik atau pun data kategoris. Modus tidak dipengaruhi oleh nilai ekstrem. Beberapa kemungkinan tentang modus suatu gugus data: Apabila pada sekumpulan data terdapat dua mode, maka gugus data tersebut dikatakan bimodal. Apabila pada sekumpulan data terdapat lebih dari dua mode, maka gugus data tersebut dikatakan multimodal. Apabila pada sekumpulan data tidak terdapat mode, maka gugus data

tersebut dikatakan tidak mempunyai modus. Meskipun suatu gugus data mungkin saja tidak memiliki modus, namun pada suatu distribusi data kontinyu, modus dapat ditentukan secara analitis.

Untuk gugus data yang distribusinya simetris, nilai mean, median dan modus semuanya sama. Untuk distribusi miring ke kiri (negatively skewed): mean < median < modus untuk distribusi miring ke kanan (positively skewed): terjadi hal yang sebaliknya, yaitu mean > median > modus.

a. Modus data tunggal Modus dari 2, 4, 5, 6, 6, 7, 7, 7, 8, 9 adalah 7

b. Mode dalam distribusi frekuensi

Keterangan: Mo = modal = kelas yang memuat modus b = batas bawah kelas modal p = panjang kelas modal bmo = frekuensi dari kelas yang memuat modus (yang nilainya tertinggi) b1= bmo bmo-1 = frekuensi kelas modal frekuensi kelas sebelumnya b2 = bmo bmo+1 = frekuensi kelas modal frekuensi kelas sesudahnya

Contoh : Tentukan nilai median dari tabel distribusi frekuensi pada Contoh 3 pada Tendensi Sentral: Mean! Kelas ke- Nilai Ujian 1 31 40 2 41 50 3 51 60 4 61 70 5 6 7 8 71 80 81 90 91 100 Jumlah fi 2 3 5 13 b1 = (24 13) = 11 24 kelas modal (frekuensinya paling besar) b2 =(24 21) =3 21 12 80

Kelas modul =kelas ke-5 b = 71-0.5 = 70.5 b1 = 24 -13 = 11 b2 = 24 21 = 3 p = 10

Mencari mode dengan cara grafik

OS1+ S1T1= 0,7315 + S1T1 S1T1 = UT UT : TV = PS : QR UT : TV = (20-10) : (20-14) = 10 : 6 UT + TV = Interval = 0,004 UT = (10/16) x 0,004 = 0,0025 Mode = 0,7135 + 0,0025 = 0,7340

Daftar Pustaka : Walpole, Ronald. 1995. Pengantar Statistika. Jakarta : PT Gramedia Pustaka Utama http://zaneta9bp2.blogspot.com/p/rata-rata-harmonik_23.html http://statistikpendidikanii.blogspot.com/2008/04/mean-rata-rata.html http://nhingz-anwar.blogspot.com/2013/01/nilai-rata-rata-ukur-dan-harmonik.html http://sinollahblog.files.wordpress.com/2012/12/4-pengukuran-tendensi-sentral.pdf Hartono Drs. 2004. Statistik Untuk Penelitian. Yogyakarta : Pustaka Pelajar Offset Dajan Anto. 1974. Pengantar Metode Statistik Jilid II. Jakarta : PT Pustaka LP3ES Indonesia. Supranto J. 2008. Statistik Teori dan Aplikasi. Jakarta: Erlangga

Simpangan baku atau standard deviasi sampel diberi notasi s, sedangkan standar deviasi populasi dinyatakan dengan (sigma).

Atau, dirumuskan :

Anda mungkin juga menyukai