2 PEMUSATAN DATA TUNGGAL Moh. Firman Amardani S., M.Pd
STATISTIKA DAN PROBABILITAS - PRODI TEKNIK SIPIL - SEMESTER 4
Unit Statistik adalah individu objek atau orang yang akan diteliti, disurvei, atau didata. Variabel adalah suatu karakteristik dari suatu objek yang dapat diamati (diobservasi), dihitung, atau diukur, yang nilainya untuk setiap objek bervariasi. Contoh: • Tinggi badan mahasiswa Teknik Sipil semester 4. • Motivasi mahasiswa Teknik Informatika dalam mengikuti Kuliah Umum. • Suhu di setiap ruangan gedung E. • Nilai UAS Matematika 3 mahasiswa Teknik Sipil semester 4. Variabel Bukan Contoh: • Rata-rata nilai UAS Matematika 3 mahasiswa Teknik Sipil. • Model pembelajaran Project Based Learning. Data (Sukestiyarno, 2010) adalah suatu keterangan yang berbentuk kualitatif (rusak, bagus, kurang, sedang) dan atau berbentuk kuantitatif (bilangan) yang merupakan hasil observasi, penghitungan, atau pengukuran dari suatu variabel. • Data hasil dari pengukuran diasumsikan data kontinu. • Data hasil dari penghitungan dan observasi diasumsikan data diskrit. Data (Sukestiyarno, 2010) Contoh Data Hasil Pengukuran: • 300 C (Variabel: Suhu). • 65,3 (Variabel: Nilai UTS).
Contoh Data Hasil Penghitungan:
• 27 buah (Variabel: Banyak kursi di ruang kuliah gedung E). • 12034 jiwa (Variabel: Jumlah penduduk).
Contoh Data Hasil Observasi:
• Baik (Variabel: Motivasi belajar). • Laki-laki (Variabel: Jenis kelamin). PEMBAGIAN BIDANG KERJA ANALISIS (Sukestiyarno, 2010) Tugas: mengurutkan, membentuk kelompok-kelompok, meringkas dan mempresentasikan data.
DESKRIPTIF Olah Datanya: belum sampai pada
kesimpulan yang teruji, sehingga kesimpulannya bersifat lemah. Diidentikkan dengan statistika STATISTIKA kualitatif/statistika non parametrik, di mana kekuatan analisisnya berupa deskripsi yang dinyatakan dalam bentuk kata-kata, sedangkan INFERENSIAL perhitungan statistik hanya dipakai sebagai pendukung informasi. Jenis Data: Data Diskrit (Data berskala Nominal, Ordinal, dan Kardinal). PEMBAGIAN BIDANG KERJA ANALISIS (Sukestiyarno, 2010) Tugas: menguji hipotesis, membuat simpulan/keputusan, memprediksikan DESKRIPTIF kejadian, dan mencari hubungan antar data.
Olah Datanya: sampai pada kesimpulan yang
teruji, sehingga kesimpulannya bersifat kuat. STATISTIKA Diidentikkan dengan statistika kuantitatif/statistika parametrik, di mana kekuatan analisisnya berupa perhitungan numerik yang dipakai sebagai dasar menolak INFERENSIAL atau menerima hipotesis.
Jenis Data: Data Kontinu (Data berskala
Interval dan Rasio). UKURAN TENDENSI SENTRAL • Ukuran tendensi sentral lebih banyak digunakan dalam penelitian maupun administrasi untuk mendeskripsikan kondisi atau kelakuan dari data. • Orang tidak mungkin menjelaskan data satu per satu, jika datanya terlalu besar. • Oleh karena itu, informasi yang berkaitan dengan pemusatan (sentral), diperlukan untuk melihat gambaran secara umum. • Ukuran tendensi sentral meliputi: Rataan, Modus, Median, Varian, Simpangan Baku, dsb. 1. RATAAN • Rataan hitung didefinisikan sebagai jumlah semua data dibagi dengan banyaknya data. 𝑥1 +𝑥2 +𝑥3 +⋯+𝑥𝑛 • Rumus: 𝑥ҧ = 𝑛 • Setiap data berperan penting dalam menentukan nilai rataan. • Contoh: nilai rataan hasil tes suatu ujian sekolah adalah 86,25. Apa maknanya? • Nilai rataan 86,25 bisa dikaitkan dan diasumsikan dengan: baiknya kondisi sekolah, baiknya sarana-prasarana pembelajaran, kualitas pengajarannya, dsb. 1. RATAAN • Jika nilai rataan misalkan 40, kita dapat menginterpretasikan bahwa kondisi sekolah berkebalikan dengan kondisi ketika nilai rataannya 86,25. 2. MODUS • Modus adalah ukuran nilai yang sering muncul. • Nilai modus pada suatu variabel bisa lebih dari satu nilai. • Contoh: Modus dari nilai ujian mahasiswa adalah 80. Apa maknanya? • Dapat diartikan bahwa jika nilai mahasiswa dikelompokkan berdasarkan nilai yang sama, maka pengelompokkan untuk nilai 80 adalah yang paling banyak mahasiswanya. 3. MEDIAN • Median adalah ukuran nilai yang berada diurutan tengah, jika data kuantitatif dari suatu variabel diurutkan/dirangking menurut besarnya (baik menurun/descending, maupun naik/ascending). • Contoh: Nilai median adalah 70. Apa maknanya? • Pengertian nilai median hanya sebagai nilai pembatas. Artinya, ada sebanyak 50% objek mendapat nilai di bawah 70, dan 50% sisanya mendapat nilai di atas 70. • Berbeda dengan rataan, dalam median, setiap data tidak begitu penting dalam menentukan nilai median. Akan tetapi ranking data yang utama. 3. MEDIAN Perhatikan data berikut! • Data Pertama: 1, 3, | 5, 10. Median = .... • Data Kedua: 1, 3, | 5, 10000. Median = .... • Data Ketiga : 1, 3, | 5, 100000000 Median = .... 3. MEDIAN Contoh Interpretasi Median: Misalkan kita mempunyai data suatu nilai ujian dari 2 kelas. 1. Kelas A nilai median ujiannya adalah 30. • Dapat dimaknai bahwa kelas A informasinya cukup menyedihkan. • Karena ada separuh (50%) jumlah peserta ujian yang nilainya < 30. • Jika batas kelulusan 60, artinya dipastikan 50% atau lebih siswa tidak lulus ujian. 2. Kelas B nilai median ujiannya adalah 80. • Ini dapat dimaknai bahwa informasinya cukup menggembirakan. • Karena ada 50% siswa yang nilainya di atas 80. • Jika batas kelulusan 60, artinya dipastikan 50% atau lebih siswa lulus ujian. 4. KUARTIL, DESIL, PERSENTIL • Untuk mendapatkan informasi yang lebih rinci/lebih kecil pembagian datanya, kita kenal generalisasi dari median yaitu kuartil, desil, dan persentil. • Jika median suatu data yang terurut dibagi menjadi 2 bagian,maka: • Kuartil membagi data terurut menjadi 4 bagian; • Desil membagi data terurut menjadi 10 bagian; • Persentil membagi data terurut menjadi 100 bagian. 4. KUARTIL, DESIL, PERSENTIL Contoh Kuartil: Dipunyai data terurut sebagai berikut. 1, 2, 2, | 3, 7, 8, | 9, 9, 11, | 18, 20, 21 Q1 Q2 Q3 (2+3) (8+9) (11+18) Q1 = = 2,5 Q2 = = 8,5 (𝑀𝑒𝑑𝑖𝑎𝑛) Q3 = = 14,5 2 2 2 Ket: • Q1 merupakan nilai pembatas: sejumlah 25% data ada di sebelah kiri Q1, dan 75% data ada di sebelah kanan Q1. • Q3 merupakan nilai pembatas: sejumlah 75% data ada di sebelah kiri Q3, dan 25% data ada di sebelah kanan Q3. • Pengertian Desil berarti pembagian per puluhan persen. • Misal nilai D2 (desil 2) merupakan nilai pembatas 20% kiri dan 80% kanan. 4. KUARTIL, DESIL, PERSENTIL Menghitung Kuartil, Desil, Persentil Rumus: 𝒊(𝒏+𝟏) • 𝒒𝒊 = , kedudukan kuartil ke-i → 𝑸𝒊 = 𝑿𝒎 + 𝒕 𝑿𝒎+𝟏 − 𝑿𝒎 , 𝟒 𝑑𝑒𝑛𝑔𝑎𝑛 𝒊 = 𝟏, 𝟐, 𝟑. 𝒊(𝒏+𝟏) • 𝒅𝒊 = , kedudukan desil ke-i → 𝑫𝒊 = 𝑿𝒎 + 𝒕 𝑿𝒎+𝟏 − 𝑿𝒎 , 𝟏𝟎 𝑑𝑒𝑛𝑔𝑎𝑛 𝒊 = 𝟏, 𝟐, 𝟑, … , 𝟗. 𝒊(𝒏+𝟏) • 𝒑𝒊 = , kedudukan persentil ke-i → 𝑷𝒊 = 𝑿𝒎 + 𝒕 𝑿𝒎+𝟏 − 𝑿𝒎 , 𝟏𝟎𝟎 𝑑𝑒𝑛𝑔𝑎𝑛 𝒊 = 𝟏, 𝟐, 𝟑, ..., 99. Ket: • 𝑄𝑖 adalah nilai ke-i dari kuartil. • 𝑚 = pembulatan ke bawah dari • 𝐷𝑖 adalah nilai ke-i dari desil. 𝑞𝑖 , 𝑑𝑖 , atau 𝑝𝑖 . • 𝑡 = 𝑞𝑖 − 𝑚, 𝑎𝑡𝑎𝑢 • 𝑃𝑖 adalah nilai ke-i dari persentil. • 𝑡 = 𝑑𝑖 − 𝑚, 𝑎𝑡𝑎𝑢 𝑡 = 𝑝𝑖 − 𝑚 4. KUARTIL, DESIL, PERSENTIL Contoh: Dipunyai data terurut sebagai berikut: 1, 2, 2, 3, 7, 8, 9, 9, 11, 18, 20, 21. Hitunglah nilai Desil ke-7! Selesaian: • Menghitung nilai D7, pertama hitung nilai posisi dari D7, yakni 7(𝑛+1) 7(12+1) d 7. 𝑑7 = = = 9,1. 10 10 • Jadi: 𝑚 = 9; • 𝑡 = 𝑑7 − 𝑚 = 9,1 − 9 = 0,1; • 𝑋𝑚 = 𝑋9 = 11; • 𝑋𝑚+1 = 𝑋9+1 = 𝑋10 = 18. • 𝑆𝑒ℎ𝑖𝑛𝑔𝑔𝑎 𝐷7 = 𝑋9 + 𝑡(𝑋10 − 𝑋9) = 11 + 0,1(18 − 11) = 11,7. 4. KUARTIL, DESIL, PERSENTIL Contoh Interpretasi: • Suatu data nilai persentil ke-90 yaitu P90=50. • Artinya, ada 90% peserta/responden mendapat nilai di bawah 50, dan hanya ada 10% peserta mendapat nilai di atas 50. • Jika nilai tersebut menggambarkan hasil ujian dengan rentang skor 0-100, hal tersebut jelas merupakan informasi yang tidak menyenangkan. • (Nilai persentil ke-90 sama dengan nilai desil ke-9) 5. RANGE/JANGKAUAN • Range atau jangkauan adalah selisih nilai tertinggi dan nilai terendah. • Contoh: Dipunyai data sebagai berikut: 2, 32, 7, 18, 9, 9, 11, 18, 20, 21, 19, 23, 7. • Range = 32 – 2 = 30. • Pemaknaan range jika dibahas bersama nilai maksimum, nilai minimum, rataan, dan simpangan baku, nantinya akan lebih banyak memberi gambaran tentang sebaran data, pencilan data (outlier), dan juga homogenitas data. 𝑹𝒖𝒎𝒖𝒔 𝑴𝒔. 𝑬𝒙𝒄𝒆𝒍: " = 𝑨𝑽𝑬𝑫𝑬𝑽(⋯ )" 6. SIMPANGAN RATA-RATA • Simpangan Rata-rata (Deviasi Mean) adalah rata-rata jarak antara nilai-nilai data menuju rata-ratanya. • Simpangan rata-rata termasuk ke dalam ukuran penyebaran data seperti halnya varian dan standar deviasi/simpangan baku. • Kegunaan: Untuk mengetahui seberapa jauh nilai data menyimpang dari rata-ratanya. • Rumus simpangan rata-rata (SR): 𝒏 𝑛 = 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑𝑎𝑡𝑎 𝟏 𝑥ҧ = 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 ഥ 𝑺𝑹 = 𝒙𝒊 − 𝒙 𝑥𝑖 = 𝑛𝑖𝑙𝑎𝑖 𝑑𝑎𝑡𝑎 𝑘𝑒 − 𝑖 𝒏 𝑥𝑖 − 𝑥ҧ = 𝑛𝑖𝑙𝑎𝑖 𝑚𝑢𝑡𝑙𝑎𝑘 𝑑𝑎𝑟𝑖 𝑥𝑖 − 𝑥ҧ 𝒊=𝟏 6. SIMPANGAN RATA-RATA Contoh: Misalkan tinggi badan 10 mahasiswa adalah sebagai berikut: 172, 167, 180, 170, 169, 160, 175, 165, 173, 170. Hitunglah simpangan rata-rata data tinggi badan tersebut! Penyelesaian: Hitung terlebih dahulu rata-ratanya. 𝑛 1 1 𝑥ҧ = 𝑥𝑖 = (172 + 167 + 180 + 170 + 169 + ⋯ + 170) 𝑛 10 𝑖=1 1 = (1701) = 170,1. 10 Penyelesaian: Selanjutnya hitung 𝑥𝑖 − 𝑥ҧ . 𝑥𝑖 𝑥𝑖 − 𝑥ҧ 𝑥𝑖 − 𝑥ҧ 172 1,9 1,9 Diperoleh: 167 -3,1 3,1 180 9,9 9,9 ഥ = 𝟑𝟗, 𝟐 𝒙𝒊 − 𝒙 𝒏 = 𝟏𝟎 170 -0,1 0,1 169 -1,1 1,1 Menghitung 160 -10,1 10,1 simpangan rata-rata: 175 4,9 4,9 𝑛 1 165 -5,1 5,1 𝑆𝑅 = 𝑥𝑖 − 𝑥ҧ 173 2,9 2,9 𝑛 𝑖=1 170 -0,1 0,1 1 = ∙ 39,2 = 3,92. 𝒙𝒊 − ഥ 𝒙 = 39,2 10 7. VARIAN DAN SIMPANGAN BAKU • Varian merupakan suatu nilai yang didefinisikan dengan 2 σ 𝑥𝑖 −𝑥ҧ 2 rumus: 𝑠 = 𝑛−1 • 𝑥ҧ 𝑎𝑑𝑎𝑙𝑎ℎ 𝑟𝑎𝑡𝑎𝑎𝑛 • 𝑥𝑖 𝑎𝑑𝑎𝑙𝑎ℎ 𝑑𝑎𝑡𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 • 𝑛 𝑎𝑑𝑎𝑙𝑎ℎ 𝑏𝑎𝑛𝑦𝑎𝑘 𝑑𝑎𝑡𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 • 𝑠 2 𝑎𝑑𝑎𝑙𝑎ℎ 𝑣𝑎𝑟𝑖𝑎𝑛 • 𝑠 𝑎𝑑𝑎𝑙𝑎ℎ 𝑠𝑖𝑚𝑝𝑎𝑛𝑔𝑎𝑛 𝑏𝑎𝑘𝑢 7. VARIAN DAN SIMPANGAN BAKU Contoh: Dipunyai data dengan varian 𝑠2 = 144,41 dan simpangan bakunya 𝑠 = 12,02. Artinya apa? • Berdasarkan rumus definisi varian, nilai 144,41 menunjukkan jumlah kuadrat dari selisih antara rataan dan masing-masing data observasi, kemudian dibagi dengan banyak data minus 1. • Selisih di sini mengukur jauh-dekatnya masing-masing nilai terhadap rataan. • Semakin jauh letak masing-masing nilai terhadap rataan, maka nilai varian akan semakin besar (dapat dikatakan data cenderung menyebar/data heterogen). 7. VARIAN DAN SIMPANGAN BAKU Contoh: Dipunyai data dengan varian 𝑠2 = 144,41 dan simpangan bakunya 𝑠 = 12,02. Artinya apa? • Sebaliknya, semakin dekat masing-masing nilai terhadap rataan, maka nilai varian semakin kecil (dapat dikatakan data cenderung mengelompok/bergerombol/data homogen). 8. SKEWNESS • Skewness diartikan sebagai kemiringan distribusi data. • Jika skewness menunjukkan bentuk simetri, maka dikatakan data membentuk distribusi normal. σ𝑛 𝑦 𝑖 −𝑦ത 3 • Rumus: 𝑆𝑘𝑒𝑤𝑛𝑒𝑠𝑠 = 𝑠𝑘 = 𝑖=1 𝑛−1 𝑠 3 • Keterangan: 𝑦𝑖 = 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 𝑑𝑎𝑡𝑎; 𝑦ത = 𝑟𝑎𝑡𝑎𝑎𝑛; 𝑠 = 𝑠𝑖𝑚𝑝𝑎𝑛𝑔𝑎𝑛 𝑏𝑎𝑘𝑢; 𝑑𝑎𝑛 𝑛 = 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑𝑎𝑡𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖. 8. SKEWNESS • Jika 𝑠𝑘 = 0 , maka menunjukkan data berdistribusi normal/skewness simetris.
• Jika 𝑠𝑘 < 0, maka skewness agak condong ke kanan.
• Jika 𝑠𝑘 > 0, maka skewness agak condong ke kiri.
9. KURTOSIS • Kurtosis diartikan sebagai keruncingan distribusi data. • Semakin runcing nilai kurtosis, menunjukkan data cenderung mengumpul (homogen). • Jika nilai kurtosis sama dengan nol, menunjukkan data berdistribusi normal. • Jika nilai kurtosis semakin kecil, menunjukkan data semakin tumpul/menyebar (heterogen). σ𝑛 𝑦 𝑖=1 𝑖 −𝑦ത 4 • Rumus: 𝐾𝑢𝑟𝑡𝑜𝑠𝑖𝑠 = 𝑘𝑢 = 𝑛−1 𝑠 4 • 𝑦𝑖 = 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖 𝑑𝑎𝑡𝑎; 𝑦ത = 𝑟𝑎𝑡𝑎𝑎𝑛; • 𝑠 = 𝑠𝑖𝑚𝑝𝑎𝑛𝑔𝑎𝑛 𝑏𝑎𝑘𝑢; 𝑑𝑎𝑛 𝑛 𝑏𝑎𝑛𝑦𝑎𝑘𝑛𝑦𝑎 𝑑𝑎𝑡𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑠𝑖. 9. KURTOSIS • Jika nilai kurtosis mendekati nol, maka data cenderung normal. • Jika nilai kurtosis negatif, berarti sebaran datanya tumpul/cenderung melebar ke bawah (heterogen). • Jika nilai kurtosis positif, berarti sebaran datanya runcing/cenderung mengelompok (homogen).