1. ANALYSIS TOOLPACK
Salah satu cara untuk mengethaui ukuran deskriptif sebuah data numerik adalah dengan
menggunakan analysis toolpack, addins yang disediakan oleh excel. Secara spesifik, yang akan
digunakan dalam modul ini adalah alat analisis: Descriptive Statistics. Alat analisis ini akan secara
otomatis mengeluarkan fungsi-fungsi antara lain:
∑𝑥
• Mean: Rata-rata dari data, dimana 𝑥̅ =
𝑛
𝜎
• Standard Error: Standar error dari rata-rata, dimana 𝑆𝑥̅ =
√𝑛
• Median: Nilai tengah dari data
• Mode: Modus atau nilai yang sering muncul dari data
∑(𝑥−𝑥̅ )2
• Standard Deviation: Simpangan baku dari data, dimana 𝑠 = √ (perlu diperhatikan
𝑛−1
disini yang dihitung oleh Descriptive statistics adalah simpangan baku dari sampel)
• Sample Variance: Variansi dari data, sama halnya dengan simpangan baku, variansi yang
dihitung disini adalah simpangan baku dari sampel
𝑛(𝑛+1) 3(𝑛+1)2
• Kurtosis: Lebar distribusi data, yaitu 𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠 = ∑𝑛 𝑧 4 −
(𝑛−1)(𝑛−2)(𝑛−3) 1 (𝑛−2)(𝑛−3)
𝑧3
• Skewness: Kemencengan distribusi data, yaitu 𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠 = 𝑛 ∑𝑛𝑖=1 ((𝑛−1)(𝑛−2))
• Range: rentang data, yaitu data maksimum dikurangi data minimum
• Minimum: nilai minimum dari data
• Maximum: nilai maksimum dari data
• Sum: Total dari semua data, yaitu
• Count: Jumlah data (n)
• Largest (kth): Nilai ke-k terbesar dari data yang diurutkan
• Smallest (kth): Nilai ke-k terkecil dari data yang diurutkan
• Confidence Level (default: 95.0%): Estimasi interval kepercayaan (akan dibahas pada
pertemuan ke-8)
Pada modul ini akan digunakan dataset Student Performances, khususnya data numerik antara lain:
Math Score, Reading Score dan Writing Score. Berikut Langkah-langkah dalam menggunakan alat
analisis: Descriptive Statistics:
• Klik “Data Analysis” pada tab Data, kamudian akan muncul jendela “Data Analysis”. Pilih
“Descriptive Statistics” dari alat analisis yang tersedia.
Gambar 1-1 Data Analysis – Descriptive Statistics
• Kemudian akan muncul jendela “Descriptive Statistics”. Isikan dalam Input Range data yang
akan diketahui statistik deskriptifnya. Dalam hal ini dipilih semua data numerik yang tersedia
yaitu kolom F hingga H. Kolom ini merupakan data match score, reading score dan writing
score. Karena pengelompokan data tersebut berada dalam kolom, dimana masing-masing
kolom menunjukkan data skor dari tiga subjek yang berbeda maka opsi Grouped By Columns
dipilih. Ceklis Labels in first row juga dicentang karena pada data yang tersedia, baris
pertamanya berisi nama variabel tersebut.
• Outout dapat disesuaikan dengan keinginan, dalam contoh ini Output option yang dipilih
adalah New Woeksheet Ply. Pada opsi ini excel akan mengeluarkan hasil analisisnya pada
sheet/halaman baru. Pengguna dapat mengatur nama sheet tersebut jika menginginkan. Jika
tidak diberi nama maka excel akan secara otomatis memberi nama sheet tersebut.
• Terdapat 4 pilihan ceklis analisis yang dapat dipilih, yaitu Summary statistics, Confidence Level
for Mean, Kth Largest, dan Kth Smallest. Pengguna harus memilih paling tidak satu dari opsi
yang tersebut. Untuk mendapatkan pengukuran data deskriptif standar cukup dicentang
Summary Statistics.
• Pada gambar 1-3 terlihat output yang dihasilkan ketika semua opsi analisis yang diperlukan
dicentang. Jika hanya memilih Summary Statistics, output yang dihasilkan adalah baris Mean
hingga Count. Tiga baris terakhir didapat dari tiga opsi terakhir yang tersedia.
TUGAS
• Bandingkan ukuran data deskriptif gaji (salary) antara laki-laki (M) dan perempuan (F). Berikan
analisis anda mengenai hasilnya!
• Bandingkan ukuran data deskriptif nilai lulusan (degree percentage), employability test
percentage dan nilai MBA (MBA percentage) antara peserta yang ditempatkan (status = placed)
dan yang tidak ditempatkan (status = Not Placed). Berikan analisis anda mengenai hasilnya!