Dosen :
Firdaus, S.T., M.Kom.
Oleh
M.Iqbal
(09011282025089)
SK3A
Melihat Data-Distribusi
1.1 Data
Analisisstatistikdimulaidengansatusetdata.Kamimembangunseperangkatdatadenganfirstdeciding
apakasus,atauunit,kitainginbelajar.Untuksetiapkasus,kamirecordinformationtentangkarakteristik yang
kita sebut variabel. Beberapa variabel, seperti nama lagu dan artis hanya menempatkan kasus
intocategories. Lainnya, seperti panjang lagu, ambil nilai-nilai numeris untuk yang kita bisa kerjakan.
Masuk akal untuk memberikan rata-rata waktu untuk lagu collectionof, tetapi tidak masuk akal
memberikan album "rata-rata". Namun, kita bisa menghitung banyaknya lagu-lagu di album yang
berbeda, dan kita bisa mengerjakan ariciewiththese.
Karakteristik utama dari kumpulan data
Secara praktiknya, setiap kumpulan data disertai informasi latar belakang yang membantu kita
memahami data tersebut. Ketika Anda merencanakan studi statistik atau mengeksplorasi data dari
pekerjaan orang lain, tanyakan pada diri sendiri pertanyaan-pertanyaan berikut:
1. Siapa? Apa kasus yang dijelaskan? Berapa banyak kasus yang ditetapkandatanya?
2. Apa?Berapabanyakvariabelyangmengandungdata?Apadefinisiyangtepatdarivariabelini?Apa satuan
pengukuran untuk setiap variabelkuantitatif?
3. Mengapa? Apa tujuan yang dimiliki datanya? Apakah kita berharap untuk menjawab beberapa
pertanyaanspesifik?Apakahkitainginmenarikkesimpulantentangkasusselainyangkitabenar-benar
memiliki data untuk? Apakah variabel yang dicatat cocok untuk tujuan yangdimaksud?
Seringvariabeldalamstudistatistikmudahdipahami:tinggisentimeter,pelajariwaktubeberapamenit, serta
sebagainya. Tetapi setiap daerah pekerjaan juga telah ditaburkan variabel khusus. Seorang psikolog
menggunakan Inventaris Kepribadian Multisains (MMPI), dan langkah pakar kebugaranfisik "VO2 ,"
volume dikonsumsi oksigen per menit saat berolahraga di kapasitas maksimum Anda. Kedua variabel
ini diukur dengan instrumen khusus. VO2 Max diukur dengan berolahraga saat bernapas ke mulut
yang terhubung ke peralatan yang mengukur oksigen yang dikonsumsi. Skor pada MMPI didasarkan
pada kuesioner panjang, yang juga merupakaninstrumen.
instrumen
Bagian dari menguasai bidang pekerjaan Anda adalah mempelajari variabel apa yang penting dan
bagaimana mereka paling diukur. Karena detail ukuran tertentu biasanya membutuhkan pengetahuan
tentang bidang studi tertentu, kita akan mengatakan sedikit tentang mereka. Pastikan setiap variabel
benar-benar mengukur apa yang Anda inginkan. Pilihan variabel yang buruk dapat menyebabkan
menyesatkan kesimpulan. Seringkali, misalnya, tingkat di mana sesuatu terjadi adalah ukuran yang
lebih bermakna daripada jumlah kejadian sederhana.
1.2 Menampilkan Distribusi denganGrafik
Alat dan ide statistik membantu kami memeriksa data untuk menggambarkan fitur utamanya.
Pemeriksaan ini disebut analisis data eksplorasi.
Analisis data eksplorasi
• Mulailah dengan memeriksa setiap variabel dengan sendirinya. Kemudian lanjutkan untuk
mempelajari hubungan antarvariabel.
• Mulailah dengan grafik atau grafik. Kemudian tambahkan ringkasan numerik dari aspek tertentu dari
datanya.
Variabel kategori: grafik batang dan diagram lingkaran
Nilai dari variabel kategori adalah label untuk kategori, seperti “Ya” dan “Tidak”. Distribusi variabel
kategoris mencantumkan kategori dan memberi, baik jumlah atau persentase kasus yang termasuk
dalam setiap kategori.
Distribusi variabel kategori
Kumpulan data yang memiliki sejumlah besar nilai untuk variabel kategori. Dalam membuat kategori
seperti ini yang menyertakan kategori yang memiliki jumlah atau persentase yang relatif kecil,
diperlukan penilaian yang cermat saat melakukannya. Jika tidak ingin menutupi beberapa informasi
penting yang terkandung dalam data, dapat menggabungkan data dengan cara ini.
Penggunaanmetodegrafisakanmemungkinkanuntukmelihatinformasidankarakteristikdatalainnya
denganmudah.
Dalam menggunakan grafik batang, harus selalu mempertimbangkan cara terbaik untuk mengurutkan
nilai kategorikal
Variabel dalam grafik.
Dalam menggunakan diagram lingkaran, harus menyertakan semua kategori yang membentuk
keseluruhan.
Variabel kuantitatif: plot batang
Plotbatang(jugadisebutplotbatangdandaun)memberikangambaransingkattentangbentukdistribusi
sambil memasukkan nilai numerik aktual dalam grafik. Stemplot bekerja paling baik untuk sejumlah
kecil pengamatan yang semuanya lebih besar dari 0. Tujuan dari stemplot adalah untuk menampilkan
bentuk distribusi. Jika ada banyak batang tanpa daun atau hanya satu daun, pemangkasan akan
mengurangi jumlahbatang.
Histogram
Fitur ini membuat stempel canggung untuk kumpulan data besar. Histogram memecah rentang nilai
variabel ke dalam kelas dan hanya menampilkan jumlah atau persentase pengamatan yang masuk ke
setiap kelas. Dapat memilih jumlah kelas yang sesuai, tetapi harus selalu memilih kelas dengan lebar
yang sama.
Memeriksa distribusi
Membuatgrafikstatistikbertujuanuntukmembantudalammemahamidata.Dalamgrafikdataapapun, cari
pola keseluruhan dan penyimpangan yang mencolok dari pola itu. Dengan cara keseluruhan pola
distribusi dengan bentuk, pusat, dan penyebarannya. Jenis penyimpangan yang penting adalah outlier,
nilai individual yang berada di luar polakeseluruhan.
Berurusan dengan outlier
Mengidentifikasi outlier adalah masalah penilaian. Carilah titik yang jelas terpisah dari tubuh data,
bukan hanya pengamatan paling ekstrem dalam suatu distribusi dan harus mencari penjelasan untuk
setiap outlier.
Plot waktu
Setiap kali data dikumpulkan dari waktu ke waktu, adalah ide yang baik untuk memplot pengamatan
dalam urutan waktu. Tampilan distribusi variabel yang mengabaikan urutan waktu, seperti plot batang
dan histogram, dapat menyesatkan bila ada perubahan sistematis dari waktu ke waktu.
Analisis data eksplorasi menggunakan grafik dan ringkasan numerik untuk menggambarkan
variabel dalam kumpulan data dan hubungan di antaramereka.
Distribusivariabelmemberitahukitanilaiapayangdibutuhkandanseberapaseringdibutuhkan
nilai-nilai ini.
Grafik batang dan diagram lingkaran menampilkan distribusi variabel kategori. Grafik ini
menggunakan hitungan atau persentasekategori.
Stemplot dan histogram ialah memisahkan setiap pengamatan menjadi batang dan daun satu
digit dan memplot frekuensi (jumlah) atau persentase kelas nilai yang samalebarnya.
Beberapadistribusimemilikibentukyangsederhana,sepertisimetrisataumiring.Jumlahmode
(puncak utama) adalah aspek lain dari bentuk keseluruhan. Tidak semua distribusi memiliki
bentuk keseluruhan yang sederhana, terutama jika ada sedikitpengamatan.
Pencilanadalahpengamatanyangterletakdiluarpolakeseluruhandistribusi.Selalucarioutlier dan
coba jelaskan.
Ketika pengamatan pada suatu variabel diambil dari waktu ke waktu, buat plot waktu untuk
menggambarkan waktu secara horizontal dan nilai variabel secara vertikal. Plot waktu dapat
mengungkapkan perubahan dari waktu kewaktu.