Anda di halaman 1dari 5

Probabilitas dan Statistik

Dosen :
Firdaus, S.T., M.Kom.

Oleh
M.Iqbal

(09011282025089)

SK3A

Jurusan Sistem Komputer


Fakultas Ilmu Komputer
Universitas Sriwijaya
Judul Buku : Introduction to the practice of statistics
Penulis : David S.Moore, Goerge P.McCabe, Bruce A.Craig
Penerbit :-
Tahun Terbit : 2015

Melihat Data-Distribusi
1.1 Data
Analisisstatistikdimulaidengansatusetdata.Kamimembangunseperangkatdatadenganfirstdeciding
apakasus,atauunit,kitainginbelajar.Untuksetiapkasus,kamirecordinformationtentangkarakteristik yang
kita sebut variabel. Beberapa variabel, seperti nama lagu dan artis hanya menempatkan kasus
intocategories. Lainnya, seperti panjang lagu, ambil nilai-nilai numeris untuk yang kita bisa kerjakan.
Masuk akal untuk memberikan rata-rata waktu untuk lagu collectionof, tetapi tidak masuk akal
memberikan album "rata-rata". Namun, kita bisa menghitung banyaknya lagu-lagu di album yang
berbeda, dan kita bisa mengerjakan ariciewiththese.
Karakteristik utama dari kumpulan data
Secara praktiknya, setiap kumpulan data disertai informasi latar belakang yang membantu kita
memahami data tersebut. Ketika Anda merencanakan studi statistik atau mengeksplorasi data dari
pekerjaan orang lain, tanyakan pada diri sendiri pertanyaan-pertanyaan berikut:
1. Siapa? Apa kasus yang dijelaskan? Berapa banyak kasus yang ditetapkandatanya?
2. Apa?Berapabanyakvariabelyangmengandungdata?Apadefinisiyangtepatdarivariabelini?Apa satuan
pengukuran untuk setiap variabelkuantitatif?
3. Mengapa? Apa tujuan yang dimiliki datanya? Apakah kita berharap untuk menjawab beberapa
pertanyaanspesifik?Apakahkitainginmenarikkesimpulantentangkasusselainyangkitabenar-benar
memiliki data untuk? Apakah variabel yang dicatat cocok untuk tujuan yangdimaksud?
Seringvariabeldalamstudistatistikmudahdipahami:tinggisentimeter,pelajariwaktubeberapamenit, serta
sebagainya. Tetapi setiap daerah pekerjaan juga telah ditaburkan variabel khusus. Seorang psikolog
menggunakan Inventaris Kepribadian Multisains (MMPI), dan langkah pakar kebugaranfisik "VO2 ,"
volume dikonsumsi oksigen per menit saat berolahraga di kapasitas maksimum Anda. Kedua variabel
ini diukur dengan instrumen khusus. VO2 Max diukur dengan berolahraga saat bernapas ke mulut
yang terhubung ke peralatan yang mengukur oksigen yang dikonsumsi. Skor pada MMPI didasarkan
pada kuesioner panjang, yang juga merupakaninstrumen.
instrumen
Bagian dari menguasai bidang pekerjaan Anda adalah mempelajari variabel apa yang penting dan
bagaimana mereka paling diukur. Karena detail ukuran tertentu biasanya membutuhkan pengetahuan
tentang bidang studi tertentu, kita akan mengatakan sedikit tentang mereka. Pastikan setiap variabel
benar-benar mengukur apa yang Anda inginkan. Pilihan variabel yang buruk dapat menyebabkan
menyesatkan kesimpulan. Seringkali, misalnya, tingkat di mana sesuatu terjadi adalah ukuran yang
lebih bermakna daripada jumlah kejadian sederhana.
1.2 Menampilkan Distribusi denganGrafik
Alat dan ide statistik membantu kami memeriksa data untuk menggambarkan fitur utamanya.
Pemeriksaan ini disebut analisis data eksplorasi.
Analisis data eksplorasi
• Mulailah dengan memeriksa setiap variabel dengan sendirinya. Kemudian lanjutkan untuk
mempelajari hubungan antarvariabel.
• Mulailah dengan grafik atau grafik. Kemudian tambahkan ringkasan numerik dari aspek tertentu dari
datanya.
Variabel kategori: grafik batang dan diagram lingkaran
Nilai dari variabel kategori adalah label untuk kategori, seperti “Ya” dan “Tidak”. Distribusi variabel
kategoris mencantumkan kategori dan memberi, baik jumlah atau persentase kasus yang termasuk
dalam setiap kategori.
Distribusi variabel kategori
Kumpulan data yang memiliki sejumlah besar nilai untuk variabel kategori. Dalam membuat kategori
seperti ini yang menyertakan kategori yang memiliki jumlah atau persentase yang relatif kecil,
diperlukan penilaian yang cermat saat melakukannya. Jika tidak ingin menutupi beberapa informasi
penting yang terkandung dalam data, dapat menggabungkan data dengan cara ini.
Penggunaanmetodegrafisakanmemungkinkanuntukmelihatinformasidankarakteristikdatalainnya
denganmudah.
Dalam menggunakan grafik batang, harus selalu mempertimbangkan cara terbaik untuk mengurutkan
nilai kategorikal
Variabel dalam grafik.
Dalam menggunakan diagram lingkaran, harus menyertakan semua kategori yang membentuk
keseluruhan.
Variabel kuantitatif: plot batang
Plotbatang(jugadisebutplotbatangdandaun)memberikangambaransingkattentangbentukdistribusi
sambil memasukkan nilai numerik aktual dalam grafik. Stemplot bekerja paling baik untuk sejumlah
kecil pengamatan yang semuanya lebih besar dari 0. Tujuan dari stemplot adalah untuk menampilkan
bentuk distribusi. Jika ada banyak batang tanpa daun atau hanya satu daun, pemangkasan akan
mengurangi jumlahbatang.
Histogram
Fitur ini membuat stempel canggung untuk kumpulan data besar. Histogram memecah rentang nilai
variabel ke dalam kelas dan hanya menampilkan jumlah atau persentase pengamatan yang masuk ke
setiap kelas. Dapat memilih jumlah kelas yang sesuai, tetapi harus selalu memilih kelas dengan lebar
yang sama.
Memeriksa distribusi
Membuatgrafikstatistikbertujuanuntukmembantudalammemahamidata.Dalamgrafikdataapapun, cari
pola keseluruhan dan penyimpangan yang mencolok dari pola itu. Dengan cara keseluruhan pola
distribusi dengan bentuk, pusat, dan penyebarannya. Jenis penyimpangan yang penting adalah outlier,
nilai individual yang berada di luar polakeseluruhan.
Berurusan dengan outlier
Mengidentifikasi outlier adalah masalah penilaian. Carilah titik yang jelas terpisah dari tubuh data,
bukan hanya pengamatan paling ekstrem dalam suatu distribusi dan harus mencari penjelasan untuk
setiap outlier.
Plot waktu
Setiap kali data dikumpulkan dari waktu ke waktu, adalah ide yang baik untuk memplot pengamatan
dalam urutan waktu. Tampilan distribusi variabel yang mengabaikan urutan waktu, seperti plot batang
dan histogram, dapat menyesatkan bila ada perubahan sistematis dari waktu ke waktu.

 Analisis data eksplorasi menggunakan grafik dan ringkasan numerik untuk menggambarkan
variabel dalam kumpulan data dan hubungan di antaramereka.
 Distribusivariabelmemberitahukitanilaiapayangdibutuhkandanseberapaseringdibutuhkan
nilai-nilai ini.
 Grafik batang dan diagram lingkaran menampilkan distribusi variabel kategori. Grafik ini
menggunakan hitungan atau persentasekategori.
 Stemplot dan histogram ialah memisahkan setiap pengamatan menjadi batang dan daun satu
digit dan memplot frekuensi (jumlah) atau persentase kelas nilai yang samalebarnya.
 Beberapadistribusimemilikibentukyangsederhana,sepertisimetrisataumiring.Jumlahmode
(puncak utama) adalah aspek lain dari bentuk keseluruhan. Tidak semua distribusi memiliki
bentuk keseluruhan yang sederhana, terutama jika ada sedikitpengamatan.
 Pencilanadalahpengamatanyangterletakdiluarpolakeseluruhandistribusi.Selalucarioutlier dan
coba jelaskan.
 Ketika pengamatan pada suatu variabel diambil dari waktu ke waktu, buat plot waktu untuk
menggambarkan waktu secara horizontal dan nilai variabel secara vertikal. Plot waktu dapat
mengungkapkan perubahan dari waktu kewaktu.

1.3 Menggambarkan Distribusi denganAngka


Kitadapatmemulaieksplorasidatakamidengangrafik,tetapianalisisbilanganmakeourlebihspesifik.
Secara singkat dari distribusi harus mencakup bentuknya dan angka yang menggambarkan pusat dan
penyebarannya.Kitamenggambarkanbentukdistribusiberdasarkaninspeksinyaterhadapakronimatau
stemplot. Sekarang kita akan mempelajari cara spesifik untuk menggunakan angka untuk mengukur
pusatdanpenyebarandistribution.Wedapatmenghitunglangkahnumerikiniuntukvariabelkuantitatif.
Tetapi untuk menafsirkan tindakan pusat dan penyebaran, dan memilih di antara beberapa tindakan
yang akan kita pelajari, Anda harus memikirkan tentang bentuk distribusi dan makna data. Angka,
sepertigrafik,adalahalatbantuuntukmemahami,bukan“jawabansecarabersamaandalamdirimereka
sendiri.
Mengukur tengah: rata-rata
Gambaran numerik dari distribusi diawali dengan ukuran pusat atau rata-rata. Dua langkah umum
adalah maksud dan median. Themean adalah “nilai rata-rata” dan rata-rata adalah “nilai tengah.” Ini
adalah dua,
Berbagaiideuntuk“pusat”,dandualangkahberperilakuberbeda.Kamimembutuhkanresepyangtepat untuk
maksud danmedian
SigmaΣ(ibukotaYunani)dirumusnyapendek“menambahmalup.”Bardiatasxmenandakanmaksud semua
nilai seks. Mengucapkan maksud x ¯ sebagai “x-bar.” Bukan ini begitu umum bahwa penulis yang
membahas data penggunaan x ¯, ¯, dll. Tanpa penjelasan tambahan. Subscript tentang observasi x,
merupakan cara menjaga pengamatanterpisah
Oleskan: Liter Kayu
Sebuah ukuran pusat sendirian dapat menyesatkan. Dua negara dengan pendapatan keluarga median
yangsamasangatberbedajikasatumemilikiekstrimkekayaandankemiskinandanyanglainmemiliki sedikit
variasi di antara keluarga. Obat yang diproduksi dengan maksud konsentrasi bahan aktif adalah
berbahaya jika beberapa batch terlalu tinggi dan lainnya terlalu rendah. Kami tertarik pada penyebaran
atau variabilitas pendapatan dan narkoba serta pusat mereka. Deskripsi numerik sederhana yangterdiri
daridistribusiyangterdiridariukuranpusatdanukuranpenyebaran.Kitadapatmenggambarkan
penyebaran atau variabilitas distribusi dengan memberikan beberapa persentil. Median membagi data
padadua;setengahdaripengamatanberadadiatasmediandansetengahberadadibawahmedian.Kami bisa
menyebut median 50th persentil. Literle adalah median bagian atas dari setengah data. Demikian pula,
literle adalah median rendah dari separuh datanya. Dengan rata-rata, literacy tersebut membagi data
ke dalam empat bagian yang sama; 25% dari data yang dimiliki setiapbagian.
Seperempat
Kita bisa melakukan penghitungan yang sama untuk persen apapun. Pth Persentase distribusi adalah
nilai yang memiliki persen pengamatan turun atau di bawahnya. Untuk menghitung persentil, susunan
pengamatan pada peningkatan pesanan dan hitungan hingga diperlukan persen dari bagian bawah
daftar.
Perseratus
Definisi persen kami yang agak tidak persis karena tidak selalu ada nilai dengan tepat p persen data di
atau di bawahnya. Kita akan puas untuk mengambil pengamatan terdekat untuk sebagian besar
persentil, tetapi limbahnya cukup penting untuk membutuhkan aturan yang tepat.
1.4 Pola keseluruhan dari suatu distribusi sering dapat digambarkan secara ringkas oleh kurva
Kepadatan.
Kurva densitas memiliki luas total 1 di bawahnya. Daerah di bawah kurva kepadatan memberikan
proporsi pengamatan untuk distribusi.
Rata-rata (titik keseimbangan), median (titik area yang sama), dan kuartil dapat ditempatkan kira-kira
denganmatapadakurvakepadatan.Simpanganbakutidakdapatditentukandenganmatapadasebagian besar
kurva densitas. Rata-rata dan median sama untuk kurva kepadatan simetris, tetapi rata-rata kurva
miring terletak lebih jauh ke arah ekor panjang daripada median. Distribusi Normal digambarkan oleh
kurva densitas unimodal berbentuk lonceng, simetris. Rata-rata dan simpangan baku secara lengkap
menentukan distribusi normal N(μ,).
Rata-rata adalah pusat simetri, dan adalah jarak dari ke titik perubahan kelengkungan di kedua sisi.
Semua distribusi normal memenuhi aturan 68–95–99.7. Untuk membakukan setiap pengamatan x,
kurangi rata-rata distribusi dan kemudian dibagi dengan standar deviasi. Hasil z-score z = (x – )/σ
menyatakan berapa banyak standar deviasi x terletak dari rata-rata distribusi. Semua NoNorma
Distribusi adalah sama ketika pengukuran ditransformasikan ke skala standar. Jika X memiliki
distribusi N(μ, ), maka variabel standar Z = (X – )/σ memiliki distribusi Normal standar N(0, 1).
Proporsi untuk setiap distribusi Normal dapat dihitung dengan perangkat lunak atau dari tabel normal
standar (Tabel A), yang memberikan proporsi kumulatif Z < z untuk banyak nilai z.
KecukupanmodelNormaluntukmenggambarkandistribusidatapalingbaikdinilaidenganplotkuantil
Normal, yang tersedia di sebagian besar paket perangkat lunakstatistik.
Pola pada plot yang menyimpang secara substansial dari garis lurus menunjukkan bahwa data tidak
Normal.

Anda mungkin juga menyukai