0% menganggap dokumen ini bermanfaat (0 suara)
108 tayangan45 halaman

Konsep Dasar Statistika dan Penerapannya

[Ringkasan] Bab 1 membahas konsep dasar statistika meliputi tujuan, komponen, populasi dan sampel, jenis data, dan metode pengumpulan data. Bab 2 menjelaskan penyajian data melalui tabel dan grafik untuk peubah kategorik dan numerik.

Diunggah oleh

Triana Dewi
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
108 tayangan45 halaman

Konsep Dasar Statistika dan Penerapannya

[Ringkasan] Bab 1 membahas konsep dasar statistika meliputi tujuan, komponen, populasi dan sampel, jenis data, dan metode pengumpulan data. Bab 2 menjelaskan penyajian data melalui tabel dan grafik untuk peubah kategorik dan numerik.

Diunggah oleh

Triana Dewi
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai PDF, TXT atau baca online di Scribd

BAB 1: KONSEP DASAR STATISTIKA

Mengapa Statistika 2. Deskripsi :


meringkas dan
o Statistika merupakan seni
menganalisis data
& ilmu yang merancang,
3. Kesimpulan :
menganalisis &
membuat keputusan &
menyimpulkan data.
prediksi
o Tujuan statistika adalah
mempelajari seluk beluk
Pengertian populasi & Sampel

o Populasi merupakan
keseluruhan
objekpengamatan yang
data sehingga data lebih menjadi pusat perhatian.
mudah untuk dipahami. Ex: Seluruh mahasiswa
PPKU
Statistical Problem Solving
o Parameter merupakan
meliputi 4 komponen proses :
karakteristik numerik dari
1. Merumuskan statistical
populasi.
Question
o Sampel merupakan
2. Mengumpulkan data
himpunan bagian dari
3. Menganalisis Data
populasi (perwakilan).
4. Menginterpretasikan hasil
Ex: Sebagian mahasiswa
analisis Data
PPKU yang menjadi objek
pengukuran.
3 Main Components of
o Statistik merupakan
Statistics:
Karakteristik numerik dari
1. Desain : menyatakan
sampel yang digunakan
tujuan, pertanyaan
sebagai penduga bagi
statistik dan bagaimana
parameter.
cara memperoleh data
Statistika Deskriptif & c. Berisi pendugaan &
Inferensia pengujian hipotesis

1. Statistika Deskriptif
Peubah dan Skala Pengukuran
a. Mempelajari teknik-
teknik yang berguna
o Peubah merupakan
dalam peringkasan data
karakteristik dari objek
dan pemberian
yang diamati.
gambaran umum
o Database : kumpulan
tentang data yang
peubah (Peubah analisis &
dimiliki.
Peubah identitas.
b. populasi – sampel >
Sampling
Skala pengukuran peubah
c. Berisi penyajian data
A. Kualitatif : hasil
(grafik & tabel) &
pencatatan
peringkasan data (min,
1. Nominal :
max, rata2, median,
mengklasifikasikan
modus, ragam,
Ex : jenis kelamin &
simpangan baku)
agama
2. Ordinal :
2. Statistika Inferensia
mengklasifikasikan &
a. Mempelajari kaidah-
mengurutkan
kaidah pengambilan
Ex : tingkat Pendidikan
keputusan statistika
& skala likert
dengan menggunakan
ilmu peluang.
b. sampel – Inferensia >
B. Kuantitatif : hasil
populasi
pengukuran
1. Interval : Ex : Jumlah
mengklasifikasikan, anak,dsb
mengurutkan & b. Kontinyu : hasil
membedakan pengukuran
Ex : skor intelegensi & Ex : Berat badan,
suhu dsb.
2. Rasio :
mengklasifikasikan, Data & Metode Pengumpulan
mengurutkan, Data
membedakan & o Data merupakan himpunan
membandingkan hasil pengukuran
Ex: umur & berat badan. karakteristik dari seluruh
Tip peubah objek yang menjadi fokus
A. Berdasarkan skala penelitian.
pengukuran o Data menurut periode
1. Kategorik : nominal & pengukuran
ordinal 1. Data Cross-section :
2. Numerik : Interval & terhadap beberapa
rasio objek pada lokasi dan
B. Berdasarkan jenis periode waktu tertentu.
1. Kategorik : ditentukan 2. Data Time series :
dalam grup atau terhadap suatu objek
kelompok dan mengikuti urutan
Ex : status marginal, waktu.
warna mata, dll. 3. Data panel : terhadap
2. Numerik : berisi angka- beberapa objek &
angka berarti mengikuti urutan waktu.
a. Diskret : hasil
perhitungan
4. Data space-time : pada Ketersediaan data secara
beberapa lokasi dan natural : data yg terekam
mengikuti urutan waktu. secara otomatis.

Pengumpulan data Big Data : Data sangat


Data Mechanistic besar dan kompleks, tidak
1. Percobaan dapat dikelola secara
o dibangkitkan dengan konvensional sehingga
memberikan dibutuhkan skill baru dalam
perlakuan terhadap analisis data.
suatu objek. 1. Volume : data sangat
o Penerapan : besar
penelitian pada 2. Variety : banyak jenis
pertanian/IPA/psikolo 3. Velocity : berubah cepat
gi
2. Survey Penerapan Statistika
o sudah tersedia di 1. Ekonomi
alam, tinggal Ex : Pertumbuhan
dikumpulkan ekonomi
o Penerapan : bidang 2. Bisnis
sosial ekonomi /non Ex : Startup statistics
IPA 3. Politik
3. Administratif Ex : Quick count
o diperoleh dari hasil 4. Iklim
pencatatan Ex : Peluang curah
administrasi suatu hujan bulanan
institusi.
o Ex : Data transaksi
perbankan, dsb.
BAB 2 : PENYAJIAN DATA

Tabel dan Grafik Peubah kategorik o Menunjukkan frekuensi


atau presentase tiap
A. Tabel
kategori.
1. Tabulasi Satu Peubah: Tabel
Distribusi Frekuensi
o peubahnya berupa kategori

2. Tabulasi dua peubah: Cross


2. Diagram pareto
Table /Tabulasi Silang/Tabel
o kombinasi antara bar chart
Kontingensi
(diurutkan dari tertinggi) &
o Memuat daftar jumlah
poligon kumulatif.
amatan dari setiap
o Memisahkan vital few dari
kombinasi dari nilai dua
trivial many.
peubah kategorik.
o Jika ada r kategori untuk
baris dan c kategori untuk

B. Grafik
1. Diagram batang dan diagram
kolom, maka r x c cross
lingkaran
table.
Tabel dan Grafik Peubah Numerik c. Jumlah kelas lebih dari 5
dan tidak lebih dari 15.
A. Satu Peubah
Note : Sturgis’s Rule
1. Line Chart
Jumlah kelas =
o Menunjukkan nilai-nilai
3.3log(n)+1
peubah seiring berjalannya
d. Kelas interval tidak
waktu.
tumpeng tindih dan
o Peubah pada axis vertical &
dibulatkan.
o Langkah :
1. Urutkan data dari kecil ke
besar
2. Hitung jangkaun data
Waktu pada axis horizontal.
3. Pilih jumlah kelas
4. Hitung lebar kelas
2. Tabel Distribusi Frekuensi
5. Tentukan Batas Kelas
o Berisi jangkauan kelas dan
6. Tempatkan pada kelas
frekuensi kemunculan data
di kelas tersebut.
o Digunakan untuk interpretasi
visual data lebih cepat.
o Ketentuan class interval &
class boundaries :
masing-masing.
a. Kelas interval sama di
setiap kelas.
b. Class Interval = 3. Histogram
o Grafik dari tabel distribusi
max − 𝑚𝑖𝑛 frekuensi.
𝑗𝑢𝑚𝑙𝑎ℎ 𝑘𝑒𝑙𝑎𝑠 𝑦𝑎𝑛𝑔 𝑑𝑖𝑖𝑛𝑔𝑖𝑛𝑘𝑎𝑛
o Axis horizontal : garis
akhir interval
o Axis vertical : frekuensi, yang tidak terlalu bergerigi
frekuensi relative & atau rata sehingga pola
persentase. variasi data tepat.
o Tinggi batang mewakili
4. Ogive
jumlah amatan di setiap
menggambarkan frekuensi
kelas.
kumulatif.
o Note :
Distribusi Data
Lebar kelas
a. Banyak/interval kelas 1. Miring negatif memiliki
sempit : menghilangkan ekor memanjang ke kiri.
distribusi yang tidak rata 2. Simetris jika pengamatan
sehingga mengurangi seimbang (menyebar data
variasi frekuensi antar mulai dari tengah)
kelas. 3. Miring positif memiliki ekor
b. Sedikit/ interval kelas memanjang ke kanan.
lebar: Menghilangkan
keragaman dan
mengaburkan pola
variasi penting.

Garis akhir interval


ditentukan untuk
menciptakan distribusi 5. Diagram dahan daun :
Untuk melihat sebaran data
secara detil suatu set data.
Langkah-langkahnya :
a. Pisahkan seri data menjadi
digit terdepan (dahan) & digit
berikutnya (daun).
b. Menggunakan angka ratusan
sebagai dahan, maka
bulatkan angka puluhan untuk
membentuk daun.

B. Dua Peubah
1. Diagram Pencar/ Scatter Plot
Untuk observasi
berpasangan yang diambil

dari dua peubah numerik yang


diletakkan pada axis
horizontal dan vertikal.
BAB 3: DESKRIPSI DATA

Ukuran Pemusatan segmen sama. (dirutkan terlebih


dulu)
1. Mean :
Menimbang data menjadi 2
Metode belah dua
kelompok data yg memiliki
massa yg sama.
Dipengaruhi nilai ekstrim
(outliers)
Q2 = Median (Q1 dari kiri)

Metode interpolasi

2. Median : titik tengah data yg


telah diurutkan. (tidak
dipengaruhi nilai ekstrim)

Bentuk sebaran

3. Modus :
Nilai yg paling sering
muncul.
tidak dipengaruhi nilai
ekstrim
untuk data numerik dan
kategorik.

4. Kuartil : membagi data menjadi 4


bagian sama dg jumlah data per
4. Ragam contoh
Rata-rata dari kuadrat jarak
antara nilai amatan dan Mean

A. Ukuran Penyebaran
1. Range/jangkauan 5. Simpangan baku populasi
Menunjukkan keragaman

Kelemahan : terhadap mean

a. tidak memperhatikan pola Satuan yg sama dengan data

distribusi data awal.

b. sensitive terhadap pencilan

2. Jangkauan InterKuartil
Mengeliminasi masalah
outlier
6. Simpangan baku contoh
Hanya memperhitungkan
50% data di tengah.

3. Ragam populasi
Rata-rata dari kuadrat jarak Mengukur Keragaman
antara nilai dan Mean
Kelebihan Ragam & Simpangan Mengukur kekuatan hub. Linier
Baku diantara 2 peubah
Populasi
1. Tiap nilai pada data digunakan
dalam perhitungan
2. Nilai yang jauh dari Mean
diberikan bobot yang lebih Contoh
(karena selisih dari Mean
dikuadratkan)

Interpretasi Covariance
The Empirical Rule

Jika data menyebar normal, maka:

Aproksimasi u/ data berkelompok


Coefficient of Variation
1. Populasi untuk N amatan
Mengukur variasi relatif antara
ragam terhadap mean dalam bentuk
persentase.

2. Sampel untuk n amatan

digunakan
untuk
membandingkan 2 atau lebih set
data yg diukur dalam satuan yg
berbeda.

Covariance
A. pengertian

Eksplorasi data adalah langkah awal untuk memvisualisasikan data


agar karakteristik data lebih mudah dipahami.

1. BOXPLOT
Sebagai alat pembandingan sebaran dua kelompok data atau
lebih yang memperhatikan pencilan.
Langkah teknis pembuatan Boxplot:
o Hitung
statistik lima serangkai : Min, Q1 , Q2 , Q3 , Max
Pagar Dalam Atas (PDA) : Q3 +1.5(Q3 -Q1 ) = Q3 +1.5(IQR)
Pagar Dalam Bawah (PDB) : Q1 – 1.5(Q3 -Q1 ) = Q1 –
1.5(IQR)
o Identifikasi data
Jika data < PDB atau data > PDA maka data dikatakan
memiliki Pencilan
o Gambar
Kotak dengan batas Q1 dan Q3
Jika Tidak ada Pencilan, maka Tarik garis dari Q1 sampai
data terkecil dan tarik garis dari Q3 sampai data terbesar
Jika ada Pencilan Tarik garis Q1 dan atau Q3 sampai data
sebelum pencilan
Pencilan digambarkan dengan asterisk

2. HISTOGRAM
Untuk melihat adanya data outlier dan mendeteksi adanya
bimodus.
3. SCATTER PLOT
o grafik yang menggunakan titik untuk mewakili nilai dua
peubah numerik yang berbeda.
o Posisi setiap titik menunjukkan nilai untuk satu titik data.
o digunakan untuk mengamati hubungan antar variabel.

B. Eksplorasi kualitas data => identifikasi keberadaan nilai


ekstrem
o Nilai ekstrem (pencilan/outlier) adalah titik data yang tersebar
di ekor distribusi suatu data.
o Histogram with Boxplot

o Scatter Plot

o Pencilan terdiri dari 2 jenis : Univariat & Multivariat


C. Eksplorasi pola sebaran data
Dilakukan dengan menggunakan boxplot dan histogram serta
statistika lima serangkai.

Untuk membuat histogram dan boxplot, pada dasarnya tetap dibuat


secara individual dan terpisah untuk setiap grup dan menempatkannya
pada sumbu yang sama serta skala yang digunakan harus identik.

EKSPLORASI PERBANDINGAN ANTAR GRUP => SCATTER PLOT

1. Nonlinier Relationship
o Menunjukkan dua peubah yang
mmiliki hub. Nonlinier di antara
keduanya.
o Dimulai dengan nilai X
negative, dengan meningkatnya X,
Y pada awalnya turun, lalu ketika X
meningkat, Y meningkat.
2. Correlation = 0.9
o memiliki hubungan linier positif
yang kuat.
o menunjukkan kecenderungan
semakin naik nilai X maka nilai Y
juga akan semakin meningkat.
o Garis lurus adalah garis tren,
dirancang sedekat mungkin dengan semua titik data.

3. Correlation = 0.2
o Memiliki hubungan linier positif
lemah.
o Titik-titik pada grafik lebih
tersebar di sekitar garis tren, karena
hubungan yang lebih lemah antara
X dan Y.

4. Correlation = -0.9
o memiliki hubungan linier negatif
yang kuat.
o menunjukkan kecenderungan
yang sangat kuat untuk X dan Y
dengan arah yang berlawanan,
semakin naik nilai X maka nilai Y
semakin menurun
Correlation = -0.2

o memiliki hubungan linier negatif


lemah.
o titik-titik pada grafik lebih
tersebar di sekitar garis tren
daripada di gambar sebelumnya,
karena hubungan yang lebih lemah
antara X dan Y.

Note:Jika tidak ada hubungan yang jelas antara kedua peubah, maka
dapat katakan tidak ada

korelasi antara kedua peubah tersebut.


A. Analisis hubungan dua peubah kategorik
1. Tabel frekuensi dua arah

Mencantumkan jumlah pengamatan untuk setiap kombinasi


nilai.
Contoh pengujian tabel kontingensi:

- Jika H0 benar, proporsi perempuan kidal = proporsi laki-laki


kidal.
- Kedua proporsi = proporsi keseluruhan.
2. Ukuran Asosiasi Dua Peubah Kategorik Berskala Ordinal
o Ukuran asosiasi : ukuran keeratan hubungan antar peubah
kategorik.
a. Chi-square
b. Tau-Kendall

c. Somer

d. Gamma

o Ideology & Voting


Ideology – conserve (1), moderate (2), liberal (3)
Voting – never (1), sometimes (2), often (3)

o Concordant : urutan kejadian yang sama pada kedua peubah

yang dianalisis.
o Discordant : urutan kejadian yang berbeda pada kedua

peubah yang dianalisis.


o Ties : urutan kejadian yang stidak berubah pada kedua
peubah yang dianalisis
a. Ties X : peubah kategorik pertama
b. Ties X : peubah kategorik kedua

B. Analisis hubungan dua peubah numerik


1. Line chart
2. Korelasi : ukuran keeratan hubungan antar peubah numerik
a. Peringkat sperman
o Koefisien korelasi spearman, rs, mengukur aaosiasi
antara dua peubah yang skala ordinal

b. Pearson/korelasi product moment


o Koefisien korelasi pearson, r, mengukur hubungan
linier antara dua peubah yang skala interval/rasio
o Populasi

o Sampel

c. Nilai r berada dalam selang -1,0 sampai +1.0


1. Mendekati 1.0 : indikasi asosiasi positif yang kuat
2. Mendekati -1.0 : indikasi asosiasi negatif yang kuat
3. Mendekati 0 : semakin lemah hubungan liniernya
d. Macam-macm koefisien korelasi
BAB 7: ANALISIS REGRESI

A. Pengertian dan tujuan


o Analisis hubungan sebab akibat : Analisis regresi
o Memprediksi nilai peubah dependen berdasarkan nilai
setidaknya satu peubah independent dan menjelaskan dampak
perubahan peubah independent terhadap peubah dependen
o Peubah bebas/eksogen (Independen variable) : peubah yang
menjelaskan peubah tak bebas
o Peubah tak bebas/endogen (Dependen variable) : peubah yang
ingin dijelaskan

B. Model Regresi
o Perubahan di Y diasumsikan disebabkan oleh perubahan di X
C. Regresi Linier Sederhana
a. Formulasi Model
o Persamaan untuk menduga garis regresi populasi

b. Pendugaan parameter model


1. Penduga Kuadrat Terkecil => meminimalkan jumlah kuadrat

o Penduga koefisien slope


o Konstanta/Intersep
o Garis regresi selalu melewati rataan X dan Y
o Menentukan prsamaan kuadrat terkecil :Hitung koef. b0 dan
b1, dan hasil regresi
o Asumsi Model regresi linier
a. Y adalah fungsi linier dari X, ditambah galat acak (random
error)
b. Komponen galat : peubah acak dengan rataan 0 dan
ragam konstan 𝜎 2
c. Homoskedastisitas : ragam yg konstan

d. Komponen galat acak, 𝜀𝑖 tidak saling berkorelasi (bebas)

e. Interpretasi slope dan intersep

Anda mungkin juga menyukai