Anda di halaman 1dari 7

Nama :

NIM:

Kelas:

Video 4: Simetri dan Kemiringan

Merupakan sebuah bentuk dari distribusi. Histogram, stemplots, boxplots dapat digunakan
ketika membahas mengenai Simetri dan Kemiringan. Sebuah distribusi dapat dikatakan
menjadi simetris apabila dapat dibagi menjadi dua bentuk yang sama besar (simetris).
Sebaliknya, bentuk distribusi yang tidak simetris dikategorikan sebagai distribusi miring
(skewed distribution). Berikut contoh gambar simetri dan kemiringan:

Sumber: Google

Jika sebagian besar data berada di sisi kiri histogram tetapi beberapa nilai yang lebih besar
berada di sisi kanan, data tersebut dikatakan miring ke kanan.

Histogram A pada gambar menunjukkan contoh data yang miring ke kanan. Beberapa nilai
yang lebih besar membawa rerata ke atas tetapi tidak benar-benar memengaruhi median. Jadi,
jika data miring ke kanan, mean lebih besar dari median. Contoh dari data tersebut adalah
gaji tim NBA di mana pemain bintang menghasilkan lebih banyak daripada rekan satu tim
mereka.

Jika sebagian besar data berada di kanan, dengan beberapa nilai yang lebih kecil muncul di
sisi kiri histogram, data miring ke kiri.
Histogram B pada gambar menunjukkan contoh data yang miring ke kiri. Beberapa nilai yang
lebih kecil menurunkan rata-rata, dan median terpengaruh secara minimal (jika ada). Contoh
data miring-kiri adalah jumlah waktu yang digunakan siswa untuk mengikuti ujian; beberapa
siswa pergi lebih awal, lebih banyak dari mereka tinggal lebih lama, dan banyak yang tinggal
sampai akhir yang pahit (beberapa akan tinggal selamanya jika mereka bisa!). Jika data
miring ke kiri, mean lebih kecil dari median.

Jika datanya simetris, mereka memiliki bentuk yang hampir sama di kedua sisi tengahnya.
Dengan kata lain, jika kita melipat histogram menjadi dua, histogram terlihat hampir sama di
kedua sisi.

Histogram C pada gambar menunjukkan contoh data simetris. Dengan data simetris, mean
dan median saling berdekatan.

Video 5: Explanatory and Response Variables, Correlation (2.1) / Variabel Penjelasan,


Variabel Respon, dan Korelasi

Variabel penjelasan (Explanatory Variable)


Variabel yang digunakan untuk menjelaskan variabilitas dalam variabel respon,
disebut juga variabel independen atau variabel prediktor; Dalam sebuah penelitian
eksperimental, ini adalah variabel yang dimanipulasi oleh peneliti.

Variabel respon (Response Variable)


Variabel hasil, juga dikenal sebagai variabel dependen.

Scatterplot
Representasi grafis dari dua variabel kuantitatif di mana variabel penjelas berada
pada sumbu x dan variabel respons pada sumbu y. Scatterplot juga dapat
digunakan untuk menampilkan hubungan antara variabel penjelas dan variabel
respons. Atau, diagram sebar dapat digunakan untuk memeriksa hubungan antara
dua variabel dalam situasi di mana tidak ada variabel penjelas dan tanggapan yang
jelas. Misalnya, kami mungkin ingin memeriksa hubungan antara tinggi dan berat
dalam sampel tetapi tidak memiliki hipotesis tentang variabel mana yang
memengaruhi variabel lainnya; dalam hal ini, tidak masalah variabel mana yang
berada pada sumbu x dan variabel mana yang berada pada sumbu y.

Saat memeriksa persebaran, kita perlu mempertimbangkan hal berikut:

1. Arah (positif atau negatif)


2. Bentuk (linier atau non-linier)
3. Kekuatan (lemah, sedang, kuat)
4. Bivariate Outliers
Pada hubungan linier ketika garis paling cocok untuk menggambarkan hubungan
antara x dan y adalah garis lurus. Hubungan linier antara dua variabel menjadi
positif ketika keduanya meningkat bersama-sama; dengan kata lain, karena nilai x
semakin besar nilai y semakin besar. Ini juga dikenal sebagai hubungan langsung.
Hubungan linier antara dua variabel menjadi negatif ketika satu meningkat
sementara yang lain menurun. Misalnya, karena nilai x semakin besar nilai y
semakin kecil. Ini juga dikenal sebagai hubungan tidak langsung.

Bivariate Outliers
adalah pengamatan yang tidak sesuai dengan pola umum pengamatan lainnya.
Bisa saja tidak terdapat variabel respon dan variabel penjelasan apabila
variabel yang dibandingkan tidak memiliki hubungan

Korelasi (r)

Ukuran arah dan kekuatan hubungan antara dua variabel.

Rumus Korelasi Pearson :

Properti Pearson's r
1. −1≤r≤ + 1−1≤r≤ + 1
2. Untuk asosiasi positif, r> 0r> 0, untuk asosiasi negatif r <0r <0, jika tidak ada
hubungan r = 0r = 0
3. Semakin dekat rr ke 00 semakin lemah hubungannya dan semakin dekat ke + 1
+ 1 atau −1−1 semakin kuat hubungannya (misalnya, r = −0.88r = −0.88
adalah relasi yang lebih kuat dari r = + 0.60r = + 0,60); tanda korelasi hanya
memberikan arah
4. Korelasi adalah unit gratis; variabel xx dan yy TIDAK perlu dalam skala yang
sama (misalnya, dimungkinkan untuk menghitung korelasi antara tinggi dalam
sentimeter dan berat dalam pon)
5. Tidak masalah variabel mana yang kita beri label sebagai xx dan yang kita beri
label yy. Korelasi antara xx dan yy sama dengan korelasi antara yy dan xx.
Video 6: Kurva kepadatan dan propertinya

• Kurva kepadatan selalu di atas atau di atas sumbu horizontal.

• Area di bawah kurva kepadatan tepat 1.

• Area di bawah kurva kepadatan dan di atas rentang nilai apa pun adalah frekuensi relatif
dari semua pengamatan yang termasuk dalam kisaran itu.

Properti kurva kepadatan adalah:

1. Selalu positif
2. dan ∫∞ − ∞f (x) d (x) = 1
3. Jadi fungsi kerapatan F (∞) = 1 kecuali jika dibatasi. jika a adalah batas atas untuk x
maka. F (a) = 1 dimana f (x≥a) = 0

Kurva kepadatan dapat berupa beberapa bentuk ataupun bermacam ukuran, dan tiap-tiap
jenis kurva kepadatan memiliki namanya sendiri, contohnya:

1. Uniform Distribution
Tiap interval mempunyai frekuensi nilai data yang sama dan seragam pada seluruh
data set
2. Triangular Distribution
Bentuknya mirip dengan segitiga
3. Normal Distribution (Bell Curves)
Merupakan kurva kepadatan paling umum dan terpenting dalam statistika
VIDEO 7

The Normal Distribution and The 68-95-99.7 Rule

Distribusi normal adalah distribusi probabilitas kontinu yang simetris pada kedua sisi mean,
sehingga sisi kanan tengah merupakan bayangan cermin dari sisi kiri. Area di bawah kurva
distribusi normal mewakili probabilitas dan total area di bawah kurva berjumlah satu.
Sebagian besar nilai data kontinu dalam distribusi normal cenderung mengelompok di sekitar
mean, dan semakin jauh nilai dari mean, semakin kecil kemungkinannya untuk terjadi.
Ekornya asimtotik, yang berarti bahwa mereka mendekati tetapi tidak pernah benar-benar
memenuhi cakrawala (yaitu sumbu x).

Kurva berbentuk lonceng

Distribusi normal adalah distribusi probabilitas terpenting dalam statistik karena banyak data
kontinu di alam dan psikologi menampilkan kurva berbentuk lonceng ini ketika disusun dan
dibuat grafiknya. Misalnya, jika kita mengambil sampel 100 orang secara acak, kita akan
melihat kurva frekuensi distribusi normal untuk banyak variabel kontinu, seperti IQ, tinggi
badan, berat badan, dan tekanan darah.

Uji signifikansi parametrik memerlukan distribusi normal dari titik data sampel

Tes statistik (parametrik) paling kuat yang digunakan oleh psikolog membutuhkan data untuk
didistribusikan secara normal. Jika data tidak menyerupai kurva lonceng, peneliti mungkin
harus menggunakan jenis uji statistik yang kurang efektif, yang disebut statistik non-
parametrik.

Untuk distribusi normal sempurna, mean, median, dan mode akan memiliki nilai yang sama,
yang secara visual diwakili oleh puncak kurva.

Distribusi normal menjadi lebih jelas (yaitu sempurna) semakin baik tingkat pengukurannya
dan semakin besar sampel dari suatu populasi. kita dapat menghitung koefisien yang
memberi tahu kami tentang ukuran ekor distribusi dalam kaitannya dengan tonjolan di tengah
kurva lonceng. Misalnya, tes Kolmogorov Smirnov dan Shapiro-Wilk dapat dihitung
menggunakan SPSS.
Tes ini membandingkan data dengan distribusi normal dan memberikan nilai p, yang jika
signifikan (p <.05) menunjukkan data kita berbeda dengan distribusi normal (oleh karena itu,
pada kesempatan ini kami tidak menginginkan hasil yang signifikan dan memerlukan p-value
lebih tinggi dari 0,05).

Distribusi normal biasanya dikaitkan dengan aturan 68-95-99.7 dimana 68% data berada

dalam 1 standar deviasi (σ) dari mean (μ), 95% data berada dalam 2 standar deviasi (σ) dari

mean (μ), dan 99,7% data berada dalam 3 standar deviasi (σ) dari mean (μ).

VIDEO 8

Z Scores, Standardization and The Standard Normal Distribution

Sederhananya, skor-z (juga disebut skor standar) memberi kita gambaran tentang
seberapa jauh titik data dari mean. Tapi yang lebih teknis, ini adalah ukuran dari berapa
banyak deviasi standar di bawah atau di atas populasi yang berarti skor mentahnya.

Skor-z dapat ditempatkan pada kurva distribusi normal. Nilai Z berkisar dari -3 standar
deviasi (yang akan jatuh ke paling kiri dari kurva distribusi normal) hingga +3 standar deviasi
(yang akan jatuh ke paling kanan dari kurva distribusi normal). Untuk menggunakan skor-z,
Anda perlu mengetahui mean μ dan juga deviasi standar populasi σ.

Skor-Z adalah cara untuk membandingkan hasil dengan populasi "normal". Hasil dari tes atau
survei memiliki ribuan kemungkinan hasil dan unit; hasil tersebut seringkali tampak tidak
berarti. Misalnya, mengetahui bahwa berat seseorang 150 pon mungkin merupakan informasi
yang baik, tetapi jika kita ingin membandingkannya dengan berat badan “rata-rata” orang,
melihat tabel data yang sangat banyak dapat membuat kitakewalahan (terutama jika beberapa
bobot dicatat dalam kilogram) . Skor-z dapat memberi tahu kita di mana berat badan orang itu
dibandingkan dengan rata-rata berat badan populasi.

Rumus skor z dasar untuk sampel adalah:


z = (x – μ) / σ
Skor z memberi tahu kita berapa banyak deviasi standar dari rata-rata skor.
alternatif-z-skor dapat melihat rumus skor z ditampilkan di sebelah
kiri. Rumus ini persis sama dengan z = x - μ / σ, kecuali bahwa x̄
(mean sampel) digunakan sebagai pengganti μ (mean populasi) dan
s (deviasi standar sampel) digunakan sebagai pengganti σ (standar populasi) deviasi).

Secara teknis, skor-z adalah jumlah deviasi standar dari nilai rata-rata populasi referensi
(populasi yang nilai-nilainya diketahui telah dicatat, seperti dalam bagan ini yang
dikumpulkan CDC tentang bobot orang). Sebagai contoh:

1. Skor-z 1 adalah 1 deviasi standar di atas rata-rata.


2. Skor 2 adalah 2 deviasi standar di atas rata-rata.
3. Skor -1,8 adalah -1,8 standar deviasi di bawah rata-rata.
Skor-z memberi tahu kita di mana skor tersebut berada pada kurva distribusi normal. Skor z
nol memberi tahu kita bahwa nilainya persis rata-rata sementara skor +3 memberi tahu kita
bahwa nilainya jauh lebih tinggi daripada rata-rata.

Anda mungkin juga menyukai