Anda di halaman 1dari 47

#RintisKarirImpian

Introduction to
Statistics
Riza Purnaramadhan
Data Analyst
Agenda

01 Apa Itu Statistika ? 02 Tipe-tipe Data


Pada Statistika
03 Sampel &
Populasi

04 Korelasi vs
Sebab Akibat
05 Statistika
Deskriptif
06 Statistika
Inferensial

#RintisKarirImpian
Agenda

07 Pengujian
Hipotesis

#RintisKarirImpian
Apa Itu Statistika ?

#RintisKarirImpian
Apa Itu Statistika?
Merencanakan

Mengumpulkan
Ilmu yang mempelajari tentang bagaimana
cara merencanakan, mengumpulkan,
mengolah/menganalisis, menginterpretasikan,
dan akhirnya menyajikan/mempresentasikan Menganalisis
data.

Menginterpretasikan

Menyajikan

#RintisKarirImpian
#RintisKarirImpian
Kapan Statistika Digunakan?

Prediksi penjualan di masa yang akan


Adanya Ketidakpastian datang, trend penjualan selalu berbeda
setiap bulan, etc.

Adanya Variansi Terdapat variasi dari sebuah data


penjualan

Peneliti mengambil sampel karena


Adanya Generalisasi
keterbatasan dalam mengambil data
populasi

#RintisKarirImpian
Studi Kasus

Lembaga survei membuka sebuah survei tentang


minat masyarakat di tentang tempat wisata saat
liburan di daerah Yogyakarta, lembaga survei
tersebut mengambil 1000 sampel untuk dijadikan
hasil kesimpulan akhir.

Pada studi kasus diatas ada yang bisa


menyebutkan unsur statistika apa yang ada di
studi kasus diatas?

#RintisKarirImpian
Tipe-tipe Data Pada Statistika

#RintisKarirImpian
Tipe-tipe Data Pada Statistika

Data

Kategorik/Kualitatif Numerik/Kuantitatif
Data Data

Nominal Ordinal Diskrit Kontinu

Numerical or Numerical or
Quantitative Data Quantitative Data

#RintisKarirImpian
Tipe-tipe Data Pada Statistika

Data dibedakan berdasarkan jenisnya :

Data Kategorik : Data Numerik :


- Data non-metric/bukan data - Data yang dapat diukur secara
pengukuran kuantitatif
- Bukan berupa angka - Berupa angka
- Variabel – variabelnya dapat - Menerima operasi matematik
dikelompokan Ex: pendapatan perkapita, harga
Ex: jenis kelamin, Pendidikan, etc jual, etc.

#RintisKarirImpian
Tipe-tipe Data Pada Statistika

Data dibedakan berdasarkan bentuk kuantitatif :

Data Diskrit : Data Kontinu :


- Data yang diperoleh dari hasil - Data yang diperoleh dari hasil
perhitungan pengukuran
- Bentuknya bilangan bulat - Bentuknya bilangan decimal
- Tidak ada sesuatu di - Selalu dalam interval
intervalnya
Ex: berat badan, tinggi badan,
Ex: jumlah kursi di kelas, jumlah jarak, etc.
penduduk, etc

#RintisKarirImpian
Tipe-tipe Data Pada Statistika
Data dibedakan berdasarkan skala pengukurannya :

Nominal : Interval :
- Skala data yang hanya - Tipe data ini memiliki semua ciri yang
digunakan untuk ada di dua tipe data sebelumnya, yang
membedakan membedakannya adalah di tipe data ini
memiliki interval.
Ex: warna, jenis kelamin, etc. - Tidak mempunyai nol mutlak
Ex: suhu, waktu, etc

Ordinal : Rasio :
- Skala data yang digunakan - Level skala data yang paling
untuk membedakan dan tinggi
mengurutkan - Mempunyai nol mutlak
Ex: tingkat pendidikan, rangking, Ex: berat badan, tinggi badan
etc. etc.

#RintisKarirImpian
Studi Kasus

Status pekerjaan mempunyai dua kategori yaitu bekerja


dan pengangguran, termasuk tipe data apa status
pekerjaan tersebut ?

#RintisKarirImpian
Sampel & Populasi

#RintisKarirImpian
Sample & Populasi

Populasi

Populasi:
Sampel
Keseluruhan objek yang akan
diteliti

Sampel:
Bagian dari populasi.

#RintisKarirImpian
Sample & Populasi

Ditinjau dari Populasi Sampel


Keseluruhan objek yang Bagian dari populasi
Pengertian
diteliti
Karakteristik Parameter Statistik

Pengumpulan Data Sensus Sampling

Mengidentifikasi Menduga karakteristik


Fokus
karakteristiknya populasi

#RintisKarirImpian
Studi Kasus
Seorang dosen mengambil sampel yang mana
sampel tersebut adalah 1000 mahasiswa yang
berada di kampus X untuk dijadikan bahan
penelitian.

Pada studi kasus di atas mana yang disebut


populasi ?

#RintisKarirImpian
Korelasi vs Sebab Akibat

#RintisKarirImpian
Korelasi vs Sebab Akibat

Korelasi
adalah ukuran statistik (dinyatakan sebagai angka) yang menggambarkan ukuran
dan arah hubungan antara dua variabel atau lebih. Korelasi antar variabel,
bagaimanapun, tidak secara otomatis berarti bahwa perubahan dalam satu variabel
adalah penyebab perubahan nilai variabel lainnya.

Contoh: Hubungan antara kenaikan harga BBM dengan harga handphone

Sebab-akibat
menunjukkan bahwa satu peristiwa adalah hasil dari terjadinya peristiwa
lainnya; yaitu ada hubungan kausal antara dua peristiwa. Ini juga disebut
sebagai sebab dan akibat.

Contoh: Awan hujan menyebabkan hujan

#RintisKarirImpian
Studi Kasus

Misalnya, Budi mengumpulkan data tentang penjualan es krim dan AC


di kota kelahirannya. Dia menemukan bahwa ketika penjualan es krim
rendah, penjualan AC cenderung rendah dan ketika penjualan es krim
tinggi, penjualan AC cenderung tinggi.

Apakah kasus diatas ada unsur sebab akibat nya ataukah hanya
korelasi ?

#RintisKarirImpian
Studi Kasus

● Budi dapat menyimpulkan bahwa penjualan es krim dan AC


berkorelasi positif.
● Budi tidak dapat menyimpulkan bahwa menjual lebih banyak es
krim menyebabkan lebih banyak AC terjual. Kemungkinan
peningkatan penjualan es krim dan pendingin udara disebabkan
oleh faktor ketiga, peningkatan suhu

Sekalipun ada korelasi antara dua variabel, kita tidak dapat


menyimpulkan bahwa satu variabel menyebabkan perubahan pada
variabel lainnya. Hubungan ini bisa kebetulan, atau faktor ketiga
mungkin menyebabkan kedua variabel berubah.

#RintisKarirImpian
Studi Kasus

#RintisKarirImpian
Statistika Deskriptif

#RintisKarirImpian
Statistika Deskriptif

Statistika Deskriptif:

Sebuah cara untuk mengatur,


mempresentasikan, dan mendeskripsikan
kumpulan data menggunakan tabel, grafik,
dan banyak parameter numerik lainnya,
tanpa menarik kesimpulan tentang
karakteristik dari populasi.

#RintisKarirImpian
Kenapa Statistika Deskriptif Sangat
Penting Bagi Data Scientist ?

#RintisKarirImpian
Pembagian Statistika Deskriptif

Descriptive Statistics

Frekuensi Ukuran Pemusatan Ukuran Penyebaran

- Distribusi Frekuensi - Mean


- Range
- Distribusi Frekuensi - Median
- Varians
Relatif - Modus
- Standar Deviasi
- Distribusi Frekuensi - Quartile
- Etc.
Kumulatif - Etc.

#RintisKarirImpian
Contoh

#RintisKarirImpian
Contoh

#RintisKarirImpian
Contoh

#RintisKarirImpian
Contoh

Modus

1, 2, 5, 5, 5, 3, 4

Maka modusnya adalah

1, 2, 3, 4, 5, 5, 5

Modus = 5

#RintisKarirImpian
Statistika Inferensial

#RintisKarirImpian
Statistika Inferensial

Statistika inferensial merupakan cakupan


seluruh metode yang berhubungan dengan
analisis sebagian data untuk kemudian sampai
pada keputusan, peramalan, estimasi yang
kemudian ditarik kesimpulan mengenai
keseluruhan data induk (populasi) tersebut.

#RintisKarirImpian
Pembagian Statistika Inferensial

Inferential Statistics

Statistika Parametrik Statistika Non Parametrik

#RintisKarirImpian
Statistika Parametrik

Statistik parametrik adalah  suatu teknik statistik


yang dapat digunakan untuk menguji hipotesis
dengan melibatkan parameter populasi.
Statistik parametrik memiliki keterbatasan
penggunaan jenis data yaitu minimal
menggunakan data interval dan rasio.

Kita dapat menggunakan statistik parametrik


apabila kita mengetahui distribusi dari populasi
yang kita amati berdistribusi normal.

#RintisKarirImpian
Statistika Non Parametrik

- Statistika non parametrik adalah salah satu metode


statistik yang dapat digunakan sebagai alternatif apabila
metode statistik parametrik tidak dapat dilakukan.

- Statistik non parametrik tidak melibatkan pendugaan


nilai populasi.

- Tidak ada asumsi kenormalan yang wajib kita penuhi


seperti pada statistik parametrik

#RintisKarirImpian
Contoh Uji
Statistika Parametrik:
- Uji T
- Uji Z
- Anova
- Uji regresi, etc

Statistika Non Parametrik


- Sign Test
- Wilcoxon Test
- Fisher Probability Exact Test
- Etc.

#RintisKarirImpian
Uji Hipotesis

#RintisKarirImpian
Perbedaan Antara Hipotesis Null dan
Hipotesis Alternatif

- Hipotesis null (H0)


Hipotesis null merupakan pernyataan yang akan diuji
kebenarannya. Secara statistik H0 diartikan bahwa tidak
terdapat perbedaan antara karakteristik populasi dan
karakteristik sampel.

- Hipotesis alternatif (H1)


Hipotesis alternatif adalah pernyataan ketika pernyataan
(H0) ditolak. Dengan demikian, secara statistik H1 diartikan
bahwa terdapat perbedaan antara karakteristik populasi
dan karakteristik sampel.

#RintisKarirImpian
Tingkat Signifikansi & p-Value

Tingkat signifikansi
Dinotasikan dengan α, adalah peluang statistik uji berada
di daerah kritis ketika hipotesis nolnya memang benar.
Dengan kata lain, α adalah peluang kita membuat
kesalahan dalam menolak hipotesis nol ketika hipotesis
ini pada kenyataannya benar.

p-Value(Nilai Probabilitas)
dapat diartikan sebagai besarnya peluang (probabilitas)
yang diamati dari statistik uji.

#RintisKarirImpian
Langkah Pengujian Hipotesis Statistika

#RintisKarirImpian
Studi Kasus Uji Hipotesis
A/B Testing
A/B testing adalah eksperimen terhadap dua variabel
(halaman website) atau lebih yang dilakukan secara
bersamaan untuk melihat variabel mana yang
memberikan performa terbaik.

A B

#RintisKarirImpian
A/B Testing

Tujuan nya disini adalah untuk memeriksa


halaman website mana yang membawa
lalu lintas lebih tinggi di situs web, yaitu
tingkat konversi. Kita akan menggunakan
pengujian A/B dan mengumpulkan data
untuk menganalisis buletin mana yang
berkinerja lebih baik.
Misal dalam 1000 pelanggan diambil
sampel dengan jumlah 30 sampel.

#RintisKarirImpian
A/B Testing

#RintisKarirImpian
A/B Testing

6. Kesimpulan
Dengan tingkat signifikansi sebesar 5% dapat kita
simpulkan bahwa dalam pengujian bulletin B berkinerja
lebih baik daripada bulletin A

#RintisKarirImpian
THANK YOU !
ANY QUESTION ?

#RintisKarirImpian
Link Mentoring

https://bit.ly/MentoringFinalProject

#RintisKarirImpian

Anda mungkin juga menyukai