Anda di halaman 1dari 65

Disusun oleh :

Team Coach Data


Kode Materi : Science
SN-07-01
SN-07-02 BASIC STATISTIC
SN-07-03

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Menu Hari ini

Apa itu Statistik

Statistik Deskriptif

Distribusi Statistik

Statistik Inferensial Dasar


Session I
Apa itu Statistik?

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Apa itu Statistika?

Ilmu yang berkaitan dengan pengumpulan,


penataan, penyajian, analisis, dan
interpretasi data menjadi informasi untuk
Lantas, kalau statistik apa, ya?
membantu pengambilan keputusan yang
efektif.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Statistik

Statistik ada hubungan dengan


pengukurannya, seperti: mean,
median, modus, dll.

Penyajian data statistik dapat


berbentuk tabel, grafik, diagram,
deretan angka dan visualisasi angka

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Statistik vs Statistika

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Data

Cara
memperoleh Waktu
Sumber pengambilan

Sifat

Time Cross
Primer Sekunder Skala Internal Eksternal Series Section
pengukuran

Kualitatif Kuantitatif

Diskrit Kontinu Nominal Ordinal Interval Rasio

AI for Gen Y and AI for Start-Up


Step of Statistics

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Aktifitas Statistika

Deskriptif Inferensial

Mendeskripsikan dan menganalisis Menganalisa sampel untuk


sampel data tanpa melakukan mengestimasi dan membuat
proses penarikan kesimpulan kesimpulan mengenai populasi

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Populasi, Sampel, Teknik Sampling

Sumber gambar :
https://datatab.net/tutorial/descriptive-inferent
ial-statistics
Teknik Sampling

Probability Sampling vs Non-Probability Sampling

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Seberapa banyak sampel yang dibutuhkan?

Bergantung pada :
● Apakah populasinya berhingga atau tidak? Homogen/heterogen? (jika tak hingga dan
heterogen tentu butuh lebih banyak sampel)
● Teknik sampling yang digunakan
● Kebiasaan kasus di tiap domain ilmu
misalnya dalam kasus kesehatan, menemukan data pasien penyakit tertentu sangat sulit
sehingga 5-10 data sudah cukup
● Metode analisis/model yang akan digunakan.
Model yang nonlinier seperti neural network cenderung membutuhkan lebih banyak data
dibandingkan regresi linier.
Jika menggunakan machine learning, belum ada teori pasti minimal sampelnya (baca :
https://sites.uab.edu/periop-datascience/2021/06/28/sample-size-in-machine-learning-an
d-artificial-intelligence/
) namun jika menggunakan metode statistik, ada beberapa rumus yang bisa digunakan:

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh rumus ukuran sampel
yang terkenal

Rumus Slovin : Rumus Lemeshow: Rumus Cochran:

N = total populasi z = nilai z (tabel


e = margin error dari normal) z = nilai z (tabel dari
(misalnya 5%) e = margin error normal)
(misalnya 5%) e = margin error
p = proporsi (misalnya 5%)
kategori p 𝛔2 = varians dari
populasi
Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Session II
Statistik Deskriptif, Distribusi,
Statistika Inferensial

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Ada yang masih
ingat apa itu Statistik
Deskriptif?

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Measures of Central
Tendency

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Bagaimana mendapatkan beberapa
informasi, tanpa membaca poin data?

Mean Median Mode

Jumlah semua Bilangan tengah Nilai yang paling


nilai dalam suatu dari sekumpulan sering dalam
himpunan, dibagi bilangan yang satu set.
dengan jumlah disusun menurut
nilai. urutan bilangan.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh 1

Kita punya data :


Data = {1, 1, 1, 2, 2, 3, 3, 3, 100}
Mean = 1+1+1+2+2+3+3+3+100 = 24
9

Trimmed Mean = 1+1+2+2+3+3+3 = 2.14


7

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh 2

Median : Median tidak terpengaruh oleh nilai ekstrim (outlier)

Data = {9, 13, 7, 5, 21, 23, 39, 23, 40, 23}


Tugas :
- Urutkan dataset
{5, 7, 9, 13, 21, 23, 23, 23, 39, 40}
Formula : med =
Ganjil Genap
Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh 3

Data : {1, 1, 2, 3, 5, 8}

Mode = 1 (unimodal)

Data = {1, 3, 5, 7, 9, 9, 21, 25, 25, 31}

Mode = 9 and 25 (bimodal)

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Measures of Dispersion

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Mengambil “insight” suatu data
dari sebaran data

Standard
Range Variance IQR
Deviation

Selisih antara Ukuran Jarak antara titik Jarak antara


nilai terbesar dan bagaimana item data ke rata- kuartal 1 dan
terkecil dari suatu tersebar tentang ratanya. kuartal 3
himpunan. rata-rata mereka.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh 1

Range

Range : sangat rentan terhadap nilai extreme (outliers)

Alternatif : IQR = Q3 - Q1

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh 2

Variance

Standard
Deviation

Note: pembagi yang “n-1” itu untuk sampel, “n” itu buat populasi, aslinya standar deviasi ya akar dari
varians jadi rumusnya sama tinggal dipakein akar yang buat stdv)
Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh 3

Kuartil Median dan Kuartil

Kuartil 1 Median/Kuartil 2 Kuartil 3


(Lower Quartile) (Middle Quartile) (Upper Quartile)

25% 25% 25% 25%

Jarak
Interkuartil
Proprietary document of Orbit Future Academy, 2021
Q3 - Q1 AI for Gen Y and AI for Start-Up
Outlier

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Kemiringan (Skewness)

Modus < Median < Mean Modus = Median = Mean Modus > Median > Mean

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Keruncingan (Kurtosis)

Negative Kurtosis Positive Kurtosis

Leptokurtic curve menunjukkan data yang rentan terhadap nilai yang ekstrem, contoh
dalam kasus keuangan kurtosis yang tinggi pada grafik return saham menunjukkan resiko
yang tinggi terhadap return yang sangat besar atau sangat kecil.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Yang cocok yang mana?

Best Measure of
Tipe Data
Central Tendency

Nominal = Mode
Ordinal = Median
Interval / Ratio = Median
(Skewed)
Interval / Ratio = Mean
(Non-Skewed)

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
LATIHAN

Okay guys,
Saat ini coba kalian pikirkan sebuah narasi informatif yang menggambarkan
data statistika deskriptif dan juga statistika inferensial.

Buatlah contoh yang paling berhubungan dengan kesibukan/hobby/kesukaan


kalian masing-masing ya.

Sajikan dalam bentuk informasi grafis!

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi

Distribusi yaitu fungsi yang menunjukkan semua nilai dari sebuah data
dan seberapa sering nilai tersebut terjadi. Untuk mengeceknya bisa
menggunakan grafik, misalnya histogram atau kurva garis.

Tiap distribusi memiliki peluang munculnya suatu nilai yang


dinamakan probability density function (pdf) untuk data kontinu atau
probability mass function (pmf) untuk data diskrit

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi Statistik
Disini yang akan kita
bahas hanya 3 distribusi:
1) Data Kontinu →
Distribusi Normal
2) Data Diskrit →
Bernoulli dan
Binomial

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi Bernoulli & Binomial

Distribusi Bernoulli adalah distribusi diskrit dimana kejadian


hanya memiliki 2 hasil, misalnya sukses atau gagal.

Jika kejadian ini terjadi sebanyak “n” kali dan saling bebas,
maka distribusi tsb disebut binomial.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi Bernoulli & Binomial
Misalkan p = peluang sukses, q = 1-p peluang gagal, maka:

Distribusi Bernoulli (Bern(p)) Binomial (B(n, p))


PMF f(x) = p, jika x = 1, sukses

q, jika x = 0, gagal
mean p np

varians pq npq

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi Binomial

Contoh:
Sebuah mata uang dilempar sebanyak 5 kali. Berapa probabilitas munculnya sisi gambar
sebanyak 2 kali?
Jawab:
Diketahui:
n=5
x=2
P (x,n) = nCx . px . q(n-x)
P (2,5) = 5C2 (1/2)2 x (1/2)(5-2)
= 10 x 1/8 x ⅛
= 10/32
= 5/16
Distribusi Normal

Distribusi Normal adalah distribusi kontinu dimana data tersebar di sekitar


rata-rata dan membentuk kurva histogram yang simetris (berbentuk
lonceng dengan mean, median, mode di tengah)

Pdf: f(x) =

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi Normal

Distribusi Normal berperan penting di statistik mengingat banyak uji


statistik mensyaratkan data berdistribusi normal.

Ada beberapa cara mengecek normalitas data:


● Dengan histogram
● Uji Kolmogorov-Smirnov
● Uji Shapiro-Wilk
● Uji Skewness & Kurtosis

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Distribusi Normal

Dari histogram
disamping, kira-
kira warna apa
yang
berdistribusi
normal?

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Teorema Limit Pusat

Teorema Limit Pusat (Central Limit Theorem) memainkan


peranan penting dalam data science, teorema ini menyatakan
bahwa jika ukuran sampel semakin besar, maka distribusi
datanya semakin mendekati distribusi normal. Sifat rata-rata
dan variansnya akan mendekati distribusi normal (Ilustrasi
ada di slide selanjutnya)

Seberapa besar? Tidak ada teori pastinya namun secara


praktis sebagian besar menetapkan n=30.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Teorema Limit Pusat

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Statistik Inferensial

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Estimasi

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Estimasi

Populasi Sampel Acak

Akan diperkirakan

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Estimasi

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Estimasi

Perkiraan pendapatan di suatu kota

Sampling

XYZ University 𝑋2 = 10.000.000 /𝑚𝑜𝑛𝑡ℎ

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Estimasi Menggunakan
Regresi Linier Sederhana

Dengan:
Atau Y = ax+b a = slope
b = intercept

Estimasi ini bisa dilakukan jika


hanya ada satu variabel berubah
dan tidak ada variabel tambahan
yang bisa menjadi pertimbangan
perubahan data

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh

Waktu Jumlah
penjualan product yang Seorang manager ingin mengetahui hubungan antara
terjual (Y)
lamanya tenaga penjualan melakukan penjualan dalam
1 2 satuan jam (x) dengan banyaknya produk yang berhasil
5 4 terjual (y). Dari sampel sebanyak 5 orang tenaga
4 6
penjualan, diperoleh data lamanya dan banyaknya
penjualan sebagai berikut,
2 4

3 2 Buatlah model regresi hubungan lamanya melakukan penjualan dan


banyaknya penjualan produk tersebut

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh

Xi Yi X2 XiYi

1 2 1 2

5 4 25 20

4 6 16 24

2 4 4 8

3 2 9 6

15 18 55 60

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Estimasi Interval

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Contoh

n = 36 Students
𝑋2 = 100 minutes
σ = 20 minutes
Confidence Interval = 95 %

Perkirakan waktu
belajar rata-rata

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Hipotesis

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
𝐻0 : Hipotesis Nol 𝐻a : Hipotesis Alternatif

Hipotesis nol sering kali merupakan Hipotesis alternatif adalah pernyataan


klaim awal yang didasarkan pada yang digunakan peneliti untuk
analisis sebelumnya atau membuktikan suatu kebenaran
pengetahuan khusus. berdasarkan data sampel

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Z Score

Metrik untuk membuat data dapat dibandingkan

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Uji Statistik

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Types of Error

- Penolakan hipotesis nol padahal benar disebut kesalahan


tipe I. (α) (Tingkat Signifikan)

- Non-penolakan hipotesis nol ketika itu salah disebut


kesalahan tipe II. (β)

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Activity
Total
Tahun
(Ton/Tahun)
Pemerintah Indonesia ingin memprediksi angka
2012 1.826,302 kebutuhan bahan kimia “XXX” di tahun 2021 dan
kebutuhannya di tahun 2045 nanti
2013 4.121,514

2014 4.606,627 Show data hasil kalian dan sampaikan dalam bentuk
yang informatif
2015 5.319,637

2016 6.946,482

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Referensi :
Sumber Website:
5 konsep dasar nya statistik untuk DS
https://towardsdatascience.com/the-5-basic-statistics-concepts-data-scientists-need-to-
know-2c96740377ae
Basic stastics
https://towardsdatascience.com/basic-statistics-you-need-to-know-for-data-science-1fd
d290f59b5
Stastik untuk data analisis
http://makemeanalyst.com/basic-statistics-for-data-analysis/
Konsep stastik untuk data sceince
https://www.mastersindatascience.org/learning/statistics-data-science/
Perhitungan Regresi Linier Sederhana
https://www.rumusstatistik.com/2020/05/regresi-linier-sederhana.html

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Referensi :
Sumber Buku Daftar Pustaka:
Furqon. 1999. Statistika Terapan Untuk Penelitian. Bandung : Alfabeta.
Kadir. 2016. Statistika Terapan. Jakarta: PT. Raja Grafindo Persada.
Landau, S & Everitt, B. S. 2004. A Handbook of Statistical Analyses Using SPSS.
New York: A CRC Press Company.
Rasyad, Rasdihan. 1998.Metode Statistik Deskriptif. Jakarta : Grasindo.
Somantri, Ating dan Sambas Ali Muhidin. 2006. Aplikasi Statistika dalam
Penelitian. Bandung : Pustaka Ceria.
Spiegel. M. R. & Stephens, L. J. 2004. Statistik. Jakarta: Erlangga.
Subana, dkk. 2000. Statistik Pendidikan. Bandung : Pustaka Setia.
Sudijono, Anas. 2008. Pengantar Statistik Pendidikan. Jakarta : Raja Grafindo
Persada.
Sudjana, M.A., M.SC.2005. Metode Statistika. Bandung : Tarsito.
Sugiyono. 2015. Statistika Untuk Penelitian. Bandung: Alfabeta.
Walpole, Ronald E, 1995. Pengantar Statistik Edisi Ke-4. Jakarta : PT Gramedia.
Walpole, Ronald E., et al. 2007. Probability & Statistics for Engineers &Scientists. New York: Prentice Hall

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Rangkuman

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
Quiz :
1. Apa perbedaan statistik dan statistika?
2. Perbedaan Median dan IQR?
3. Bagaimana mengambil “insight” suatu data dari sebaran
data?
4. Sebutkan 2 jenis Hipotesa!
5. Ceritakan tentang Regresi Linier Sederhana dan
penggunaanya.

Proprietary document of Orbit Future Academy, 2021 AI for Gen Y and AI for Start-Up
THANK YOU

Proprietary document of Orbit Future Academy, 2021 AI For Gen Y and AI For Startup

Anda mungkin juga menyukai