Anda di halaman 1dari 55

Analisis Statistik dan

Probabilitas
Week #1
Community guidelines

• Anything that you find crucial and


would like to add to this list of
community guidelines?
Tujuan Perkuliahan

•  Mahasiswa menguasai dasar-dasar statistik dan

probabilitas

•  Mahasiswa dapat mengambil keputusan dalam

ketidakpastian

•  Mahasiswa mengerti perencanaan berdasarkan

probabilitas terutama berkaitan dengan bidang Teknik


Sipil.
Knowledge = 40 %
Percentage
Skill = 30 %
Attitude = 30 %

Activity (hour/week) Course = 3


Tutorial = 1
Mandiri = 5

UTS = 30 %
Assessment/Penilaian UAS = 50 %
Tugas = 20 %

References/Bibliography 1.  Ang, A.H.S, and Tang, W.H.,”Probability Concepts


in Engineering Planning and Design”, Vol-I,
McGraw-Hill.

2.  Cornell, A.J,”Probability, Statistic, and Decision for


Civil Engineers”, McGraw-Hill.
Rincian Kuliah
Ketidakpastian dlm kehidupan nyata,
Mg 1 Pendahuluan sifat acak, ketidaksempurnaan,
Pengamatan, variabel lebih dari satu,
Bias data

Mg 2 Dasar-dasar -  Kejadian acak

Probabilitas -  Pengukuran kemungkinan

-  Kemungkinan terjadi
Mg 3-4 Kejadian-kejadian -  Kemungkinan bersyarat &
Ketidaktergantungan
-  Pengambilan keputusan &
ketidakpastian
-  Teorema prababilitas total
-  Teorema Bayes
-  Fungsi kepadatan dan kumulatif
Mg 5-6 Fungsi Distribusi -  Fungsi beberapa besaran acak
-  Pengembangan fungsi beberapa variabel

Mg 7 Transformasi Fungsi -  Fungsi satu variabel


Distribusi -  Fungsi dua variabel

Mg 8 UTS
-  Beberapa macam momen
-  Ekspektasi
Mg 9-10 Momen
-  Ekspektasi dan momen dua variabel

Mg 11-12 Model Fungsi -  Model eksperimen sederhana


Model kejadian acak
Distribusi - 
-  Model kasus-kasus limit
-  Distribusi lainnya
Mg 13-15 Penggunaan -  Cara perhitungan
-  Distribusi kumulatif
Probabilitas dalam -  Perencanaan probabilitas
Perencanaan -  Fungsi distribusi
-  Transformasi
-  Simulasi Monte Carlo

Mg 16 UAS
Break!
Sta$s$ka adalah ilmu pengetahuan tentang
metode pengumpulan, pengolahan,
Pendahuluan penafsiran, dan penarikan kesimpulan dari
data peneli4an.

—  Statistika: Teori dan Metodologi untuk analisis data kuantitatif dari


sampel observasi dalam hubungan-hubungan yang telah di
Jawaban sementara terhadap masalah yang masih
hipotesiskan Hipotesa? Hipotesis? bersifat praduga karena masih harus dibuktikan
kebenarannya
—  Berkaitan dengan pengumpulan informasi/keterangan, penyajian dalam

bentuk daftar, diagram, atau grafik sehingga memudahkan untuk


dianalisa, yang selanjutnya disimpulkan dan diambil kesimpulan.

—  Ilmu Statistika membantu analis yang memiliki tumpukan data untuk

menghasilkan susunan yang teratur dan penyederhananaan dari hal


yang kompleks dan tidak beraturan.
Pendahuluan
—  Datum: Setiap informasi atau keterangan yang diperoleh (jamak: data)

—  Data kuantitatif: Keterangan – keterangan berupa angka

—  Data diskrit/cacahan: diperoleh dari hasil penghitungan, diperoleh dengan

cara mencacah, membilang, atau menghitung banyak objek. Contoh: data


tentang banyaknya jumlah bangunan bagi di satu petak sawah, data jumlah
kendaraan yang lewat di jalan tol dalam waktu satu jam.

—  Data kontinu: diperoleh dari hasil pengukuran. Contoh: data tinggi pasang

surut dalam waktu 24 jam, data magnitude gempa yang terjadi di Lombok
dalam 1 (satu) minggu terakhir

—  Data kualitatif: keterangan – keterangan bukan angka, data yang

diamati berdasarkan atribut, misalnya pendapat siswa terhadap


pelajaran Analisis Statistik dan Probabilitas, seperti amat senang –
senang – kurang senang – tidak senang.
Pendahuluan
—  Populasi: himpunan universal (semesta)

dengan karakteristik tertentu

•  Sampel: contoh yang dipilih dari populasi (himpunan bagian dari


populasi)
•  Sensus: cara pengumpulan data, di mana data diperoleh dari setiap
anggota populasi.
•  Sampling: cara pengumpulan data, di mana hanya sebagian anggota
populasi (sampel) saja yang diteliti. Akan tetapi, dari sebagian anggota
populasi ini diharapkan dapat menggambarkan keadaan populasi yang
sebenarnya.

•  Statistik: Nilai – nilai yang diperoleh dari sampel


•  Parameter: Nilai – nilai populasi
Bagan alir
Fenomena
Acak

Engineering

Fenomena Acak

DATA

Desain Optimal
Syarat data yang baik
—  Objektif: data harus dapat memberikan gambaran tentang keadaan

yang sebenarnya

—  Terpercaya: data diperoleh dari sumber yang tepat atau dapat

dipercaya

—  Representatif: data yang diambil secara sampel harus bisa mewakili

semua data yang merupakan populasinya

—  Relevan: data yang diperoleh harus benar-benar sesuai dan

berhubungan dengan obyek atau permasalahan yang diteliti

—  Terkini (up to date): data yang diperoleh merupakan data yang terbaru

(terkini) dan bukan merupakan data usang yang sudah tidak sesuai lagi.
Metode Sampling DATA PRIMER
—  Pengamatan (observasi): cara pengumpulan data dengan mengamati

secara langsung subjek yang diteliti.

—  Penggunaan kuesioner (angket): cara pengumpulan data dengan

menggunkan daftar pertanyaan (angket) atau daftar isian terhadap


subjek yang teliti.

—  Wawancara (interview): cara pengumpulan data dengan langsung

mengadakan tanya jawab kepada subjek yan diteliti.

—  Penelusuran literatur: cara pengumpulan data dengan menggunakan

sebagian atau seluruh data yang telah ada dari peneliti sebelumnya.
Penelusuran literatur disebut juga pengamatan tidak langsung.

DATA SEKUNDER
Logika Statistika
1.  Observasi dan eksperimen
2.  Munculnya hipotesis ilmiah
3.  Verifikasi dan pengukuhan
4.  Sebuah teori dan hukum ilmiah (Cecep Sumarna,
2004:98)

(1) (2) (3) (4)


Karakteristik Statistika (1)
1. Statistika bekerja dengan angka
—  Angka statistik sebagai jumlah atau frekuensi dan angka statistik
sebagai nilai atau harga à data statistik adalah data kuantitatif
(contoh: jumlah mahasiswa S1 Teknik Sipil yang meraih predikat
cumlaude, jumlah mahasiswa tingkat 2 yang mengambil mata
kuliah Metode Numerik)

—  Angka statistik sebagai nilai mempunyai arti data kualitatif yang


diwujudkan dalam angka. Contoh: nilai IQ, mutu pengajaran dosen
Teknik Sipil, metode pengajaran dosen Teknik Sipil, index
kebahagiaan warga Bandung
Karakteristik Statistika (2)
2. Statistika bersifat Objektif

Angka statistik dapat digunakan sebagai alat pencari fakta,


pengungkapan kenyataan yang ada dan memberikan keterangan
yang benar à menentukan kebijakan sesuai fakta dan temuannya
yang diungkapkan apa adanya.

3. Statistika bersifat Universal

Statistik tidak hanya digunakan dalam salah satu disiplin ilmu saja,
tetapi dapat digunakan secara umum dalam berbagai bentuk disiplin
ilmu pengetahuan dengan penuh keyakinan
Manfaat dan Fungsi Statistika
—  Komunikasi: sebagai penghubung beberapa pihak yang menghasilkan data
statistik atau berupa analisis statistik sehingga beberapa pihak tersebut akan
dapat mengambil keputusan melalui informasi tersebut.

—  Deskripsi: penyajian data dan ilustrasi data (contoh: mengukur tingkat


kelulusan mahasiswa, laporan jumlah pelanggar lalu lintas, tingkat inflasi)

—  Regresi: meramalkan pengaruh data yang satu dengan data yang lainnya dan
untuk menghadapi gejala-gejala yang akan datang (contoh: forecasting jumlah
penduduk)

—  Korelasi: Untuk mencari kuatnya atau besarnya hubungan data dalam suatu
peneltian

—  Komparasi yaitu membandingkan data dua kelompok atau lebih


Pendekatan Statistika
—  Arti sempit: Statistika Deskriptif (Descriptive Statistics):
—  meliputi tabulasi, penyederhanaan, dan penjelasan data.

—  menyimpulkan data yang kompleks dengan suatu nilai.

—  tahap statistika yang berkaitan dengan kondisi suatu kesimpulan yang

akan diambil

—  Arti luas: Statistika Inferensial (Inferential Statistics):

—  perkiraan karakteristik dari suatu populasi berdasarkan pengetahuan

karakteristik suatu sample dalam populasi tersebut.

—  tahap statistika yang berusaha melukiskan dan menganalisa kelompok

data tanpa menarik kesimpulan (hasilnya dimanfaatkan untuk


mengeneralisasi suatu populasi)
Perkiraan Statistika

Se4ap anggota dalam populasi


mempunyai kesempatan yang
sama untuk terpilih sebagai
sampel.
Populasi

Parameter-Parameter

Perkiraan
Sampel Acak

Statistik
Statistika Deskriptif
Skala Pengukuran (1)

—  Nominal

—  Tidak terdapat properti numerik atau quantitatif, klasifikasi group

atau kategori
—  Sex: Pria atau wanita

—  Bidang: Struktur atau Sumber Daya Air

—  Ordinal

—  Digunakan untuk mengurutkan level variabel yang sedang di

analisis. Tidak ada nilai spesifik yang ditempatkan dalam skala


rating tersebut.

—  Rating hotel: bintang 4, bintang 3, bintang 2, dan bintang 1


Skala Pengukuran (2)
—  Interval

—  Perbedaan antar nilai dalam skala dan interval tersebut berukuran sama.

Tidak ada nilai nol.

—  Dapat digunakan pembanding nilai pengukuran

—  Suhu: Perbedaan antara 200 dan 300 adalah sama dengan perbedaan

antara 300 dan 400. Kita tidak bisa bilang bahwa 400 dua kali lebih panas
dari 200, hanya 400 lebih panas.
—  Rasio

—  Skala yang mempunyai titik nol yang mengindikasikan nilai variabel

tersebut tidak ada.

—  Dapat dinyatakan dalam perbandingan

—  Berat: 100 kg adalah setengahnya dari 200 kg


Distribusi Frekuensi
—  Adalah susunan data menurut kelas interval tertentu atau menurut kategori

tertentu dalam sebuah daftar.

—  Dalam tabel, distribusi frekuensi di bentuk dengan me-resume data dalam

bentuk nilai frekuensi observasi dalam setiap kategori, skor, atau interval skor.
—  Dalam grafik, distribusi frekuensi dibentuk dengan meresume data dalam

bentuk histogram atau poligon frekuensi


Histogram dan Poligon Frekuensi
Tampilan grafis dari tabulasi frekuensi yang Diagram garis yang menghubungkan
digambarkan dengan grafis batangan setiap tengah-tengah sisi atas
persegi panjang yang berdampingan
Jenis kurva dalam statistika deskriptif
—  Kurva Normal —  Curva Bimodal

—  Positively Skewed —  Negatively Skewed


Property distribusi frekuensi:
Central Tendency (1)
—  Modus (Mode)
—  Nilai yang mempunyai frekuensi paling besar

—  3 3 3 4 4 4 5 5 5 6 6 6 6: Modus=6

—  3 3 3 4 4 4 5 5 6 6 7 7 8: Modus adalah 3 dan 4

—  Nilai Tengah (Median)


—  Nilai yang membagi dua grup nilai dimana 50 % berada di atas dan 50 % berada di bawah nilai
median

—  3 3 3 5 8 8 8: Median=5

—  3 3 5 6: Median=4 (Rata-rata dari 2 nilai yang terdapat di tengah)


Property distribusi frekuensi:
Central Tendency (2)
—  Nilai Rerata (Mean)
—  Nilai yang selalu di utamakan, dan satu-satunya properti central
tendency yang digunakan dalam analisis statistika lanjut.

—  Lebih akurat dan reliabel

—  Cocok bagi perhitungan aritmatik

—  Pada umumnya menjumlahkan semua nilai dibagi dengan banyaknya


nilai.

—  2 3 4 6 10: Mean=5 (25/5)


Properti distribusi frekuensi: Variability/
Dispersion
—  Rentang (Range)

—  Dihitung dengan mengurangi nilai tertinggi dengan nilai terendah

—  Hanya digunakan untuk skala Ordinal, Interval, dan Ratio scales dan data

harus terurut

—  Contoh: 2 3 4 6 8 11 24 (Rentang=22)

—  Varian (Variance)

—  Jangkauan nilai dalam distribusi frekuensi (The extent to which individual

scores in a distribution of scores differ from one another)

—  Standard Deviasi (Standard Deviation)

—  Akar kuadrat dari varian

—  Digunakan untuk menggambarkan dispersi dalam set observasi pada

sebuah distribusi
Korelasi dan Regresi Linear
—  Korelasi atau Kovarian (Correlation/Covariation)
—  Koefisien korelasi: summary statistik dari derajat keterkaitan atau

hubunan antara dua variabel


—  Dapat memililiki korelasi negatif atau positif

—  Regresi Linear
—  Tujuan dari persamaan regeresi: untuk perkiraaan sampel baru

observasi berdasarkan temuan dari sampel sebelumnya.


STATISTIKA DESKRIPTIF
Break!
Statistik Inferensial
Sampling (1)
—  Sampel berhubungan dengan siapa yang akan disurvey, apakah

merupakan perwakilan dari populasi spesifik?

—  The sample frame: kumpulan orang yang mendapat kesempatan

untuk menjawab survey

—  A question related to external validity is the degree to which the

sample frame corresponds to the population to which the


researcher wants to apply the results (Fowler, 1988)
Sampling (2)
—  Two basic types: PROBABILITY AND NON-PROBABILITY

—  Probability sampling (PS):

—  random sampling,

—  stratified random sampling, and

—  cluster sampling

—  Non-probability sampling (NPS):

—  quota sampling,

—  snowball sampling, and

—  convenience sampling
Random Sampling (PS)
—  Every unit has an equal chance of selection

—  Although it is relatively simple, members of specific

subgroups may not be included in appropriate


proportions
Stratified Random Sampling (PS)
—  The population is grouped

according to meaningful
characteristics or strata

—  This method is more likely

to reflect the general


population, and subgroup
analysis is possible

—  However, it can be time

consuming and costly


Systematic Sampling (PS)
—  Every xth unit is selected

—  (e.g., every other person entering the gate was selected)

—  The method is convenient and close to random sampling if the

starting point is randomly chosen

—  Recurring patterns can occur and should be examined


Cluster/Multistage Sampling (PS)
—  Natural groups are

sampled and then


their members are
sampled

—  This method is

convenient and can


use existing units
Quota Sampling (NPS)
—  The population is divided into subgroups and the sample is

selected based on the proportions of the subgroups necessary to


represent the population

—  This method depends on reliable data about the proportions in

the population
Convenience Sampling (NPS)
—  This method uses readily available

groups or units of individuals

—  It is practical and easy to use

—  However, it may produce a biased

sample

—  Convenience sampling can be perfectly

acceptable if the purpose of the


research is to test a hypothesis that
certain variables are related to one
another
Snowball Sampling (NPS)
—  Previously identified

members identify others

—  This method is useful when

a list of potential names is


difficult to obtain

—  However, it may produce a

biased sample
Interval Estimate & Sampling Distributions

—  Interval Estimate

—  A range or band within which the parameter is thought to lie, instead of a

single point or value as the estimate of the parameter

—  Sampling Distributions

—  The sampling distribution of the mean is a frequency distribution, not of

observations, but of means of samples, each based on n observations

—  The standard error of the mean is used as an estimate of the magnitude of

sampling error. It is the standard deviation of the sampling distribution of the

sample means.
Inferential Statistics
—  Confidence Intervals
—  Same as the percentage of cases in a normal distribution that

lie within 1, 2, or 3 standard deviations from the mean

—  Central Limit Theorem

—  States that the distribution of samples (means, medians,

variances, and most other statistical measures) approaches a


normal distribution as the sample size, n, increases
Resume:
Statistic Descriptive & Inferential
—  Descriptive
—  For one variable ("univariate analysis"):

—  Measures of "CENTRAL TENDENCY") (averages) and of DISPERSION or variance

around that average.

—  Examples: Means, Modes, Medians, Standard Deviation, quartiles

—  B. Descriptive statistics for the strength of relationship between two variables (bivariate

analysis) or among a set of variables (multivariate analysis) are measures of


ASSOCIATION or correlation.

—  Inferential
—  Are measures of the SIGNIFICANCE of the relationship between two or more variables.

Significance refers to the probability that the findings could be attributed to sampling
error.

—  Appropriate statistics depend on the LEVEL OF MEASUREMENT OF THE


51 DEPENDENT VARIABLE (and of the independent variable).
Types of Statistical Analysis -
Descriptive
—  Quantify the degree of relationship between

variables

—  Parametric tests are used to test hypotheses with

stringent assumptions about observations


—  e.g., t-test, ANOVA

—  Nonparametric tests are used with data in a

nominal or ordinal scale


—  e.g., Chi-Square, Mann-Whitney U, Wilcoxon
Types of Statistical Analysis -
Inferential
—  Allow generalization about populations using data from samples

—  Non-parametric

—  Non-parametric tests do not require any assumptions about normal

distribution, but are generally less sensitive than parametric tests.

—  The test for nominal data is the Chi-Square test

—  The tests for ordinal data are the Kolmogorov-Smirnov test, the

Mann-Whitney U test, and the Wilcoxon Matched-Pairs Signed-


Ranks test

—  Parametric

—  The tests for interval and ratio data include the t-test and etc
Break!
Assignment 1
—  Buat kelompok @5 0rang
—  Lakukan pengambilan sampel pada teman 1 angkatan
—  Tema bebas
—  Kelompok 1: METODE RANDOM SAMPLING
—  Kelompok 2: STRATIFIED RANDOM SAMPLING
—  Kelompok 3: SYSTEMATIC SAMPLING
—  Kelompok 4: CLUSTER SAMPLING
—  Kelompok 5: QUOTA SAMPLING
—  Kelompok 6: CONVENIENCE SAMPLING
—  Kelompok 7&8: SNOWBALL SAMPLING

—  Diskusikan hasilnya pada kuliah minggu depan

Anda mungkin juga menyukai