Anda di halaman 1dari 37

Pertemuan 1

KONSEP DASAR DAN REVIEW


Konsep Statistika

Kita sekarang hidup di era yang didominasi oleh


informasi.
Kita terus-menerus dibombardir dengan statistik dan
informasi statistik. Sebagai contoh:
Survei Pelanggan Berita Medis
Polling Politik Prediksi Ekonomi
Informasi Pemasaran Data Scanner
Pikirkan seberapa sering Anda menggunakan data
dalam kehidupan sehari-hari.
Tidak ada cara untuk menghindari penggunaan data.
Apakah Statistika itu?!
Konsep Statistika

Statistika adalah cara untuk mendapatkan informasi dari


data.
Itu saja!
-Gerald Keller
Konsep Statistika

Statistika adalah cara untuk mendapatkan informasi dari


data

Statistika

Data Informasi
Data: Fakta, khususnya Informast:
fakta numerik, Pengetahuan yang
dikumpulkan bersama- dikomunikasikan
sama untuk referensi berkaitan dengan
atau informasi. beberapa fakta tertentu.
Konsep Statistika

Statistika adalah ilmu yang mempelajari cara


pengumpulan, pengolahan, penyajian, dan analisis data
serta cara pengambilan keputusan secara umum
berdasarkan hasil penelitian.

Di dalam statistika ada Ketidakpastian dan Variasi

Tujuan pengumpulan dan analisis data adalah untuk


mendapatkan informasi. Metode statistik menyediakan
alat untuk mendapatkan informasi dari data. Metode ini
terbagi menjadi dua cabang
Statistik Deskriptif Statistik Inferensia
(Metstat I)
Konsep Statistika

Statistik deskriptif menggambarkan kumpulan data yang


sedang dianalisis, tetapi tidak memungkinkan kita untuk
menarik kesimpulan atau campur tangan terhadap data.
Oleh karena itu kita perlu cabang statistik lain: statistik
inferensia.

Statistik inferensia juga merupakan seperangkat metode,


tetapi digunakan untuk menarik kesimpulan atau inferensi
tentang karakteristik populasi berdasarkan data dari
sampel.
Statistika Inferensia

Inferensi Statistik merupakan proses pembuatan suatu


estimasi, prediksi, atau keputusan mengenai suatu
populasi berdasarkan suatu sampel.
Populasi

Sampel

Inferens

Statistik
Parameter

Apa yang bisa kita simpulkan tentang Parameter Populasi


berdasarkan Statistik Sampel?
Statistika Inferensia

Kita menggunakan statistik untuk membuat kesimpulan/


inferensi tentang parameter.

Oleh karena itu, kita dapat membuat estimasi, prediksi,


atau keputusan tentang populasi berdasarkan data
sampel.

Dengan demikian, kita dapat menerapkan apa yang kita


ketahui tentang sampel ke populasi yang lebih besar di
mana sampel tersebut diambil!
Statistika Inferensia

Secara rasional:
populasi besar membuat penyelidikan setiap anggota tidak
praktis dan mahal.
Lebih mudah dan lebih murah untuk mengambil sampel
dan melakukan estimasi tentang populasi dari sampel.

Bagaimanapun:
Kesimpulan dan Estimasi tidak selalu akan menjadi benar.
Untuk alasan ini, kita masuk ke dalam inferensi statistik
"ukuran reliabilitas (keandalan)", yaitu tingkat
kepercayaan dan tingkat signifikansi.
Statistika Inferensia

Tingkat kepercayaan adalah proporsi suatu prosedur


estimasi akan benar.
Misalnya tingkat kepercayaan 95% berarti bahwa,
perkiraan berdasarkan bentuk inferensi statistik akan
benar 95%.

Ketika tujuan dari inferensi statistik adalah untuk menarik


kesimpulan tentang populasi, tingkat signifikansi
mengukur seberapa sering suatu kesimpulan akan salah
dalam jangka panjang.
Misalnya tingkat signifikansi 5% berarti bahwa, dalam
jangka panjang, jenis kesimpulan akan salah 5%.
Parametrik dan Nonparametrik

Salah satu sumber kebingungan dalam menentukan


statistik apa yang digunakan dalam menganalisis data
adalah apakah data Anda memungkinkan untuk dianalisis
dengan statistik parametrik atau nonparametrik.

Pentingnya masalah ini tidak dapat diremehkan!

Jika salah maka Anda menggunakan prosedur statistik


yang salah atau Anda menggunakan prosedur yang
kurang tepat.
Parametrik dan Nonparametrik

Definisi Nonparametrik menurut Walsh, J.E. (1962) dalam


buku Handbook of Nonparametric Statistics:

A precise and universally acceptable definition of the


term nonparametric is not presently available. The
viewpoint adopted in this handbook is that a statistical
procedure is of a nonparametric type if it has properties
which are satisfied to a reasonable approximation when
some assumptions that are at least of a moderately general
nature hold.

Definisi tersebut menggarisbawahi fakta bahwa sulit


untuk mendefinisikan secara khusus istilah nonparametrik.
Parametrik dan Nonparametrik

Untuk umumnya tujuan praktis, definisi prosedur statistik


nonparametrik adalah kelas prosedur statistik yang tidak
bergantung pada asumsi tentang shape atau bentuk
distribusi peluang dari mana data diambil.

Pertimbangan lain:
Jika skala pengukuran N-O Nonparametrik
Jika skala pengukuran I-R Parametrik

Pada umumnya lebih mudah untuk membuat daftar


contoh-contoh dari tiap jenis prosedur (parametrik dan
nonparametrik) daripada mendefinisikan istilah itu sendiri.
Induksi dan Deduksi

Statistik inferensia digunakan untuk menarik


kesimpulan.
Kesimpulan bisa induksi dan deduksi.
Kesimpulan statistika adalah induksi.
Manakah yang induksi?
Jenis Populasi dan Sampel

Ada dua macam jenis populasi, yaitu populasi terbatas


dan populasi tidak terbatas (tak terhingga).

1) Populasi Terbatas
Populasi terbatas mempunyai sumber data yang jelas
batasnya secara kuantitatif sehingga dapat dihitung
jumlahnya.

2) Populasi Tak Terbatas


Populasi tak terbatas yaitu sumber datanya tak dapat
ditentukan batas-batasnya sehingga relatif tidak dapat
dapat dinyatakan dalam bentuk jumlah.
Jenis Populasi dan Sampel

Berdasarkan sifatnya populasi dapat digolongkan menjadi


populasi homogen dan populasi heterogen.

a. Populasi homogen
Populasi homogen adalah sumber data yang unsurnya
memiliki sifat atau keadaan yang sama sehingga tidak perlu
mempermasalahkan jumlahnya secara kuantitatif.

b. Populasi heterogen
Populasi heterogen adalah sumber data yang unsurnya
memiliki sifat atau keadaan yang berbeda (bervariasi)
sehingga perlu ditetapkan batas-batasnya baik secara
kuantitatif maupun secara kualitatif.
Jenis Populasi dan Sampel

Teknik Sampling
Sampling Techniques

Nonprobability Probability
Sampling Techniques Sampling Techniques

Convenience Judgmental Quota Snowball


Sampling Sampling Sampling Sampling

Simple Random Systematic Stratified Cluster Other Sampling


Sampling Sampling Sampling Sampling Techniques
Statistika & Metode Ilmiah

METODE ILMIAH :
Adalah salah satu cara mencari kebenaran yang bila ditinjau dari segi
penerapannya, resiko untuk keliru paling kecil.

LANGKAH-LANGKAH DALAM METODE ILMIAH :


1. Merumuskan masalah
2. Melakukan studi literatur
3. Membuat dugaan-dugaan, pertanyaan-pertanyaan atau hipotesis

4. Mengumpulkan dan mengolah data, menguji hipotesis,


atau menjawab pertanyaan

5. Mengambil kesimpulan

INSTRUMEN

SAMPEL

SIFAT DATA
PERAN STATISTIKA
VARIABEL

METODE ANALISIS
Apanya Apa??

Tiga puluh enam persen dari penduduk DKI dewasa


memiliki alergi. Sampel sebanyak dari 1.200 orang
dewasa yang dipilih secara acak menghasilkan 33,2%
memiliki alergi.

Apa yang menjadi populasi, sampel, variabel, data,


eksperimen, statistik, parameter?
Apanya Apa??

Populasi orang dewasa di DKI


Sample 1200 orang dewasa yang dipilih secara acak
Variable Alergi
Data ya atau tidak
Experiment Mungkin dengan tanya jawab/wawancara
Statistic 33.2% (dari sampel)
Parameter persen populasi dengan alergi
Data

DATA terbagi atas DATA KUALITATIF dan DATA KUANTITATIF

DATA KUALITATIF : DATA KUANTITATIF :


Data yang dinyatakan dalam Data yang dinyatakan dalam
bentuk bukan angka. bentuk angka
Contoh : jenis pekerjaan, Contoh : lama bekerja,
status marital, tingkat jumlah gaji, usia, hasil
kepuasan kerja ulangan

DATA

KUALITATIF JENIS KUANTITATIF


DATA

NOMINAL INTERVAL
ORDINAL RASIO
Data
DATA NOMINAL :
Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi.
CIRI : posisi data setara
tidak bisa dilakukan operasi matematika (+, -, x, :)
CONTOH : jenis kelamin, jenis pekerjaan

DATA ORDINAL :
Data berskala ordinal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi, tetapi
di antara data tersebut terdapat hubungan
CIRI : posisi data tidak setara/ada urutan
tidak bisa dilakukan operasi matematika (+, -, x, :)
CONTOH : kepuasan kerja, motivasi

DATA INTERVAL :
Data berskala interval adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara
dua titik skala sudah diketahui dan tidak mempunyai titik nol absolut.
CIRI : Tidak ada kategorisasi
bisa dilakukan operasi matematika
CONTOH : temperatur yang diukur berdasarkan 0C dan 0F, sistem kalender

DATA RASIO :
Data berskala rasio adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara
dua titik skala sudah diketahui dan mempunyai titik 0 absolut.
CIRI : tidak ada kategorisasi
bisa dilakukan operasi matematika
CONTOH : gaji, skor ujian, jumlah buku
Pengolahan Data

PROSEDUR PENGOLAHAN DATA :

A. PARAMETER : Berdasarkan parameter yang ada statistik dibagi menjadi

Statistik PARAMETRIK : berhubungan dengan inferensi statistik yang


membahas parameter-parameter populasi; jenis data interval atau rasio;
distribusi data normal atau mendekati normal.

Statistik NONPARAMETRIK : inferensi statistik membahas parameter-


parameter populasi; jenis data nominal atau ordinal; distribusi data tidak
diketahui atau tidak normal

B. JUMLAH VARIABEL : berdasarkan jumlah variabel dibagi menjadi

Analisis UNIVARIAT : hanya ada 1 pengukuran (variabel) untuk n


sampel atau beberapa variabel tetapi masing-masing variabel dianalisis
sendiri-sendiri. Contoh : korelasi motivasi dengan pencapaian akademik.

Analisis MULTIVARIAT : dua atau lebih pengukuran (variabel) untuk n


sampel di mana analisis antar variabel dilakukan bersamaan. Contoh :
pengaruh motivasi terhadap pencapaian akademik yang dipengaruhi oleh
faktor latar belakang pendidikan orang tua, faktor sosial ekonomi, faktor
sekolah.
Penyajian Data

TABEL
Tabel 1.1 Bidang Pekerj aan berdasarkan Latar Belakang Pendidikan

Count
pendidikan
SMU Akademi Sarjana Jumlah
bidang administrasi 1 8 6 15
pekerjaan personalia 1 7 8
produksi 4 3 5 12
marketing 2 14 11 27
keuangan 3 4 6 13
Jumlah 10 30 35 75

bidang pekerjaan
GRAFIK admini strasi
personal ia
produksi
marketi ng
keuangan

Pies show counts


Penyajian Data

TABEL : memberikan informasi secara rinci. Terdiri atas kolom dan baris

Kolom pertama : LABEL


KOLOM
Kolom kedua . n : Frekuensi atau label
TABEL
BARIS Berisikan data berdasarkan kolom

Tabel Tabulasi Silang

Pendapat tentang sertifikasi


Asal Wilayah Sangat Perlu Tidak Tidak Sangat Jumlah
perlu tahu perlu tdk
perlu
Jawa Barat
Jawa Tengah
Jawa Timur
NTT
Papua
Jumlah
Penyajian Data

GRAFIK : memberikan informasi dengan benar dan cepat, tetapi tidak rinci.

Syarat :
1. Pemilihan sumbu (sumbu tegak dan sumbu datar), kecuali grafik lingkaran
2. Penetapan skala (skala biasa, skala logaritma, skala lain)
3. Ukuran grafik (tidak terlalu besar, tinggi, pendek)

Jenis Grafik :
4
Grafik Batang (Bar)
Sumbu tegak

3
Grafik Garis (line)
2
Grafik Lingkaran (Pie)
1
Grafik Interaksi (Interactive)
0
1 2 3 4
Titik
pangkal Sumbu datar
Penyajian Data

Grafik Batang (Bar) Grafik Garis (line)


30 30

20 20

10 10

Jumlah
Count

0 0
administrasi personalia produksi marketing keuangan administrasi personalia produksi marketing keuangan

bidang pekerjaan bidang pekerjaan

Grafik lingkaran (pie) Grafik Interaksi (interactive)


800000

keuangan
administrasi

700000

600000

personalia
500000
Mean gaji perbulan

Jenis kelamin
400000
marketing
laki-laki
produksi
300000 w anita
sangat jelek jelek cukup baik baik sangat baik

prestasi kerja
Frekuensi

FREKUENSI : banyaknya data untuk satu kelompok/klasifikasi

KELOMPOK FREKUENSI
Kelompok ke-1 f1 Pendidikan Frekuensi
Kelompok ke-2 f2
S1 62
Kelompok ke-3 f3
S2 19
Kelompok ke-i fi
S3 9
Kelompok ke-k fk
90
k
n = fi
i=1

k
n = fi = f1 + f2 + f3 +.. + fi + + fk
i=1
Distribusi Frekuensi

DISTRIBUSI FREKUENSI : mengelompokkan data interval/rasio dan menghitung


banyaknya data dalam satu kelompok/klasifikasi

USIA FREKUENSI Membuat distribusi frekuensi :


1. Mencari sebaran (range) yakni selisih antara data paling besar
20 5
dengan data paling kecil) 35 20 = 15
21 6 2. Menentukan banyak kelas dengan rumus k = 1 + 3,3 log n
22 13 7
3. Menentukan panjang kelas dengan rumus
23 4 p = sebaran / banyak kelas 15/7 = 2
24 7
25 7 KELOMPOK USIA FREKUENSI
26 7 20 21 11
27 5 22 23 17
28 3 24 25 14
29 4 26 27 12
30 15 28 29 7
31 3 30 31 18
33 5 32 - 33 5
35 1 34 - 35 1
Ukuran Pemusatan

RATA-RATA : suatu bilangan yang bertindak mewakili sekumpulan bilangan


atau jumlah bilangan dibagi banyaknya bilangan

X + X2 + X3 + + Xn n
X= 1 Xi
n i =1

n
Bila terdapat sekumpulan bilangan di mana masing-masing bilangannya memiliki frekuensi,
maka rata-rata hitung menjadi :
k
X f + X2 f2 + X3 f3 + + Xkfk Xifi
X= 1 1
f 1 + f2 + f 3 + + f k i =1

k
fi
Cara menghitung : i =1

Bilangan (Xi) Frekuensi (fi) Xi fi


70 3 210
63 5 315
Maka : X = 695 = 69.5
10
85 2 170
Jumlah 10 695
Ukuran Pemusatan

MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.

Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55.
Pertanyaannya adalah apakah siswa yang memperoleh nilai 7
termasuk istimewa, baik, atau biasa-biasa saja ?

Jika nilai ulangan tersebut adalah : 10 10 8 7 7 6 5 5 5 5 4,


maka rata-rata hitung = 6.55, median = 6
Kesimpulan : nilai 7 termasuk kategori baik sebab berada di atas rata-rata hitung
dan median (kelompok 50% atas)

Jika nilai ulangan tersebut adalah : 8 8 8 8 8 8 7 5 5 4 3,


maka rata-rata hitung = 6.55, median = 8
Kesimpulan : nilai 7 termasuk kategori kurang sebab berada di bawah median
(kelompok 50% bawah)

Jika sekumpulan data banyak bilangannya genap (tidak mempunyai bilangan tengah)
Maka mediannya adalah rata-rata dari dua bilangan yang ditengahnya.
Contoh : 1 2 3 4 5 6 7 8 8 9 maka median (5+6) : 2 = 5.5
Ukuran Pemusatan

MODUS : bilangan yang paling banyak muncul dari sekumpulan bilangan,


yang fungsinya untuk melihat kecenderungan dari sekumpulan bilangan tersebut.

Contoh : nilai ulangan 10 10 8 7 7 6 5 5 5 5 4


Maka : s = 6 ; k = 3 ; p =2
rata-rata hitung = 6.55 ; median = 6
modus = 5 ; kelas modus = 5 - 7

Nilai Frekuensi Nilai Frekuensi


10 2 8 10 3
8 1 57 7
7 2 24 1
6 1 Jumlah 11
5 4
4 1
Jumlah 11 - +
Mo X Me
Kurva positif apabila rata-rata hitung > modus / median
Kurva negatif apabila rata-rata hitung < modus / median
Ukuran Penyebaran

UKURAN YANG MENYATAKAN HOMOGENITAS / HETEROGENITAS :


1. RENTANG (Range)
2. DEVIASI RATA-RATA (Average Deviation)
3. VARIANS (Variance)
4. DEVIASI STANDAR (Standard Deviation)

Rentang (range) : selisih bilangan terbesar dengan bilangan terkecil.


Sebaran merupakan ukuran penyebaran yang sangat kasar, sebab hanya bersangkutan
dengan bilangan terbesar dan terkecil.

Contoh : A : 100 90 80 70 60 50 40 30 20 10
B : 100 100 100 100 100 10 10 10 10 10
C : 100 100 100 90 80 30 20 10 10 10

X = 55
r = 100 10 = 90
Rata-rata
Ukuran Penyebaran
Deviasi Rata-rata : penyebaran
Berdasarkan harga mutlak simpangan Kelompok A Kelompok B
bilangan-bilangan terhadap rata- Nilai X X - X |X X| Nilai X X - X |X X|
ratanya. 100 45 45 100 45 45
90 35 35 100 45 45
80 25 25 100 45 45
70 15 15 90 35 35
60 5 5 80 25 25

Rata-rata 50 -5 5 30 -25 25
40 -15 15 20 -35 35
30 -25 25 10 -45 45
20 -35 35 10 -45 45
10 -45 45 10 -45 45
Jumlah 0 250 Jumlah 0 390

DR = 250 = 25 DR = 390 = 39
10 10

n
|Xi X|
Rata-rata DR =
n
i=1

Makin besar simpangan,


makin besar nilai deviasi rata-rata
Ukuran Penyebaran
Varians : penyebaran berdasarkan Kelompok A Kelompok B
jumlah kuadrat simpangan bilangan- Nilai X X -X (XX)2 Nilai X X -X (X X)2
bilangan terhadap rata-ratanya ; 100 45 2025 100 45 2025
melihat ketidaksamaan sekelompok data
90 35 1225 100 45 2025
80 25 625 100 45 2025
n
s = (Xi X)
2 70 15 225 90 35 1225
2

i=1 n-1 60 5 25 80 25 625


50 -5 25 30 -25 625
40 -15 225 20 -35 1225

Deviasi Standar : penyebaran 30 -25 625 10 -45 2025

berdasarkan akar dari varians ; 20 -35 1225 10 -45 2025


menunjukkan keragaman kelompok data 10 -45 2025 10 -45 2025
Jumlah 8250 Jumlah 15850

8250 15850
n s= 9 = 30.28 s= 9 = 41.97
(Xi X)
2
s=
i=1 n-1
Kesimpulan :
Kelompok A : rata-rata = 55 ; DR = 25 ; s = 30.28
Kelompok B : rata-rata = 55 ; DR = 39 ; s = 41.97
Maka data kelompok B lebih tersebar daripada kelompok A
A manufacturer of computer chips claims that less
than 10% of its products are defective. When 1,000
chips were drawn from a large production, 7.5%
were found to be defective.
a. What is the population of interest?
b. What is the sample?
c. What is the parameter?
d. What is the statistic?
e. Does the value 10% refer to the parameter or to
the statistic?
f. Is the value 7.5% a parameter or a statistic?
g. Explain briefly how the statistic can be used to
make inferences about the parameter to test the
claim.
You are shown a coin that its owner says is fair in
the sense that it will produce the same number of
heads and tails when flipped a very large number of
times.
a. Describe an experiment to test this claim.
b. What is the population in your experiment?
c. What is the sample?
d. What is the parameter?
e. What is the statistic?
f. Describe briefly how statistical inference can be
used to test the claim.

Anda mungkin juga menyukai