Ringkasan Metode Statistika PDF
Ringkasan Metode Statistika PDF
RingkasanMetodeStatistika2/27
1 STATISTIKAPARAMETRIK
Sebagian besar metode statistika diturunkan secara analitik dan deduktif
berdasarkan asumsi fungsi kepadatan. Oleh karena itu, untuk bisa
memanfaatkanmetodetersebutdenganbenar,dataharusmengikutisebaran
tertentu (misalnya Binomial, Poisson, Normal, Eksponensial, Gamma dan
sejenisnya). Persoalan yang dihadapi pada umumnya adalah menduga atau
menguji partemeter yang belum diketahui dari distribusi tertentu yang
dianggap sesuai dengan kondisi data. Metode statistika yang diturunkan
seperti ini disebut metode parametrik. Namun tidak semua metode
parametrik melakukan uji parameter (uji hipotesis), beberapa diantaranya
hanya melakukan eksplorasi informasi yang melaporkan kesimpulan yang
diperolehdarieksplorasitersebut.
1.1 STATISTIKADENGANUJIHIPOTESIS
Dalambeberapakondisi,penelititelahmemilikigambaran(dugaan)tentang
populasi (bisa berdasarkan kajian teori, atau hasil penelitian terkait
sebelumnya). Dalam hal ini, tujuan utama peneliti adalah membuktikan,
dengan alat statistika, apakah dugaan yang yang dimilikidapat
RingkasanMetodeStatistika3/27
dibuktikanbenar atau sebaliknya. Ada dua kelopok besar yang dapat
dilakukandenganujihipotesisyaitu:
1. Ujihipotesisterkaitujireratayaituuntukmengujiataumengestimasi
besarnya rerata 1 kelompok, menguji beda dua kelompok atau lebih,
denganberbagaikondisikelompok(salingbebasatauberpasangan/
tidaksalingbebas).
2. Uji hubungan baik terbatas pada besarnya derajat asosiasi (uji
korelasi)ataumencaribentukhubunganfungsionalbeberapavariabel
(uji regresi). Uji regresi saat ini juga telah berkembang sangat luas
tergantungdistribusivariabelresponyangdihadapi.
UJIRERATA
Dalam statistika parametrik, salah satu parameter yang banyak menarik
perhatian untuk diuji atau diramal adalah parameter rerata (mean). Untuk
data dengan 1 subpopulasi atau 2 subpopulasi (sering juga disebut
kelompokdengansatuatauduakategori,)ujiyangdipakaiadalahujiZatau
T.SedangkanuntuksubpopulasilebihdariduadipergunakanujiFataulebih
dikenaldengananalisivariansi(ANAVA)
UJITDANZ(KELOMPOKDENGANSATU DUAKATEGORI)
RingkasanMetodeStatistika4/27
1. Kita ingin menguji apakah rerata keseluruhan populasi sama dengan
angkatertentu.Dalamhaliniadaduaujistatistikayangdapatdilakukan
yaitu:
a. UjiTsatukelompokjikaukuransampelkecildanvariansipopulasi
tidakdiketahui.
b. UjiZsatukelompokjikaukuransampelcukupbesaratauvariansi
populasidiketahui.
2. Kita ingin menguji apakah rerata dua kelompok (yang ada secara
alamiah, misalnya lakiperempuan, dalam kotaluar kota) sama atau
berbeda. Dengan kata lain apakah suatu atribut (jenis kelamin, status
sosial,tempattinggal)berpengaruhterhadapsuatukondisiyangmenjadi
perhatian.
a. Uji T dua kelompok saling bebas jika ukuran sampel kecil dan
variansipopulasitidakdiketahui.
b. UjiZduakelompoksalingbebasjikaukuransampelcukupbesar
atauvariansipopulasidiketahui.
3. Kita ingin menguji apakah rerata dua kelompok (yang muncul dari
rekayasa, misalnya kelompok eksperimenkontrol) sama atau berbeda.
Dengankatalainapakahsuatueksperimenmemberidampaksepertiyang
diperkirakan. Dalam hal ini dua subpopulasi yang terbentuk merupakan
subpopulasiyangtidaksalingbebasataubahkan(satukelompokdengan
dua atribut, pre & post treatment/test atau dua subpopulasi yang saling
berpasangan,eksperimenkontrol)
a. Uji T dua kelompok berpasangan jika ukuran sampel kecil dan
variansipopulasitidakdiketahui.
b. UjiZduakelompokberpasanganjikaukuransampelcukupbesar
atauvariansipopulasidiketahui.
RingkasanMetodeStatistika5/27
UJIF/ANAVA(KELOMPOKDENG ANKATEGORIATAULEBIH)
Jika banyaknya subpopulasi lebih dari dua (tiga atau lebih), maka uji yang
dapat dilakukan adalah uji ANAVA/ANOVA (Analisis variansi/analysis of
variance). Pada umumnya uji anava dibatasi pada subpopulasi yang saling
bebasyaitusubpopulasisatudenganlainnyabukanmerupakansubpopulasi
yang sama, juga bukan merupakan subpopulasi yang berpasangan. Uji
ANAVAdibedakanmenjadiduamacamyaitu:
1. ANAVA satu arah (jika hanya ada satu pengelompokan yang menjadi
perhatian,misalnyastatussosial:kaya,menengah,miskin)
2. ANAVA multi arah (jika hanya ada lebih dari satu pengelompokan yang
menjadi perhatian, misalnya beda ratarata tekanan darah penduduk
dilihatdaristatussosial(kaya,menengah,miskin)danpendidikan(dasar,
menengah, tinggi), atau yang lainnya (suku bangsa: jawa, bali dan
lainnya)
3. MANAVA/MANOVA*) 1 (Multivariat Anava) yaitu ANAVA untuk respon
yangtidaksalingbebas(multivariat).Datamultivariatiniterjadiapabila
kelompok yang sama diamati untuk lebih dari dua atribut (misalnya
untukmahasiswadilihatnilaiTugas,NilaiUjianMiddanNilaiUjianAkhir,
atausatuatributdiamatilebihdariduakali(tekanandarahpasienpagi,
siang dan malam hari). Uji MANOVA kadangkadang disebut juga uji
profil.
Uji dengan tanda *) menunjukkan termasuk metode tingkat menengah atau lanjut
(advanced statistical method) yang diberikan pada tingkat S2/S3. Sedangkan ujiuji lainnya
termasukmetodestatistikadasaryangdiberikanditingkatS1
RingkasanMetodeStatistika6/27
A . UJIPROPORSI
UJIHUBUNGAN
Selain melakukan uji beda rerata beberapa kelompok, kadangkadang kita
inginmengujiapakah duapeubah (atributmasyarakat)salingberhubungan
atau tidak. Dalam hal ini ada dua hal yang umum dilakukan yaitu (i) hany
ainginmengetahuiderajatasosiasi(apakahduavariabelberhubunganpositif
ataunegatif),(ii)inginmengetahuihubunganfungsionalantaraduavariabel
ataulebih.
UJIKORELASI
UJIREGRESI
Berbeda dengan uji korelasi, dengan uji regresi kita lebih tertarik pada
hubungan fungsional antara suatu peubah (misalnya y) dengan beberapa
peubahlainnya(misalnya x1 , x2 ,... )yangdinyatakandalambentuk
y = f ( x1 , x2 , ) + e .
RingkasanMetodeStatistika7/27
Variabelydisebutvariabelrespon(terikat)danxidisebutvariabelbebasatau
variabel penjelas. Dari bentuk umum di atas diperoleh beberapa bentuk
analisisregresikhususyangdilihatdarijenisdistribusidatanya.
A. REGRESINORMAL(NORMAL LINEARMODEL),
yaituregresidengandatarespon(y)berdistribusiNormaldansalingbebas.
B. REGRESINORMALCAMPURAN(NORMALMIXEDMODEL)*,
yaituregresiuntukdataresponberdistribusinormaltetapimerupakandata
tidak saling bebas (bisa berasal dari pengamatan berulang, seperti tekanan
darahdalamtigawaktuberbeda)
C. REGRESITERGENERALISIR(GENERALIZEDLINEARMODEL)*,
yaituregresidengandataresponyangtidakberdistribusinormal(misalnya
Binomial,Poisson,Eksponensial).Termasukdalamjenisiniadalahanalisis
probitataulogitatauregresilogistik(untukdataberdistribusiBinomial)dan
analisisloglinieruntukdataberdistribusiPoisson.
D. REGRESICAMPURANTERGENERALISIR(GENERALIZEDLINEAR
MIXEDMODEL)*,
yaitu regresi untuk data yang tidak berdistribusi normal juga tidak bebas.
Termasuk dalam analisi ini adalah GEE (Generalized Estimating Equation),
GLMM, HGLM (Hierarchical Generalized Linear Model), GRASP untuk data
bersipatspasial.
E. REGRESIDENGANMULTIKOLINIERITAS
Selain berdasarkan distribusi sebaran, dalam penerapannya analisis regresi
jugabervariasijikadilihatkompleksitasvariabelpenjelas xi,misalyaapakah
diantaranya ada variabel kategorik berupa kelompok atau faktor (misalnya
jeniskelamin,etnikdansejenisnya),demikianjugaapakahdiantaravariabel
RingkasanMetodeStatistika8/27
penjelas ada yang saling berkorelasi satu dengan lainnya (ada tidaknya
multikolinieritas).
F. REGRESINONLINIER(ADITIF)
Regresiregresi(model)diatasdikelompokkandalamregresi(model)linier
karenamasukknyaparameterkedalammodel,khususnyakaitannyadengan
peubah penjelas. Berupa hubungan linier
x
j =1
ij
yang selanjutnya
G. REGRESIDENGANPENGHALUSAN(SEMIPARAMETRIK)
Adakalanyaselainmembentukfungsinonlinierdenganparameter j ,dapat
jugadikombinasikandengankomponenpenghalusyangbiasadisebutfungsi
nonparametrik.
Keduanya
menghasilkan
regresi
semiparametrik
g ( ) = f ( xij j ) + s ( ) .
H. REGRESIDENGANDIRISENDIRI(ANALISISDERETWAKTU/TIME
SERIES)*.
Sering peneliti tertarik melihat tren dari suatu fenomena dari waktu ke
waktudalamjangkawaktuyangrelatiflama.Misalnyahargarataratabarang
perbulan dalam jangka waktu 23 tahun, biaya listrik ataupun tilpun
perbulan selama 23 tahun. Analisis deret waktu (time series) berkembang
cukup luas dan telah menjadi bidang kajian tersendiri yang banyak
aplikasinyadalambidangekonomi(ekonometrik).
RingkasanMetodeStatistika9/27
1.2 EKSPLORATIF(ANALISISEKSPLORASIDATA)
Tidak semua analsis statistika bertujuan menguji atau meramal parameter.
Ada beberapa analisis, umumnya untuk data multi variabel, lebih bersifat
eksploratif dan hanya melaporkan hasil eksplorasi tanpa harus didahului
olehpendugaanparameter.Namun,analisisinidisisilainmasihdidasarkan
atasasumsibahwaresponyangdiamatimengikutisebarannormal.Beberapa
analisis multivariat (peubah ganda) yang termasuk dalam kelompok ini
diantaranyaadalahanalisisgerombol,analisidiskriminan,analisiskomponen
utama.
5
ANALISISKOMPONENUTAMA
ANALISISGEROMBOL(CLUSTERANALYSIS)*
RingkasanMetodeStatistika10/27
kedekatan potensi sehingga memudahkan pemerintah daerah membuat
kebijakanyang
sesuai
dengan
wilayah
tersebut.
Analisis
untuk
pengelompokkansepertiinidisebutanalisisgerombol.Analisisgerombolini
adayangbersifathirarkis(bertingkat)adajugayangtidak.
Berbeda
dengan
kondisi
sebelumnya
dimana
pada
dasarnya
RingkasanMetodeStatistika11/27
2 STATISTIKANONPARAMETRIK
Statistika nonparametrik tidak didasarkan atas asumsi distribusi pada data.
Oleh karena itu analisis ini sering disebut sebagai analisis statistika bebas
distribusi (distribution free statistical anaysis). Kondisi ini biasanya
diberlakukan pada data dengan ukuran kecil dan dengan skala pengukuran
yang jauh dari skala interrval. Karena ukuran data yang kecil, ukuran
pemusatanyangmenjadifokustidaklagiratarataataurerata,tetapimedian.
RingkasanMetodeStatistika12/27
2.2 UJIKELOMPOKBERPASANGAN
UjiiniekuivalendenganujiZatauujiTuntuksampelberpasanganpadauji
parametrik. Bedanya terletak pada kondisi sebaran data yang juga terkait
dengan sekala pengukuran data. Uji yang dapat dipergunakan adalah Uji
Wilcoxonuntukdataberpasangan.
2.3 UJILEBIH DARIDUAKELOMPOKSALINGBEBAS
Uji ini ekuivalen dengan uji ANAVA pada uju parametrik. Bedanya terletak
padakondisisebarandatayangjugaterkaitdengansekalapengukurandata.
UjiyangdapatdipergunakanadalahujiHKruskalWalis.
2.4 KORELASI RANK SPEARMAN DAN REGRESI TEGAR
(ROBUST)
Analisis ini ekuivalen dengan analsis korelasi produk momen untuk uji
parametrik.Untukujinonparametrik,karenadatanyapadaumumnyapada
skalarankorder,korelasiyangdihitungadalahkorelasirankdariSpearman.
Untuk data yang tidak bersebaran normal yang ditandai dengan adanya
beberapa pencilan analisis regresi yang dapat dipakai diantaranya adalah
regresitegar/robust.Adabeberapapendekatanuntukregresitegar.
RingkasanMetodeStatistika13/27
3 METODE
SIMULASI
STATISTIKA
BERBASIS
RingkasanMetodeStatistika14/27
3.2 MCMC(MCMC:MARKOVCHAINEDMONTECARLO)
Merekonstruksi sampel baru dengan karakteristik yang sesuai. Selanjutnya
estimasi dan uji keseluruhan dilakukan berdasarkan informasi yang
diperolehestimasipadamasingmasingdatasimulasitadi.
RingkasanMetodeStatistika15/27
4 PAKETSTATISTIKAR
PaketstatistikaRdapatdiaksesdenganduacaraumumyaitumelaluimenu
untuk metode statistika yang umum, salah satu menu (Rgui) yang populer
adalah Rcommander. Cara lain adalah dengan mrelalui skrip pemrograman
(CLI). Informasi lebih lanjut dapat dicari pada Situs R (http://www.r
project.org) Untuk informasi awal berbahasa Indonesia dapat dicari pada
SituRdiUnej(http://r.unej.ac.id)
4.1 STRUKTURMENURCOMMANDER
Panel-----|-|-|-|-|--
Menu
Data ------|--Data set Baru
|--Impor data --------|--Dari Teks
|--Dari SPSS
|--Dari Minitab
|--Data pada R -------|--Daftar data
|--Data dari paket aktif
Statistika-|--Ringkasan ---------|--Data set aktif
|--Numerik
|--Matriks korelasi
|--Tabel kontingensi -|--Satu arah
RingkasanMetodeStatistika16/27
|--Multi arah
|--Analisis dua arah
|--Proporsi ----------|--Sampel Tunggal
|--Sampel ganda
|--Variansi ----------|--Uji F beda variansi
|--Uji Bartlett
|--Uji Levene
|--Nonparametrik -----|--Uji Wilcoxon sampel tunggal
|--Uji Wilcoxon sampel ganda
|--Uji Kruskal Walis
|--Regresi -----------|--Regresi Sederhana
|--Model Linier
|--Model Linier Tergeneralisir
(GLM)
|--Uji Beda ----------|--Uji
|--Uji
|--Uji
|--Uji
|--Uji
t sampel tunggal
t sampel ganda
t sampel berpasangan
anava satu faktor
anava multi faktor
Normal
t
Chi-kwadrat
Seragam
Gumbel
RingkasanMetodeStatistika17/27
Alat ------|--Aktifkan paket
|--Aktifkan Plug-in
|--Pilihan
Bantuan ---|--Bantuan Commander
|--Pengantar RCommander
|--Bantuan data (jika ada)
|--Tentang Rcmdr
RingkasanMetodeStatistika18/27
5 OUTPUTRCOMMANDER
BerikutadalahbeberapacontohkeluarananalisisdenganRCommander.
5.1 UJIBEDA
Berikutadalahcontohkeluarandenganhipotesisalternatifduaarahdengan
penjelasannya(nomorbarisditambahkanuntukmemudahkanpembahasan)
1. One Sample t-test
2. data:
ContohData$NMat
Keterangankeluaran
1. Judul/namauji,dalamhaliniujitsatusampel(onesampletest)
2. Nama data danvariabel yang diuji, dalam contoh ini datanya adalah
ContohData,variabelnyaadalahMat.
RingkasanMetodeStatistika19/27
3. Hasil perhitungan thitung yaitu 3,74, derajat kebebasan (df= degree of
freedom),yaitu79dannilaipatau(pvalue),yaitu0,00034.
4. Rumusanhipotesisalternatif,dalamcontohinimenggunakanHaduaarah.
5. Judulintervalkeyakinanyangdihitung(dalamhalini,intervalkeyakinan
99%)
6. Besarnya batas bawah dan batas atas interal keyakinan, dalam hal ini
(72,35;77,68).
7. Judulpendugasampel
8. Statistiksampelyangdihitung(dalamhalinirataratasampel,meanofX)
9. Besarnyastatistiksampelyangdimaksud(rataratasampel=75,01).
Denganhipotesisalternatifduaarah(reratakeduakelompoktidaksamaatau
selisihreratakeduakelompoktidaksamadengannol),danasumsivariansi
sama,diperolehhasilberikut
1. Two Sample t-test
2. data:
NMat by JKelamin
8.308270
6. sample estimates:
mean in group L mean in group P
76.50488
73.51860
Keterangankeluaran
1. Judulanalisis(Ujitduasampel)
2. Namadata(Nmat)danfaktorpengelompokan(JenisKelamin)
RingkasanMetodeStatistika20/27
3. Nilaithitung(t = 1,1171) ,derajatkebebasan(df = 78), dannilai
p(p-value = 0,2674).
4. Rumusan hipotesis alternatif (Beda rerata yang sebenarnya tidak sama
dengannol)
5. Intervalkeyakinan95%daribedareratakelompokLakidanPerempuan
yaitu(2,34;8,31).
6. Pendugarerata(rataratamasingmasingkelompoLakidanPerempuan),
yaitumasingmasingL:76,5danP:73,52
5.2 UJIKORELASI
Keterangan
RingkasanMetodeStatistika21/27
1. JudulujiyaituUjikorelasprodukmomendariPearson
2. Nama data dan variabel yang korelasinya diuji, yaitu data DataSim
varianelNFisdanNMat.
3. Besarnya nilai t hitung (12,43), derajat kebebasan (78) dan nilai
peluangp(<1%,yangberartisangatsignifikan).
4. Rumusanhipotesisalternatif(yaitukorelasitidaksamadengan0)
5. Intervalkeyakinan95%darikorelasipopulasiyaitu[0,73;0,88].
6. Korelasisampel(cor),yaitu0,82.
RingkasanMetodeStatistika22/27
5.3 UJIREGRESI
Keluarandariprogramtersebutadalahsepertiberikutini.Keluarantersebut
diberinomoruntukmemudahkanpenjelasan.
1. lm(formula = NFis ~ NMat, data = DataSim)
2. Residuals:
Min
1Q
Median
3Q
Max
-29.4726
-2.6436
-0.5996
1.0129
34.2166
3. Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)
8.55473
5.12003
1.671
NMat
0.83811
0.06741
12.432
0.0988 .
<2e-16 ***
Keterangankeluaran
1. Menunjukkan fungsi R yang dipanggil dengan data dan variabel terkait.
Pada contoh di atas data diambi dari DataSim dengan bentuk model
NFis=f(NMat), yaitu variabel respon NFis dan variabel penjelas NMat.
Dalamkonteksinipenelitiinginmemperolehhubunganfungsionalantara
NilaiUjianFisikadenganNilaiUjianMatematika.
2. Menunjukkan sebaran (statistik ringkas) dari kesalahan (sisa), yaitu
penyimpanganantaradugaangarisregresidengandata.
3. Menunjukkan hasil pendugaan koefisien dan uji signifikansinya. Pada
contohdiatasdiperoleh
RingkasanMetodeStatistika23/27
a. Intercept (titk potong/konstanta) a=8,55 dengan nilai p = 0,099.
Angkainimenunjukkanbahwakonstantaregresitidaksignifikan.
Walaupunnilainyacukupbesar(8,55)tetapisecarastatistikdapat
dianggap0.Dengankatalainmodelyanglebihtepatadalahmodel
Y=bX. Ini juga menunjukkan bahwa pada saat tingkat nilai X=0,
maka Y juga cenderung 0. Namun kusus untuk uji konstanta
(intercept), nilai 9% dapat dianggap sebagai nilai marjinal
(dekatdengan5%),olehkarenaitukonstantacenderungdibiarkan
padamodel.
b. Koefisien regresi untuk variabel NMat, b,besarnya 0,83 dengan
nilai p <2e-16. Ini menunjukkan bahwa koefisien ini sangat
signifikan (walaupun secara matematis nominalnya jauh lebih
kecildibandingkonstanta).
4. Menunjukkan tingkat signifikansi yang diperoleh (0%, 0,1%, 1%, 5%,
10%dan100%)
5. Menunjukan kesalahan baku dan derajat kebebasan (besarnya n2) dari
sisa.
6. Menunjukkankoefisiendeterminasidankoefisiendeterminasiyangtelah
disesuaikan. Koefisien determinasi yang baik adalah yang mendekati 1.
Semakin mendekati 1, semakin baik. Koefisien determinasi yang rendah
menunjukkan banyak data yang pemyebar jauh dari garis regresi.
Besarnya koefisien determinasi berbanding terbalik dengan besarnya
kesalahan baku sisa. Jika kesalahan baku besar, koefisien determinasi
cenderungkecil(Lihatcontohkeluaranberikutnya).
7. MenunjukkanujisignifikansisecarakeseluruhanyangmenggunakanujiF
padaderajatkebebasan(1dann2).Padacontohinihasilnyasignifikan.
RingkasanMetodeStatistika24/27
5.4 GRAFIK
ILUSTRASIUJIBEDA1SAMPEL
t-tab:
2.05
|t-hit|:
9.6
Sebaran Sampel
p-val
0
54
58.88
59.92
57.84
Interval Keyakinan Mean
52
54
56
58
60
62
0.95
64
66
UJIBEDA2KELOMPOK
RingkasanMetodeStatistika25/27
Sebaran Sampel
p-val
t-tab:
2.0017
|t-hit|:
11.5291
49.07
64.15
Rata-rata Sampel
IK Beda Mean(M-B)
-12.46
-17.7
0.95
40
50
60
70
80
DIAGRAMPENCARDENGANVARIABELKELOMPOK
RingkasanMetodeStatistika26/27
JKelamin
70
50
60
NFis
80
90
L
P
50
60
70
80
90
NMat
MATRIKSDIAGRAMPENCARDENGANVARIABELKELOMPOK
RingkasanMetodeStatistika27/27
30
40
50 60
70
120
160
200
y1
||
y2
70
-20 -10
10
y3
60
x1
30 40
50
L
P
160
200
-20 -10
10