DISUSUN OLEH :
AFIFAH NUR
PO.71.4.241.15.1.001
1. Statistik Deskriptif
Statistik deskriptif adalah metode-metode yang berkaitan dengan pengumpulan
dan penyajian suatu gugus data sehingga menaksir kualitas data berupa jenis variabel,
ringkasan statistik (mean, median, modus, standar deviasi, etc), distribusi, dan
representasi bergambar (grafik), tanpa rumus probabilistik apapun (Walpole, 1993;
Correa-Prisant, 2000; Dodge, 2006).
2. Ukuran pemusatan
Ukuran pemusatan Data adalah sembarang ukuran yang menunjukkan pusat
segugus data, yang telah diurutkan dari yang terkecil sampai yang terbesar atau
sebaliknya dari yang terbesar sampai yang terkecil.Adapun yang termasuk ukuran
pemusatan yaitu mean,median,modus,dan ukuran letak.
Salah satu kegunaan dari ukuran pemusatan data adalah untuk membandingkan
dua ( populasi ) atau contoh, karena sangat sulit untuk membandingkan masing-
masing anggota dari masing-masing anggota populasi atau masing-masing anggota
data contoh.
3. Ukuran penyebaran
Ukuran Penyebaran Data adalah ukuran yang digunakan untuk menyatakan
sebaran atau variasi dari suatu kelompok data.
4. Uluran letak
Ukuran letak suatu rangkaian data adalah ukuran yang didasarkan pada letak
ukuran tersebut dalam suatu distribusi.Adapun yang termasuk ukuran lerak adalah
kuarti,desil,dan persentil.
5. Mean
Mean adalah teknik penjelasan kelompok yang didasarkan atas nilai rata-rata dari
kelompok tersebut. Rata-Rata (mean) ini didapat dengan menjumlahkan data seluruh
individu dalam kelompok itu, kemudian dibagi dengan jumlah individu yang ada pada
kelompok tersebut.
6. Median
a. Definisi
Median adalah salah satu teknik penjelasan kelompok yang didasarkan atas
nilai tengah dari kelompok data yang telah disusun urutannya dari yang terkecil
sampai yang terbesar, atau sebaliknya dari yang terbesar sampai yang terkecil.
b. Kelemahan dan kelebihan
Kelemahan :
Tidak mempertimbangkan semua nilai data.
Kurang menggambarkan rata-rata populasi.
Peka terhadap penambahan jumlah data.
Kelebihan :
Kelebihan
8. Range
a. Definisi
Range yang biasa diberi lambang R adalah salah satu ukuran statistik yang
menunjukkan jarak penyebaran antara skor (nilai) yang terendah (Lowest Score)
sampai skor (nilai) yang tertinggi (Highest Score). Rentang (range) atau disebut
juga dengan jangkauan adalah selisih antara data dengan nilai yang terbesar
dengan data denga nilai yang terkecil tersebut. Dengan singkat dapat dirumuskan
dengan
R = H-L
Range kita gunakan sebagai ukuran apabila di dalam waktu yang sangat
singkat kita ingin memperoleh gambaran tentang penyebaran data yang sedang
kita selidiki dengan mengabaikan faktor ketelitian atau kecermatan.
b. Kelemahan dan kelebihan Range :
a. Kelebihan range sebagai suatu ukuran penyeabran data ialah dengan
menggunakan range dalam waktu singkat kita dapat memperoleh
gambaran umum mengenai luas penyebaran data yang sedang kita hadapi.
b. kelemahannya adalah sebagai berikut:
1) Range akan sangat bergantung pada nilai-nilai ekstrimnya. Dengan kata
lain besar-kecilnya range akan sangat ditentukan oleh nilai tertinggi
dan terendah yang terdapat dalam data distribusinya, dengan demikian
range sifatnya sangat labil dan kurang teliti.
2) Range sebagai ukuran penyebaran data tidak memperhatikan distribusi
yang terdapat dalam range itu sendiri, sehingga apabila yang diketahui
hanya nilai tertinggi dan terendahnya saja, kita tidak akan tahu nilai-
nilai yang didapat oleh setiap orangnya dari masing-masing tes yang
dilalui.
9. Simpangan baku
a. Definisi
Simpangan baku atau deviasi standar adalah ukuran sebaran statistik yang
paling lazim. Singkatnya, ia mengukur bagaimana nilai-nilai data tersebar. Bisa
juga didefinisikan sebagai, rata-rata jarak penyimpangan titik-titik data diukur dari
nilai rata-rata data tersebut.
Simpangan baku didefinisikan sebagai akar kuadrat varians. Simpangan baku
merupakan bilangan tak-negatif, dan memiliki satuan yang sama dengan data.
Misalnya jika suatu data diukur dalam satuan meter, maka simpangan baku juga
diukur dalam meter pula.
Dalam Statistik, wilayah data yang berada di antara +/- 1 simpangan baku
akan berkisar 68.2%, wilayah data yang berada di antara +/- 2 simpangan baku
akan berkisar 95.4%, dan wilayah data yang berada di antara +/- 3 simpangan
baku akan berkisar 99.7%,
KV = (S / x) . 100%
Keterangan :
KV = Koefisien variasi
S = Simpangan baku
x = Rata-rata
14. Desil
Desil merupakan nilai yang membagi data menjadi sepuluh bagian sama besar.
Desil sering dilambangkan dengan D. jenis ada 9, yairu D1 , D2 , D3, ….,…,…,D9.
15. Persentil
Persentil merupakan nilai yang membagi data menjadi serratus bagian sama
besar. Persentil sering dilambangakan dengan P. jenis persentil ada 99, yaitu P1, P2,
P3 … P99.
16. Statistik inferensial
Statistika inferensial mencakup semua metode yang berhubungan dengan analisis
sebagian data (contoh ) atau juga sering disebut dengan sampel untuk kemudian
sampai pada peramalan atau penarikan kesimpulan mengenai keseluruhan data
induknya(populasi)
Dalam statistika inferensial diadakan pendugaan parameter, membuat hipotesis,
serta melakukan pengujian hipotesis tersebut sehingga sampai pada kesimpulan yang
berlaku umum.
17. Statistik parametrik
a. Definisi
Statistik Parametrik, yaitu ilmu statistik yang mempertimbangkan jenis
sebaran atau distribusi data, yaitu apakah data menyebar secara normal atau tidak.
Dengan kata lain, data yang akan dianalisis menggunakan statistik parametrik
harus memenuhi asumsi normalitas. Pada umumnya, jika data tidak menyebar
normal, maka data seharusnya dikerjakan dengan metode statistik non-
parametrik, atau setidak-tidaknya dilakukan transformasi terlebih dahulu agar
data mengikuti sebaran normal, sehingga bisa dikerjakan dengan statistik
parametrik.
b. Syarat
Data dengan skala interval dan rasio
Distribusi normal
c. Kelebihan dan kekurangan statistik parametrik
Kelebihan dari statistik parametrik adalah sebagai berikut.
1. Syarat-syarat parameter dari suatu populasi yang menjadi sampel biasanya
tidak diuji dan dianggap memenuhi syarat, Pengukuran terhadap data
dilakukan dengan kuat.
2. Observasi bebas satu sama lain dan ditarik dari populasi yang berdistribusi
normal serta MemilIki varian yang homogeny.
Sedangkan kekurangan dari statistik parametrik adalah
1. Populasi harus memiliki varian yang sama.
2. Variabel-variabel yang diteliti harus dapat diukur setidaknya dalam skala
interval.
3. Dalam analisis varian ditambahkan persyaratan rata-rata dari populasi harus
normal dan bervarian sama, dan harus merupakan kombinasi linear dari efek-
efek yang ditimbulkan.
Kelebihan :
Menguji bagaimana pengaruh masing-masing variabel bebasnya secara sendiri-
sendiri terhadap variabel terikatnya. Uji ini dapat dilakukan dengan
mambandingkan t hitung dengan t tabel atau dengan melihat kolom signifikansi
pada masing-masing t hitung, proses uji t identik denganUji F (lihat
perhitungan SPSS pada Coefficient Regression Full Model/Enter). Atau bisa
diganti dengan Uji metode Stepwise.
20. Anova
a. Definisi
Anova adalah analisis yang digunakan untuk menguji perbedaan mean (rata-
rata) data lebih dari dua kelompok. Misalnya kita ingin mengetahui apakah ada
perbedaan rata-rata IQ antara siswa kelas SMP kelas I, II, dan kelas III. Ada dua
jenis Anova, yaitu analisis varian satu faktor (one way anova) dan analisis varian
dua faktor (two ways anova).
b. Syarat
Data berskala minimal interval
Varian antar kelompok harus homogen
Data masing-masing kelompok berdistribusi normal
Kelebihan :
Metode penelitian yang paling akurat dalam melakukan eksperimen yang
berusaha membuktikan atau menolak hipotesis secara matematika dengan
menggunakan analisastatistik. Hal yang menonjol dari metode ini adalah adanya
variabel dan control grup (Shuttleworth, 2008). Kontrol adalah perlakuan yang
dijadikan sebagai standar (benchmark) untuk mengevaluasi efektifitas dari
perlakuan-perlakuan yang diberikan dalam eksperimen (Kuehl, 2000). Anova
digunakan sebagai alat analisis untuk menguj ihipotesis penelitian yang mana
menilai adakah perbedaan rerata antara kelompok. Hasil akhir dari analisis
ANOVA adalah nilai F test atau F hitung. Nilai F Hitung ini yang nantinya akan
dibandingkan dengan nilai pada tabel f. Jika nilai f hitung lebih dari f tabel, maka
dapat disimpulkan bahwa menerima H1 dan menolak H0 atau yang berarti ada
perbedaan bermakna rerata pada semua kelompok.
21. Korelasi pearson
a. Definisi
Korelasi Pearson adalah suatu bentuk rumus yang digunakan untuk mencari
hubungan antara dua variabel, yaitu variabel bebas atau independent
variable dan variabel terikat atau dependent variable. Di mana umumnya variabel
terikat diberi notasi Y dan variabel bebas diberi notasi X, di mana variabel bebas
ini merupakan pemberian dari hasil suatu pengamatan sehingga variabel bebas
tersebut tidak lagi Random atau acak. Untuk penelitian lebih lanjut perlu
dilakukan uji kerandoman data sampel.
b. Syarat
Sampel diambil dengan teknik random (acak)
Data yang akan diuji harus homogen
Data yang akan diuji juga harus berdistribusi normal
Data yang akan diuji bersifat linier
c. Kelebihan
Korelasi ini menghitung data apa adanya, tidak membuat ranking atas data yang
digunakan seperti pada korelasi Rank Spearman. Ketika kita memiliki data
numeric seperti nilai tukar rupiah, data rasio keuangan, tingkat pertumbuhan
ekonomi, data berat badan dan contoh data numeric lainnya, maka Korelasi
Pearson Product Moment cocok digunakan.
b. Syarat
Regresi linear sederhana :
Data interval atau rasio,
Linearitas,
Normalitas,
Heteroskedastisitas,
Outlier,
Autokorelasi (Hanya untuk data time series atau runtut waktu).
Kekurangan :
Tidak mampu menunjukkan titik jenuh fungsi yang sedang diselidiki akibatnya
selalu timbul kemungkinan kesalahan prediksi.
Kelebihan :
Dengan menggunakan regresi lianer berganda maka dapat menganalisis dengan
menggunakan beberapa variabel bebas (X) sehingga hasil prediksi yang
didapatkan lebih akurat dibandingkan dengan regrasi linear sederhana yang hanya
menggunakan satu variabel bebas (X).
Kelebihan :
menguji kondisi (variabel) pada sampel yang berpasangan atau dapat juga
untuk penelitian sebelum dan sesudah. Dalam uji ini ingin diketahui manakah
yang lebih besar dari antara pasangan. Cara ini sekarang dinamakan uji Wilcoxon
atau Uji Ranking Bertanda Wilcoxon. Merupakan penyempurnaan dari uji tanda.
Kelebihan :
Metode ini dapat diterapkan terhadap data yang diukur dengan skala ordinal dan
dalam kasus tertentu, dengan skala nominal. Pengujian non parametric bermanfaat
untuk digunakan apabila sampelnya kecil dan lebih mudah dihitung dari pada
metode parametrik. Metode nonparametric juga digunakan secara luas guna
mengenalisis data di bidang ilmu sosial (Supranto dalam Sriwidadi Teguh, 2011:
752).Uji Mann-Whitney adalah uji terkuat yang digunakan sebagai alternative uji
parametrik T test. Uji test Mann- Whitney ini digunakan unutuk menguji hipotesis
komparatif dua sampelin dependen bila datanya berbentuk ordinal.
Kelebihan :
Uji kruskal wallish merupakan uji alternative untuk uji F dan uji one way Anova
untuk pengujian kesamaan beberapa nilai Tengah dan analisis ragam yang dapat
kita gunakan jika asumsi kenormalan tidak terpenuhi.Kruskall Wallis dapat
digunakan pada lebih dari 2 kelompok misal 3, 4 atau lebih.
b. Syarat
Tidak ada cell dengan nilai frekuensi kenyataan atau disebut juga Actual
Count (F0) sebesar 0 (Nol).
Apabila bentuk tabel kontingensi 2 X 2, maka tidak boleh ada 1 cell saja
yang memiliki frekuensi harapan atau disebut juga expected count (“Fh”)
kurang dari 5.
Apabila bentuk tabel lebih dari 2 x 2, misak 2 x 3, maka jumlah cell dengan
frekuensi harapan yang kurang dari 5 tidak boleh lebih dari 20%.
30. Regresi logistik
a. Definisi
Regresi logistik merupakan salah satu jenis regresi yang menghubungkan
antara satu atau beberapa variabel independen (variabel bebas) dengan variabel
dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen
berupa kategori inilah yang membedakan regresi logistik dengan regresi berganda
atau regresi linear lainnya.
b. Syarat
variabel bebas berskala Interval /Rasio, sedangkan variabel terikat berskala
Nominal dengan nilai 1 dan 0.
Berbasis distribusi chi-square sehingga tak memerlukan persyaratan
normalitas data.
c. Kekurangan dan kelebihan
Walaupun analisis diskriminan dapat menganalisis variabel dependen yang
bersifat nonmetrik, regresi logistik juga memiliki dua alasan mengapa variabel
dependen berpasangan. Pertama analisis diskriminan mempercayakan dengan
pertemuan asumsi kewajaran multivariat dan kesamaan matriks varian-kovarian
jarak asumsi kelompok dimana tidak akan ditemukan dalam semua situasi.Regresi
logistik tidak menggambarkan secara jelas sebuah asumsi dan lebih kuatketika
asumsi tidak mencukupi, membuat aplikasi secara tetap dalam banyak situasi.
Kedua ketika asumsi tidak mencukupi, banyak peneliti lebihmenggunakan regresi
logistik karena hampir mirip dengan regresi berganda.Regresi logistik merupakan
pilihan nilai yang lebih baik. Masalah penelitianyang muncul kategori variabel
dependen sederhana dan beberapa variabeldependen metrik atau nonmetrik.
Kelebihan relatif atas kemampuan jarak yang fleksibel sesuai dengan aturan
peneliti, mendapatkan ketahanan dari asumsi yangmendasari dan hubungan regresi
berganda untuk interpretasi tujuan. Hasilnyaakan memberikan implikasi luas
terhadap bidang akademisi dan praktisi.