Anda di halaman 1dari 81

Analisis Statistik

ISTILAH
• Statistika.
suatu ilmu yang mempelajari cara pengumpulan, pengolahan
/pengelompokan, penyajian dan analisis data serta cara
pengambilan secara kesimpulan secara umum berdasarkan
hasil penelitian yang tidak menyeluruh
• Statistika Deskriptif dan Statistika Inferensia.
Statistika deskriptif adalah metode-metode yang berkaitan
dengan pengumpulan dan penyajian suatu gugus data
sehingga memberikan informasi yang berguna.
• Statistika inferensia mencakup semua metode yang
berhubungan dengan analisis sebagian data untuk kemudian
sampai pada peramalan atau penarikan kesimpulan
mengenai keseluruhan gugus data induknya.
• Populasi dan Contoh.
Populasi adalah keseluruhan pengamatan yang menjadi
perhatian kita.
Contoh adalah suatu himpunan bagian dari data.
• Contoh Acak Sederhana.
Suatu contoh acak sederhana n pengamatan adalah
suatu contoh yang dipilih sedemikian rupa sehingga
setiap himpunan bagian yang berukuran n dari populasi
tersebut mempunyai peluang terpilih yang sama.
• Statistik dan Parameter.
Statistik adalah sembarang nilai yang menjelaskan ciri
suatu contoh.
Parameter adalah sembarang nilai yang menjelas-kan ciri
populasi.
• Datum dan Data.
Datum adalah bentuk tunggal dari data berupa satu nilai
hasil pengamatan atau hasil pengukuran.
Data adalah bentuk jamak dari datum berupa
sekumpulan nilai hasil pengamatan atau hasil
pengukuran.
Types of Data
Interval scale data
• Data interval adalah data yang diperoleh dengan cara pengukuran, dimana
jarak antar dua titik pada skala, sudah diketahui. Berbeda dengan skala
ordinal, dimana jarak dua titik tidak diperhatikan (seperti berapa jarak
antara puas dan tidak puas, yang sebenarnya menyangkut perasaan orang
saja)

Contoh:

• Temperatur bisa diukur dalam Celsius, atau Fahrenheit, dengan masing-


masing punya skala sendiri.

Celcius pada 0° C sampai 100° C. Skala ini jelas jaraknya 100-0=100


• Fahreinheit pada 32° F sampai 212°F. Skala ini jelas jaraknya, 212-32=180

Ciri Data Interval:


• Tidak ada kategorisasi atau pemberian kode seperti terjadi pada data
nominal dan ordinal.
• Bisa dilakukan operasi matematika. Panas 40 ° C =dua kali panas 20 ° C.
• Kita tahu persis seberapa besar perbedaan
berat yang seperti kita gambarkan sepanjang
seri.
• Perbedaan berat benda antara 1 dan 2 g
sama dengan pada langkah 2-3 g atau 6-7 g,
dan sebagainya.
• Karena pengukuran ini memiliki langkah-
langkah berukuran konstan (interval),
pengukuran skala digambarkan sebagai 'skala
interval konstan dan data sebagai' scale'.
Ordinal scale data
Data berskala ordinal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi,
tetapi diantara data tersebut terdapat hubungan.

Ada pengukuran yg bersifat subjektif misal baik atau bagus untuk mengukur sesuatu
objek.
Contoh:
Kepuasan pelanggan, diklasifikasikan sebagai:

Sangat puas, diberi tanda 1,


Puas, diberi tanda 2,
Cukup puas, diberi tanda 3,
Tidak puas diberi tanda 4,
Sangat tidak puas diberi tanda 5

Ciri Data Ordinal:


1. posisi data tidak setara. Dalam kasus di atas, sikap pelanggan yang sangat puas, lebih
tinggi dari yang puas. Sikap pelanggan yang puas, lebih tinggi dari yang cukup puas, dst.
Angka/tanda bisa dibalik dari 5 hingga 1, tergantung kesepakatan.
2. Tidak bisa dilakukan operasi matematika. Tidak mungkin 1+2=3 (yang berarti sangat
puas ditambah puas = cukup puas)
Nominal scale data
• Data Nominal biasa disebut data skala nominal adalah data yang
diperoleh dengan cara kategorisasi atau klasifikasi
• Contoh: Jenis Tablet, diklasifikasi sebagai:

Tablet immediate release, diberi tanda 1,


Tablet sustained release, diberi tanda 2,
Tablet pulsatile release , diberi angka 3

• Ciri Data Nominal:


Posisi data setara. Dalam contoh tersebut, Tablet immediate release
tidak lebih tinggi/lebih rendah dari Tablet sustained release.
• Tidak bisa dilakukan operasi matematika (X, +, - atau : ). Contoh,
tidak mungkin 3-2=1 (Tablet pulsatile release dikurangi Tablet
sustained release =Tablet immediate release
DATA RASIO
• Data berskala rasio adalah data yang diperoleh dengan cara
pengukuran, dimana jarak dua titik pada skala sudah
diketahui, dan mempunyai titik nol yang absolut. Ini berbeda
dengan skala interval, dimana tdk ada titik nol
mutlak/absolut. Seperti titik 0°C tentu beda dengan titik 0°F.

Contoh:Jumlah kapsul dalam kemasan botol: Jika 100, berarti


ada 100 kapsul. Jika 0, berarti tidak ada kapsul (absolut 0)

Ciri Data Rasio:


• Tak ada kategorisasi atau pemberian kode.
• Bisa dilakukan operasi matematika. Missal: 100 cm + 35 cm =
135 cm; 5 L + 2 L = 7 L
• Pengolahan data kuantitatif sebagian besar menggunakan
data rasio.
NILAI STATISTIKA
• PENJUMLAHAN
• MINIMUM
• MAXIMUM
• Mean
• Median
• Modus
• Wilayah (Range)
• Standard Deviasi (simpangan baku)
• dll
Mean/
Rata-rata populasi
N= jumlah populasi

Rata-rata sampel
N= julah sampel
Rata-rata untuk data berkelompok

• Apabila data sudah disajikan dalam data berkelompok seperti dalam bentuk tabel
frekuensi dimana observasi-observasi dikelompokan kedalam kelas-kelas yang
disebut frekuensi
Rata-rata= 3285/50=65,7
Median

• Nilai tengah data setelah diurutkan, nilai yg ke


Median untuk data berkelompok
• Mediannya merupakan observasi yang ke (50/2) yaitu yang ke 25
• Jumlah tiga frekuensi pertama (f1 + f2 + f3) yaitu 3 + 5 + 8 =
16. Untuk mencapai 25 observasi diperlukan 9 observasi lagi. 9
observasi tersebut dapat dipenuhi dari frekuensi keempat (f4) karena
jumlah observasi f4 ada sebanyak 14 observasi. Jadi median terletak
pada kelas keempat atau kelas (60 – 69) dengan kata lain kelas
keempat adalah kelas median.
• Apakah nilai median yang sebenarnya adalah 66,33?
• Belum tentu, karena cara ini adalah cara interpolasi dimana data aslinya
memang tidak diketahui, yang ada adalah data sudah dalam bentuk tabel
frekuensi/sudah dikelompokkan.
• Hasil interpolasi ini mungkin tidak tepat, namun cara ini memberikan hasil
yang mendekati nilai median yang sebenarnya.
Modus/ Mode
• Modus adalah nilai observasi yang memiliki frekuensi
terbanyak dalam seperangkat data (nilai yang paling
banyak muncul)
a). 2, 3, 5, 7, 8

b). 2, 5, 7, 9, 9, 9, 10, 10,


11, 12.

c). 2, 3, 4, 4, 4, 5, 5, 7,
7, 7, 9.

Data
a) tidak mempunyai modus karena semua nilai mempunyai
frekuensi yang sama.
b) mempunyai modus = 9, karena nilai observasi ini
mempunyai frekuensi paling banyak.
c) Mempunyai dua modus yaitu 4 dan 7, dua nilai observasi
tersebut mempunyai frekuensi paling banyak dan sama
banyak.
• Modus untuk data yang disusun dalam bentuk kelas interval
(data berkelompok) bisa ditentukan berdasarkan nilai tengah
kelas interval yang memiliki frekuensi terbanyak

Mo = modus
b = batas bawah kelas interval dengan frekuensi terbanyak
p = panjang kelas interval
b1 = frekuensi terbanyak dikurangi frekuensi kelas sebelumnya
b2 = frekuensi terbanyak dikurangi frekuensi kelas sesudahnya
Contoh:

Berikut ini adalah nilai statistik mahasiswa s2

Berapakah modus nilai statistik mahasiswa tersebut?


• Dari tabel kita bisa mengetahui bahwa modus terletak
pada kelas interval keempat (66 – 70) karena kelas
tersebut memiliki frekuensi terbanyak yaitu 27.
• Batas bawah kelas adalah 65,5, frekuensi kelas
sebelumnya 14, frekuensi kelas sesudahnya 21. Panjang
kelas interval sama dengan 5.
Standard Deviation
• Standar deviasi/simpangan baku merupakan
ukuran simpangan yg menggambarkan
besaran sebaran suatu kelompok data
terhadap rata-ratanya atau dengan kata lain
gambaran keheterogenan suatu kelompok
data
Dari 11 pohon pear menghasilkan buah dengan berat sbb (dlm Kg):
330 284 326 268 236 346 326 402 374 292
380

Dari hasil perhitungan didapat varians produksi dari 11 pohon pear adalah
sebesar 2.575,2 kg. sehingga standar deviasi produksinya adalah sebesar
50,75 kg.
Varians untuk data berkelompok
Quartiles

Kuartil adalah pengukuran yang dilakukan untuk


menentukan nilai batas jika distribusi frekuensi dibagi
menjadi 4 bagian.

Desil diaplikasikan jika distribusi data dibagi menjadi 10


bagian

Persentil untuk distribusi frekuensi yang dibagi


menjadi 100 bagian

Ada tiga buah kuartil, yaitu K1, K2, dan K3. Pemberian
nama dimulai dari nilai kuartil yang paling kecil.
a. Data tunggal / tanpa frekuensi :

i ( n + 1)
Ki = nilai yang ke ; dimana i = 1, 2 dan 3 atau K1, K2 dan K3
4
i = menunjukkan kuartil ke berapa yang hendak dihitung
n = jml individu frek.

b. Data distribusi frekuensi

n/4 N - cfb
Kn = Bb + ( )x i
Fd
Kn : nilai kuartil yang dicari (K1, K2 atau K3)
Bb : batas bawah nyata dari interval yang mengandung kuartil
Cfb : frekuensi kumulatif dibawah interval yang mengandung kuartil
Fd : frekuensi dalam interval kelas yang mengandung kuartil
i : lebar interval/ lebar kelas
n/4 N : komponen yang menunjuk pada urutan kuartil.
Jika ¼ N artinya kuartil pertama
Contoh
Sampel data
27 30 28 29 22 25 24 23 24 25 27 31 21 26

Setelah disusun,
21 22 23 24 24 25 25 26 27 27 28 29 30 31

antara data ke-3 dengan ke-4 dan 0,75 unit jauhnya dari data ke-3

nilai K1 = data ke-3 + 0,75(data ke-4 - data ke-3)


K1 = 23 + 0,75(24-23) = 23,75
Antara data ke-7 dengan data ke-8 dan 0,5 unit jauhnya
dari data ke-7
K2 = 25 + 0,5(26-25) = 25,5

Antara data ke-11 dengan data ke-12 dan 0,25 unit jauhnya dari
data ke-11
Dengan demikian,

K3 = 28 + 0,25(29-28) = 28,25
Jenis Data
• Tabel : Kumpulan angka-angka yang disusun
menurut kategori-kategori

• Grafik: merupakan gambar yang menunjukkan


secara visual data berupa angka (mungkin juga
dengan symbol – symbol) yang biasanya
berasal dari tabel yang di buat
Jenis Tabel ada 3 yaitu :
a. Tabel satu arah (one way table) : Yaitu tabel
yang memuat keterangan mengenai satu hal
atau satu karakteristik saja.
Contoh:
Jenis sediaan Jumlah (juta)
Tablet 100
Kapsul 75
Sirup 50
Suspensi 25
Parenteral 10
b. Tabel dua arah (two way table) : Yaitu tabel yang menunjukkan hubungan dua hal
atau dua karakteristik.

Fakultas mahasiswi mahasiswa jumlah


Biologi
Farmasi
Kehutanan
Kedokteran
Teknik
c. Tabel tiga arah (three way table) : Yaitu tabel yang
menunjukkan tiga hal atau tiga karakteristik.

Masa SMP SMA Sarjana


kerja I II III I II III II III IV
<5
5-10
10-15
15-20
>20
2. Grafik
Bentuk Grafik dalam statistik adalah :
a. Grafik garis (line chart)
b. Grafik batangan / balok (bar chart/histogram)
c. Grafik lingkaran (pie chart)
d. Grafik gambar (pictogram)
e. Grafik berupa peta (cartogam)
KOEFISIEN KORELASI LINEAR DAN KOEFISIEN DETERMINASI

• Koefisien korelasi linear (r), berfungsi untuk


mengetahui hubungan perilaku data dalam suatu
gugus data (variabel) dengan perilaku data pada gugus
data (variabel) lainnya (misal gugus data X dan Y).

• Sifat data: berpasangan, banyak data pada kedua


variabel sama
Nilai koefisien korelasi yang mungkin terjadi ada dalam batasan:

-1 ≤ r ≤ 1

-1 0 1

Nilai koefisien korelasi tersebut terbagi menjadi 3 kategori:


1. Korelasi (hubungan) positif : 0 < r ≤ 1
2. Tidak berkorelasi (tidak berhubungan) : r = 0
3. Korelasi (hubungan) negatif : -1 ≤ r < 0
Arti dari nilai koefisien korelasi masing-masing kategori:
1. Korelasi (hubungan) positif : semakin tinggi nilai X maka semakin
tinggi pula nilai Y atau sebaliknya semakin rendah nilai X maka akan
semakin rendah pula nilai Y.
2. Tidak berkorelasi (tidak berhubungan) : perubahan nilai (naik turun)
yang terjadi pada X tidak mengakibatkan perubahan nilai (naik
turun) pada Y.
3. Korelasi (hubungan) negatif : semakin rendah nilai X maka akan
semakin tinggi nilai Y atau sebaliknya semakin tinggi nilai X akan
semakin rendah nilai Y.
REGRESI LINEAR SEDERHANA
Arti secara umum dari persamaan regresi linear sederhana:

yˆ  a  bx
Arti dari nilai b:

Jika b positif, setiap kenaikan satu satuan variabel X akan menaikkan variabel Y sebesar b
satuan.

Jika b negatif, setiap kenaikan satu satuan variabel X akan menurunkan variabel Y sebesar
│b│ satuan.

Arti dari nilai a:

Pada saat tidak terjadi aktivitas pada variabel X (x=0) maka variabel Y akan memiliki nilai
sebesar a (nilai a bisa positif atau negatif).
REGRESI LINEAR SEDERHANA
Contoh :
Ketika dilakukan penelitian pengaruh dari biaya promosi (juta rupiah)
terhadap pendapatan perusahaan (juta rupiah) didapatkan persamaan
regresi:

yˆ  112  5,925 x
Arti dari nilai 5,925:
Setiap kenaikan satu juta rupiah biaya promosi yang dikeluarkan, akan
menaikkan pendapatan perusahaan sebesar 5,925 juta rupiah.
Arti dari nilai 112:
Pada saat perusahaan tidak mengeluarkan biaya promosi, maka perusahaan
masih menerima pendapatan sebesar 112 juta rupiah.
Contoh:
Ketika dilakukan penelitian pengaruh dari usia mobil bekas (bulan) terhadap harga
jualnya (juta rupiah) didapatkan persamaan regresi:

yˆ  125  2,25 x
Arti dari nilai -2,25:
Setiap kenaikan satu bulan usia mobil, akan menurunkan harga jualnya sebesar 2,25 juta
rupiah.
Arti dari nilai 125:
Pada saat melakukan penjualan mobil baru (usia = 0 bulan), maka mobil tersebut akan
laku seharga 125 juta rupiah.
• Contoh kasus 2
Perusahaan shampo merek x ingin mngetahui
pengaruh iklan dan promosi penjualan
terhadap volume penjualan yg dilakukan toko-
toko pengecer. Untuk keperluan tersebut
diambil sampel berupa data biaya iklan,
promosi penjualan dan volumedari 15 toko
pengecernya
• Hipotesis
– Hipotesis 1
• Ho: β1 ≤ 0, tidak terdapat pengaruh positif iklan
terhadap volume penjualan
• H1: β1 > 0, terdapat pengaruh positif iklan terhadap
volume penjualan
– Hipotesis 2
• Ho: β1 ≤ 0, tidak terdapat pengaruh positif promosi
terhadap volume penjualan
• H1: β1 > 0, terdapat pengaruh positif promosi terhadap
volume penjualan
• Kriteria penerimaan:
– Ho diterima jika t hitung ≤ t tabel atau sig. > alpha (α)
– Ho diterima jika t hitung > t tabel atau sig. ≤ alpha (α)
Summary output
• Multiple R menunjukkan bahwa korelasi antara
variabel bebas dg variabel tergantung sebesar 0,944
yg berarti bahwa korelasi antara iklan dan promosi
penjualan terhadap volume penjualan sebesar 0,944

• R square atau koefisien determinasi sebesar 0,891


menunjukkan bahwa variasi volume penjualan dapat
dijelaskan oleh variasi iklan dan variasi promosi
penjualan sebesar 89,1 % atau variasi iklan dan
promosi penjualan mempengaruhi volume penjualan
sebesar 89,1 % , sisanya ditentukan oleh variasi
variabel lain yg tidak diteliti.
Koefisien determinasi sebesar 0,891 merupakan
kuadrat dari multiple R (0,944 x 0,944=0,891)
• Adjusted R Square: merupakan koefisien
determisi yang telah terkoreksi dg jumlah
variabel dan jumlah pengamatan shg dpt
mengurangi bias jika terjadi penambahan
variabel atau pengamatan. Adjusted R Square
sebesar 0,873 artinya variasi penjualan dpt
dijelaskan oleh variasi iklan dan variasi
promosi penjualan sebesar 87,3 %, sisanya
ditentukan oleh variasi variabel lain yg tdk
diteliti.
Standar error: menunjukkan bahwa penyimpangan antara persamaan
regresi dengan nilai dependen riilnya adalah sebesar 10,797 satuan variabel
dependen (jika penjualan dalam satuan juta rupiah makan besarnya
penyimpangan adalah sebesar 10,797 juta rupiah). Semakin kecil nilai
standar error, semakin baik persamaan regresi tersebut sebagai alat prediksi

Observation: menunjukkan bahwa nilai observasi sebesar 15, sesuai dg


jumlah pengamatan atau ukuran sampel

df regression: jumlah variabel dikurangi 1 ( 3-1=2)

df residual: jumlah pengamatan dikurangi jumlah variabel (15-3=12)

df total= penjumlahan df regression dg df residual (2+12=14)


• SS regression: merupakan nilai yg menujukkan
jumlah kuadrat dari selisih antara nilai prediksi
dg nilai rata-rata prediksi

• SS Residual: merupakan nilai yang menunjukkan


jumlah kuadrat dari selisih antara nilai riil
dengan nilai prediksi
• SS Total : merupakan nilai yg menunjukkan
jumlah kuadrat dari selisih antara nilai riil
dengan nilai rata-raya Y riil.

•MS Regression = SS Regression/df regression = 1147,637/2=5737,337

•MS Residual = SS Residual/df residual= 1398,927/12=116,577

•Significance, F = merupakan nilai yg menunjukkan titik kesalahan yg terjadi.

F = MS Regression/MS Residual = 5737,337/116,577= 49,215

Nilai F= 49,215, dan ternyata tingkat kesalahan /probabilitas sebesar 1.64653E-06 yg berarti
lebih kecil dari 0,05. berarti variabel bebas secara simultan mampu menjelaskan perubahan
pd variabel tergantung atau model dinyatakan cocok atau fit
• Coefficients intersept: merupakan konstanta yg
artinya jika perusahaan tanpa melakukan iklan
dan promosi penjualan maka volume penjualan
akan sebesar 4,183

• Coefficients Iklan: menunjukkan koefisien regresi


variabel iklan yg artinya jika perusahaan
meningkatkan iklan sebesar 1 juta rupiah maka
penjualan akan meningkat sebesar 7,968 juta
rupiah

• Coefficients Promosi: menunjukkan koefisien


regresi variabel promosi yg artinya jika
perusahaan meningkatkan promosi penjualan
sebesar 1 juta rupiah maka penjualan akan
meningkat sebesar 3,422 juta rupiah
• Standar error intercept: merupakan
penyimpangan dari konstanta yg ada dalam
model persamaan regresi

• Standar error iklan: menunjukkan penyimpangan


koefisien regresi variabel iklan yg ada dlm model
tersebut

• Standar error promosi penjualan: menunjukkan


penyimpangan koefisien regresi variabel promosi
penjualan yg ada dlm model tersebut
• t Stat Intercept: digunakan untuk mengetahui
signifikansi intercept (biasanya yg diuji t Stat
koefisien regresi)

t Stat Intercept = Coefficients intercept/standar


error intercept = 4,183/8,618=0,485

• t Stat Iklan: digunakan utk mengetahui


signifikansi variabel iklan. Jika nilai t stat lebih
besar dari nilai t tabel dengan df;α(n-K) maka
variabel tersebut memiliki pengaruh yg signifikan
terhadap variabel tergantung

t stat iklan= Coefficients iklan/standar error iklan


= 7,968/2,684 = 2, 968
• t Stat promosi penjualan: digunakan utk
mengetahui signifikansi variabel promosi
penjualan. Jika nilai t stat lebih besar dari nilai
t tabel dengan df;α(n-K) maka variabel
tersebut memiliki pengaruh yg signifikan
terhadap variabel tergantung

T stat promosi= Coefficients promosi/standar


error promosi = 3,422/2,391= 1,431
• P-value intersept: merupakan angka yg
menunjukkan besarnya tingkat kesalahan pd nilai t
stat intercept yg diperoleh ( 0.485). Jika nilai t stat
intercept semakin besar maka nilai kesalahan p-
value akan semakin kecil. Jika nilai p-value lebih
kecil dari α (0,05) maka dikatakan signifikan.

• P-value iklan: merupakan angka yg menunjukkan


besarnya tingkat kesalahan pd nilai t stat iklan yg
diperoleh ( 2,968). Nilai p-value iklan (0,011) < 0,05
maka variabel iklan memiliki pengaruh yg berarti
terhadap Y (volume penjualan)
• P-value promosi penjualan: merupakan angka
yg menunjukkan besarnya tingkat kesalahan
pd nilai t stat promosi penjualan yg diperoleh (
1,434). Nilai p-value promosi (0,178) > 0,05
maka variabel promosi penjualan tidak
memiliki pengaruh yg berarti terhadap Y
(volume penjualan)

Anda mungkin juga menyukai