(STATISTIK LANJUTAN)
STATISTIK
o adalah bentuk analisis matematika yang
menggunakan model kuantitatif,
representasi dan sinopsis untuk
serangkaian data eksperimen atau studi
kehidupan nyata.
o metodologi studi statistik untuk
mengumpulkan, meninjau, menganalisis,
dan menarik kesimpulan dari data.
DATA Fakta atau
kejadian
Sesuatu
yang
diketahui
Sesuatu
yang
DIOLAH dianggap
DATA
STATISTIK
INFORMASI
The Importance of Statistics
Membantu menggunakan
Proses penting di balik
metode yang tepat untuk
penemuan dalam sains,
mengumpulkan data,
membuat keputusan
menggunakan analisis yang
berdasarkan data, dan
benar, dan menyajikan hasilnya
membuat prediksi.
secara efektif.
Diagram
DESKRIPTIF
Pemusatan Data
STATISTIK
JENIS
Penyebaran Data
Statistik Deskriptif
Estimasi/Ramalan
INFERENSI
Menguji Hipotesis
Membuat KesimpulanUmum/
Generalisasi
SIFAT DATA
1. KUALITATIF : Merupakan segala
sesuatu yang TIDAK dapat dinyatakan
sebagai ANGKA. Data yang mewakili
adalah skala nominal seperti jenis
kelamin, status ekonomi sosial,
preferensi agama, atau sebuah
kuesioner yang berisikan berbagai
macam pertanyaan tentang suasana
kerja, gaya kepemimpinan, dan lain-
lain.
2. Eksternal
Data eksternal merupakan sebuah data yang didapat dari luar
organisasi atau instansi tertentu dimana data tersebut tetap
menggambarkan berbagai faktor yang dapat mempengaruhi
output dari sebuah instansi atau organisasi. Contohnya adalah
daya beli dari masyarakat yang mempunyai kaitan dengan
hasil penjualan dari sebuah perusahaan
JENIS DATA MENURUT CARA MEMPEROLEHNYA
1. Primer
Data primer atau primary data merupakan sebuah data yang
memang secara khusus dikumpulkan langsung oleh orang
perorangan atau oleh suatu organisasi dengan cara langsung
didapat dari obyek yang akan diteliti dan memang digunakan
langsung dalam studi yang berkaitan dengannya dengan cara
interview ataupun observasi.
2. Sekunder
Data sekunder atau secondary data merupakan sebuah data
yang didapat dan dipersatukan oleh displin ilmu atau studi
yang telah dilakukan sebelumnya ataupun dikeluarkan oleh
instansi atau organisasi lainnya. Contoh dari data ini adalah
data dokumentasi maupun arsip arsip yang sifatnya penting
dan juga resmi.
JENIS DATA MENURUT WAKTU PENGUMPULANNYA
1. Cross Section
Data cross section merupakan data yang diperoleh at a
poin of time guna memberikan gambaran tentang sebuah
kegiatan dan keadaan dalam kurun waktu tertentu,
contohnya adalah data penelitian yang menggunakan
sebuah kuesioner diisi oleh responden.
2. Time Series
Data berkala atau time series data merupakan data yang
memang dikumpulkan dari waktu ke waktu guna melihat
langsung bentuk perkembangan dari sebuah kejadian dan
juga kegiatan dalam kurun waktu tertentu, contohnya
adalah data sensus penduduk di Indonesia, ekonomi, dll.
3. Panel Data : Gabungan Cross section dengan Time
Series
SKALA PENGUKURAN
1. DATA NOMINAL
Data Nominal biasa disebut data skala nominal (skala variabel
kategori ) adalah data yang diperoleh dengan cara kategorisasi atau
klasifikasi, yaitu skala yang digunakan untuk memberi label pada
variabel ke dalam klasifikasi yang berbeda dan tidak melibatkan nilai
atau pesanan kuantitatif.
Contoh:
• Temperatur ruangan. Bisa diukur dalam Celsius, atau Fahrenheit, dengan masing-
masing punya skala sendiri. Untuk air membeku dan mendidih:
• Celcius pada 0° C sampai 100° C. Sakala ini jelas jaraknya, bahwa 100-0=100
• Fahreinheit pada 32° F sampai 212°F. Skala ini jelas jaraknya, 212-32=180
Contoh: Jumlah buku di kelas: Jika 5, berarti ada 5 buku. Jika 0, berarti tak ada buku
(absolut 0)
• Cluster Sampling
Teknik cluster sampling dapat digunakan apabila objek penelitian atau sumber data sangat luas.
Cluster sampling dapat dipilih karena dua keadaan. Yang pertama, ketika simple random sampling
tidak dapat dilakukan karena beberapa faktor seperti jarak yang jauh dan biaya yang tidak
memadai. Yang kedua, ketidaktahuan peneliti terhadap lokasi pasti dari populasi yang akan
digunakan, sehingga tidak memungkinkan untuk menyusun kerangka sampling.
• Systematic Sampling
Pemilihan sampel ini dilakukan secara sistematik dengan syarat adanya daftar subjek yang
dibutuhkan. Teknik ini dilakukan sesuai dengan nomor urut yang telah diberikan kepada elemen
atau anggota populasi.
• Non-Probability Sampling
Non-probability sampling atau non-random sampling merupakan teknik sampling
yang menggunakan sampel pilihan berdasarkan subjektivitas peneliti dan tidak
acak. Non-probability sampling ditentukan oleh keahlian peneliti.
Non-probability sampling banyak dipakai dalam penelitian kualitatif. Dalam teknik
ini, tidak semua sampel dari sebuah populasi memiliki probabilitas terpilih seperti
pada teknik random sampling. Beberapa teknik sampling yang termasuk dalam
non-probability sampling, di antaranya:
•
Purposive Sampling (Judgmental Sampling)
Purposive sampling merupakan teknik penetapan sampel dengan cara memilih
sampel sesuai dengan pengetahuan peneliti terhadap penelitian (berdasarkan
tujuan atau masalah dari penelitian). Sampel yang dipilih karena dianggap sesuai
untuk penelitian tersebut dan dapat memberikan informasi yang dibutuhkan.
• Consecutive Sampling
Pengambilan sampel ini dilakukan dengan menetapkan subjek yang memenuhi
kriteria penelitian dan dimasukkan dalam penelitian hingga waktu tertentu. Teknik
sampling ini merupakan teknik non-probability yang cukup mudah untuk
dilakukan. Consecutive Sampling menetapkan satu objek lain agar jumlah sampel
yang dibutuhkan dapat terpenuhi.
• Convenience Sampling
Metode ini dilakukan dengan cara menetapkan sampel dan mencari subjek berdasarkan hal-hal yang
menyenangkan atau diminati oleh peneliti. Sampel dipilih berdasarkan populasi yang tersedia dan mudah
dijangkau oleh peneliti. Subjek penelitian dijadikan sebagai sampel karena secara kebetulan ditemukan di
lokasi dan keadaan yang bersamaan dengan pengambilan data.
Sampel pada teknik ini diambil tanpa sistematika apapun. Biasanya, peneliti memilih teknik ini karena
ketidakmungkinan untuk menjangkau semua populasi yang sangat besar dan tempat penelitian yang sangat
luas.
• Quota Sampling
Metode quota sampling dilakukan dengan menentukan sampel dalam kuota. Kemudian menetapkan setiap
strata populasi sesuai dengan tanda-tanda yang memiliki pengaruh dominan terhadap variabel yang akan
diteliti.
Populasi dalam teknik ini tidaklah homogen, sehingga populasi perlu diseleksi terlebih dahulu ke dalam
kategori strata. Nantinya setiap strata akan diberikan jatah sampel agar sampel tersebut dapat mewakili
semua strata.
Kuota pada teknik ini berarti subjek ditetapkan berdasarkan kapasitas yang diperlukan dalam penelitian.
Besaran kuota dapat ditentukan secara proporsional.
• Snowball Sampling
Teknik snowball adalah teknik pengambilan sampel yang dimulai dari sampel pertama (baik hanya satu
maupun lebih dari satu). Sampel pertama akan dibutuhkan untuk menentukan objek lainnya yang sesuai
dengan karakteristik sampel dan kemudian memberitahukannya kepada peneliti.
Pengambilan sampel ini dilakukan berulang kali hingga jumlah kebutuhan sampel terpenuhi. Dari satu
sampel bertambah menjadi dua, dua menjadi empat, dan seterusnya. Penambahan tersebut diibaratkan
dengan bola salju yang menggelinding dan semakin membesar.
Peneliti memilih teknik ini karena tidak mengetahui keberadaan populasi tersebut.
DEFINISI :
REGRESI
BERGANDA/MAJEMEUK
(MULTIPLE REGRESSION
VARIABEL
VARIABEL (PEUBAH) : konsep, kualitas, karakteristik,
atribut, atau sifat-sifat dari suatu objek (orang, benda,
tempat, dll) yang nilainya berbeda-beda antara satu
objek dengan objek lainnya dan sudah ditetapkan oleh
peneliti untuk dipelajari dan ditarik kesimpulannya
(Sesuatu yang dapat berubah-rubah).
Y = α + βX + Ɛ
Y = variabel dependen atau response.
α = intercept atau konstanta.
β = koefisien regresi atau slope.
X = variabel independen
ε = residual atau error (epsilon)
Asumsi-Asumsi Regresi Linier
Sederhana
1. Eksogenitas yang lemah
• Sebelum menggunakan analisis regresi, kita harus
paham bahwa analisis ini mensyaratkan bahwa variabel
X bersifat fixed atau tetap, sementara variabel Y
bersifat random. Maksudnya, satu nilai variabel X akan
memprediksi variabel Y sehingga ada kemungkinan
beberapa variabel Y. Dengan demikian harus ada nilai
error atau kesalahan pada variabel Y.
• Sebagai contoh ketika pendapatan (X) seseorang
sebesar Rp1 juta, maka pengeluarannya bisa saja
sebesar Rp500 ribu, Rp600 ribu, Rp700 ribu, atau
seterusnya.
2. Linieritas
Model analisis regresi bersifat linier, artinya
kenaikan variabel X harus diikuti secara
proporsional oleh kenaikan variabel Y. Jika dalam
pengujian linieritas tidak terpenuhi, maka kita
dapat melakukan transformasi data atau
menggunakan model kuadratik, eksponensial
atau model lainnya yang sesuai dengan pola
hubungan nonlinier.
3. Varians error yang konstan
• Ini menjelaskan bahwa varians error atau varians
residual yang tidak berubah-ubah pada response yang
berbeda. Asumsi ini lebih dikenal dengan asumsi
homoskedastisitas.
• Mengapa varians error perlu konstan? Sebab, jika
konstan maka variabel error dapat membentuk model
sendiri dan mengganggu model utama. Oleh karena
itu, penanggulangan permasalahan
heteroskedastisitas/non-homoskedastisitas dapat
diatasi dengan menambahkan model varians error ke
dalam model atau model ARCH/GARCH.
4. Autokorelasi untuk data time series
• Jika menggunakan analisis regresi sederhana untuk data
time series atau data yang disusun berdasarkan urutan
waktu, maka ada satu asumsi yang harus dipenuhi, yaitu
asumsi autokorelasi.
• Asumsi ini melihat pengaruh variabel lag waktu
sebelumnya terhadap variabel Y. Jika ada gangguan
autokorelasi, artinya ada pengaruh variabel lag waktu
sebelumnya terhadap variabel Y.
• Sebagai contoh, model kenaikan harga BBM terhadap
inflasi. Jika ditemukan autokorelasi, maka artinya terdapat
pengaruh lag waktu terhadap inflasi. Artinya, inflasi hari ini
atau bulan ini bukan dipengaruhi oleh kenaikan BBM pada
hari ini, namun dipengaruhi oleh kenaikan BBM
sebelumnya (satu hari atau satu bulan tergantung data
yang dikumpulkan).
Contoh Kasus:
Seorang manajer pemasaran akan meneliti
apakah terdapat pengaruh BIAYA iklan terhadap
PENJUALAN pada perusahaan-perusahaan di
Kabupaten Maros, untuk kepentingan
penelitian tersebut diambil 8 perusahaan
sejenis yang telah melakukan promosi.
Pemecahan
1) Judul
Pengaruh biaya promosi terhadap
penjualan perusahaan.
2) Pertanyaan Penelitian
Apakah terdapat pengaruh positif biaya
promosi terhadap penjualan perusahaan ?
3) Hipotesis
Terdapat pengaruh positif biaya promosi
terhadap penjualan perusahaan.
4. Kriteria Penerimaan Hipotesis
Ho : Tidak terdapat pengaruh positif biaya iklan
terhadap penjualan perusahaan.
Ha : Terdapat pengaruh positif biaya iklan
terhadap penjualan perusahaan.
• Ho diterima Jika
b ≤ 0, t hitung ≤ tabel
• Ha diterima Jika
b > 0, t hitung > t tabel.
5. Sampel
8 perusahaan
6. Data Yang dikumpulkan :
Penjualan
(Y) 64 61 84 70 88 92 72 77
Biaya iklan/
Promosi (X) 20 16 34 23 27 32 18 22
7. Analisis Data
Untuk analisis data diperlukan, perhitungan:
1. Persamaan regresi
2. Nilai Prediksi
3. Koefisien Korelasi ( r )
4. Koefesien Determinasi ( r² )
5. Uji Hipotesis
6. Kesimpulan
Persamaan Regresi
Y X XY X2 Y2
64 20 1280 400 4096
61 16 976 256 3721
84 34 2856 1156 7056
70 23 1610 529 4900
88 27 2376 729 7744
92 32 2944 1024 8464
72 18 1296 324 5184
77 22 1694 484 5929
8(15032) (192)(608)
b 1,497
8( 4902) (192) 2
a
Y b( X )
n
Regression Statistics
Multiple R 0.862108943
R Square 0.74323183
Adjusted R Square 0.700437135
Standard Error 6.157605036
Observations 8
ANOVA
df SS MS F Significance F
Regression 1 658.5034014 658.5034014 17.367382 0.005895457
Residual 6 227.4965986 37.91609977
Total 7 886
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
R2 1
(Y ˆ
Y ) 2
R 1
2 (227,497)
0,743
(Y Y ) 2
(886)
Artinya : Besarnya pengaruh biaya iklan (X) terhadap terhadap
kenaikan/penurunan jumlah penjualan (Y) adalah sebesar 74,3%,
selebihnya sebesar 25,7% adalah disebabkan o/ faktor lain.
Persamaan Regresi
linier Sederhana:
n( XY ) ( X )( Y )
Y = a + bX + b
n( X 2 ) ( X ) 2
Y = Nilai yang diramalkan
a = Konstansta
b = Koefesien regresi
a
Y b( X )
X = Variabel bebas n
= Nilai Residu
Model Persamaan :
Y = a + bX atau
Y = α + βX atau
Y = b0 + b1X
Taksiran Persamaan Regresi adalah :
Y = 10 + 2X
Mengindikasikan bahwa ditaksir rata-rata jam kerja
bertambah dengan 2 jam untuk setiap pertambahan 1
unit produk
Perbedaan mendasar antara korelasi dan
regresi ?
• Korelasi hanya • Regresi menunjukkan
menunjukkan sekedar hubungan pengaruh.
hubungan. • Dalam regresi terdapat
• Dalam korelasi istilah tergantung dan
variabel tidak ada variabel bebas.
istilah tergantung dan
variabel bebas.
CORRELATION COEFFICIENT / PEARSON CORRELATION
R 1
2 (Y ˆ
Y ) 2
R 1
2 (227,497)
0,743
(Y Y ) 2
(886)
P (1 R 2
) 1(1 0,743)
Radj R2 Radj 0,743 0,70
N P 1 8 11
Kesalahan Baku Estimasi
Digunakan untuk mengukur tingkat kesalahan dari
model regresi yang dibentuk.
Se
(Y Yˆ ) 2
Se
(227,467)
6,1576
nk 82
Standar Error Koefesien Regresi
Digunakan untuk mengukur besarnya tingkat kesalahan dari
koefesien regresi:
Se 6,1576
Sb Sb1 0,359
( X ) 2
(192) 2
X
2
(4902)
n 8
UJI
HIPOTESIS
UJI HIPOTESIS DUA VARIABEL (Uji-t)
1. Simbol Hipotesis :
• H0 : b = 0…………..(Tidak terdapat pengaruh yang signifikan dari X
terhadap Y)
• H1 : b ≠ 0………….(Terdapat pengaruh yang signifikan dari X
terhadap Y)
2. Tentukan Significance Level :
misal α = 5% atau 0.05…..1 – α = 1 – 0,05 = 95%
(uji satu arah atau 2 arah, jika 2 arah maka α/2 ?)
3. Derajat bebas (db) / degree of freedom (df) = n – k
n = banyaknya observasi k = banyaknya variabel
4. Kriteria penerimaan Uji Hipotesis :
. Uji-t (t hitung dibandingkan dengan t Tabel)
. P-value
• - Terima H0 jika t hitung ≤ t tabel atau p-value > alpha (α)
- Tolak H0 Jika t hitung> t tabel atau p-value ≤ alpha (α)
• Jika gunakan EXCEL maka bila nilai signifikan (sig.) > t-value, maka Ho
ditolak atau H1 diterima
UJI HIPOTESIS / Uji F…> 2VARIABEL
Pengertian Uji F
• Salah satu teknik pengujian statistika yang terkenal adalah
uji koefisien regresi secara simultan serentak atau yang
lebih akrab disapa dengan uji F. Uji F biasa digunakan
untuk membandingkan 2/lebih perlakuan kelompok atau
objek/data, yang masing-masing perlakuannya dilakukan
ulangan.
• Uji F digunakan dalam percobaan, group sampling dan sub
group sampling. Nah, uji F ini dilakukan untuk melihat
variabel independen secara serentak/bersama,
berpengaruh signifikan terhadap variabel dependen atau
tidak. Uji F digunakan untuk menguji keberartian model
regresi yang digunakan. Uji F juga akan berhubungan
dengan uji ANAVA atau ANOVA.
Tahapan dalam uji F/Simultan :
Tahapan dalam uji F :
• Buat hipotesis :
• Ho : Bj = 0
• H1 : Bj ≠ 0
• •Buatlah H 0 dan H a atau H1 sebagai hipotesis penelitian. H 0
inilah yang akan digunakan sampai akhir kriteria pengujian
nantinya.
• •Tentukan tingkat signifikansi
• •Tingkat signifikansi yang standar dan biasa digunakan adalah a=
5% (0,05), derajat kebebasan/df : (n-k)(k-1)
• dk pembilang = k – 1 =
• dk penyebut = N – k =
• •Tentukan nilai F hitung
• •Tentukan F tabel
• •Tentukan nilai signifikansi
• •Kriteria pengujian
Perhitungan Uji-t
Digunakan untuk mengatahui pengaruh variabel bebas
terhadap variabel tergantung (2 variabel).
Ho: Diterima jika t hitung t tabel
Ha: Diterima jika t hitung > t tabel
Tentukan α dan derajat bebas (db)
bj 1,497
Thitung t hitung 4,167
Sbj
0,359
Karena t hitung (4,167) > dari t tabel (1,943) maka H0 ditolak, artinya terdapat
pengaruh biaya promosi terhadap penjualan pada tingkat
signifikansi/kepercayaan sebesar 95%).
KESIMPULAN DAN IMPLIKASI
KESIMPULAN
Terdapat pengaruh positif dan signifikan dari
biaya promosi/periklanan terhadap volume
penjualan pada taraf kepercayaan 95%.
IMPLIKASI
Sebaiknya perusahaan terus memperhatikan dan
meningkatkan promosi agar penjualan
meningkat.
Pe Er:
Carilah persamaan regresi dari data berikut:
X 3 4 5 6 7 8 9
Y 12 11 13 12 13 14 16
REGRESI LINEAR BERGANDA DAN REGRESI (TREND)
NON LINEAR
• Contoh
Pola Asuh
X1
Prestasi Belajar
Y
Cara Belajar
X2
REGRESI LINEAR BERGANDA
• Rumus
Y ' b0 b1 X 1 b2 X 2 ... bk X k
Y 'i b0 b1 X 1i b2 X 2i ... bk X ki
b0 X 2 b1 X 2 X 1 b2 X 2 ... bk X 2 X k X 2Y
2
b0 X k b1 X k X 1 b2 X k X 2 ... bk X k X kY
2
b0 n b1 X 1 b2 X 2 Y
b0 X 1 b1 X 1 b2 X 1 X 2 X 1Y
2
b0 X 2 b1 X 2 X 1 b2 X 2 X 2Y
2
REGRESI LINEAR BERGANDA
• Penyelesaiannya digunakan persamaan matriks
n
X 1 X2 b
Y
0
X 1 X X X 2 b1 X 1Y
2
1 1
X 2
2 X 2Y
X 2 X1 X2
2 b
Ab = H
b = A-1H
A B H
• A = matriks (diketahui)
• H = vektor kolom (diketahui)
• b = vektor kolom (tidak diketahui)
• A-1 = kebalikan (invers) dari matriks A
REGRESI LINEAR BERGANDA (MATRIX)
• Matriks 2 baris dan 2 kolom
a11 a12
Matriks A
21
a a 22
• Contoh
2 4
Matriks A
6 7
det (A) = | A | = a11a22 – a12a21 = 14 – 24 = -10
REGRESI LINEAR BERGANDA
• Matrisk 3 baris dan 3 kolom
a11 a12 a13
A a 21 a 22 a 23
a31 a32 a33
a11 a12 a13 a11 a12
A a 21 a 22 a 23 a 21 a 22
a31 a32 a33 a31 a32
det A a11 a 22 a33 a12 a 23 a31 a13 a 21 a32 a31 a 22 a13 a32 a 23 a11 a33 a 21 a12
REGRESI LINEAR BERGANDA
• Contoh
2 4 6
A 3 2 3
1 4 9
2 4 6 2 4
A 3 2 3 3 2
1 4 9 1 4
det A 2.2.9 4.3.1 6.3.4 1.2.6 4.3.2 9.3.4
det A 36 12 72 12 24 108
det A 24
REGRESI LINEAR BERGANDA
• Penggunaan matriks dalam 3 persamaan 3 variabel
a11b1 a12 b2 a13 b3 h1 a11 a12 a13 b1 h1
a 21b1 a 22 b2 a 23 b3 h2 a 21 a 22 a 23 b2 h2
a31b1 a32 b2 a33 b3 h3 a31 a32 a33 b3 h3
b0 X 2 b1 X 2 X 1 b2 X 2 X 2Y
2
R 2 /( k 1) 0,743 /(2 1)
F F 17,367
1 R 2 /( n k ) 1 0,743 /(8 2)
Y X1 X2
X1 adalah persediaan modal
(dalam jutaan rupiah), X2 2 1 2
5 2 3
adalah biaya iklan (dalam
jutaan rupiah), dan Y = 9 4 4
X2 = 10. 20 14 13
21 16 13
Soal-soal