Anda di halaman 1dari 53

MODUL PRAKTIKUM

STATISTIKA DAN PROBABILITAS

DISUSUN OLEH:
RATNA SALKIAWATI, S.T., M.KOM (0310038006)

PROGRAM STUDI INFORMATIKA


FAKULTAS ILMU KOMPUTER
UNIVERSITAS BHAYANGKARA
JAKARTA RAYA
2022

1
DAFTAR ISI

PENDAHULUAN .................................................................................................................. 3
1.1 Pengertian ..................................................................................................................... 3
1.2 Excel ............................................................................................................................ 4
Latihan 1 ............................................................................................................................ 11
Latihan 2 ............................................................................................................................ 17
Latihan 3 ............................................................................................................................ 23
Latihan 4 ............................................................................................................................ 27
Latihan 5 ............................................................................................................................ 30
Latihan 6 ............................................................................................................................ 33
Latihan 7 ............................................................................................................................ 36
Latihan 8 ............................................................................................................................ 38
Latihan 9: ........................................................................................................................... 41
Latihan 10: ......................................................................................................................... 48

2
PENDAHULUAN

1.1 Pengertian
Statistika adalah ilmu yang berhubungan dengan pengumpulan data (collecting),
analisis data (analyze) dan penafsiran data (intepreting). Definisi statistika tersebut
memberikan gambaran bahwa statistika merupakan ilmu yang sangat erat hubungannya
dengan data. Persoalan-persoalan ekonomi, sosial dan eksakta dapat diselesaikan dengan
menggunakan metode statistika yang memerlukan data mengenai masalah tersebut.
Langkah-langkah dalam melakukan proses statistika sebagai berikut:
• Pengumpulan Data (Collecting)
Cara yang digunakan untuk mengumpulkan data, misalnya melalui angket/ quesioner,
wawancara, informasi dari sumber, dan lain-lain.
• Analisis Data (Analyze)
Langkah ini diperlukan untuk memperoleh gambaran mengenai karakter suatu obyek
dengan menggunakan seluruh data (populasi) atau sebagian data (sampel). Adapun
konsep statistika yang dapat digunakan untuk proses analisis ini, misalnya probabilitas,
estimasi statistika, uji hipotesis dan sebagainya.
• Penafsiran Data (Intepreting)
Hasil analisis dapat digunakan untuk membuat taksiran terhadap karakteristik obyek
yang diteliti. Penafsiran ini dapat berupa kesimpulan atau keputusan statistik mengenai
obyek yang diteliti tersebut

Aplikasi ilmu statistika dapat dibagi dalam dua bagian, yaitu:


1. Statistika Deskriptif merupakan bidang ilmu statistika yang mempelajari cara- cara
pengumpulan, penyusunan dan penyajian data dalam penelitian. Kegiatan yang
termasuk dalam kategori ini antara lain kegiatan pengumpulan data, pengelompokan
data, penentuan nilai dan fungsi statistik, pembuatan grafik, diagram dan gambar.
Tujuan utama dari operasi statistika deskriptif adalah memudahkan orang untuk
membaca data serta memahami maksudnya.
2. Statistika Inferensi/Induktif merupakan bidang ilmu statistika yang mempelajari
cara-cara penarikan suatu kesimpulan dari suatu populasi tertentu berdasarkan sebagian
data (sampel) yang dikumpulkan. Tindakan inferensi tersebut misalnya melakukan
perkiraan, peramalan, pengambilan keputusan dan sebagainya.

3
1.2 Excel
Excel sebagai sebuah program spreadsheet mampu untuk mengolah data statistika
lewat dua cara, yaitu:
a. Dengan Program Bantu Khusus Perhitungan Statistika
Excel menyediakan fasilitas bantu (Add-Ins) yang disebut Data Analysis, yang
berfungsi khusus untuk mengolah data statistika yang meliputi antara lain uji t, uji F,
ANOVA, regresi, dan sebagainya. Karena programnya adalah khusus, maka pengguna
(user) hanya memasukkan data statistika yang diperlukan, sedang perhitungan dan
penyajian akan dilakukan oleh Excel.
Fasilitas khusus tersebut termasuk dalam program Add-Ins, untuk bisa diigunakan
harus diaktifkan terlebih dahulu oleh user. Untuk mengaktifkan fasilitas yang ada dalam
program Add-Ins, langkah- langkahnya sebagai berikut :
1. Pilih menu utama Tools pada Excel, kemudian dari menu Tools tersebut pilih menu
Add-Ins… dengan mengklik menu Add-Ins… tersebut.
2. Maka akan tampak di layar menu Add-Ins, sebagai berikut :

Gambar 1. Kotak Dialog Add-Ins

4
3. Fungsi Menu Add-Ins, antara lain yaitu :
a. AccesLinks Add-In
Program tambahan yang berfungsi agar Excel bisa saling berkomunikasidengan
data dari program Access (juga dari Microsoft Office).
b. Analysis ToolPark dan Analysis ToolPark VBA
Program tambahan yang berisi kemampuan Excel dalam membantumelakukan
analisis masalah-masalah statistika.
c. AutoSave
Program tambahan ini berfungsi menjaga agar data yang sedang diinput tidak hilang
jika mendadak listrik padam, dengan jalan menyimpan data yang ditulis di
worksheet tiap selang waktu tertentu.

Semua program Add-Ins di atas bersifat optional, dalam arti boleh dimasukkan
dalam Excel atau tidak usah digunakan. Penggunaan program Add-Ins tentunya bisa
berlainan bagi pemakai yang satu dengan pemakai yang lainnya. Karena akan
menggunakan program bantu analisis statistika, maka akan dipilih program Add-Ins yang
relevan, yaitu Analysis ToolPark dan Analysis ToolPark VBA. Untuk itu, klik kotak
disisi pilihan Analysis ToolPark dan Analysis ToolPark VBA, kemudian tekan tombol
OK, maka Excel akan memproses pemasukan program Add-Ins tersebut ke dalam Excel.
Setelah program Add-ins Analysis ToolPark dan Analysis ToolPark VBAdiinstal,
langkah berikutnya adalah melihat apakah program tersebut sudah bisa aktif ataukah
belum. Langkah-langkahnya adalah sebagai berikut:
1. Pilih menu Tools pada menu utama Excel. Perhatikan semua submenu dari menu
Tools tersebut. Jika pada bagian paling bawah dari menu Tools terdapat menu Data
Analysis…, berarti program Add-Ins Analysis ToolPark sudah terpasang dan siap
dipakai. Jika menu Data Analysis tidak tampak pada menu Tools, ada dua
kemungkinan, yaitu:
• Ada kesalahan dalam pengisian program Add-Ins. Untuk itu, kembali ke langkah
sebelumnya untuk mengaktifkan program.
• Program Add-Ins memang tidak disertakan dalam install Excel awal.

5
6

2. Jika menu Data Analysis… sudah tampak, pilih menu tersebut makatampak di
layar kotak dialog Data Analysis seperti berikut:

Gambar 2. Kotak Dialog Data Analysis

Menu di atas adalah isi dari menu Data Analysis yang akan digunakan untuk
pembahasan masalah-masalah statistika.
Untuk menambah Data Analysis pada Microsoft Office Excel 2007,
langkahnya sebagai berikut :
Klik bulatan pada pojok kiri atas (Office Button), terus pilih Excel Options
dan klik Add-Ins kemudian pilih Analysis ToolPak dan klik Go terus centang
Analysis ToolPak dan Analysis ToolPak–VBA klik Ok,selanjutnya tunggu proses
sampai selesai.

6
7

Gambar 3. Excel Option

Gambar 4. Dialog Add-Ins

7
8

b. Dengan Fungsi Statistika yang Terdapat dalam Excel


Dengan cara ini, Excel melakukan perhitungan statistika lewat fungsi-fungsikhusus
statistika. Fungsi tersebut bisa diaktifkan lewat dua cara, yaitumenggunakan Function
Wizard atau mengetikkan fungsi statistika pada sel. Untuk mengaktifkan Function
Wizard, pilih menu Insert kemudian pilih pilihan Function… atau tekan icon
pada toolbar. Pada layar akan tampak
kotak dialog Paste Function seperti berikut:

Gambar 5. Kotak Dialog Menu Paste Function

Kotak dialog tersebut adalah serangkaian fungsi Excel yang digunakanuntuk


berbagai aplikasi: Adapun fungsi-fungsi menu Function sebagai berikut :
1. Most Recently Used, fungsi-fungsi yang paling sering dipakai dalam praktekExcel,
seperti AVERAGE, COUNT, SUM, IF, dan sebagainya.
2. All, seluruh fungsi yang terdapat pada Excel.
3. Financial, Fungsi Excel khusus untuk masalah-masalah keuangan, sepertiNPV,
IRR, dan sebagainya.
4. Date & Time, Fungsi Excel khusus untuk masalah-masalah yang berhubungandengan
waktu dan kalender, seperti DATE, DAY, dan sebagainya.
5. Math & Trig, Fungsi Excel khusus untuk perhitungan matematika dan
trigonometri seperti ACOS, ABS, dan sebagainya.
6. Statistical, fungsi Excel khusus untuk masalah-masalah dan perhitunganstatistik
seperti CHIDIST, CHIINV, dan sebagainya.
7. Lookup & Preference, fungsi seperti COLUMNS, OFFSET, dan sebagainya.

8
9

8. Database, fungsi yang berhubungan dengan masalah-masalah databaseseperti


DAVERAGE, DMAX, dan sebagainya.
9. Text, fungsi yang berhubungan dengan pengerjaan teks (teks diratakirikan,
ditengahkan, diberi tanda ‘$’ dan sebagainya), seperti CHAR, DOLLAR, dan
sebagainya.
10. Logical, fungsi yang berhubungan dengan pengerjaan logika suatu pernyataan,seperti
apakah pernyataan betul atau salah dan sebagainya. Fungsi logika dalam Excel ada
enam, yaitu AND, FALSE, IF, NOT, OR dan TRUE.
11. Information, fungsi yang berhubungan dengan keterangan, seperti CELL, INFO,
ISERROR dan sebagainya.
12. User Defined, fungsi yang berhubungan dengan suatu definisi tertentu, seperti
RegCloseKey, RegSetXLValue, dan sebagainya.
13. Engineering, fungsi yang berhubungan dengan pekerjaan rekayasa teknik, seperti
BESSELI, BIN2DEC, dan sebagainya.

Selain cara di atas, fungsi-fungsi dalam Excel bisa diaktifkan denganmengetik


atau menulis fungsi tersebut. Misalnya untuk menghitung jumlah atau rata-rata dari
sekelompok bilangan, diperlukan sejumlah angka tertentu sepertidi bawah ini.

Jika ingin mencari berapa jumlah penjualan Buah Melon pada tahun 2021, maka
digunakan fungsi SUM, dengan langkah-langkah sebagai berikut :
• Tempatkan pointer pada sel yang akan dijadikan tempat penulisanfungsi,
misalnya pada sel B16, diketik fungsi pada sel tersebut :
9
10

=SUM(B4:B15) atau bisa juga ketik


=SUM(50,45,40,51,39,38,48,49,52,50,51,53)
• Untuk jumlah angka yang besar, tentu lebih efisien dengan menulisrange
selnya daripada menulis angkanya satu per satu.
• Kemudian tekan Enter, maka akan tampak total atau jumlah penjualan pada
tahun 2021 sebanyak 566 unit.
Jika ingin mencari berapa rata-rata penjualan Buah Melon setiap bulan, makadigunakan
rumus umum fungsi statistik yaitu AVERAGE, sebagai berikut :
• Tempatkan pointer pada sel yang akan dijadikan tempat penulisanfungsi,
misalnya pada sel B17, diketik fungsi pada sel tersebut :
=AVERAGE(B4:B15) atau bisa juga ketik
=AVERAGE(50,45,40,51,39,38,48,49,52,50,51,53)
• Kemudian tekan Enter, maka akan tampak rata-rata penjualan per bulan
sebanyak 47,16 (47 unit).

10
11

Latihan 1

Manajer perusahaan dealer mobil merk Arjuna ingin mengetahui


gambaran ringkas mengenai penjualan mobil Arjuna selama tahun 2021, seperti
rata-rata mobil yang terjual, variannya, standar deviasi dan sebagainya.

Langkah-langkah Perhitungan
Untuk bisa menyajikan hasil statistika deskriptif seperti permintaan
manajer pemasaran di atas, berikut diberikan data penjualan mobil Arjunaselama
tahun 2021. Berikut adalah data penjualan unit mobil per bulan :

Tabel 1. Data untuk Statistika Deskriptif


A B
1 BULAN MOBIL TERJUAL (unit)
2 JANUARI 1200
3 FEBRUARI 1345
4 MARET 1435
5 APRIL 1324
6 MEI 1768
7 JUNI 1654
8 JULI 1543
9 AGUSTUS 1556
10 SEPTEMBER 1600
11 OKTOBER 1685
12 NOVEMBER 1705
13 DESEMBER 1654

Langkah-langkah Penyelesaian :

1. Pilih menu Tools atau Data, lalu klik pilihan Data Analysis…(biasanya
terletak paling bawah atau kanan) yang ada pada menu Tools tersebut.

2. Tampak gambar berikut :

11
12

Gambar 4. Kotak Dialog Data Analysis

3. Dari serangkaian alat analysis statistik tersebut, sesuai dengan kebutuhan


pada kasus, pilih Descriptive Statistics dengan mouse, lalu tekan OK.

4. Tampak gambar berikut.

Gambar 5 Kotak Dialog Descriptive Statistics

12
13

Langkah pengisian menu Descriptive Statistics :

1. Untuk Input Range, ketik B2:B13 (data jumlah mobil terjual).


2. Untuk pengisian kolom Grouped By: isi menurut default yang ada, yaitu
columns. Dalam hal ini, karena sudah dipilih columns (terlihat dengan titik
hitam pada sisi kiri columns), maka lewati saja prosedur ini.
3. Untuk kolom Labels in First Row, jabaikan kolom ini.
4. Pengisian pilihan output (Output Options), yaitu untuk penempatan hasil
analysis atau output. Output Statistik Deskriptif yang akan dihasilkan Excel
bisa ditempatkan pada tiga pilihan:
• Pada workbook yang baru (New Workbook). Di sini output akan
ditampilkan pada workbook yang lain.
• Pada worksheet yang baru (New Worksheet Ply) namun masih dalam
workbook yang sama. Di sini akan ditampilkan pada worksheet yang lain
dari worksheet yang digunakan sekarang (sheet1).
• Pada workbook yang sama, pada worksheet yang sama (Sheet1) pula,
namun pada tempat (range) yang berbeda. Untuk itu, pilih option output
range, klik bulatan di dengannya dan isi kotaknya, ketik D1.

5. Klik Summary Statistics, yaitu ringkasan Statistika Deskriptif seperti Mean,


Median, Modus, dan sebagainya.

13
14

6. Klik Confidence Level for Mean, yaitu tingkat kepercayaan untuk Mean
dengan angka default 95 % atau tingkat signifikan 5 %.
7. Klik Kth Largest, biarkan angka yang sudah ada yaitu angka 1 artinya output
untuk angka (data) yang terbesar pertama, Klik Kth Smallest, biarkan angka
yang sudah ada yaitu angka 1 artinya output untuk angka (data) yang terkecil
pertama.
8. Klik OK. Tampilan input data pada Descriptive Statistics secara lengkap
seperti tampak pada Gambar 6 berikut.

Gambar 6. Kotak Dialog Descriptive Statistics

Tampak hasil analisis sebagai berikut :


Column1

Mean 1547.416667
Standard Error 53.19610067
Median 1578
Mode #N/A
Standard Deviation 184.2766982
Sample Variance 33957.90152
Kurtosis -0.726620092
Skewness -0.616702759
Range 568
Minimum 1200
Maximum 1768
Sum 18569
Count 12
Largest(1) 1768
Smallest(1) 1200
Confidence Level(95.0%) 117.0838874

14
15

Dari tabel output di atas tampak serangkaian output Statistika Deskriptif


seperti Mean, Median, dan sebagainya. Label untuk output di atas adalah
Column1 yang merupakan default dari Excel.
Analisis Hasil

• Mean (rata-rata hitung) adalah 1547,417. Hal ini berarti rata-rata penjualan
mobil Arjun untuk tahun 2013 adalah 1547,417 unit atau 1549 unit.
• Median (titik tengah) dari data di atas adalah 1578 unit mobil. Untuk kasus
ini, Median tidak perlu digunakan karena tidak relevan dengan pembahasan.
• Mode atau data yang paling sering muncul tertulis #N/A atau Not Available
(tidak tersedia). Hal ini berarti tidak ada unit mobil yang terjual dalam jumlah
yang sama selama dua belas bulan.
• Standar Deviasi (s) adalah 184,2767. Hal ini berarti bahwa Standar Deviasi
penjualan mobil Arjuna selama tahun 2013 adalah 184 unit (pembulatan),
atau bisa dikatakan mobil Arjuna yang terjual berada pada kisaran:
= Mean  Standar Deviasi = 1547  184 unit
= (1547 – 184) sampai (1547 + 184) unit = 1363 unit sampai 1731 unit
• Sample Variance (s2) adalah 33957,9. Hal ini berarti bahwa variance dari
penjualan mobil Arjuna adalah 33958 unit. Sample variance adalah kuadrat
dari Standar Deviasi, atau :
Variance = (184,2767) 2 = 33957,9
• Data minimum adalah 1200 dan data maksimum adalah 1768. Hal ini berarti
mobil Arjuna terjual minimum 1200 unit dan maksimum 1768 unit selama
tahun 2021.
• Sum adalah 18569, atau jumlah total mobil Arjuna yang terjual selama tahun
2012 adalah 18569 unit.
• Count adalah 12 atau ada 12 data (12 bulan) untuk melaporkan penjualan
mobil Arjuna
• Largest (1) adalah 1768 dan Smallest (1) adalah 1200. Hal ini berarti data
terbesar (pertama) adalah 1768 unit dan data terkecil (pertama) adalah
1200 unit.

15
16

Jika pada input awal untuk baris Kth Largest ditulis misalnya 2, maka data
terbesar kedua adalah 1754 unit.
• Skewness atau tingkat kemencengan adalah –0,6167. Tanda negatif berarti
distribusi data ‘menceng’ ke kiri (tidak simetris), dengan ciri Median (1578)
lebih besar dari Mean (1547).
• Kurtosis atau tingkat keruncingan distribusi adalah –0,72662.
• Standard Error (x) adalah 53,1961. Hal ini berarti penyimpangan dari rata-
rata sampel pada populasi adalah 53,1961 unit.
Standard Error dari Mean ini bisa didapat dari:

• Confidence Level pada 95 % didapat angka 117,08. Berarti pada tingkat


keyakinan 95 % rata-rata penjualan mobil Arjuna tahun 2021 berada di
antara:
= 1547  117,08 unit, atau:
= (1547 - 117,08 unit) sampai (1547 + 117,08 unit)
= 1430,33 unit sampai 1664,5 unit

16
17

Latihan 2
Histogram : Histogram biasa digunakan untuk menggambarkan data kuantitatif.
Data berikut merupakan hasil pengukuran tinggi tanaman jagung dari
tanaman sampel (10 % dari populasi dalam hamparan budidaya yang diambil
secara acak), data dalam cm.

Tabel 2. Kasus Statistik Deskriptif


68 84 75 82 68 90 62 88 76 93
73 79 88 73 62 93 71 59 85 75
62 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 62
96 62 89 62 75 95 62 79 83 71
79 80 67 97 78 85 76 65 71 75
65 67 73 57 88 78 62 76 53 74
86 78 73 81 72 63 76 75 85 77

Pertanyaan :
1. Hitunglah range (R) dan jumlah kelas (k).
2. Carilah interval kelasnya (p).
3. Gambarkan grafik histogram, poligon dan ogive.
Penyelesaian :
Ketik semua data dalam Tabel 3 di atas, mulai pada kolom A baris kedua
(A2) sampai kolom J baris 9 (J9).

Membuat Kerangka Distribusi Frekuensi (Pembuatan Bin Range)


Karena akan dibuat distribusi frekuensi, maka terlebih dahulu disusun
interval kelas, jumlah kelas dan sebagainya, yang dalam Excel disebut dengan
istilah BIN. Langkah penyusunan kerangka distribusinya sebagai berikut :
Range (R) = Data Terbesar – Data Terkecil
= 97 – 53 = 44
Jumlah kelas (k) = 1 + 3,3 log n = 1 + 3,3 log 80 = 7,28  8 kelas
Interval kelas (p) = R / k = 44 / 8 = 5,5  6
Setelah diketahui range, jumlah kelas dan interval kelas, maka dibuatkan
kerangka/tabel distribusi frekuensi yaitu sebagai berikut :

Tinggi Tanaman Frekuensi


50 - 55 ?
17
18

56 - 61 ?
62 - 67 ?
68 - 73 ?
74 - 79 ?
80 - 85 ?
86 - 91 ?
92 - 97 ?

Kerangka distribusi di atas kemudian ditempatkan pada Excel untuk


pembuatan tabel distribusi frekuensi.

1. Tempatkan pointer pada sel L1 dan ketik BIN untuk mengisi sel tersebut.
2. Dengan memperhatikan kerangka distribusi seperti tabel di atas, ketik sel-
sel berikut untuk mengisi BIN dari Excel:

Nama Sel BIN Range


L2 55
L3 61
L4 67
L5 73
L6 79
L7 85
L8 91
L9 97

Data di atas digunakan untuk mengisi BIN Range yang ada di EXCEL.

Adapun langkah-langkah pengisian HISTOGRAM sebagai berikut :

1. Pilih menu Tools atau Data, lalu klik pilihan Data Analysis… (biasanya
terletak paling bawah) pada menu Tools atau Data tersebut.

2. Tampak gambar serangkaian alat analisis, yang sama dengan tampilan


pada pembuatan Descriptive Statistics sebelumnya.

3. Dari serangkaian alat analisis tersebut, sesuai dengan kebutuhan pada


kasus, pilih Histogram, lalu tekan OK. Tampak gambar berikut.

18
19

Gambar 7. Kotak Dialog Histogram

4. Untuk Input Range, yang adalah data tinggi tanaman, bisa dilakukan
dengan blok dari A2...J9 atau ketik A2:J9 (data angka yang akan dianalisis).
5. Ulangi prosedur di atas untuk BIN RANGE dengan range adalah L2..L9.
6. Untuk kolom Labels, untuk keseragaman, bisa dilewati atau diabaikan saja.
7. Pengisian pilihan output (Output Options)
Untuk keseragaman, output akan ditempatkan pada worksheet yang sama,
hanya pada range yang berbeda, tepatnya berada di samping kasus di atas.

Untuk itu, pilih option Output Range dengan mengklik mouse pada sisi kiri
pilihan tersebut. Kemudian klik mouse pada icon/pada sisi kanan pilihan
tersebut. Klik dimana output dikehendaki atau ditempatkan (misalnya klik
pada sel atau kolom N1).
8. Mengisi pilihan untuk output yang akan ditampilkan.
Untuk keseragaman, klik kotak sebelah kiri pilihan Chart Output.
9. Setelah seluruh pengisian dianggap benar, tekan OK untuk melihat output
dari histogram. Gambar Histogram dan Frekuensi yang dihasilkan sbb.:

Histogram
30
24
y 25
c 20 17
e 15 13 Frequency

Bin

Gambar 8. Output Grafik Histogram (Diagram Batang)


19
20

Tabel 3. Output Distribusi Frekuensi

Bin Frequency
55 1
61 2
67 17
73 13
79 24
85 9
91 7
97 7
More 0

Gambar diagram batang (Gambar 8) tersebut dapat dibentuk menjadi


histogram. Langkah-langkahnya sebagai berikut :
a. Klik badan grafik dua kali.
b. Muncul windows Format Data Series, klik menu Options () atauklik kanan
pilih Format Data Series (Excel 2007).

c. Isi kotak Gap width dengan angka nol atau 0 %, lalu klik OK.
d. Hasilnya seperti gambar berikut.

Histogram
30
24
25
17
13 Frequency
u 9
q

50 - 55 56 - 61 62 - 67 68 - 73 74 - 79 80 - 85 86 - 91 92 - 97 More

Tinggi Tanaman (cm)

Gambar 9. Output Grafik Histogram Tinggi Tanaman

20
21

Distribusi Frekuensi Kumulatif


Dari tabel frekuensi yang dihasilkan Excel, output tersebut dapat
dibuatkan table distribusi kumulatif “kurang dari” dan “lebih dari” sbb.:

Tabel . Distribusi Frekuensi Kumulatif Tinggi Tanaman

Kelas Kurang dari Frekuensi Kelas Lebih dari Frekuensi


< 50 0 > 49 80
< 56 1 > 55 79
< 62 3 > 61 77
< 68 20 > 67 60
< 74 33 > 73 47
< 80 57 > 79 23
< 86 66 > 85 14
< 92 73 > 91 7
< 98 80 > 97 0

Untuk membuat grafik “ogive kurang dari” dan “ogive lebih dari” ketik
kelas dan frekuensi masing-masing pada dua kolom yang berbeda, serta
demikian juga untuk pembuatan grafik poligon. Cara pembuatan grafiknya, klik
gambar grafik pada menu bar, pilih chart type line lalu klik Next kemudian isi

data range dengan cara blok kelas dan frekuensinya, selanjutnya klik Next
dua kali dan klik Finish, Hasilnya sebagai berikut :

Distribusi Frekuensi dengan Bantuan Fungsi Frequency (Cara Lain)

Data yang akan digunakan sama, yaitu data tinggi tanaman pada contoh di
depan. Langkah-langkah Perhitungan :
1. Ketik More pada sel L10.
2. Ketik Frekuensi pada sel M1, kemudian blok/highlight sel M2:M10.
21
22

3. Pada sel M2 ketik, =FREQUENCY(A2:J9,L2:L10).


4. Tekan tombol CTRL dan SHIFT serta ENTER secara bersamaan, maka
akan keluar hasilnya.

Tugas I : Kerjakan secara manual data berikut.


73 86 66 86 50 78 66 72
80 83 87 79 80 77 81 92
58 82 73 95 66 60 84 80
80 88 58 84 96 87 72 65
86 68 76 41 80 40 63 94
76 66 74 76 68 82 59 75
65 63 85 87 79 77 76 74
75 60 96 74 73 87 52 98

a. Buatlah tabel distribusi frekuensi bergolong dan distribusi kumulatif.


b. Gambarkan grafik histogram, poligon, dan ogive kurang dari dan lebih dari.

22
23

Distribusi Binomial

Banyak data maupun informasi dalam dunia usaha, atau riset-riset dalam
bisnis, yang menghasilkan respon dalam bentuk dikotomi, dalam arti
menghasilkan hanya dua alternatif, misalnya jawaban suatu pertanyaan yang
hanya menghasilkan dua jawaban, “ya” atau “tidak”, “gagal” atau “ sukses” ,
“suka” atau “tidak suka” dan sebagainya. Jumlah alternatif jawaban dikotomi
seperti itu (jumlah yang menjawab “ya” atau jumlah yang menjawab “tidak”) akan
membentuk suatu distribusi probabilitas binomial.

Latihan 3
Sebuah dadu (yang mempunyai enam angka) dilempar sebanyak lima kali.
Berapa kemungkinan angka 4 dari dadu tersebut muncul sebanyak nol kali

(tidak pernah muncul), satu kali, dua kali, tiga kali, empat kali atau lima kali
(muncul terus menerus)?
Masalah ini adalah persoalan binomial, karena hanya ada dua
kemungkinan, yaitu ‘angka 4 muncul’ atau ‘angka 4 tidak muncul’.

Tabel . Kasus Distribusi Binomial


A B C
1 Jumlah Pelemparan (n) 5
2 Probabilitas 0.16666667
3 X PROB (X) PROB (<=X)
4 0 ? ?
5 1 ? ?
6 2 ? ?
7 3 ? ?
8 4 ? ?
9 5 ? ?

Langkah-Langkah Perhitungan :
Menghitung Probabilitas X (PROB X)
Probabilitas angka 4 tidak pernah muncul dari lima kali lemparan :
1. Tempatkan pointer pada sel B4
2. Ketik pada sel B4 tersebut dengan
=BINOMDIST(A4,$C$1,$C$2,FALSE)
atau dengan memasukkan angka langsung seperti berikut :

23
24

=BINOMDIST(0,5,0.16666667,FALSE)
3. Tekan Enter
4. Untuk mengisi probabilitas tidak muncul angka 4 sebanyak 1 kali, 2 kali, 3
kali, 4 kali, atau 5 kali dalam lima kali lemparan, maka dengan jalan
mengcopy rumus di atas.
(FALSE adalah tanda bahwa yang dihitung adalah probabilitas untuk satu
titik saja, bukan suatu interval).
Keterangan hasil yang diperoleh sebagai berikut :
• Probabilitas “angka 4” tidak pernah muncul (0 kali) selama 5 kali lemparan
dadu adalah 0,4019 atau 40,19 %.
• Probabilitas “angka 4” muncul 1 kali selama 5 kali lemparan dadu adalah
0,4019 atau 40,19 %.

• Probabilitas “angka 4” muncul 2 kali selama 5 kali lemparan dadu adalah


0,1608 atau 16,08 %.
• Probabilitas “angka 4” muncul 3 kali selama 5 kali lemparan dadu adalah
0,0322 atau 3,22 %.
• Probabilitas “angka 4” muncul 4 kali selama 5 kali lemparan dadu adalah
0,0032 atau 0,32 %.
• Probabilitas “angka 4” muncul 5 kali selama 5 kali lemparan dadu adalah
0,0001 atau 1 %.

Menghitung PROB(<=X)

1. Tempatkan pointer pada sel C4.

2. Ketik pada sel C4 tersebut, =BINOMDIST(A4,$C$1,$C$2,TRUE)


atau dengan memasukkan angka langsung seperti berikut :
=BINOMDIST(0,5,0.16666667,TRUE)
3. Tekan Enter.
4. Untuk mengisi probabilitas muncul angka 4 sebanyak 1 kali, 2 kali, 3 kali, 4
kali, atau 5 kali dalam lima kali lemparan, maka dengan jalan mengcopy
rumus di atas.
(TRUE adalah tanda bahwa yang dihitung adalah probabilitas untuk suatu
interval).
Keterangan hasil yang diperoleh sebagai berikut :
24
25

• Probabilitas “angka 4” muncul 1 kali, 0 kali (tidak pernah muncul) selama 5


kali lemparan dadu adalah 0,8038 atau 80,38 %.
• Probabilitas “angka 4” muncul 2 kali, 1 kali, 0 kali selama 5 kali lemparan
dadu adalah 0,9645 atau 96,45 %.
• Probabilitas “angka 4” muncul 3 kali, 2 kali, 1 kali, 0 kali selama 5 kali
lemparan dadu adalah 0,9967 atau 99,67 %.
• Probabilitas “angka 4” muncul 4 kali, 3 kali, 2 kali, 1 kali, 0 kali selama 5 kali
lemparan dadu adalah 0,9999 atau 99,99 %.
• Probabilitas “angka 4” muncul 5 kali (muncul terus-menerus) selama 5 kali
lemparan dadu adalah 1,0000 atau 100 %.

Hasil lengkapnya disajikan pada Tabel 6 berikut.

Tabel 6. Output Distribusi Binomial


A B C
1 Jumlah Pelemparan (n) 5
2 Probabilitas 0.16666667
3 X PROB (X) PROB (<=X)
4 0 0.4019 0.4019
5 1 0.4019 0.8038
6 2 0.1608 0.9645
7 3 0.0322 0.9967
8 4 0.0032 0.9999
9 5 0.0001 1.0000

Distribusi Normal

Salah satu bentuk distribusi probabilitas yang paling penting dan paling
sering digunakan dalam praktek statistik adalah distribusi normal. Distribusi
normal adalah suatu distribusi yang berbentuk bell shaped (lonceng) yaitu
terbentuk dalam dua bagian yang simetris, dengan menaik dari sebelah kiri,
kemudian setelah mencapai titik tertentu, mulai menurun namun tidak sampai
menyentuh sumbu horizontal.
Kurva normal mempunyai sifat-sifat sebagai berikut :
• Rata-rata mempunyai satu puncak (berbentuk lonceng) dimana mean =
median=modus
• Kedua kakinya mendekati garis horizontal tetapi tidak pernah menyentuh
• Keseluruhan luas dari kurva normal = 1.
25
26

Biasanya pada kasus distribusi normal menggunakan rumus transformasi,


artinya setiap nilai random X, bisa diubah ke nilai random terstandarisasi Z,
dengan rumus :

X −
Z =

Dimana:

Z = Nilai yang terstandarisasi ; X = Nilai tertentu


 = Rata-rata populasi ;  = Standar deviasi populasi

26
27

Latihan 4
Hasil ujian sebuah kelas terdistribusi normal dengan rata-rata 70 dan standar
deviasi 3,5. Jika ada seorang mempunyai hasil nilai 81, berapa nilai Z ?
Berapa luas area atau probabilitas di bawah kurva Z pada masalah di atas?

Penyelesaian :
Data yang ada adalah :  = 70 ;  = 3,5 ; X = 81 (sebuah variabel random)

81 − 70 = 3,14
Z =
3,5

Angka 3,14 beratri standarisasi nilai dari variabel random 81 adalah 3,14.

Menghitung Z menggunakan fungsi STANDARDIZE dari Excel :


STANDARDIZE(X,mean,standard_dev) Atau STANDARDIZE(X,,)
Dengan menempatkan pointer di sembarang sel, ketik :
=STANDARDIZE(81,70,3.5) akan didapat hasil 3,14
(hasilnya sama dengan perhitungan terdahulu).
Menghitung area atau probabilitas di bawah kurva Z dengan Tabel Z :

Dengan melihat Tabel Z untuk angka 3,14 didapat 0,49916. Karena akan
dihitung luas area di bawah angka Z tertentu (3,14), maka angka tersebut
dijumlah dengan angka 0,5 yang merupakan luas area satu sisi dari Z. Lihat
gambar berikut :

Luas sisi kanan diarsir = 0,4996

+ 3,14

Luas sisi kiri = 0,5 Luas sisi kanan = 0,5

Luas daerah di bawah angka Z (+3,14) adalah seluruh daerah yang diarsir :

27
28

0,5 + 0,4996 = 0,9996, berarti luas daerah Z (+3,14) adalah 0,9996 atau
probabilitas diperoleh nilai 81 ke bawah (80, 79, 78 dan seterusnya
sampai nilai 0) adalah 99,96 %.

Menghitung area atau probabilitas di bawah kurva Z dengan menggunakan


fungsi NORMSDIST dan NORMDIST dari Excel (bedakan adanya perbedaan
huruf ‘S’ diantara dua fungsi tersebut).

Jika nilai Z sudah diketahui, gunakan rumus NORMSDIST(Z).


Dengan menempatkan pointer di sembarang sel, ketik =NORMSDIST(3.14)
akan didapat hasil 0,9992 atau 99,92 % yang sama dengan perhitungan
terdahulu (perbedaan angka di belakang koma karena adanya pembulatan).
Jika nilai Z belum diketahui, gunakan rumus NORMDIST(X, ,,TRUE)
atau NORMDIST(X, ,,FALSE)
Di sini fungsi logika TRUE berarti akan dihitung luas area sebelum angka X
tertentu. Sedangkan fungsi logika FALSE berarti akan dihitung luas area setelah
angka X tertentu.
1. Untuk menghitung luas area sebelah kiri Z letakkan pointer di sembarang sel,
ketik :

=NORMDIST (81,70,3.5,TRUE) maka didapat hasil 0,9992 atau 99,92 %.


2. Untuk menghitung luas area sebelah kanan Z letakkan pointer di sembarang
sel, ketik :
=NORMDIST (81,70,3.5,FALSE) maka didapat hasil 0,00081 yang berarti
luas area disebelah kanan angka Z (+3,14) adalah 0,00081 atau probabilitas
untuk memperoleh nilai di atas 81 adalah 0,00081 atau 0,081 %.
Menghitung nilai Z dan X jika luas di bawah kurva diketahui dengan
menggunakan fungsi NORMSINV dari Excel, dengan rumus :
=NORMSINV(Probability<X)
Di sini diketahui luas kurva di bawah nilai X tertentu adalah 0,05.
Dengan menempatkan pointer di sembarang sel, ketik =NORMSINV(0.05)
akan didapat hasil –1,645 atau berarti nilai Z adalah –1,645. Perhatikan gambar
berikut:

28
29

Luas area 0,05

-1,645

Luas sisi kiri = 0,5 Luas sisi kanan = 0,5

Pada umumnya fungsi NORMSINV dalam praktek untuk mencari titik kritis

pada tingkat signifikansi tertentu, seperti 0,05 (uji satu sisi) yang berarti tingkat

signifikansi adalah 5 %. Jika 0,025 berarti tingkat signifikansi adalah 5 %

*uji dua sisi) dan seterusnya.

Menghitung nilai Z dan X jika luas di bawah kurva diketahui dengan

menggunakan fungsi NORMINV dari Excel, dengan rumus :

=NORMINV(Probability < X, ,)

Di sini diketahui luas area kurva di bawah nilai X tertentu adalah 0,05

Dengan menempatkan pointer di sembarang sel, ketik :

=NORMINV(0.05,70,3.5) akan didapat hasil 64,24 atau berarti nilai X yang

berhubungan dengan luas kurva 0,05 adalah 64,24.

Tugas II :

1. Sepuluh persen dari semacam benda tergolong dalam kategori A. Sebuah


sampel berukuran 25 telah diambil secara acak. Berap peluang sampel itu
akan berisikan benda kategori A, jika : a) semuanya, b) 2 buah, c) paling sedikit
1 buah, dan d) paling banyak 3 buah.

2. Hasil ujian Statistika mahasiswa diperoleh rata-rata nilainya 6,6 dan standar
deviasinya 1,12 dengan asumsi berdistribusinormal. Hitunglah : a) berapa
persen dari mahasiswa mendapat nilai 6, b) nilai tertinggi dari 10 persen
mahasiswa yang mendapat nilai terendah, dan c) nilai tertinggi dari 10 persen
mahasiswa yang mendapat nilai tertinggi.

29
30

UJI HIPOTESIS SATU RERATA DAN


SAMPEL BERPASANGAN

Perusahaan “SUKA MAJU” melaporkan kepada Departemen Tenaga Kerja


bahwa pendapatan rata-rata keryawan di perusahaannya sebesar Rp 500.000
setiap bulan. Dalam analisis statistik untuk membuktikan pernyataan pihak
perusahaan itu bahwa penghasilan rata-rata setiap bulan karyawan tersebut
merupakan suatu hipotesis.
Hipotesis adalah jawaban sementara sebelum percobaan atau penelitian
dilaksanakan yang didasarkan pada hasil studi literatur. Hipotesis adalah sesuatu
yang perlu diuji kebenarannya. Untuk menguji kebenaran suatu hipotesis
diperlukan informasi/data yang dapat digunakan untuk mengambil kesimpulan
apakah pernyataan itu dapat diterima atau ditolak.
Uji t Satu Rerata
Uji t satu rerata ini digunakan untuk membandingkan rerata sampel dengan
nilai tertentu (standard). Nilai tertentu tersebut dapat berupa rerata populasi yang
diketahui atau nilai hipotetiknya. Nilai simpangan baku (standar deviasi) populasi
tidak diketahui. Sedangkan uji z satu rerata tidak dapat diselesaikan dengan
Excel karena harus diketahui simpangan baku populasinya.
Rumus uji hipotesis satu rerata untuk n < 30 digunakan uji-t (t-test) dan untuk
n ≥ 30 gunakan uji-z (z-test) jika varians populasi diketahui.
X − 0 X − 0
t-hitung = atau Z-hitung =
n / n
Latihan 5
Diketahui rata-rata pendapatan pekerja rakitan dengan pengalaman kurang
dari 5 tahun di suatu perusahaan besar adalah Rp 700 ribu sebulan. Suatu
Lembaga Swadaya Masyarakat (LSM) percaya bahwa pekerja wanita dibayar
kurang dari itu. Contoh acak 9 pekerja wanita pendapatannya dalam ribuan
rupiah sbb.: 650 680 710 680 690 720 640 670 700
Ujilah apakah pernyataan LSM bahwa rata-rata upah pekerja wanita dibawah
700 ribu rupiah per bulan dapat diterima pada taraf nyata 5 %.

30
31

Dalam pengujian hipotesis hendaknya terlebih dahulu memperjelas


pernyataan matematis hipotesis nol (Ho) dan hipotesis alternatifnya (H1), apakah
mengacu ke uji satu arah (one-tailed test) atau uji dua arah (two-tailed test).
Pernyataan matematis tersebut dapat dinyatakan dalam tiga bentuk uji hipotesis
yaitu :
1. Ho : μ ≥ μo vs H1 : μ < μo (uji satu arah ke kiri)
2. Ho : μ ≤ μo vs H1 : μ > μo (uji satu arah ke kanan)
3. Ho : μ = μo vs H1 : μ ≠ μo (uji dua arah)
Langkah Penyelesaian :
a. Tulis secara matematis Ho dan H1-nya, sebagai berikut :
Ho : μ ≥ 700 vs H1 : μ < 700
b. Ketik R-pdptn (untuk menyatakan rata-rata pendpatan) di sel A1 dan R-pop
(untuk menyatakan nilai standard) di sel B1.
c. Ketik data Teladan 6 pada kolom A2 .. A10 dan ketik angka 700 pada
kolom B2 .. B10.
d. Untuk mencari nilai t-hitung, pilih menu Tools atau Data, lalu buka pilihan
Data Analysis.
e. Pilih t-test: Paired Two Sample for Means, lalu tekan OK.

Gambar 10. Kotak Dialog Paired Sample Test

f. Untuk input variable 1 range, blok/highlight sel A2:A10, dan untuk variable 2
range, blok/highlight sel B2:B10.
g. Klik kotak di depan output range dan ketik D1 kemudian tekan OK.
h. Hasilnya disajikan pada tabel berikut.

31
32

Tabel 7. Hasil Uji-t Satu Rerata


t-Test: Paired Two Sample for Means
Variable 1 Variable 2
Mean 682.2222222 700
Variance 694.4444444 0
Observations 9 9
Pearson Correlation #DIV/0!
Hypothesized Mean Difference 0
df 8
t Stat -2.023857703
P(T<=t) one-tail 0.038796503
t Critical one-tail 1.859548320
P(T<=t) two-tail 0.077593007
t Critical two-tail 2.306005626

Kesimpulan : nilai t-hitung (-2,024) < nilai t-tabel (-1,860), maka Ho ditolak
artinya pernyataan LSM bahwa rata-rata pendapatan wanita di bawah Rp
700.000 dapat diterima.
Nilai t-hitung sebenarnya dapat dicari dengan menggunakan rumus berikut :

t-hitung = (mean – μo) √ n / S

dimana : S = standar deviasi ; μo = nilai yang dihipotesiskan

Uji t Untuk Data Berpasangan

Dua sampel dikatakan berpasangan jika pengambilan unit-unit sampel


pertama memperhatikan bagaimana unit-unit sampel kedua dipilih. Dengankata
lain, kedua sampel tersebut ada saling ketergantungan atau berkorelasi positif.
Keterkaitan kedua sampel pada kasus berpasangan ditentukan oleh suatu
peubah kontrol (control variable) misal lokasi, kemiringan lahan, tingkat
pendidikan, kondisi sosial ekonomi dan lain-lain.
Ukuran contoh untuk kasus berpasangan harus sama yaitu sebesar (n),
dimana besaran n menunjukkan banyaknya pasangan yang dipilih. Untuk melihat
perbedaan dua populasi dari kasus dua contoh berpasangan dapat dilakukan
dengan secara langsung membedakan setiap obyek pada contoh satu dan
contoh dua untuk setiap pasangan. Langkah tersebut akan

32
33

menghasilkan satu gugus data baru, yang nilai-nilainya merupakan perbedaan


contoh satu dengan contoh dua.

Pasangan 1 2 3 4 ..... n
Contoh 1 (X) X1 X2 X3 X4 ..... Xn
Contoh 2 (Y) Y1 Y2 Y3 Y4 ..... Yn
Di = X – Y D1 D2 D3 D4 ..... Dn
d = (Di – Md) d1 d2 d3 d4 ..... dn
(Di – Md)2 d12 d22 d32 d42 ..... dn2

Jika dimisalkan beda nilai tengah populasi dinotasikan dengan μ = μ1 = μ2 maka

penduga tak berbias dari μ adalah rata-rata dari beda dua contoh (Md), yang

diperoleh dari : Md = ∑ Di / n

Bentuk hipotesisnya dapat dibedakan menjadi tiga, yaitu :

1. Ho : μ ≥ μ0 vs H1 : μ < μ0

2. Ho : μ ≤ μ0 vs H1 : μ > μ0
3. Ho : μ = μ0 vs H1 : μ ≠ μ0

Statistik uji yang digunakan untuk menguji hipotesis-hipotesis tersebut adalah:

t-hitung = Md / √ ∑ (Di – Md)2 / n (n – 1) ; dengan derajat bebas n – 1.

atau t-hitung = Md / (Sd / √ n) ; Sd = √ {∑ di2 – (∑ d)2/n} / (n – 1)

Kriteria pengambilan keputusan sama dengan kasus satu populasi.

Latihan 6
Seorang pemulia tanaman menemukan dua turunan tanaman padi yang
mempunyai potensi tinggi dalam menghasilkan biji. Kedua jenis tanaman padi itu
diberi kode seleksi X dan Y. Jenis-jenis tanaman padi telah dicobakan pada 12
daerah (sentra)penanaman padi. Hasil yang didapat sbb.: (ton/Ha)
Daerah : 1 2 3 4 5 6 7 8 9 10 11 12
X : 10,5 14,8 10,3 7,2 8,8 14,2 15,7 12,3 8,9 7,9 11,1 14,4
Y : 12,7 13,1 7,2 8,9 10,1 11,1 13,2 10,9 7,3 8,1 8,2 9,7
Ujilah apakah kedua jenis padi mempunyai daya hasil yang berbeda, α = 5%.

33
34

Langkah-langkah Perhitungan (sama dengan uji t satu rerata)Hipotesisnya :


Ho: 1 = 2 ; artinya tidak ada perbedaan rata-rata daya hasil antara kedua
jenis padi tersebut.
Hi: 1 ≠ 2 ; artinya ada perbedaan rata-rata daya hasil antara kedua jenis
padi tersebut.

a. Ketik X di sel A1 dan Y di sel B1 (untuk menyatakan jumlah produksi).


b. Ketik data Teladan 6, data X pada kolom A2 .. A13 dan data Y pada kolom
B2 .. B13.
c. Untuk mencari nilai t-hitung, pilih menu Tools atau pilih menu Data (pada
Excel 2007), lalu buka pilihan Data Analysis...
d. Pilih t-test: Paired Two Sample for Means, lalu tekan OK.
e. Untuk input variable 1 range, blok/highlight sel A2:A13, dan untuk variable 2
range, blok/highlight sel B2:B13.
f. Klik kotak di depan output range dan ketik D1 kemudian tekan OK.
g. Hasilnya disajikan pada tabel berikut.

Tabel 8. Hasil Analisis Uji t Satu rerata

t-Test: Paired Two Sample for Means


Variable 1 Variable 2
Mean 11,3416667 10,04166667
Variance 8,4244697 4,766287879
Observations 12 12
Pearson Correlation 0,66380049
Hypothesized Mean Difference 0
df 11
t Stat 2,06016801
P(T<=t) one-tail 0,03192344
t Critical one-tail 1,79588481
P(T<=t) two-tail 0,06384688
t Critical two-tail 2,20098516

34
35

Pengambilan Keputusan :
• Dengan membandingkan t-hitung dengan t-tabel
Karena t-hitung (2,060) lebih kecil dari t-tabel (2,201) maka Ho diterima,
artinya kedua jenis padi tersebut mempunyai daya hasil yang sama (tidak
berbeda nyata).
• Dengan melihat nilai probabilitas (p-value):
Karena p-value hasil perhitungan dari komputer adalah 0,0638 (lihat kolom
p-value untuk two tail) yang lebih besar dari 0,05 maka Ho diterima artinya
kedua jenis padi tersebut mempunyai daya hasil yang tidak berbeda nyata
(kesimpulannya sama dengan melihat nilai t).

Catatan :
Jika menggunakan uji z, maka terlebih dahulu harus melakukan
perhitungan tersendiri untuk mencari varians sampel (S2) atau varians populasi
(2) untuk tiap variabelnya.
1. Untuk varians sampel ketik, =VARA(sel data)
Misalnya, variabel 1 =VARA(A2:A12) dan variabel 2 =VARA(b2:b12)
2. Untuk varians populasi ketik, =VARP(sel data)
Misalnya, variabel 1 =VARP(A2:A12) dan variabel 2 =VARP(B2:B12)
Pilih menu Tools, lalu buka pilihan Data Analysis...
Pilih z-test: Two Sample for Means, tekan OK, lalu isi inputnya, OK.

35
36

UJI HIPOTESIS DUA RERATA


SAMPEL TIDAK BERPASANGAN

T-Test untuk Equal Variance (Varians Sama/Homogen)


Latihan 7
Manajer PT Cemerlang yang memproduksi berbagai jenis parfum khusus
laki-laki ingin mengetahui apakah golongan usia seseorang mempengaruhi
perilaku mereka dalam membeli parfum. Untuk itu dilakukan pengambilan dua
sampel dari dua populasi, yaitu golongan remaja (batas usia ditetapkan di bawah
17 tahun) dan golongan dewasa (usia 17 tahun keatas). Data sampel adalah
jumlah pengeluaran mereka (dalam Rupiah) untuk membeli parfum tiap periode
tertentu. Berikut adalah data pengeluaran dalam rupiah/bulan.

t-hitung = 2 2
dimana Sp2 = (n1-1)Sx2 + (n2-1)Sy2 / n1-1 + n2-1
s s
p
+ p

n1 n2
A B
1 Remaja Dewasa
2 25000 28000
3 26500 27500
4 24800 28500
5 26000 27750
6 25800 28000
7 24500 29750
8 26000 26850
9 25000 27500
10 23500 28000
11 25600 29500

Dalam kasus ini manajer tersebut berasumsi kedua populasi tersebut


mempunyai varians yang sama.

Langkah-langkah Perhitungan

1. Pilih menu Tools atau Data, lalu buka pilihan Data Analysis...

2. Pilih t-Test: Two Sample Assuming Equal Varians, lalu tekan OK.
Tampak gambar berikut.

36
37

Langkah Pengisian :
1. Untuk input range, dimulai dengan range untuk variabel pertama (Variable
1 Range), ketik A2:A11.
2. Untuk input range variabel kedua (Variable 2 Range), ketik B2:B11.
3. Pilih option Output Range dengan mengklik sisi kiri pilihan tersebut.
kemudian ketik D1 (untuk tempatkan hasil analisis) lalu tekan OK.

Keluaran komputer dari langkah-langkah di atas sebagai berikut:

t-Test: Two-Sample Assuming Equal Variances

Variable 1 Variable 2
Mean 25270 28135
Variance 784555.5556 807250
Observations 10 10
Pooled Variance 795902.7778
Hypothesized Mean Difference 0
df 18
t Stat -7.180912226
P(T<=t) one-tail 5.50637E-07
t Critical one-tail 1.734063062
P(T<=t) two-tail 1.10127E-06
t Critical two-tail 2.100923666

Langkah Analisis:
1. Membuat Hipotesis:
Ho: 1 = 2 atau 1 - 2 = 0
Artinya : tidak ada perbedaan antara perilaku pembelian (pengeluaran
konsumsi golongan Remaja dengan golongan Dewasa).

37
38

H1: 1  2 atau 1 − 2  0
Artinya: ada perbedaan antara perilaku pembelian (pengeluaran konsumsi
golongan Remaja dengan golongan Dewasa.
2. Pengambilan Keputusan :
• Dengan membandingkan t tabel dan t hitung:
Karena t hitung (-7,1809) lebih kecil dari t tabel (-2,1009) atau ada di
daerah Ho ditolak, maka sesungguhnya ada perbedaan antarakonsumsi
golongan remaja dengan golongan dewasa.
• Dengan melihat nilai probabilitas (P-value):
Karena P-value hasil perhitungan dari komputer adalah 1.1E-06 atau 1,1
x 10-6 atau 0,0000011 (lihat kolom P-value untuk two tail) yanglebih
kecil dari 0,05, maka Ho ditolak atau rata-rata pengeluaran konsumsi
kedua golongan tersebut berbeda.

Perhatikan kedua cara pengambilan keputusan akan menghasilkan


keputusan yang sama.
t- hitung

Ho ditolak Ho ditolak
Ho diterima

–7,1809 -2,1009 +2,1009

T-Test untuk Unequal Variance (Varians Tidak Sama)

Latihan 8

PT Maju Mundur ingin mengetahui kinerja para salesmannya yang


memasarkan produk-produk kosmetik. Untuk itu pada dua daerah yang berbeda
(Daerah 1 dan Daerah 2), diambil sampel mengenai data penjualan (unit produk
terjual) para salesman untuk masing-masing daerah, kemudian manajer
menganalisis apakah kinerja salesman di daerah 1 dan daerah 2 sama ataukah
berbeda. Data unit produk disajikan berikut.

38
39

t-hitung = 2
; Sx2 = [∑X2 – (∑X)2/n]/n-1 ; Sy2 = [∑Y2 – (∑Y)2/n]/n-1
2
s s
x
+
n1 n2
A B
1 DAERAH 1 DAERAH 2
2 56000 55000
3 53000 52000
4 59000 55000
5 60000 53450
6 61000 49500
7 49000 55300
8 45500 55600
9 47500 54000
10 58000
11 59850

Dalam kasus ini manajer perusahaan beranggapan varians kedua populasi


tidak sama.
Langkah-langkah Perhitungan :
1. Pilih menu Tools atau Data, lalu buka pilihan Data Analysis...
2. Pilih t-Test: Two Sample Assuming Unequal Varians, lalu tekan OK.
3. Tampak gambar di bawah:

Langkah Pengisian :

1. Untuk input range, dimulai dengan range untuk variabel pertama (Variable
1 Range), ketik A2:A9.

39
40

2. Untuk input range variabel kedua (Variable 2 Range), ketik B2:B11.

3. Pilih option Output Range dengan mengklik sisi kiri pilihan tersebut.
Kemudian ketik D1 (untuk tempatkan output), tekan OK.

Keluaran komputer sebagai berikut:


t-Test: Two-Sample Assuming Unequal Variances

Variable 1 Variable 2
Mean 53875 54770
Variance 36339285.71 8344000
Observations 8 10
Hypothesized Mean Difference 0
df 10
t Stat -0.38597632
P(T<=t) one-tail 0.353799291
t Critical one-tail 1.812461505
P(T<=t) two-tail 0.707598582
t Critical two-tail 2.228139238

Membuat Hipotesis
Ho: 1 = 2 atau 1 - 2 = 0; artinya tidak ada perbedaan antara rata-rata
penjualan daerah 1 dengan daerah 2.
Hi: 1  2 atau 1 − 2  0; artinya ada perbedaan antara rata-rata penjualan
daerah 1 dengan daerah 2.
Pengambilan Keputusan
Karena t hitung (–0,3859) lebih besar dari t tabel (-2,2281) atau ada di
daerah Ho diterima, maka sesungguhnya tidak ada perbedaan antara
rata-rata penjualan daerah 1 dengan daerah 2.

t- hitung

Ho ditolak
Ho diterima

-2,2281 -0,3859 +2,2281

40
41

REGRESI SEDERHANA DAN BERGANDA

Regresi Sederhana

Analisis regresi digunakan terutama untuk tujuan peramalan, dimana


dalam model tersebut ada sebuah variabel dependen dan variabel independen.
Sebagai contoh, ada tiga variabel, yaitu penjualan, biaya promosi dan biaya iklan.
Dalam praktek, akan dibahas bagaimana hubungan antara biaya promosi dan
biaya iklan terhadap penjualan. Di sini berarti ada variabel dependen, yaitu
penjualan, sedangkan variabel independennya adalah biaya promosi dan biaya
iklan. Metode korelasi akan membahas keeratan hubungan, dalam hal ini
keeratan hubungan antara biaya promosi dan biaya iklan terhadap penjualan.
Sedang metode regresi akan membahas prediksi (peramalan), dalam hal ini
apakah penjualan di masa mendatang bisa diramalkan jika biaya promosi dan
biaya iklan diketahui.
Kita asumsikan terdapat hubungan yang linier antara penjualan dan
biaya promosi. Hubungan linier kedua variabel dapat kita tulis dalam
persamaan regresi berikut :
Yi = a + b Xi
Keterangan : a = konstanta (intercept) atau titik potong
b = koefisien arah regresi (slope)

(Y )( X 2 )− ( X )( XY )


Rumus : a= atau a = ∑ Y/n – b ∑ X/n
n X 2 − ( X )
2

n XY − ( X )(Y )
b=
n X 2 − ( X )
2

Latihan 9:

PT Manunggal Jaya yang memproduksi pupuk Urea briket dan pupuk

SP-36 dalam usaha meperkenalkan produk-produknya, melakukan promosi


41
42

gencar di seluruh daerah yang dianggap potensial. Setelah beberapa bulan,

manajer pemasaran perusahaan tersebut ingin mengetahui apakah promosi

yang selama ini dilakukan sudah efektif untuk mempengaruhi penjualan produk-

produknya. Untuk itu manajer tersebut mengambil data biaya promosi yang telah

dikeluarkan dan penjualan bulanan dari 25 daerah yang dianggap potensial. Data

hasil penelitian sebagai berikut.

A B C
1 PROMOSI (X) SALES (Y)
DAERAH
2 (JUTA Rp) (JUTA Rp)
3 Jakarta Pusat 12.5 145.3
4 Jakarta Barat 14.9 159.5
5 Jakarta Timur 11.6 140.2
6 Jakarta Utara 17.5 195.2
7 Jakarta Selatan 12.4 140.6
8 Tangerang 10.5 100.6
9 Bekasi 8.6 95.8
10 Bogor 9.3 99.5
11 Bandung 7.5 87.6
12 Cirebon 8.5 90.5
13 Semarang 9.4 98.6
14 Surakarta 5.6 75.8
15 Yogyakarta 5.8 78.6
16 Surabaya 11.5 141.2
17 Malang 6.5 81.5
18 Denpasar 9.8 95.4
19 Medan 11.9 148.6
20 Padang 6.2 86.4
21 Palembang 5.8 77.9
22 Pekanbaru 4.6 70.9
23 Pontianak 8.2 91.5
24 Samarinda 5.6 75.1
25 Manado 4.6 72.6
26 Balik Papan 7.5 86.4
27 Ujung Pandang 9.8 100.5

42
43

Langkah-langkah Perhitungan

1. Pilih menu Tools atau Data, lalu buka pilihan Data Analysis...

2. Pilih Regession, kemudian tekan OK.

3. Tampak gambar berikut.

Langkah Pengisian :

1. Untuk Input Y Range atau input untuk variabel dependen Y, ketik C3:C27.

2. Untuk Input X Range atau input untuk variabel independen ketik B3:B27.

3. Pilih Output Range dari Output Options dengan mengklik bulatan di depan
pilihan tersebut, lalu isi kotak putih panjang dengan ketik E1, tekan OK.

Hasil Output Regresi


SUMMARY OUTPUT

Regression Statistics
Multiple R 0.959351976
R Square 0.920356214
Adjusted R Square 0.916893441
Standard Error 9.499677322
Observations 25

43
44

ANOVA
df SS MS F Significance F
Regression 1 23985.54541 23985.54541 265.7858713 3.94579E-14
Residual 23 2075.608992 90.24386922
Total 24 26061.1544

Coefficients Standard Error t Stat P-value


Intercept 18.22708023 5.676431779 3.21101018 0.003875326
X Variable 1 9.64229542 0.591445168 16.30294057 3.94579E-14

Lower 95% Upper 95% Lower 95.0% Upper 95.0%


6.484502413 29.96965804 6.484502413 29.96965804
8.418799538 10.8657913 8.418799538 10.8657913

Persamaan Regresi Sederhana dan analisisnya

Y = 18,22 + 9,64 X
• Interpretasinya, intercept atau konstanta sebesar 18,22 artinya tanpa adanya
promosi, penjualan dari produk PT Sehat Terus adalah 18,22 juta.
• Koefisien regresi 9,64 artinya setiap kenaikan biaya promosi sebesar satu
rupiah akan meningkatkan sales sebesar Rp 9,64. Perhatikan hubungannya
dengan tanda ‘+’.

• Arah hubungan:
Dari persamaan terlihat adanya tanda ‘+’ yang menggambarkan hubungan
yang positif, atau dalam hal ini peningkatan variabel X (promosi) akan
meningkatkan variabel Y (Sales). Tanda ‘+’ juga berarti garis regresi yang
tergambar bersifat miring ke kanan atas.

• R-Square (koefisien determinasi):


Dari kolom R Square (R2) pada output Regression Statistics didapat angka
0,9203. Hal ini berarti 92,03 % variasi pada Sales PT Sehat Terus bisa
dijelaskan oleh variasi pada biaya promosi yang dikeluarkan. Sedang
sisanya (100 % - 92,03 % atau 7,97 %) dijelaskan oleh variasi-variasi yang
lain (misal variasi pada kebijakan harga, jumlah outlet dan sebagainya).

44
45

Menggambar Persamaan Regresi

Berikut langkah-langkah untuk memplot hubungan variabel X dan Y.

1. Range tempat gambar dari output grafik persamaan regresi.

2. Pilih menu Insert pada menu utama Excel, lalu pilih menu Chart... maka
tampak tampilan berikut:

3. Pilih menu XY (Scatter) dari pilihan Standard Types, klik Next untuk masuk
ke Step 2 dari pengoperasian Chart Wizard.

4. Pada Step 2, untuk pilihan Data Range, ketik range data B3..C27. Sedang
untuk pilihan Series in:, harus dipilih Columns dengan memberi tanda pada
kolom di kiri pilihan Columns. Tampak secara kasar plot dari dua variabel
Sales dan Promosi. Lalu tekan Next dan Finish.

Memberi Garis dan Persamaan Regresi pada Gambar

Setelah scatter X dan Y selesai dibuat, akan ditambah garis dan persamaan
regresi dengan langkah-langkah:

1. Tempatkan pointer pada kumpulan titik-titik pada gambar tersebut. Maka


dengan mengklik kanan mouse, sebagian dari titik-titik tersebut akan
berubah warnanya.

2. Pilih menu Chart dan selanjutnya pilih pilihan Add Trendline... dari menu
Chart tersebut. Tampak gambar berikut:
45
46

3. Pilih Type, ada berbagai tipe Trend (garis) yang disediakan Excel. Pilih
pilihan Linear, yang berarti garis akan dibuat linier (lurus).

4. Pada tiga kotak pilihan terakhir, klik kotak di depan Display equation on
chart (untuk menyajikan persamaan regresi), dan Display R-squared value
on chart (untuk menampilkan koefisien determinasi), lalu tekan OK.

250 y = 9.6423x + 18.227


R2 = 0.9204
200

150 Series1
100 Linear (Series1)

50

10 15 20

Tampak di gambar output regresi sederhana lengkap dengan garis dan


persamaan regresinya. Seperti hasil output yang lain, gambar di atas bisa
dimodifikasi supaya lebih bagus penampilannya.

46
47

Pengambilan Keputusan:
• Dengan membandingkan t tabel dan t hitung:
Karena t hitung (+16,3029) lebih besar dari t tabel (+2,069) maka Ho
ditolak, atau biaya promosi benar-benar mempengaruhi sales secara
signifikan.
• Dengan melihat nilai probabilitas (p-value):
Karena p-value hasil perhitungan dari komputer adalah 3,94x10-14 (lihat
kolom p-value dari output komputer) yang jauh lebih kecil dari 0,05, maka
Ho ditolak atau promosi memang berpengaruh nyata terhadap sales PT
Sehat Terus.
t-Hitung

Ho ditolak
Ho ditolak
Ho diterima

-2,069 +2,069 +16,3029

Regresi Berganda

Seperti telah diuraikan sebelumnya, jika pada regresi sederhana hanya ada
satu variabel dependen (Y) dan satu variabel independen (X), maka pada kasus
regresi berganda, ada satu variabel dependen dan lebih dari satu veriabel
independen. Dalam praktek bisnis, regresi berganda justru lebih banyak
digunakan, selain karena banyaknya variabel dalam bisnis yang perlu dianalisis
bersama, juga karena ada banyak kasus regresi berganda lebih relevan
digunakan.

Dalam banyak kasus bisnis yang menggunakan regresi berganda, jumlah


variabel dependen berkisar dua sampai empat variabel. Walaupun secara teoritis
bisa digunakan banyak variabel bebas, namun penggunaan lebih dari tujuh
variabel independen dianggap akan tidak efektif.
Hubungan peubah-peubah dalam regresi berganda dapat dituliskan
dalam bentuk persamaan:

Yi = 0 + 1 Xi1 + 2 X i 2 + +  p−1 X i, p−1 + i


47
48

Y = Peubah tak bebas, X = Peubah bebas, 0 = intersept/perpotongan dengan


sumbu tegak, 1, 2, ...., p−1 = parameter model regresi, i saling bebas dan
menyebar normal N(0,2), dimana i = 1, 2, …, n

Persamaan regresi dugaannya adalah : Yˆ = b + b X + b X + + b p−1 X i, p−1


i 0 1 i1 2 i2

Hipotesis yang harus diuji dalam analisis regresi ganda adalah

H0 : 1 = 2 = … = k= 0
H1 : Tidak semua i (i = 1, 2,…,k) sama dengan nol

Untuk mengestimasi atau menduga koefisien regresi bo, b1, b2, ……. bk
digunakan persamaan berikut :

nb0 + b1  X1i + b2  X 2i +... + bk  X ki =  Yi


1i 2i k 1i ki 1i i

b0  X 1i + b  X +b X X +... + b X X =X Y
2

1 1i 2

b0  X 2i + b1  X1i X 2i +b2  X 2
+... + b X X ki =  X 2iYi
2i k 2i

…………………

b0  X ki + b  X X +b X X +... + b X =X Y
2

1 1i ki 2 2i ki k ki ki i

Untuk melakukan pendugaan parameter model regresi berganda dan


menguji signifikansinya dapat dilakukan secara manual (metode eliminasi) atau
dengan bantuan program EXCEL.

Latihan 10:
PT Manunggal Jaya yang memproduksi pupuk Urea briket dan pupuk SP-36
(lihat kasus regresi sederhana) dalam usaha memperkenalkan produk-
produknya, melakukan promosi gencar di seluruh daerah yang dianggap
potensial. Setelah beberapa bulan, manajer pemasaran perusahaan tersebut
ingin mengetahui apakah promosi yang selama ini dilakukan sudah efektif untuk
mempengaruhi penjualan produk-produknya. Untuk itu, manajer tersebut

48
49

mengumpulkan data sebagai berikut (dalam satu periode tertentu):


• Biaya promosi seperti iklan, sales promotion dan sebagainya (X1).
• Luas outlet yang disewa pada pusat perbelanjaan di tiap daerah (X2).

49
50

• Petani atau pelanggan yang tercatat pada tiap outlet (X3).


• Sales atau penjualan produk PT Manunggal Jaya (Y)
A B C D E
1 Daerah Promosi Luas Outlet Pengunjung Sales
2 (JUTA Rp) (m2) ORANG (JUTA Rp)
3 Jakarta Pusat 12.5 100 1245 145
4 Jakarta Barat 14.9 75 1458 160
5 Jakarta Timur 11.6 110 2250 140
6 Jakarta Utara 17.5 80 2145 195
7 Jakarta Selatan 12.4 85 2596 141
8 Tangerang 10.5 100 2541 101
9 Bekasi 8.6 50 500 95.8
10 Bogor 9.3 60 650 99.5
11 Bandung 7.5 55 450 87.6
12 Cirebon 8.5 60 550 90.5
13 Semarang 9.4 100 650 98.6
14 Surakarta 5.6 80 400 75.8
15 Yogyakarta 5.8 86 500 78.6
16 Surabaya 11.5 90 1100 141
17 Malang 6.5 55 600 81.5
18 Denpasar 9.8 40 900 95.4
19 Medan 11.9 110 1200 149
20 Padang 6.2 80 450 86.4
21 Palembang 5.8 60 400 77.9
22 Pekanbaru 4.6 55 450 70.9
23 Pontianak 8.2 70 750 91.5
24 Samarinda 5.6 90 500 75.1
25 Manado 4.6 50 650 72.6
26 Balikpapan 7.5 60 700 86.4
27 Ujung Pandang 9.8 80 900 100.5

Langkah-langkah Perhitungan :

1. Pilih menu Tools atau Data, lalu buka pilihan Data Analysis... kemudian
pilih regression, lalu tekan OK.

2. Untuk Input Y Range atau input untuk variabel dependen Y, bisa dilakukan
dengan mengetikkan langsung range Sales, yaitu E3:E27.

3. Untuk Input X Range atau input untuk variabel independen (bebas) diblok
semua rangenya atau ketik B3:D27.

4. Pengisian pilihan output (Output Options), yaitu:

50
51

Untuk keseragaman, output akan ditempatkan pada worksheet yang sama,


hanya rangenya berbeda, yaitu dipilih range G1.

Pilih Output Range dari Output Options dengan mengklik bulatan di depan
pilihan tersebut, lalu kotak putih panjang muncul dan isi dengan ketik G1,
kemudian tekan OK.

Regression Statistics
Multiple R 0.964694906
R Square 0.930636262
Adjusted R Square 0.920727157
Standard Error 9.282561026
Observations 25

df SS MS F Significance F
Regression 3 24277.41288 8092.471 93.91728 2.48752E-12
Residual 21 1809.484723 86.16594
Total 24 26086.8976

Coefficients Standard Error t Stat P-value


Intercept 7.632537477 8.639665291 0.88343 0.387006
X Variable 1 9.474878633 0.868174923 10.91356 4.1E-10
X Variable 2 0.186839845 0.110441733 1.69175 0.105481
X Variable 3 -0.001953505 0.004383335 -0.44567 0.660399

Kesimpulan :

Nilai F-hitung = 93,917 (bandingkan dengan F-tabel) atau p-value 2,488 x 10-12
yang jauh lebih kecil dari taraf nyata 1% makaHo ditolak, artinya secara bersama-
sama semua variabel bebas (biaya promosi, luas outlet dan jumlah petani) yang
dimasukkan dalam model berpengaruh sangat nyata terhadap penjualan
produk/pupuk (Y).

Nilai koefisien determinasi (R Square) = 0,9306 artinya 93,06% perubahan nilai


penjualan produk (pupuk) dipengaruhi oleh biaya promosi, luas outlet dan jumlah
petani, sedangkan sisanya 6,94% disebabkan oleh faktor lain di luar model.

51
52

Secara parsial (t-test) diketahui bahwa hanya variable X1 (biaya promosi) saja
yang berpengaruh nyata terhadap nilai penjualan pupuk/produk (Y), ini
ditunjukkan oleh p-value yang lebih kecil dari tarah nyata 5%. Sedangkanvariabel
X2 (luas outlet) dan X3 (jumlah petani) tidak berpengaruh nyata terhadap nilai
penjualan produk/pupuk (Y), dimana p-value lebih besar dari α=0,05.

52
53

DAFTAR PUSTAKA

J. Supranto, 2000. Statistik Teori dan Aplikasi. Penerbit Erlangga, Jakarta.

Singgih Santoso, 2001. Aplikasi Excel Dalam Statistik Bisnis. Penerbit PT. Elex
Media Komputindo, Jakarta.

Singgih Santoso, 2001. Buku Latihan SPSS Statistik Parametrik. Penerbit PT.
Elex Media Komputindo, Jakarta.

Sudjana, 1983. Pengatar Statistika. Penerbit PT. Tarsito, Bandung.

Sudjana, 2000. Teknik Analisis Regresi dan Korelasi. Penerbit PT. Tarsito,
Bandung.

53

Anda mungkin juga menyukai