Anda di halaman 1dari 115

Laboratorium Statistika Industri dan Penelitian Operasional

Fakultas Rekayasa Industri


Universitas Telkom
Pembina Hilman Dwi Angga, S. Si., M. Si
Tim Penyusun Asisten Laboratorium SIPO
-
MODUL MATERI SIPO 2022

TATA TERTIB PRAKTIKUM STATISTIKA INDUSTRI DAN


PENELITIAN OPERASIONAL TAHUN AJARAN 2021/2022

PERATURAN UMUM
I . Praktikan wajib mengetahui semua informasi terkait pelaksanaan praktikum.
2. Praktikan wajib mengetahui seluruh kelengkapan dan persyaratan praktikum
dan menyiapkan hal-hal yang dibutuhkan untuk pelaksanaan praktikum (data,
peralatan, dll.) sesuai dengan modul yang diikuti.
3. Segala bentuk plagiarism, kecurangan, pemalsuan dalam kegiatan praktikum
akan dibawa ke Komisi Etik Fakultas dan akan dikenakan sanksi sesuai dengan
aturan di Institusi Universitas Telkom.
4. Praktikan wajib menjaga ketenangan dan ketertiban selama kegiatan praktikum
ataupun setelah kegiatan praktikum.
5. Praktikan wajib menjaga sikap sopan santun dan etika kepada sesama rekan,
asisten, dosen, dan laboran serta teknisi laboratorium.
KELENGKAPAN PRAKTIKUM
l . Praktikan wajib memenuhi persyaratan administrasi dan akademis yang telah
diumumkan oleh Laboratorium SIPO.
2. Praktikan wajib memenuhi kelengkapan persyaratan setiap modul (persyaratan
tambahan akan diumumkan pada laman facebook atau website Laboratorium
SIPO sebelum praktikum modul bersangkutan dimulai).
PELAKSANAAN PRAKTIKUM
1. Praktikum SIPO terdiri atas 9 modul dengan rincian 6 modul Statistika Industri
dan 3 modul Penelitian Operasional.
2. Praktikum dilaksanakan dengan jadwal yang akan ditentukan kemudian. Jika
terjadi pemindahan jadwal akan diberitahukan selanjutnya.
3. Praktikan wajib hadir tepat waktu saat pelaksanaan praktikum. Tidak ada
toleransi keterlambatan (Toleransi Keterlambatan: () menit).

4. Apabila praktikan tidak mengikuti praktikum salah satu modul atau lebih tanpa
alasan yang dapat dipertanggungjawabkan dan diterima oleh seluruh asisten
Laboratorium SIPO 2022, maka praktikan tersebut diwajibkan mengulang
praktikum di tahun selanjutnya.
5. Jika praktikan berhalangan hadir karena sakit, maka diwajibkan untuk
menyerahkan surat keterangan dokter maksimal 3 hari setelah pelaksanaan

SIPO LABORATOR
MODUL MATERI SIPO 2022

praktikum. Jika tidak, maka dianggap tidak mengikuti praktikum modul yang
bersangkutan.
6. Praktikum Susulan
a. Praktikum susulan hanya diberikan kepada praktikan yang tidak dapat
mengikuti praktikum dengan alasan yang benar, resmi, jelas, dan dapat
diterima oleh seluruh asisten Laboratorium SIPO 2021.
b. Apabila praktikan yang mendapatkan kesempatan praktikum susulan
tidak mengikuti praktikum pada jadwal yang telah ditentukan dengan
alasan yang tidak dapat dipertanggungiawabkan, maka wajib mengulang
modul tersebut di tahun berikutnya.
c. Jadwal susulan dilaksanakan sebanyak satu kali sebelum UTS dan satu
kali sebelum UAS.
7. Tukar Jadwal
a. Praktikan dapat melakukan tukar jadwal praktikum dengan alasan yang
dapat dipertanggungjawabkan dan dapat diterima oleh seluruh asisten
Laboratorium SIPO 2021 paling lambat 1x24 jam sebelum praktikum
dilaksanakan dnegan mengisiform tukar jadwal.
8. Pakaian
a. Praktikan wajib mengenakan pakaian sesuai dengan ketetapan Universitas
Telkom, yaitu hari Senin-Rabu mengenakan kemeja putih, Kamis dan
Sabtu menggunakan kemeja, serta pada hari Jumat mengenakan batik.
b. Rambut mahasiswa pria harus rapi, tidak melebihi kerah kemeja yang
dikenakan dan tidak boleh diikat.

9. Laboratorium SIPO tidak mentoleransi segala bentuk kecurangan dan


plagiarism. Apabila praktikan terbukti berbuat curang dan atau plagiarism,
maka nilai praktikum SIPO 2021 dipastikan mendapat nilai E.
IO. Jam operasional kerja Laboratorium SIPO yaitu dimulai pukul 06.00 — 20.00
WIB.
I I . Hal-hal yang belum tercantum dalam peraturan ini akan ditetapkan kemudian.
12. Peraturan dapat mengalami perubahan sewaktu-waktu berdasarkan kebijakan
Laboratorium SIPO.
TES AWAL

l . Tes Awal dilakukan di setiap awal praktikum pada semua modul.

SIPO LABORATOR
MODUL MATERI SIPO 2022

2. Tes Awal bersifat individu.


3. Tes Awal dilakukan dalam bentuk yang akan ditetapkan kemudian.
4. Praktikan yang masuk dalam kategori keterlambatan Level I diberikan
kesempatan mengikuti Tes Awal tanpa perpanjangan waktu.
TES AKHIR
1. Tes Akhir dilaksanakan di setiap akhir praktikum pada semua modul.
2. Tes Akhir dilakukan dalam bentuk tes praktik atau bentuk lain yang akan
ditetapkan kemudian.

iii

SIPO LABORATOR
MODUL MATERI SIPO 2022

KOMPONEN PENILAIAN
Ko nen Penilaian
MODUL Tes Awal Praktikum Tes Akhir T as ran
La
60% 40%

1 20% 50% 30%


2 20% 50% 30%

3 20% 50% 30%


4 20% 50% 30%
5A 20% 50% 30%
5B 20% 50% 30%
6A 20% 55% 25%

6B 20% 50% 30%


Keterangan:
CLO 1: Modul O, 1, 2, 3, 6A, 6B

SIP O
MODUL MATERI SIPO 2022

CLO 2: Modul 4, 5A, 5B

iv
MODUL O

TEKNIK SAMPLING DAN DA TA PREPROCESSING

TUJUAN PRAKTIKUM
l. Praktikan memahami definisi dari sampel dan istilah-istilah yang terkait.
2. Praktikan mengetahui cara pengambilan sampel yang tepat dengan berbagai
metode yang ada.
3. Praktikan mampu melakukan pengolahan data menggunakan software Microsoft
Excel berdasarkan studi kasus.
4. Praktikan mampu mengetahui urgensi serta tugas utama dari Data

SIP O
MODUL MATERI SIPO 2022

Preprocessing.

REFERENSI
Han, K. P. (2012). Data Mining: Concepts and Techniques in Data Mining.
Retrieved from Concepts and Techniques: https://doi.org/10.1016/C2009-
O61819-5
Hamdani, S. S. (2013). Statistik Terapan. Surabaya: IAIN Sunan Ampel.
Nugroho, S. (2007). Dasar-dasar Metode Statistika. Jakarta: Grasindo.
Santoso, S. (2018). Menguasai Statistik Dengan SPSS 25. Jakarta: Gramedia.
Scheaffer, R. L. (2012). Elementary Survey Sampling. USA.
Sugiyono. (2016). Metode Penelitian Kuantitatif, Kualitatif dan R&D. Bandung:
PT Alfabet.
MIND MAP

Simple Random

Systematic
Random
Sampling

Stratified
Random
Sampling

Cluster
Sampling

Convenience
Sampling

Non-
Purposive
Probability
Sampling
Sampling

SIP O
MODUL MATERI SIPO 2022

Sampling

Judgement
Sampling

Quota Sampling
Snowball
Sampling

DASAR TEORI

Populasi dan Sampel


Populasi adalah wilayah generalisasi, obyek/subjek yang mempunyai kualitas dan
karakteristik tertentu yang ditetapkan oleh peneliti untuk dipelajari dan kemudian
ditarik kesimpulannya (Sugiyono, 2016). Populasi bukan hanya orang, tetapi juga
obyek dan benda-benda alam yang lain. Populasi bisa didefenisikan sebagai
sekumpulan data yang mengidentifikasi suatu fenomena (Singgih Santoso, 2018).
Sampel adalah sebagai sekumpulan data yang diambil atau diseleksi dari suatu
populasi (Singgih Santoso, 2018). Sampel juga didefinisikan sebagai bagian dari
jumlah dan karakteristik yang dimiliki oleh populasi tersebut (Sugiyono, 2016).

SIP O
MODUL MATERI SIPO 2022
MAT ERİ

Teknik Sampling
Teknik Sampling merupakan teknik pengambilan sampel. Untuk menentukan
sampel yang akan digunakan dalam penelitian, terdapat berbagai teknik sampling
yang digunakan (Sugiyono, 2016). Teknik sampling yang digunakan diantaranya:
I. Probability Sampling
Probability Sampling adalah teknik pengambilan sampel yang membagikan
peluang yang sama bagi setiap unsur (anggota) populasi untuk dipilih menjadi
anggota sampel. Terdapat beberapa teknik sampling yang termasukprobabi/ity
sampling akan tetapi pada modül ini hanya membahas Simple Random
Sampling, Systematic Randam Sampling, Stratified Randam Sampling dan
sampling area (cluster).
a. Simple Randam Sampling
Simple Random Sampling adalah metode pengambilan anggota sampel
secara acak dari populasi dan tidak memperhatikan strata yang ada dalam
populasi tersebut.
Syarat Simple Randam Sampling:
l. Adanya kerangka sampling
2. Sifat populasi homogen agar tidak bias
3. Keadaan populasi secara geografis tidak terlalu tersebar
Prosedur Simple Random Sampling:
l. Menyusun kerangka sampel
2. Tetapkan ukuran sampel
3. Generate angka random
4. Ambil sampel secara acak
Contoh penerapan metode Probability Sampling adalah setiap orang
memiliki kesempatan untuk memenangkan undian (dengan asumsi mereka
semua memiliki satu tiket undian).
b. Systematic Random Sanıpling
Systematic Random Sampling adalah teknik sampling yang dilakukan
secara sistematis dengan proses awal yang random, dimana hanya unit
pengamatan pertama saja dari sampel yang diambil secara random.
Sedangkan, setiap unit selanjutnya dipilih secara sistematis menurut

SİPO
MODUL SİPO 2022
interval (1=n/N). Pada mulanya, peneliti memberi nomor
seluruh populasi yang diurutkan, lalu urutan nomor dalam
daftar diacak. Setelah itu pada setiap perhitungan tertentu, satu sampel
diambil, dihitung lagi, satu sampel diambil lagi untuk diteliti. Begitu
seterusnya sampai jumlah sampel sesuai dengan rencana awal.
Prosedur Systematic Random Sampling:
. Menyusun kerangka sampel dan samplingnya harus tersusun secara random.
2. Tetapkan ukuran sampel yang ingin diambil (n) dari populasi (N) sehingga
diketahui Intervalnya (1=n/N).
3. Pilih sampel pertama (rl) secara random menggunakan angka random

4. Pilih sampel berikutnya (r2) dengan cara menambahkan interval sampling (I).
Contoh penerapan metode ini adalah seorang peneliti ingin meneliti pola
tidur mahasiswa Fakultas Rekayasa Industri. Jumlah total populasinya 800
mahasiswa. Peneliti ingin melakukan survei pada 80 mahasiswa saja.
Teknik sampling yang dilakukan, pertama-tama peneliti merencanakan,
misal sampel yang diambil adalah daftar nomor urut ke 8 dan kelipatannya
(16, 24, 32, 800). Lalu, peneliti mengacak daftar 800 nomor yang semula
berurutan. Setelah diacak, dilihat kembali, mahasiswa yang namanya
berada di urutan nomor 8 dan kelipatannya diambil sebagai sampel.
c. Stratified Random Sampling
Stratified Random Sampling adalah teknik pengambilan sampel dengan
membagi anggota populasi kedalam beberapa strata. Sampel dipilih dari
masing-masing populasi dengan jumlah yang proporsional.
Prosedur Stratified Random Sampling:

l . Susun kerangka sampel.


2. Bagi kerangka sampel tersebut berdasarkan strata yang dikehendaki.
3. Tetapkan ukuran sampel setiap populasi secara proporsional.
4. Ambil sampel dari setiap populasi secara acak.

SİPO
MODUL MATERI SIPO 2022
MAT ERİ

Contoh penerapan metode ini adalah suatu tim berjumlah 30 orang terdiri
18 pria dan 12 wanita. Jika akan dipecah menjadi sebuah tim berjumlah 15
orang yang dipilih secara acak, maka anggota tim yang terbentuk harus
berasal dari grup wanita berjumlah 6 orang (40% x 15) dan grup laki-laki
9 orang (60% x 15).
d. Cluster Sampling
Cluster Sampling adalah teknik pengambilan sampel berdasarkan
kelompok atau klaster dimana pengambilan sebuah sampel tidak langsung
ke unit pengamatan, akan tetapi dilakukan melalui pengambilan sebuah
sampel dari kelompok - kelompok pengambilan sampel tersebut. Dapat
dilakukan bertahap bisa satu tahap (single stage cluster sampling) atau dua
tahap (two stage cluster sanıpling). Tahap pertama, menentukan sampel
daerah dan tahap berikutnya, menentukan unit sampel secara random.
Prosedur Cluster Sampling:

I . Tentukan populasi studi (N) yang akan diambil sebagai sampelnya.


2. Mengelompokkan populasi berdasarkan cluster.
3. Tentukan jumlah sampel (n) dan jumlah cluster (W).
4. Pilih cluster secara acak dan proporsional.
5. Ambil semua unit atau pilih secara random dengan jumlah yang proporsional
pada cluster terpilih.
Contoh penerapan metode ini adalah seorang dosen mengajar 10 kelas.
Jika akan dibentuk sebuah tim yang anggotanya dipilih secara randam dari
kesepuluh tersebut, maka tahap pertama misalkan dilakukan pengundian
untuk menentukan I kelas (Ti-44-02 terpilih). Tahap kedua, dari kelas
Tİ44-02 yang terpilih tersebut dipilih 10 mahasiswa secara acak. Atau
dapat juga dilakukan tahap ketiga dengan stratified randam sampling.

2. Non-ProbabiIity Sampling
Non-Probability Sampling adalah teknik yang tidak memberi
peluang/kesempatan yang sama bagi setiap unsur atau anggota populasi untuk dipilih
menjadi sampel (Sugiyono, 2016). Teknik sampel ini meliputi, convenience

SİPO
MODUL SİPO 2022
sampling, purposive sampling, quota sampling, judgement
sampling, dan snowball sampling.

a. Convenience sampling
Convenience sampling adalah metode pengambilan sampel didasarkan
pada ketersediaan elemen dan kemudahan untuk mendapatkannya. Sampel
diambil/terpilih karena sampel tersebut ada pada tempat dan waktu yang
tepat. Contoh penerapan metode ini adalah penelitian untuk mengetahui
jenis social media yang digunakan oleh dosen, maka sampel yang diambil
adalah para dosen yang ada di ruang dosen supaya lebih mudah, lebih cepat
atau lebih dekat. Oleh karena itu, beberapa kasus penelitian yang
menggunakan jenis sampel ini, hasilnya ternyata kurang objektif sehingga
memberikan kesimpulan umum yang kurang baik.
b. Purposive sampling
Purposive sampling adalah metode pengambilan sampel didasarkan pada
teknik penentuan sampel dengan pertimbangan tertentu (Sugiyono, 2016).
Terdapat dua jenis pengambilan sampel pada purposive sampling yaitu
quota sampling, judgement sampling.

l. Judgement sampling
Judgement sampling adalah metode pengambilan sampel
berdasarkan penilaian peneliti bahwa sesuatu atau orang yang akan
dijadikan sampel tersebut adalah pihak yang paling baik untuk
dijadikan sampel penelitiannya. Contoh penerapan metode ini adalah
untuk memperoleh data tentang bagaimana satu proses produksi
direncanakan oleh suatu perusahaan, maka manajer produksi
merupakan orang yang terbaik untuk bisa memberikan informasi.
Jadi,judgement sampling umumnya memilih sesuatu atau seseorang
menjadi sampel karena mereka memiliki informasi yang mendalam.
2. Quota sampling
Quota sampling adalah metode pengambilan sampel
distratifikasikan secara proposional, namun tidak dipilih secara acak
melainkan secara kebetulan saja. Contoh penerapan metode ini

SİPO
MODUL MATERI SIPO 2022
V

SİPO
MODUL MATERI SIPO 2022

adalah misalnya suatu kelas berjumlah 40 orang terdiri 16 mahasiswi


dan 24 mahasiswa. Jika akan dibentuk sebuah Tim berjumlah 10
orang, maka anggota tim yang terbentuk harus berasal dari grup
perempuan berjumlah 4 orang (40% x 10) dan grup laki-laki 6 orang
(60% x 10). Berbeda dengan sampling stratifikasi, di sini pemilihan
anggota tim tidak secara acak, tapi secara convinience.
c. Snowball sampling
Snowball sampling adalah metode pengambilan sampel yang banyak
dipakai ketika peneliti tidak banyak tahu tentang populasi penelitiannya.
Peneliti hanya mengetahui satu atau dua orang yang menurutnya bisa
dijadikan sampel karena peneliti menginkan sampel dengan jumlah yang
banyak, dia menunjuk sampel pertama untuk mencarikan orang Iain yang
dapat dijadikan sampel. Satuan sampel ditentukan berdasarkan informasi
dari responden sebelumnya. Contoh penerapan metode ini adalah peneliti
ingin mengetahui pandangan kaum lesbian terhadap lembaga perkawinan
dan kemudian diwawancarai. Setelah selesai peneliti tadi meminta kepada
sampel yang diwawancarai untuk mewawancari teman lesbian Iainnya.
Jika jumlah sampel memenuhi kuota penelitian dihentikan.

Penentuan Ukuran Sampel


Dalam pengambilan sampel, terdapat beberapa parameter yang dijadikan
pertimbangan dalam pengambilannya, parameter tersebut antara Iain adalah
karakteristik dari populasinya, jumlah populasi, dan tujuan dari pengambilan
sampel tersebut. Berikut merupakan penentuan ukuran sampel deskriptif
(gambaran data tanpa membuat kesimpulan) dan komparatif (membandingkan satu
variabel atau lebih sampel yang berbeda).
Penentuan Ukuran Sampel Deskriptif
l. Untuk penelitian deskriptif sampelnya 10% dari populasi, penelitian
korelasional paling sedikit 30 elemen populasi, penelitian perbandingan
kausal 30 elemen per kelompok, dan untuk penelitian eksperimen 15 elemen
per kelompok (Gay dan Diehl, 1992).

SİPO
MODUL MATERI SIPO 2022

2. Champion (1981), rekomendasi ukuran sampel untuk uji-uji statistik yang


ada akan sangat efektif jika diterapkan pada sampel yang jumlahnya 30 s/d
60 atau dari 120 s/d 250. Bahkan jika sampelnya di atas 500, tidak
direkomendasikan untuk menerapkan uji statistik.
3. Kemudian Sugiyono (2016, p.90) dalam Roscoe (1982, p.253) memberikan
rekomendasi penentuan jumlah sampel sebagai berikut:
a. Ukuran sampel di antara 30 sd.500.
b. Jika sampel dipecah lagi ke dalam subsampel (laki/perempuan,
SD/SLTP/SMU, dsb), jumlah minimum subsampel harus 30.
c. Pada penelitian multivariat (termasuk analisis regresi multivariat)
ukuran sampel harus beberapa kali lebih besar (10 kali) dari jumlah
variabel
yang akan dianalisis.
d. Untuk penelitian eksperimen yang sederhana, dengan pengendalian
yang ketat, ukuran sampel bisa antara 10 s.d 20.
4. Krejcie and Morgan dalam Sekaran (2009) membuat daftar kolom jumlah
populasi yang bisa dipakai untuk menentukan kolom jumlah sampel.

Tabel 1. 1 Daftar Jumlah Sampel menurut Krejcie dan Morgan


Populasi Sampel Populasi Sampel Populasi Sampel
(N) (n) (N) (n) (N) (n)

10 10 220 140 1200 291

15 14 230 144 1300 297

20 19 240 148 1400 302

25 24 250 152 1500 306

30 28 260 155 1600 310

35 32 270 159 1700 313

10

SİPO
MODUL MATERI SIPO 2022

40 36 280 162 1800 317

45 40 290 165 1900 320

50 44 300 169 2000 322

55 48 320 175 2200 327

60 52 340 181 2400 331

65 56 360 186 2600 335

70 59 380 191 2800 338

75 63 400 196 3000 341

80 66 420 201 3500 346

85 70 440 205 4000 351

90 73 210 4500 354

95 76 480 214 6000 361

100 80 500 217 6000 361

110 86 550 226 7000 364

120 92 600 234 8000 367

130 97 650 242 9000 368

140 103 700 248 10000 370

150 108 750 254 15000 375

160 113 800 260 20000 377

SIPO
MODUL MATERI SIPO 2022

170 118 850 265 30000 379

180 123 900 269 40000 380

190 127 950 274 50000 381

200 132 1000 278 75000 382

210 136 1100 285 1000000 384

Penentuan Ukuran Sampel Komparatif

1. Penentuan ukuran sampel dalam mencari rata-rata (g) dengan parameter error
menggunakan simple random sampling, dengan menggunakan rumus
sebagai berikut:

(N 1)D+o-2

Dimana:

n = Ukuran sampel N =
Populasi a 2 = Variansi
Populasi
B — Jumlah atau taraf kesalahan.

SLOVING
Dengan menghitung jumlah sampel minimal jika perilaku dari sebuah populasi
tidak diketahui secara pasti dapat menggunakan rumus slovin. Formula yang paling
populer dan sederhana yang dikemukakan dalam Altares, et al. (2003, p. 13) dikenal
sebagai SLOVIN'S FORMULAS. Menurut Tejada (2012, p. 130), rumus
SLOVING digunakan untuk membuat estimasi proporsi populasi dengan simple
random sampling tanpa pengembalian (SRSWOR) dengan asumsi tingkat
keyakinan 95% sebagai berikut:

12

SİPO
MODUL MATERI SIPO 2022

(1 +
Ne2)

SIPO
MODUL MATERI SIPO 2022

Dimana:
n = Ukuran Sampel
N = Ukuran Populasi e = Tarafnyata
atau batas kesalahan

DATA PREPROCESSING

l. Urgensi Data Preprocessing


Data didapatkan dari berbagai sumber dan berukuran besar. Karena berasal dari
sejumlah sumber, maka sangat rentan data yang kita peroleh tidak konsisten,
mengandung kesalahan, menyimpang dari yang diharapkan dan tidak akurat.
Kualitas data sangatlah berpengaruh terhadap hasil pengolahan data, karena
data yang berkualitas juga akan menghasilkan output yang berkualitas. Maka
dari itu dibutuhkan data preprocessing. Data preprocessing merupakan suatu
kegiatan yang bertujuan untuk meningkatkan kualitas data sehingga dapat
meningkatkan efisiensi data serta memudahkan dalam pengolahan data
selanjutnya. (Han, Kamber, & Pei, 2012)
2. Tugas Utama dalam Data Preprocessing
Pada bagian ini, akan dijelaskan langkah-langkah utama yang terlibat dalam
preprocessing data, yaitu, Data Cleaning, Data Integration, Data Reduction,
dan Data Transformation and Data Discretization (Han et al., 2012).
a. Data Cleaning

Data Cleaning
Gambar l. I Data Cleaning

Data cleaning (pembersihan data) dilakukan untuk menangani missing


value (data yang hilang), mengidentifikasi outlier, dan memperbaiki
ketidak konsistenan dalam data. Adapun tugas dari data cleaning adalah
sebagai berikut (Han et al., 2012):
1. Handling Missing Data
Missing values merupakan kondisi dimana tidak lengkapnya data.
Ketika melakukan pengolahan data dan ternyata terdapat data yang

14
IPO LABORATORY
MODUL MATERI SIPO 2022

S
hilang atau tidak lengkap maka berikut merupakan beberapa cara
untuk menanganinya:
a. Abaikan tupel (abaikan informasi yang hilang).
b. Isi nilai yang hilang secara manual.
c. Gunakan konstanta global untuk mengisi nilai yang hilang.
d. Gunakan ukuran kecenderungan sentral untuk atribut (mis., mean
atau median) untuk mengisi nilai yang hilang. e. Gunakan mean
atribut atau median untuk semua sampel milik kelas yang sama
dengan tupel yang diberikan.
f. Gunakan nilai yang paling mungkin untuk mengisi nilai yang
hilang.

2. Noisy Data adalah kesalahan acak atau varians dalam variabel yang
diukur. Adapun cara untuk mengatasinya yaitu:
a. Binning Method
Binning Method berguna untuk meratakan nilai data yang
diurutkan. Adapun beberapa metode pada binning untuk data
smoothing (meratakan data) yaitu partition into (equalfrequency)
bins, smoothing by bin means, smoothing by bin boundaries.
Sorted data for price (in dollars): 4, 8, 15, 21, 21, 24, 25, 28, 34

Partition into (equal-frequency) bins:


Bin 1: 4, 8.15
Bin 2: 21, 21,24
Bin 3: 25, 28, 34

Smoothing by bin means:


Bin 1:
Bin2: 22, 22,22
Bin 3: 29, 29,29

Smoothing by bin boundaries:


Bin 1:
Bin 2:
Bin 3: 25, 25,34

15

SIP O LABORATORY
MODUL MATERI SIPO 2022

Gambar l. 2 Bining Method

O
b. Regression
Untuk meratakan data juga dapat dilakukan dengan regresi yaitu
dengan menyesuaikan nilai data dengan suatu fungsi. Seperti
halnya regresi linier yang digunakan untuk menyesuaikan dua
varlabel sehingga satu variabel dapat digunakan untuk
memprediksi yang lain.
c. Outlier analysis
Outlier atau pencilan dapat diprediksi dengan pengelompokan,
misalnya dengan mengorganisasikan nilai nilai yang sama ke
dalam cluster, maka nilai-nilai yang berada diluar cluster
dianggap outlier.

b. Data Integration

Data
Integration

Gambar 1. 3 Data integration

Dalam mengolah data terkadang dibutuhkan gabungan dari beberapa data,


maka dari itu dilakukan pengintegrasian data. Hanya saja heterogenitas
data menyebabkan pentingnya menguji apakah data yang akan
digabungkan memiliki kecocokan atau tidak. Data integration juga dapat
mendeteksi dan menyelesaikan konflik nilai data misalnya nilai atribut

16
IPO LABORATORY
MODUL MATERI SIPO 2022

dari sumber yang berbeda. Selain itu data integration juga dapat
menghapus data yang berlebihan dan sama.

17

SIP O LABORATORY
MODUL MATERI SIPO 2022

c. Data Reduction
16

Data Reduction

Gambar 1. 4 Data Reduction

Ketika akan dilakukan pengolahan data dari data yang berukuran besar,
analisis data yang kompleks akan memakan waktu yang lama sehingga
tidak efisien. Maka dari itu perlu dilakukan reduksi data atau pengurangan
data. Pengurangan data disini bertujuan untuk memperoleh representasi
dengan volume yang lebih kecil, namun tetap mempertahankan tingkat
integrasi data asli. Data yang dikurangi harus lebih efisien namun
menghasilkan hasil analitis yang sama. Adapun beberapa strategi untuk
mereduksi data yaitu:
1) Dimensionality reduction (menghapus atribut yang tidak penting)
2) Aggregation and clustering
3) Sampling

d. Data Transformation and Discretization

Gambar 1. 5 Data Transformation

Transformasi data berguna untuk mengefisienkan proses pengolahan data.


Adapun strategi untuk transformasi data adalah sebagai berikut:

l . Smoothing: untuk meratakan data.


2. Attribute construction: atribut baru dibangun dan ditambahkan dari
set atribut yang diberikan untuk membantu proses pengolahan data.
3. Aggregation: operasi ringkasan atau agregasi diterapkan pada data.
Contoh data penjualan akan dikumpulkan berdasarkan total penjualan
tahunan.
4. Normalization: data atribut diskalakan agar berada dalam kisaran
yang lebih kecil, seperti — 1,0 hingga 1,0, atau 0,0 hingga 1,0.

18
IPO LABORATORY
MODUL MATERI SIPO 2022

5. Discretization: nilai atribut numerik yang sebenarnya (misal usia)


diganti oleh label interval (0-10, 11-20, dll.) atau label konseptual
(pemuda, dewasa, senior).
6. Concept hierarchy generation for nominal data: dimana atribut seperti
jalan dapat digeneralisasi ke konsep tingkat yang lebih tinggi, seperti
kota atau negara.
Data Discretization yaitu mengubah data numerik dengan memetakan nilai
ke interval atau label konsep. Metode seperti itu dapat digunakan untuk
secara otomatis menghasilkan hierarki konsep untuk data. Adapun
beberapa teknik Data Discretization yaitu:

l . Binning
2. Analisis histogram
3. Analisis klaster
4. Analisis pohon keputusan
5. Analisis korelasi
6. Untuk data nominal, hierarki konsep dapat dihasilkan berdasarkan
definisi skema serta jumlah nilai yang berbeda per atribut.
MODUL 1
PENGOLAHAN DAN PENYAJIAN DATA STATISTIKA
DESKRIPTIF

TUJUAN PRAKTIKUM

l . Praktikan mampu memahami konsep statistika deskriptif


2. Praktikan mampu memahami konsep penyajian data statistika deskriptif
3. Praktikan mampu memahami konsep pengolahan data statistika deskriptif.
4. Praktikan mampu melakukan pengolahan dan penyajian data dengan
menggunakan software Microsoft Excel, R Cloud dan IBM SPSS Statistics.
REFERENSI

Harlan, Johan. 2004. Metode Statistika I. Jakarta: Gunadarma

Nugroho, Sigit. 2007. Dasar-Dasar Metode Statistika, Jakarta: Grasindo.

19

SIP O LABORATORY
MODUL MATERI SIPO 2022

Rasyad, Rasdihan. 2008. Metode Statistik Deskriptif. Jakarta: Grasindo.

Priyatno, Duwi. 2009.5 Jam Belajar Olall Data Dengan SPSS 17. Yogyakarta: CV.
ANDI OFFSET.

Sugiyono. 2010. Statistika Untuk Penelitian. Bandung: Alfabeta.

Walpole. 1992. Pengantar Statistika. Jakarta: Gramedia Pustaka Utama.

MIND MAP
Penyajian Data Pengolahan Data
Statistika Desk-riptif Statistika
Statistika ripe Data Deskriptif

DASAR TEORI

Statistika

Statistika merupakan suatu teknik yang digunakan untuk mengumpulkan,


menganalisa, dan mengadakan penafsiran data yang berbentuk angka (Marguerite
F. Hall, 1892). Statistika dibedakan menjadi duajenis, yaitu:

1. Statistika Deskriptif (Statistika Deduktif)


Statistika deskriptif adalah kegiatan dalam mengumpulkan data, menyusun
data, mengolah data, menyajikan data, dan menganalisis data yang
digambarkan dalam bentuk tabel, grafik, diagram, dan pengukuran numerik
tanpa berupaya menyimpulkan kondisi keseluruhan.

20

SIP O LABORATORY
MODUL MATERI SIPO 2022

Gambar 2. I Flowchart Pengolahan Statistika Deduktif

2. Statistika Inferensia (Statistika Induktit)


Statistika inferensia adalah ilmu statistik yang menyediakan aturan atau suatu
metode yang digunakan untuk meramalkan, menaksir, dan mengambil suatu
kesimpulan yang bersifat umum dari sekumpulan yang telah disusun dan
diolah.

21

SIP O LABORATORY
MODUL MATERI SIPO 2022

Gambar 2.2 Flowchart Pengolahan Statistika Induktif

Tipe Data

1. Data Nominal
Data nominal adalah data yang disusun untuk menggantikan data nonnumerik
menjadi data numerik atau sebagai simbol, cara penyusunan angkanya
berdasarkan beberapa kategori tertentu tanpa memperhatikan urutan.
Kategori hanya bertujuan untuk membedakan kategori satu dengan kategori
yang lain dan tidak memiliki suatu makna yang matematis. Misalkan I
menyimbolkan jenis kelamin laki-laki dan 2 menyimbolkan jenis kelamin
perempuan.

2. Data Ordinal
Data ordinal adalah kategorisasi variabel pada data dimana penyusunan
angkanya memperhatikan urutan tertentu. Dengan kata lain, dalam data ini
memiliki kedudukan kategori yang tidak setara, tetapi sesuai dengan simbol.
Simbol yang diberikan pada masing-masing merupakan suatu peringkat atau

22

SIP O LABORATORY
MODUL MATERI SIPO 2022

urutan dalam penilaian. Contoh data ordinal adalah kategori pelayanan yang
terdiri atas sangat baik, baik, cukup baik, kurang baik, dan tidak baik.

23

SIP O LABORATORY
MODUL MATERI SIPO 2022

3. Data Interval
Data interval adalah data yang nilai-nilainya berlaku sebagai pembeda, ada
tingkatan dimana jarak antar tingkatan diketahui dalam suatu ukuran/satuan
yang pasti, berlaku beberapa operasi matematika dan tidak memiliki nilai nol
mutlak. Contoh data interval adalah suhu nol derajat Celcius.

4. Data Rasio
Data rasio adalah data yang nilai-nilainya diperoleh dari suatu pengukuran
dalam sekumpulan bilangan real, jarak antar tingkatan diketahui dalam suatu
ukuran/satuan yang pasti, berlaku beberapa operasi matematika dan memiliki
nilai nol mutlak. Contoh data rasio adalah tinggi badan dan berat badan.

Penyajian Data Statistika Deskriptif

Penyajian data statistika memiliki prinsip haruslah komunikatifdan lengkap, selain


itu penyajian data harus dapat menarik perhatian pembaca dan mudah dipahami.
Data tunggal dan data kelompok disajikan dengan menggunakan visualisasi yang
berbeda. Berikut merupakan penyajian data yang dapat digunakan untuk data
tunggal dan data kelompok:

24

SİPO LABORATORY
MODUL MATERI SIPO 2022

1. Penyajian Data Tunggal

Gambar 2.3 Penyajian Data Tunggal

2. Penyajian Data Kelompok

25

SIP O LABORATORY
MODUL MATERI SIPO 2022

Gambar 2.4 Penyajian Data Kelompok

S
3. Control Chart

Gambar 2.5 Control Chart

Pengolahan Data Statistika Deskriptif

1. Pengukuran Terpusat
a. Mean
Mean adalah nilai tengah pada suatu kelompok data yang diperoleh dari
penjumlahan keseluruhan data pada suatu kelompok dibagi dengan
banyaknya data.

b. Median
Median adalah suatu nilai yang terletak di tengah kelompok data yang telah
diurutkan dari nilai terkecil sampai terbesar atau sebaliknya

c. Modus
Modus adalah salah satu ukuran pemusatan yang paling sering
digunakan dengan menggunakan karakter data yang paling sering
muncul dalam suatu kelompok data adalah modus dari kelompok
tersebut.

2. Pengukuran Penyebaran
a. Jangkauan (range)
Jangkauan atau range (R) merupakan selisih dari nilai terbesar dan nilai
terkecil suatu kelompok data. Jangkauan juga dapat menunjukkan
kualitas suatu data. Semakin kecil nilai R, maka kualitas data semakin
26
IPO LABORATORY
MODUL MATERI SIPO 2022

baik, dan semakin besar nilai R suatu data maka kualitas data tersebut
semakin baik.

b. Jangkauan kuartil
Jangkauan kuartil merupakan setengah nilai dari selisih kuartil atas dan kuartil
bawah.

27

SIP O LABORATORY
MODUL MATERI SIPO 2022
c. Variansi
Variansi adalah nilai rata-rata kuadrat selisih atau kuadrat simpangan
dari semua nilai data terhadap rata rata hitung.

d. Standar Deviasi
Standar deviasi merupakan besarnya perbedaan nilai sampel terhadap
rata-rata atau akar pangkat dua dari variansi.

e. Kemiringan
Kemiringan atau skewness adalah derajat atau ukuran dari
ketidaksamaan (asimetri) suatu distribusi data. Biasanya digunakan
untuk mengetahui apakah data memiliki jenis distribusi normal atau
bukan pada standard error of skewness dari output SPSS dengan
kriteriajika rasio skewness antara -2 sampai 2 maka data memiliki jenis
distribusi normal (Routledge, 1997).

Ukuran kemiringan (skewness) terbagi menjadi tiga jenis, antara lain:

Normal skewness
Jika suatu populasi berdistribusi normal/simetris, maka akan
menghasilkan bentuk kurva dengan kemiringan normal (normal
skewness). Normal skewness memiliki nilai mean, median, dan
modus yang sama besar (mean = median = modus).
Mean
Median
Mode

Symmetrical
Distribution

Gambar 2.6 Normal Skewness

Positive skewness
Jika suatu populasi memiliki nilai-nilai besar yang lebih banyak
daripada nilai-nilai kecilnya, maka akan menghasilkan
kemiringan yang asimetris, dimana ekor Sisi kanan akan lebih

28

SIP O
MODUL MATERI SIPO 2022
panjang. Distribusi ini disebutpositive skewness atau
skewed to the right ("menceng ke kanan"). Banyaknya
jumlah nilai yang lebih besar akan mempengaruhi nilai mean,
sehingga posisi mean seolah-olah 'tertarik' ke kanan, sedangkan
posisi median hanya 'tertarik' sedikit (nilai median sedikit
terpengaruh), sedangkan posisi modus tidak berubah. Distribusi
ini juga memiliki nilai mean lebih besar dari median, dan nilai
median lebih besar dari modus (mean > median > modus).

Median

Mode t - Mean

Positive
Skew

Gambar 2.7 Positive Skewness

Negative skewness
Kebalikan dari kondisi positive skewness ditemukan pada
negative skewness. Kondisi ini memiliki penambahan nilai-nilai
ekstrim kecil yang mengakibatkan posisi rerata paling banyak
'tertarik' ke kiri, posisi median sedikit 'tertarik' dan posisi modus
tetap. Sehingga distribusi ini disebut skewed to the left
("menceng ke kiri"). Distribusi ini juga memiliki nilai modus
lebih besar dari median, dan nilai median lebih besar dari mean
(modus > medan > mean).
MAT ERİ

Median

29

SIP O
MODUL SİPO 2022
Mean—ı Mode

Negative
Skew

Gambar 2.8 Negative Skewness

f. Kurtosis
Kurtosis merupakan derajat ketinggian puncak atau keruncingan suatu
distribusi. Untuk menentukan apakah data memiliki distribusi normal
atau tidak, pada kurtosis dilakukan dengan menghitung rasio kurtosis
dengan standard error kurtosis, dimana kriteria yang digunakan yaitu
apabila rasio kurtosis antara -I hingga 2, maka data berdistribusi normal
(Routıedge, 1997).

Terdapat tiga jenis nilai kurtosis, diantaranya:

Mesokurtic
Distribusi yang bentuk ekornya kira-kira sama dengan
distribusi normal lainnya, bukan hanya distribusi normal
standar, disebut mesokurtic. Kurtosis distribusi mesokurtic
tidak tinggi atau rendah, melainkan dianggap sebagai dasar
untuk dua klasifikasi lainnya.

Leptokurtic
Distribusi leptokurtic adalah distribusi yang memiliki
kurtosis lebih beşar daripada distribusi mesokurtic.
Distribusi leptokurtic terkadang dikenali dari puncak yang
tipis dan tinggi. Distribusi leptokurtic dinamai dengan
awalan "lepto” yang berarti "kuruş”.

30

SİPO
MODUL MATERI SIPO 2022

Platykurtic
Distribusi platykurtic adalah yang memiliki ekor ramping.
Seringkali mereka memiliki puncak yang lebih rendah
daripada distribusi mesokurtic. Nama jenis distribusi ini
berasal dari arti awalan "platy" yang berarti "luas".

Gambar 2.9 Kurtosis

Rumus Hitung dari Pengukuran Terpusat dan Pengukuran Penyebaran

Tabel 2. I Rumus Hitung Pengukuran Terpusat dan Pengukuran Penyebaran


Pengukuran Tunggal Kelompok

31

SİPO LABORATORY
MODUL MATERI SIPO 2022

Mean

Keterangan:
Keterangan:
n = Jumlah Observasi
k = Jumlah kelas
Data ke — i
Kelas interval

Frekuensi kelas ke-i

Nilai tengah — i

Median ika urutan data n ganjil maka:

2 ika

urutan data n genap maka:

eterangan:

132 = Tepi bawah kelas median

I = Lebar kelas

N = Jumlah data

Frekuensi kumulatif lebih


rendah dari kelas median
sebelumnya f = Frekuensi kelas
median

32
IPO LABORATORY
MODUL MATERI SIPO 2022

Modus ilai yang frekuensi munculnya


erbanyak
MO =

Keterangan:

Tepi bawah kelas modus

I = lebar kelas (class Width)

Selisih frekuensi kelas modus


dengan kelas sebelumnya

Selisih frekuensi kelas modus


dengan kelas sesudahnya

Jangkauan Range = Qmax — Qmin Range = Qmax — QmLn


(Range)

Keterangan: Keterangan:

Qmax= Nilai Tertinggi Qmax= Nilai Tertinggi

Nilai Terendah Qmm Nilai Terendah

Jangkauan
- (21)
Kuartil

Vari ansi
s - s (XL — X)2

33

SİPO LABORATORY
MODUL MATERI SIPO 2022

Standar
Deviasi 1
n=l

Kemiringan For Unclassified Data For Unclassified Data ct3


(Skewness)
n s
Keterangan: Keterangan:

ct3= Slope coeffîcient Slope coeficient

Data frekuensi ke-i n = Frekuensi kelas ke-i

Banyaknya data pengamatan n = Banyaknya data pengamatan


= Rata — rata hitung (mean) k = Banyak kelas
s 3 = Simpangan baku = Rata-rata hitung (mean)

s = Simpangan baku

Keruncingan For Unclassified Data For Unclassified Data a4


(Kurtosis)
4 1 Yi=l fi(Mi -
n s 4
n s

34
IPO LABORATORY
MODUL MATERI SIPO 2022

Keterangan: Keterangan:

a32 Slope coefficient Slope coefficient fi =

X1 = Data frekuensi ke-i Frekuensi kelas ke-i n =

n — Banyak data pengamatan Banyak data pengamatan

Mt Banyaknya kelas x =
x = Rata-rata hitung (mean) s
4
= Simpangan Baku Rata- rata hitung (mean)

s — Simpangan Baku

O
MODUL 2

PENENTUAN DISTRIBUSI PELUANG DIKSRIT DAN KONTINU

TUJUAN PRAKTIKUM

Praktikan mampu memahami konsep distribusi peluang diskrit dan peluang


kontinu.
2. Praktikan mampu menyelesaikan permasalahan terkait distribusi peluang
diskrit dan distribusi peluang kontinu menggunakan Microsoft Excel dan
software R.

REFERENSI

Montgomery, D. C. & Runger, G. C. , 2011. Applied Statistics and Probability for


Engineers. 5th ed. United States: John Wiley & Sons, Inc.

Sudjana, 2002. Metode Statistika. Bandung: Tarsito.

Walpole, R. E., Myers, R. H., Myers, S. L. & Ye, K., 2012. Probability and
Statistics for Engineers and Scientists 9th Edition. New Jersey: Pearson Prentice
Hall.

MIND MAP

35

SİPO
MODUL MATERI SIPO 2022

DASAR TEORI

Dalam kehidupan sehari-hari, seseorang dalam pengambilan keputusan pasti


memperhatikan faktor ketidakpastian yang berkaitan dengan probabilitas atau
peluang kejadian. Probabilitas ini dapat digunakan untuk mengukur tingkat
terjadinya suatu kejadian yang acak atau random. Konsep probabilitas memiliki
peranan penting dalam berbagai bidang, seperti bidang pemerintahan, bidang usaha
atau industri, dan bidang Iainnya. Nilai dari probabilitas berkisar antara 0 sampai
dengan I. Jika semakin dekat nilai probabilitas ke nilai O, maka semakin kecil juga
kemungkinan suatu kejadian akan terjadi. Jika semakin dekat nilai probabilitas ke
nilai 1, maka semakin besar peluang suatu kejadian akan terjadi. Oleh sebab itu,
perlu didapatkan suatu hasil pengamatan yang telah dilakukan sebelumnya sebagai
sebuah informasi untuk mengambil keputusan yang objektif.

A. Distribusi Peluang

36

SİPO
MODUL MATERI SIPO 2022

Hubungan antara nilai variabel acak dan peluangnya dicerminkan Oleh


distribusi peluang. Dalam distribusi peluang terdapat peubah acak atau
variabel acak. Peubah acak atau variabel acak adalah sebuah fungsi yang
mewakili bilangan real ke setiap hasil diruang sampel dari sebuah
eksperimen acak (Montgomery & Runger, 2011). Variabel acak dinyatakan
dengan huruf kapital misalnya "X", sedangkan nilainya dinyatakan dengan
huruf kecil misalnya "x" (Walpole, Myers, Myers, &
Ye, 2012). Terdapat 2 jenis variabel acak yaitu:
1. Variabel Acak Diskrit
Variabel acak disebut variabel acak diskrit jika serangkaian
kemungkinan hasil dapat dihitung (countable) (Walpole, Myers,
Myers, & Ye, 2012). Menurut (Ingram, 1994), variabel acak diskrit
adalah variabel acak yang hanya mengambil nilai-nilai yang
terisolasi, yaitu nilai yang mungkin ditandai pada suatu garis nyata.
Sedangkan menurut (Montgomery & Runger, 2011), variabel acak
diskrit adalah variabel acak dengan range terbatas. Jika digambarkan
dalam garis interval, variabel acak diskrit akan terlihat seperti
deretan dari titik-titik yang terpisah dan nilainya merupakan
bilangan bulat. Contoh dari variabel acak diskrit sebagai berikut:
a. Banyaknya permunculan Sisi muka atau angka dalam
pelemparan koin (uang logam).
b. Jumlah kesalahan dalam pengetikan naskah.
c. Total jumlah mahasiswa disuatu kelas sebanyak 45 orang,
dimana terdapat 25 orang mahasiswa dan 20 orang
mahasiswi.
Dimana . Xa = 25 terdapat 25 orang mahasiswa didalam
suatu kelas.
Xi 20 ; terdapat 20 orang mahasiswi didalam
suatu kelas.

2. Variabel Acak Kontinu


Variabel acak kontinu adalah variabel acak yang dapat diukur untuk
setiap tingkat akurasi yang diinginkan. Semua nilai yang mungkin

37

SİPO
MODUL MATERI SIPO 2022

dari variabel acak kontinu terdiri dari satu atau lebih interval
bilangan real (Ingram, 1994). Variabel acak kontinu adalah variabel
acak dengan interval (baik terbatas atau tidak terbatas) yang
memiliki bilangan real untuk setiap rentangnya (Montgomery &
Runger, 2011). Dari pernyataan tersebut, dapat diketahui bahwa
kedekatan dari dua angka dalam suatu interval akan selalu ada
bilangan Iain. Contohnya adalah antara bilangan I dan 2, terdapat
bilangan Iain yaitu (l. l, 1.2, 1.3,.. ..). Variabel acak kontinu dibatasi
Oleh titik -T < x < -Foo. Variabel acak kontinu jika digambarkan
pada sebuah garis interval akan berupa sederetan titik yang
bersambung membentuk suatu garis Iurus. Contoh dari variabel acak
kontinu adalah sebagai berikut:
a. Diameter tabung logam sebesar 49.5, dimana nilai x berada
dalam rentang 49 < diameter < 50.
Maka
Peubah acak memiliki peluang dari suatu kejadian yang
dapat dibentuk menjadi suatu fungsi peluang, kemudian
fungsi kumulatif dari peluang tersebut direpresentasikan
menjadi fungsi distribusi.
b. Panjang sebuah tali
c. Berat badan seseorang
B. Distribusi Peluang Diskrit
Menurut (Montgomery & Runger, 2011), distribusi peluang diskrit adalah
sebuah distribusi yang dapat dijelaskan oleh fungsi yang menentukan
probabilitas pada masing-masing kemungkinan nilai diskrit untuk X.
Sedangkan, menurut (Walpole, Myers, Myers, & Ye, 2012), distribusi
peluang diskrit adalah suatu ruang contoh yang mengandung jumlah titik
sama banyaknya dengan bilangan cacah. Dengan kata lain, distribusi
peluang diskrit merupakan suatu distribusi peluang dimana semesta peubah
acaknya dapat dihitung atau berhingga.
Untuk memudahkan, seringkali probabilitas dari variabel acak X diwakili
oleh rumus. Rumus tersebut menjadi sebuah fungsi dari nilai-nilai numerik
x yang ditunjukkan dengan f(x), g(x), r(x), dan seterusnya.

38

SİPO
MODUL MATERI SIPO 2022

Contoh : Jika f(x) = P(X=x)


Maka : f(3) =
Himpunan pasangan terurut (x, f(x)), menurut (Walpole, Myers, Myers, &
Ye, 2012) disebut sebagai fungsi probabilitas, atau fungsi massa
probabilitas, atau fungsi distribusi probabilitas dari variabel acak diskrit X
jika memenuhi syarat:

(x)

= f(x)
Terdapat beberapa jenis distribusi peluang diskrit yang sering digunakan
yaitu distribusi hipergeometrik, distribusi poisson, distribusi geometrik,
distribusi binomial-negatif dan distribusi binomial. Namun dalam modul ini,
distribusi peluang diskrit yang akan dibahas yaitu distribusi binomial dan
distribusi poisson.
I. Distribusi Binomial
Distribusi binomial berasal dari proses bernoulli, dimana percobaan
dilakukan secara berulang-ulang dan setiap usaha dari percobaan
tersebut memiliki dua kemungkinan yaitu "sukses" dan "gagal"
Jumlah "X" keberhasilan dalam uji coba "n" Bernoulli disebut
variabel acak binomial. Distribusi probabilitas dari variabel acak
diskrit ini disebut distribusi binomial, dan nilainya akan
dilambangkan dengan B (x, n, p) menurut (Walpole, Myers, Myers,
& Ye, 2012). Adapun ciri-ciri dari distribusi binomial adalah sebagai
berikut:

a. Percobaan dilakukan berulang sebanyak "n" kali.


b. Hasil dari setiap pengulangan yang dilakukan akan
menghasilkan "sukses" atau "gagal", "ya" atau "tidak", 0
atau I
c. Peluang berhasil disimbolkan dengan "p" dan dalam setiap
pengulangan yang dilakukan nilai "p" konstan.

39

SİPO
MODUL MATERI SIPO 2022

d. Setiap pengulangan yang dilakukan bersifat bebas


(independent).

Distribusi peluang X dari distribusi binomial dilambangkan dengan:


X B(x, n, p)
Besarnya nilai probabilitas setiap x peristiwa sukses dari n kali
eksperimen ditunjukkan oleh probabilitas sukses p dan probabilitas
kegagalan q. Untuk peluang sukses sebanyak 'x' buah darl 'n'
percobaan adalah sebagai berikut:
B (x, n, p) = P (X = x) = — p) n -
x

Dimana:

Maka:
Menurut (Walpole, Myers, Myers, & Ye, 2012), rumus untuk
menghitung rata-rata, variansi, dan standar deviasi dari nilai tengah
dan ragam bagi Distribusi Binomial adalah sebagai berikut:
Parameter Rata-rata (Mean) Variansi Standar Deviasi

Rumus np npq npq

Dimana: n — Banyak percobaan yang dilakukan p


— Peluang sukses pada setiap percobaan
Banyak harapan suatu unit muncul dalam
percobaan q = Peluang gagal dalam percobaa (q = I—p)

Dalam kejadian sehari-hari, kita sering diminta untuk menghitung


peluang distribusi kumulatif dari suatu kejadian. Misalnya P(X < r)
atau P(a X b). Maka, untuk menghitung distribusi kumulatif tersebut
kita dapat menggunakan rumus berikut:

(1 - p) n - x

40

SİPO
MODUL MATERI SIPO 2022

Untuk menghitung sigma tersebut, kita dapat menggunakan tabel


binomial untuk berbagai macam nilai "x", "n", dan p

2. Distribusi Poisson
Percobaan poisson adalah eksperimen yang menghasilkan nilai
numerik dari peubah acak X pada selang waktu tertentu atau daerah
tertentu. Jumlah keluaran yang terjadi selama suatu selang waktu
yang diketahui atau di dalam suatu daerah (ruang) yang ditentukan
disebut sebagai percobaan Poisson, sehingga sebuah percobaan
Poisson dapat memunculkan pengamatan untuk peubah acak x.
Secara singkat, jumlah X dari hasil yang terjadi selama percobaan
poisson disebut sebagai variabel acak poisson, dan distribusi
probabilitasnya disebut distribusi poisson. Sehingga distribusi
poisson adalah sebuah distribusi dimana peubah acak poisson X
mewakili jumlah sukses yang terjadi dalam selang waktu atau
daerah tertentu yang dinotasikan dengan "t" (Walpole, Myers,
Myers, & Ye, 2012). Berikut merupakan contoh kejadian dari
distribusi poisson:
a. Banyaknya kesalahan penulisan kata dalam satu halaman
essay.
b. Banyaknya ular yang ditemukan dalam satu hektar hutan.
c. Banyaknya gol dalam satu musim premier league.
d. Banyaknya mesin yang rusak dari suatu pabrik selama satu
tahun operasi.

Adapun ciri-ciri dari distribusi poisson menurut (Walpole, Myers,


Myers, & Ye, 2012), yaitu sebagai berikut:
a. Banyaknya hasil percobaan yang terjadi dalam selang waktu
atau daerah tertentu, tidak tergantung pada banyaknya hasil
percobaan yang terjadi pada selang waktu atau daerah lain
yang terpisah.

41

SİPO
MODUL MATERI SIPO 2022

b. Peluang terjadinya suatu hasil percobaan selama selang


waktu yang singkat atau dalam suatu daerah yang kecil
sebanding dengan panjang selang waktu tersebut atau
besarnya daerah tersebut dan tidak bergantung pada
banyaknya hasil percobaan yang terjadi di luar selang waktu
atau daerah tersebut.

c. Peluang bahwa lebih dari suatu hasil percobaan akan terjadi


dalam selang waktu yang singkat atau dalam daerah yang
kecil dapat diabaikan.

Distribusi peluang X dari distribusi poisson dilambangkan dengan:

Sedangkan perhitungan peluang untuk distribusi poisson adalah


sebagai berikut:

P(x, Xt) = e
Keterangan

— Rata-rata banyaknya sukses per satuan waktu, daerah, atau


volume (y)

e =2.71828..

C. Distribusi Peluang Kontinu


Distribusi peluang kontinu adalah peubah acak yang mendapatkan nilainya
pada skala kontinu. Bila ruang sampel mengandung titik sampel yang tak
berhingga, maka disebut dengan ruang sampel kontinu. Distribusi peluang
kontinu adalah suatu ruang contoh yang mengandung tak terhingga
banyaknya titik contoh yang sama dengan banyaknya titik pada sebuah garis
(Walpole, Myers, Myers, & Ye, 2012). Syarat dari distribusi kontinu adalah
apabila fungsi f(x) yaitu fungsi pada peluang peubah acak kontinu X
didefinisikan atas semua himpunan bilangan real (R), jika:
1. f(x) 0, untuk semua x € R

42

SİPO
MODUL MATERI SIPO 2022

3. P(a < x < b) = f:M (X) dx


Berikut ini merupakan contoh dari data yang dikategorikan sebagai data
kontinu.
l . Berat badan
2. Volume air dalam tabung
3. Suhu ruangan
4. Panjang tali

Terdapat beberapa jenis distribusi peluang kontinu yang sering digunakan


pada pengolahan data, yaitu distribusi uniform, distribusi normal, distrlbusi
eksponensial, dan distribusi weibull. Namun dalam modul ini, distribusi

43

SİPO
MODUL MATERI SIPO 2022

peluang kontinu yang akan dibahas yaitu distribusi normal dan distribusi
eksponensial.

I. Distribusi Normal
Distribusi normal atau gaussian distribution merupakan distribusi
paling penting dalam ilmu statistika. Dikatakan penting karena
distribusi normal dapat menggambarkan banyak fenomena yang
terjadi di alam, industri dan penelitian. Distribusi normal juga dapat
digunakan untuk mengaproksimasi Distribusi Probabilitas Diskrit
seperti Binomial dan Poisson (Walpole, Myers, Myers, & Ye, 2012).
Distribusi normal juga merupakan fungsi probabilitas yang
menggambarkan bagaimana nilai suatu variabel didistribusikan.
Distribusi normal merupakan distribusi simetris di mana sebagian
besar pengamatan mengelompok di sekitar puncak pusat dan
probabilitas kedua arah. Berikut merupakan gambar kurva distribusi
normal.

Gambar 4.1 Kurva Distribusi Normal

Berdasarkan gambar di atas, distribusi normal memiliki beberapa


karakteristik diantaranya yaitu:
a. Kurva berbentuk garis lengkung yang halus dan berbentuk seperti genta
(lonceng).
b. Simetris terhadap rataan (mean).
c. Kedua ekor atau ujungnya semakin mendekati sumbu absisnya tetapi
tidak pernah memotong.
d. Jarak titik belok kurva tersebut dengan sumbu simetrisnya = o.

44

SIPO
MODUL MATERI SIPO 2022

LABOR AT ORV
e. Luas daerah di bawah lengkungan kurva tersebut dari —oo sampai

Distribusi peluang X dari distribusi normal dapat dilambangkan dengan:


X (x, 02)
Sedangkan perhitungan peluang untuk distribusi normal adalah sebagai
berikut.

= f(x) =
2
Jika X adalah variabel acak normal dengan E(X) maka
variabel acak normal adalah :

x- 11

Dimana
Rata-rata
= Simpangan baku
Tt = 3.14159...
e =2.71828...

2. Distribusi Eksponensial
Distribusi eksponensial merupakan pengujian yang digunakan untuk
melakukan perkiraan atau prediksi dengan hanya membutuhkan
perkiraan rata-rata populasi karena distribusi eksponensial memiliki
standar deviasi sama dengan rata-rata. Ciri-ciri dari distribusi ini
adalah kurvanya memiliki ekor di sebelah kanan dan nilai 'x' dimulai
dari O sampai 00. Distribusi eksponensial memiliki pertalian erat
dengan distribusi poisson. Namun, jika pada poisson peubah acak

45

SİPO
MODUL MATERI SIPO 2022

poisson X menggambarkan jumlah keluaran yang terjadi pada suatu


selang waktu atau luas daerah tertentu, pada peubah acak
eksponensial X menggambarkan panjang rentang waktu antara suatu
kejadian dengan kejadian lain.

Contoh dari aplikasi distribusi eksponensial adalah sebagai berikut:

I . Dalam teori antrian jarak antar kedatangan pelanggan di


fasilitas pelayanan (seperti bank, loket kereta api, tukang
cukur, dll.) memenuhi distribusi eksponensial.
2. Lama waktu mulai dipakai sampai rusaknya suatu suku cadang dan
alat listrik memenuhi distribusi eksponensial.

Kurva distribusi eksponensial berbeda-beda, tergantung dari nilai x


dan À. Untuk lebih jelas, kita dapat melihat kurva distribusi
eksponensial pada gambar berikut.

Gambar 4.2 Kurva Distribusi Eksponensial

Distribusi peluang 'X' dari distribusi eksponensial dilambangkan dengan:

Sedangkan perhitungan fungsi padat peluang dari distribusi eksponensial


adalah sebagai berikut.

46

SİPO
MODUL MATERI SIPO 2022

;x >
0,
Menurut (Walpole, Myers, Myers, & Ye, 2012), adapun rumus
untuk menghitung rata-rata dan variansi dari distribusi eksponensial
adalah sebagai berikut:

47

SIP O LABORATORY
MODUL MATERI SIPO 2022

MODUL 3

DISTRIB UTION FITTING

TUJUAN PRAKTIKUM

1. Praktikan mampu memahami konsep dalam melakukan distribution fitting.


2. Praktikan mampu menggunakan software R dalam menyelesaikan
permasalahan distribution fitting dan menentukan distribusi yang paling tepat.
REFERENSI

Karian, Zaven A., Dudewicz, Edward J., 2011. Handbook of Fitting Statistical
Distributions with R. Florida: Taylor and Francis Group, LLC.

Montgomery, D. C. & Runger, G. C. , 2011. Applied Statistics and Probability for


Engineers. 5th ed. United States: John Wiley & Sons, Inc.

Walpole, R. E., Myers, R. H., Myers, S. L. & Ye, K., 2012. Probability and
Statistics for Engineers and Scientists 9th Edition. New Jersey: Pearson
Prentice Hall.

MIND MAP

DASAR TEORI

48

SIP O
MODUL MATERI SIPO 2022

Pada zaman modern ini, sebagian besar dalam bidang ilmu pengetahuan dan
pengembangan manusia melibatkan pembangunan model statistik untuk
menggambarkan variabel yang mendasar pada bidang pengetahuan terkait. Model
yang paling mendasar dan banyak digunakan adalah distribusi probabilitas
(probability distribution)

Distribution probability merupakan fungsi matematika yang memberikan


kemungkinan (likelihood) dari variabel acak yang berguna untuk menjelaskan
semua nilai variabel serta probabilitas yang mungkin dalam interval tertentu.
Terdapat dua macam distribusi probabilitas, yaitu:

Distribusi Probabilitas Diskrit atau Probability Mass Function (PMF)


Menurut Montgomery & Runger (2011), distribusi probabilitas diskrit
adalah sebuah distribusi yang dapat dijelaskan oleh fungsi yang menentukan
probabilitas pada masing - masing kemungkinan dari nilai diskrit untuk X.
Jenis distribusi probabilitas diskrit antara lain Distribusi Binomial,
Distribusi Multinomial, Distribusi Geometrik, Distribusi Hipergeometrik,
dan Distribusi Poisson.

2. Distribusi Probabilitas Kontinu atau Probability Density Function (PDF)


Distribusi probabilitas kontinu adalah suatu ruang contoh yang
mengandung tak terhingga banyaknya titik contoh yang sama dengan
banyaknya titik pada sebuah garis (Walpole, Myers, Myers, & Ye, 2012).
Distribusi probabilitas kontinu menggunakan variabel mengambil semua
nilai pada skala kontinu. Jenis distribusi probabilitas kontinu antara lain
adalah
Distribusi Seragam (Uniform), Distribusi Normal (Gaussian), Distribusi
Gamma, Distribusi Eksponensial, Distribusi Chi-Square, Distribusi
Weibull, dan Distribusi Lognormal. Pada modul 3 akan lebih menjelaskan
mengenai distribusi probabilitas kontinu karena lebih sering digunakan
dalam simulasi dibandingkan distribusi probabilitas diskrit.

Distribution Fitting adalah penentuan distribusi yang paling sesuai dengan data
sampel dengan menentukan fungsi matematika yang paling baik mewakili variabel

49

SIP O LABORATORY
MODUL SİPO 2022
MAT ERİ

statistik. Berikut merupakan langkah - langkah dalam melakukan distribution fitting,


antara lain:

I. Memilih model atau fungsi sebagai kandidat untuk menjadi goodfits data sampel.
2. Mengestimasikan parameter tiap distribusi yang harus dihitung.
3. Menguji distribusi menggunakan goodness offit.
Pemilihan Model Distribusi

Langkah pertama dalam melakukan distribution fitting adalah untuk memilih


kandidat model atau fungsi minimal dua distribusi untuk dibandingkan dan dipilih
yang paling sesuai. Semakin baik suatu model maka semakin baik pula representasi
data. Untuk pemilihan data pada suatu model atau fungsi bisa menggunakan teknik
grafik seperti histogram. Namun secara grafik dapat mengakibatkan cenderung
subjektif, oleh karena itü ada metode yang didasari pada ekspresi analitik seperti
kriteria Pearson's K. Memecahkan persamaan diferensial tertentu dapat dicapai
dengan menggunakan kelompok fungsi yang mewakili distribusi empiris. Kurva
dari fungsi tersebut hanya bergantung pada nilai mean, variability, skewness, dan
kurtosis.

Dengan standarisasi data, tipe kurva yang hanya bergantung pada pengukuran skewness dan
kurtosis diformulasikan dalam fungsi berikut :

y12 (Y12 + 6Y
4(4Y2 — 3y12 + - 3Y12 )

Dimana :

adalah koefisien skewness Pearson's


no.3

4
— 3 , adalah koefisien kurtosis Pearson's
7104
Berdasarkan nilai K yang diperoleh dari data sampel yang digunakan,
didapatkan suatu fungsi jenis tertentu. Pada modul ini hanya beberapa distribusi
probabilitas kontinu yang akan dibahas, antara lain:

Distribusi Normal (Gaussian)

50

SİPO
MODUL MATERI SIPO 2022
Distribusi ini merupakan distribusi yang paling penting di
antara distribusi yang lain. Kurva pada distribusi normal
berbentuk seperti setangkup Ionceng yang simetri terhadap sumbu absis
dengan luas di bawah kurva adalah I dan kedua ujung kurva distribusi
normal mendekati sumbu absis secara asimptotik seperti yang ditunjukan
pada gambar berikut

Distribusi Normat

Variabel acak X dikatakan berdistribusi normal jika memiliki fungsi distribusi


probabilitas kontinu seperti berikut :

Dengan g sebagai mean dan a 2 sebagai variansi. Bentuk khusus dari


distribusi ini adalah jikag = O dan a = I, disebut dengan Distribusi Normal
Baku.

Y
Distribusi Gamma
Distribusi normal tidak selamanya dapat digunakan untuk memecahkan
masalah teknik dan sains. Distribusi gamma biasanya diterapkan dalam

51

SİPO
MODUL MATERI SIPO 2022
menganalisis lamanya waktu untuk menyelesaikan
pekerjaan seperti pada teori antrean dan keandalan.
Distribusi gamma diterapkan untuk nilai variabel yang berupa bilangan
positif. Kurva pada distribusi gamma memiliki kemiringan (skewness) yang
cukup signifikan seperti yang ditunjukan pada gambar berikut :

Distribusi Gamma

10

Variabel acak X dikatakan berdistribusi gamma jika dengan dua parameter


dan F memiliki fungsi distribusi probabilitas kontinu seperti berikut :

1 a, Èo
F>
xŒ-1e-x/P
Dengan nilai mean = ŒF dan nilai variansi (T — aF 2 . Bentuk khusus dari
distribusi ini adalah jika F = 1 , disebut dengan Distribusi Gamma
Baku.
Distribusi Eksponensial
Distribusi eksponensial digunakan untuk memodelkan jumlah waktu hingga
kemunculan sebuah peristiwa tertentu, atau memodelkan waktu di antara
peristiwa-peristiwa yang saling independen. Jika suatu peristiwa terjadi
dalam konteks proses poisson, maka panjangnya waktu atau ruang antar dua
peristiwa yang berurutan mengikuti distribusi probabilitas kontinu karena
waktu bersifat kontinu.

Distribusi eksponensial merupakan permasalahan dari tipe distribusi


gamma. Variabel acak X dikatakan berdistribusi eksponensial jika
parameter sehingga memiliki fungsi distribusi probabilitas kontinu seperti
berikut :

52

SİPO
MODUL MATERI SIPO 2022
f(x,ß) 1 20
— e-x/ß ; ø > o; x

Dengan nilai mean g = dan nilai variansi 0 2 = [3 2

Distribusi Chi-Square
Distribusi chi-square merupakan permasalahan dari tipe distribusi gamma.
Variabel acak X dikatakan berdistribusi chi-square jika parameter dan
sehingga memiliki fungsi distribusi probabilitas kontinu seperti berikut :

1 f (x, r/ 2,2) =
xr/2—1 —x/2 . r > 0
r (L) 202
Dengan nilai mean g = r = 2a dan nilai variansi 0 2 = 2r = 2a.

Distribusi Weibull
Distrlbusi ini banyak digunakan untuk memodelkan waktu hidup dalam teknik
ketahanan. Distribusi weibull merupakan permasalahan dari tipe

distribusi gamma sehingga memiliki bentuk kurva yang mirip dengan distribusi
gamma, seperti yang ditunjukan pada gambar berikut :

Distribusi weibull

53

SİPO
MODUL MATERI SIPO 2022
Fungsi pada distribusi weibull adalah sebagai berikut :

ara x" -le


f (x, cz,P) =

Dengan nilai mean g = (1 +—) dan nilai variansi a 2 =

Distribusi Lognormal
Jika variabel acak berdistribusi normal dengan g sebagai mean dan sebagai variansi,
maka pada variabel acak berdistribusi lognormal.

Fungsi pada distribusi lognormal adalah sebagai berikut:

1 (In(y) —
gx) 2

Dengan nilai mean = exp (gx 4- 0.50}) dan nilai variansi 0 2 = exp exp —
I) dimana mean distribusi normal dan ok variansi distribusi normal.

Distribusi Uniform
Distribusi Uniform kontinu disebut juga sebagai Distribusi Seragam
kontinu, distribusi ini memiliki sebaran peluang yang sama pada seluruh
interval [u,ß], dengan fungsi kepadatan peluang sebagai berikut:
untuk a < x
< ß untuk
yang Iain
Distribusi Uniform mempunyai rata — rata dan varians sebagai berikut :

Rata -rata (g) =


2

Varians (0 2 ) =
12

Distribusi Logistik
Distribusi logistik adalah distribusi yang memiliki fungsi kepekatan peluang
kontinu. Distribusi logistik memiliki kurva dengan bentuk simetris dan uni
modal. Fungsi kepekatan peluang distribusi logistik memiliki bentuk umum
sebagai berikut:

54

SİPO
MODUL MATERI SIPO 2022
Suatu variabel acak X dikatakan memiliki distribusi
logistik dengan parameter (g, o ), jika fungsi kepekatan
peluangnya didefinisikan sebagai berikut:

; — 00 < X < 00,

Dengan parameter lokasi g yang bersifat simetrik dan parameter skala a.


Sedangkan fungsi distribusi kumulatif (CDF) dari distribusi logistik sebagai
berikut:

1
; — 00 < X < 00,

Estimasi Parameter

Parameter dalam populasi biasanya tidak diketahui sehingga perlu


dilakukan estimasi terhadap parameter melalui data sampel untuk mengetahuinya.
Setelah memilih model atau fungsi distribusi sebagai kandidat yang dianggap dapat
merepresentasikan data sampel yang digunakan, selanjutnya untuk meyakinkan
apakah kandidat distribusi yang dipilih sesuai atau tidak perlu menggunakan metode
estimasi parameter untuk mengukur kandidat-kandidat distribusi berdasarkan data
sampel yang digunakan. Berikut diantaranya beberapa metode untuk mengestimasi
parameter.

Metode Analogi
Metode analogi terdapat dalam estimasi model parameter yang
mengaplikasikan fungsi yang sama untuk data empiris, yaitu mengestimasi
mean yang tidak diketahui dari populasi normal menggunakan mean
sample.

Metode Momen
Metode momen adalah metode tertua dan paling lama digunakan. Metode
ini memiliki prosedur paling mudah dalam memperoleh estimator dari satu
atau lebih parameter populasi. Metode momen membandingkan momen
sampel secara empiris terhadap populasi secara teoritis.

Pendefinisian momen (empiris) suatu data sampel adalah sebagai berikut :

55

SİPO
MODUL MATERI SIPO 2022
Momen sampel ke-t sekitar 0 (nol).

XiYi , t = O, I, 2, ...

Momen sampel ke-t sekitar mean.

(Xi — U) t Yi , t = O, 1,2,

Momen populasi dari tinjauan teori adalah sebagai berikut :


Momen populasi ke-t sekitar O (nol).

x tf(x, 9) dx , t = 0, 1, 2,

Momen populasi ke-t sekitar mean.

(x — f (x, O)dx , t = O, I, 2, ..

Dimana (F — Œ) adalah interval f (x, 9) didefinisikan dengan g adalah mean dan


Yi adalah frekuensi relatif empiris.

• Metode Maximum Likelihood Estimate (MLE)


Metode Maximum Likelihood Estimate (MLE) adalah metode yang paling
sering digunakan untuk mengestimasi parameter. Mengestimasi
menggunakan MLE dimulai dengan model kandidat distribusi yang sudah
ditentukan sebelumnya yang diketahui sebagai fungsi Iikelihood dari data
sampel. Singkatnya, likelihood dari himpunan data adalah probabilitas
untuk memperoleh himpunan data dengan yang sudah diberikan model
probabilitas yang dipilih. Ekspresi ini mengandung parameter tidak
diketahui (unknown).

Langkah-langkah menentukan estimator parameter g dan a 2 dengan metode MLE


adalah sebagai berikut :

56

SİPO
MODUL MATERI SIPO 2022
1. Membuat fungsi Iikelihood berdasarkan kandidat distribusi
yang telah dipilih. Fungsi likelihood adalah sebagai berikut :

Contoh penerapan fungsi likelihood pada distribusi normal.

1
L (U, 0 2 ) = fla e 202
L (g, 0 2 )

2. Membuat transformasi fungsi tersebut dalam bentuk In.


2
3. Membuat turunan secara parsial terhadap parameter g dan a dan
menyamakan dengan nol.
4. Dari turunan parsial terhadap g dan a 2 dapat diperoleh estimator parameter
sesungguhnya.

Goodness of Fit

Langkah terakhir setelah mengetahui bahwa kandidat distribusi yang dipilih


sesuai, perlu dilakukan pengukuran untuk menilai seberapa baik distribusi tersebut
merepresentasikan data sampel. Pengujian goodness of fit dapat menggunakan
beberapa uji antara lain Chi-Square, Kolmogorov-Smirnov, dan Anderson-Darling.
Pada modul ini akan lebih dibahas mengenai Uji Chi-Square dalam
membandingkan sebaran distribusi karena dapat digunakan pada distribusi
probabilitas diskrit maupun kontinu.

Langkah-langkah melakukan uji Chi-Square adalah sebagai berikut :

I. Menentukan hipotesis.

• Hipotesis nol (Ho)


Hipotesis ini juga disebut hipotesis awal merupakan hipotesis yang
diharapkan akan ditolak dan sering menyatakan kondisi yang menjadi
dasar pembandingan serta harus menyatakan satu pernyataan mengenai
nilai parameter populasi. Ho dinyatakan dalam bentuk persamaan (=).

• Hipotesis alternatif (Hl)

57

SİPO
MODUL MATERI SIPO 2022
Hipotesis ini merupakan suatu pernyataan yang diterima jika data
sampel memberikan cukup bukti bahwa hipotesis nol (Ho) adalah
salah.
Hl dinyatakan dalam bentuk pertidaksamaan (<; >; dan șk).

Berikut merupakan hipotesis pada Uji Chi Square.

Ho : Sampel memiliki distribusi yang sama.


Hl : Sampel tidak memiliki distribusi yang sama.

Y
2. Melakukan uji statistik.
3. Mengambil keputusan.
Dasar pengambilan keputusan dapat dilakukan dengan dua cara, antara lain sebagai
berikut :
Membandingkan nilai x 2 dengan nilai Xtabel dengan ketentuan:
Jika X 2 dengan nilai xtabel, Ho tidak ditolak.

Jika X 2 > dengan nilai Xtabel, Ho ditolak.

Melihat nilai signifikansi dengan ketentuan:


Jika tingkat kepercayaan sebesar 95% maka tingkat signifikansi 5%.

Nilai signifikansi 0.05 maka Ho tidak ditolak.

Nilai signifikansi < 0.05 maka Ho ditolak.

4. Menarik kesimpulan.

58

SİPO
MODUL MATERI SIPO 2022

4th MODULE
LINEAR PROGRAMMING, TRANSPORTATION, AND
ASSIGNMENT

LABWORK OBJECTIVES
l . Students are able to understand and determine decision variables, objective
functions, and constraints in the case of linear programming.
2. Students are able to understand the methods that exist in the case of
transportation, namely the Northwest Corner Method, the Least Cost Method,
and the Vogel's Approximation Method.
3. Students are able to understand the assignment method (Hungarian Method).
4. Students are able to understand transportation and assignment cases.
5. Students are able to know and understand the Python programming language
that is applied to solve linear programming cases, POM-QM software to solve
transportation cases, and Excel Solver to solve assignment cases.
REFERENCE
Herjanto, E. (1999). Manajemen Produksi dan Operasi Edisi Kedua. Jakarta:
Grasindo.
Lieberman, F. S. (2015). Introduction to Operations Research (10th ed.). New
York: McGraw-Hill Education. Retrieved September 25, 2019
Mulyono, S. (2017). Riset Operasi (2nd ed.). Jakarta: Mitra Wacana Media.
Retrieved September 25, 2019
Ristono, P. &. (2012). Penelitian Operasional (1st ed.). (F. W. Nurwiyati, Ed.)
Yogyakarta: Graha 11mu. Retrieved September 25, 2019
Siswanto. (2007). Operations Research (Vol. I). Jakarta: Erlangga.
Taha, H. A. (2011). Operations Research An Introduction (9th ed.). United States
of America. Retrieved September 26, 2019
MIND MAP

59

SIP O
MODUL MATERI SIPO 2022

REVIEW OF RELATED LITERATURE


Linear Programming
Linear programming (LP) is a problem-solving technique by considering the
constraints that exist in the problem so that an optimal condition is obtained.
Optimization of a situation is done by maximizing or minimizing objectives, such
as maximizing profit or minimizing production costs/costs (Ristono, 2012).
(Siswanto (2007) states that linear programming (LP) is a linear mathematical
method to determine an optimal solution by maximizing or minimizing the
objective function of a constraint arrangement. The "linear" nature of linear
programming means that all mathematical functions in this model are linear
functions, while the word "programming" is a synonym for planning. Thus, linear
programming (LP) is an activity planning to obtain an optimum result, that is, a
result that achieves the best goal among all feasible alternatives. Overall, the goal
of linear programming is to solve the problem of maximizing or minimizing to get
the optimal solution.
Linear programming is an important basis for the development of other Operational
Research techniques, including integer, stochastic, network flow, and quadratic
programming. In this module, the linear programming described includes the
formulation and solving of graphs and the application of the simple simplex method.

60

SIP O
MODUL MATERI SIPO 2022

According to Taha (2011), linear programming in all Operational Research


techniques has three basic components, including determining decision variables,
determining goals such as maximizing or minimizing, and determining the
constraint function used in finding solutions. Some main elements that build linear
programming, namely:

1. Decision Variable
Decision variables are variables that affect the value ofthe goals to be achieved.
In the process of forming a model, determining the decision variables is the
first step before determining the objective function and the constraint function.
For example, the decision variable will determine how much interior and
exterior paint must be produced every day to get optimal profit. The two
products come from the two raw materials that are available every day, 24 tons
Ml, and 6 tons M2. Interior paint requires 6 MI and I M2 in production, while
exterior paint requires 4 Ml and 2 M2. The profit for one ton is $5 thousand for
exterior paint and $4 thousand for interior paint(Taha, 2011).
The decision variables in this case:
Xl = the number of interior paints that are made every day
X2 = the amount of exterior paint that is made every day
2. Objective Function
The objective function in a linear programming model must be linear.
Furthermore, the objective function is maximized or minimized against the
existing constraint functions. In the case of interior and exterior paint, the
following objective function is:

Maximization Z = 5x1 + 4x2


3. Constraint Function
The constraint function is a barrier on the decision
variables that are made. The constraint constraint
function in a linear programming model must also be
linear. In the case of determining the amount of
interior and exterior paint production, the
constraint functions are obtained as follows:
+ 24 (Raw material Ml)

61

SIP O
MODUL MATERI SIPO 2022

X 1 + 2X2 6 (Raw material M2)


4. Non-Negative Function
A function that states that every variable contained
in a linear programming model cannot be negative.
Mathematically written as:

Xl, X2, . . ., x
A special type of linear programming problem is known
as a transportation problem. A part from
transportation, there are assignment problems that
are closely related to transportation problems.

Transportation
The transportation method is a special network technique
developed so that it can solve a problem more effectively
and efficiently than using the simplex method. The
intended network is the lines or channels connecting a
source point to a destination point. This network model
also considers constraints in finding optimal solutions,
such as products with a certain demand or supply, minimum
transportation costs, etc (Mulyono, 2017).

Transportation problems are generally related to the


problem of distributing a product from several sources
(supply) to several destinations (destinations or
demand) to minimize the transportation costs that occur.
In mathematical modeling, transportation problems can be
formulated as a modeling in the case of a linear program.
A transportation model is said to be balanced if the
total supply (source) equals the total demand
(destination) with the following formulation:

62

SIP O
MODUL MATERI SIPO 2022

• Minimization

• Constraints

Transportation Methods
In solving the transportation problem, it is possible to determine a solution that
meets all the constraints or the required transportation system. From these solutions,
it can be sought optimal solutions, namely solutions that minimize transportation
costs. Transportation methods can be done in several ways including:
a. Northwest Corner Method
Introduced by Charnes and Cooper, then developed by Danzig. This method is
an initial solution that is feasible but not optimal, so it must be continued to the
next stage using advanced methods.
Procedure:
l) The filling of cells or boxes starts from the upper left.
2) Allocation of the maximum (largest) amount according to the requirements
so that it is feasible to meet the demand.

63

SIP O
MODUL MATERI SIPO 2022

3) Move to the right box if there is still sufficient supply. If not, move to the
box below according to demand. The movement continues until supply runs
out and demand is met.

b. Least Cost Method


The principle of this method is to give allocation priority to the place that has
the smallest unit cost. Almost similar to the Northwest Corner method, here is
the procedure of the Least Cost Method:

l) The filling of cells or boxes starts from the box that has the smallest price.
2) Allocation of the maximum (largest) amount according to the
requirements so that it is feasible to meet the demand.
3) Move to the next available box at the lowest price if there is sufficient
supply. If not, move to the box below as demanded. Keep moving until
supply runs out and demand is met.
c. Vogel's Approximation Method (VAM)
This method is the best method compared to the two methods above because
in general, the minimum cost allocation is obtained compared to other methods.
Procedure:
1) Calculate the difference between the two smallest costs for each row and
column. The difference or difference value is written in a new column next
to the existing column (called the penalty row or column).
2) Select the row or column with the largest penalty value, then enclose it In
parentheses. If the values in the row or column are the same, choose the one
that moves the most items.
3) From the row or column selected in (2), determine the number of goods that
can be transported by taking into account the restrictions that apply to the
row or column and the cells with the smallest cost.
4) Delete rows or columns that have met the previous requirements (meaning
that the supply has been fulfilled).
5) Repeat steps (I) through (4) until all allocations are met.
Assignment

64

SIP O
MODUL MATERI SIPO 2022

Assignment is a special case of the transportation model, where several m sources


are assigned to several n destinations (one source for one destination) to obtain a
minimum total cost. Hiller and Lieberman (2015) state that assignment is one type
of linear programming to solve problems in the form ofjob assignments to workers,
machines on location, work on machines, or others.
Usually, the meaning of the source is a job (job) while the meaning of the goal is
the machines (workers). So, in this case, there are M jobs assigned to N machines,
where if the job i (i 1, 2, 3, ..., M) is assigned to machine j (j l, 2, 3, ..., N) the Cij
assignment fee will appear. The objective of the engagement model is to determine
the lowest possible cost.
The general assignment model with M sources and N jobs can be seen in the
following table.
Table 5.1 General Model of The Assignment
Job
Supply
1 2

1 Cl l C12 CIN
2 C21 C22 C2N
Source

CM2 CMN 1
Demand 1 1 1
The mathematical model for the assignment case is as follows.
Variable

Xij — {
If source i is assigned to another job j

Objective Function

Minimization Z = ij ij

65

SIP O
MODUL MATERI SIPO 2022

Constraints

Xij = I; for i = 1,2, ... ...n i-l

XLJ = l; for j =

Hungarian Method
The Hungarian Method is one of several solving techniques available for
assignment problems. This method was originally developed by a Hungarian
mathematician named D. Konig in 1916. The following are the steps in the
Hungarian method:
1. A row reduction, which reduces each value in the row by the smallest value on
that row. Enter the results in a new table.
2. A column reduction, which reduces each value in the column from the smallest
value in that column. Enter the results in a new table.
3. Test whether the assignment model is optimal or not by determining the
minimum number of rows needed to cover up (write off) all O numbers. If the
minimum number of rows is equal to the number of rows, then the assignment
model is optimal. Next, go to step 6. If it is not optimal, then continue to the 4
steps.

4. If the number of lines is less than the number of rows, modify the table by:
a. Subtract any value that is not exposed to the line with the smallest value
that is not affected by the line in the table.
b. Add any value that is intersected by the line with the smallest value that is
not affected by the lines in the table.
c. Values were exposed but did not intersect the line value is fixed or
unchanging.
5. Repeat steps 3 and 4 so that you get the optimal assignment model.

66

SIP O
MODUL MATERI SIPO 2022

MODUL 5A

OPTIMASI DETERMINISTIK: KASUS TRA VELING SALESMAN


PROBLEM (TSP)

TUJUAN PRAKTIKUM

Praktikan mampu memahami konsep optimasi deterministik dalam kasus


Traveling Salesman Problem (TSP).
2. Praktikan mampu menyelesaikan permasalahan optimasi deterministik pada
Traveling Salesman Problem (TSP) menggunakan bahasa pemrograman
Python.
REFERENSI

B. W. Santoso, F. S. (2016). Implementasi Algoritma Brute Force Sebagai Mesin


Pencari (Search engine) Berbasis Web Pada Database,. J. Sisfotek Glob, 8.

Eric. V. Denardo. (2010). Dynamic Programming (Models and Applications).


Ghiani, G., Laporte, g. , & Musmanno, R. (2004). Introduction to Logistics Systems
Planning and Control. England: John Wiley & Sons.

Hoffman, K. L., Padberg, M., & Rinaldi, G. (2013). Traveling Salesman Problem.
Encyclopedia of Operations Research and Management Science, 15731578.

Matai, R., Singh, S. P., & Mittal, M. L. (2010). Traveling Salesman Problem: An
Overview of Application, Formulation and Solution Approaches.

Singh, G. &. (2012). An Analysis of various techniques to solve Travelling


Salesman Problem: A Review. International Journal ofAdvanced Research
in Computer Science, 3.

67

SIP O
MODUL MATERI SIPO 2022

MIND MAP

DASAR TEORI

Dalam kehidupan sehari-hari, seringkali kita menemui masalah dalam menentukan


rute perjalanan. Misalnya, ketika seorang salesman perlu menentukan rute mana
yang harus ditempuh sehingga memiliki biaya terendah untuk mengunjungi
sejumlah daerah. Terkadang seorang salesman dihadapkan pada banyak pilihan rute
yang dapat mereka gunakan, sehingga mereka harus dapat menentukan rute
perjalanan terbaik untuk distribusi yang akan dilakukan agar efektif dan efisien.
Sehingga masalah tersebut dapat diatasi dengan menggunakan model Traveling
Salesman Problem (TSP).

Program Dinamis Deterministik

Pada program dinamis deterministik dijelaskan dimana keadaan (state) pada tahap
(stage) berikutnya ditentukan sepenuhnya oleh keadaan dan keputusan pada tahap
ini. Salah satu cara untuk mengkategorikan program dinamik deterministik adalah
melalui bentuk fungsi tujuannya. Sebagai contoh, fungsi tujuan tersebut mungkin
merupakan minimum dari penjumlahan kontribusi dari setiap tahapan.

Traveling Salesman Problem (TSP)

Traveling Salesman Problem (TSP) dikemukakan pertama kali oleh


matematikawan Irlandia, yaitu William Rowan Hamilton dan matematikawan asal
Inggris, yaitu Thomas Penyngton pada tahun 1800. Hingga saat ini model Traveling
Salesman Problem (TSP) menjadi populer dan sering dipakai sebagai model

68

SIP O
MODUL MATERI SIPO 2022

pemecahan masalah pada produksi, transportasi, dan komunikasi. Traveling


Salesman Problem (TSP) adalah pencarian sebuah rute dari seorang salesman yang
dimulai dari titik awal, mengunjungi beberapa kota yang ditentukan dan kembali ke
tempat asal sedemikian sehingga total jarak perjalanan adalah minimum dan setiap
kota dikunjungi hanya sekali.

Menurut Matai dkk. (2010) Traveling Salesman Problem (TSP) merupakan


bagaimana menemukan cara terbaik untuk mengunjungi semua kota dan kembali
ke titik awal yang meminimalkan biaya perjalanan (atau jarak perjalanan).
Traveling Salesman Problem (TSP) menentukan jarak terpendek dalam perjalanan
melewati titik-titik tertentu di mana satu titik harus dilalui satu kali dan hanya boleh
dilalui satu kali saja dan perjalanan harus berakhir dengan kembali ke titik pertama.
Dalam hal ini titik-titik tersebut merupakan kota-kota dalam suatu wilayah tertentu
(Hoffman, Padberg, & Rinaldi, 2013).

Aturan yang mengidentifikasi permasalahan dapat diselesaikan dengan model


Traveling Salesman Problem (TSP):

I. Perjalanan dimulai dan diakhiri di kota yang sama sebagai kota asal sales.
2. Seluruh kota harus dikunjungi tanpa satupun kota yang terlewatkan.
3. Sales tidak boleh kembali ke kota asal sebelum seluruh kota terkunjungi.

Model Matematika TSP (Taha, 2017)

Berlkut merupakan fungsi tujuan TSP:

Min Z =
Dengan batasan kendala:

69

SIP O
MODUL MATERI SIPO 2022
MAT ERİ

Keterangan:

xi] Ada tidaknya perjalanan dari titik i ke j dalam suatu rute

terdapat perjalanan, 0 tidak terdapat perjalanan)

Cij Jarak perjalanan dari titik i ke titikj

Klasifikasi Traveling Salesman Problem (TSP)

Menurut Ghiani dkk. (2004) Traveling Salesman Problem (TSP) diklasifikasikan


menjadi dua, yaitu Symmetric Traveling Salesman Problem (sTSP) dan
Asymmetric Traveling Salesman Problem (aTSP). sTSP cocok untuk transportasi
antar kota, sedangkan aTSP direkomendasikan untuk pengaturan perkotaan
dikarenakan jalur satu arah. Dalam penerapannya teknik solusi untuk aTSP dapat
diterapkan pada sTSP, namun pendekatan dianggap tidak efisien. Sehingga
biasanya sTSP dan aTSP dibedakan dalam penyelesaiannya. Berikut merupakan
pengertian dari sTSP dan aTSP:

Symmetric Traveling Salesman Problem (sTSP)


Symmetric Traveling Salesman Problem (sTSP) adalah penentuan rute
perjalanan denganjarak total atau biaya yang paling minimum dengan jarak
antar kota bersifat simetrik atau jalur pergi sama dengan jalur pulang.
Asymmetric Traveling Salesman Problem (aTSP)
Asymmetric Traveling Salesman Problem (aTSP), yaitu permasalahan
pencarian rute dengan jarak minimal untuk mengunjungi setiap kota. aTSP
merupakan variasi dari persoalan TSP yang memiliki perbedaan pada
matriks jarak antarkota, yaitu asimetris. Asimetris berarti jalur pergi tidak
sama dengan jalur pulang (jarak dari kota A ke kota B dapat berbeda dengan
jarak kota B ke kota A).

Permasalahan Traveling Salesman Problem (TSP)

Berikut merupakan contoh dari permasalahan traveling salesman problem:

Permasalahan rute bus sekolah. Mendapatkan pola pemberhentian bus


sehingga jumlah trayek dan total jarak yang ditempuh oleh bus dapat

70

SİPO
MODUL SİPO 2022
diminimalkan serta waktu yang dibutuhkan bus untuk
melintasi trayek tidak melebihi maksimum kebijakan yang diizinkan.
Masalah pengambilan pesanan di gudang terkait penanganan gudang
(Ratliff & Rosenthal, 1983). Menentukan rute terpendek untuk kendaraan
dengan waktu penjemputan pesanan minimum.

Pada (Singh & Chopra, 2012) membahas mengenai algoritma penyelesaian


permasalahan pada kasus TSP, seperti algoritma Nearest Neighbor, Brute Force,
Algoritma Djikstra, Bellman ford algorithm, Floyd Marshal, Jhonson Algorithm,
dan Ant Colony Optimization. Algoritma yang cocok untuk node yang relatif kecil
adalah Brute Force.

Algoritma Brute-Force

Algoritma Brute-Force menghitung dan membandingkan semua kemungkinan


permutasi rute atau jalur untuk menentukan solusi rute terpendek. Pada algoritma
ini akan dihitung jumlah total rute dan kemudian menggambar semua rute yang
memungkinkan serta akan dihitung jarak setiap rute dan dipilih yang paling
minimum.

Pada algoritma Brute-Force, untuk n kota yang harus dikunjungi maka


menghasilkan (n!) kombinasi kota yang kemudian dibandingkan jarak rute setiap
kombinasi. Dengan memakai algoritma ini, waktu komputasi yang dibutuhkan akan
bertambah seiring jumlah kota yang harus dikunjungi juga bertambah. Dalam
menyelesaikan TSP algoritma Brute-Force diyakini selalu mendapatkan solusi yang
paling optimal, namun memiliki kelemahan dalam hal kecepatan komputasi ketika
menemui banyak node yang harus dilalui. Sehingga dapat disimpulkan
permasalahan TSP dapat diselesaikan dengan algoritma Brute-Force jika jumlah
node atau kota tidak banyak.

Brute Force memiliki 3 kelebihan, yaitu:

l . Algoritma yang sederhana dan mudah dimengerti.


2. Algoritma yang cocok untuk beberapa masalah penting seperti pencarian,
pengurutan, pencocokan string, dan perkalian matriks.

MATE-RI

71

SİPO
MODUL MATERI SIPO 2022
3. Menghasilkan algoritma baku untuk kasus komputasi
seperti penjumlahan/perkalian N buah bilangan dan
mencari nilai minimum atau maksimum.

72

SİPO
MODUL SİPO 2022
O

73

SİPO
MODUL MATERI SIPO 2022
MODUL 5B
OPTIMASI STOKASTIK: KASUS RANTAI
MARKOV

TUJUAN PRAKTIKUM

I. Praktikan mampu memahami konsep rantai markov.


2. Praktikan mampu menyelesaikan permasalahan terkait rantai markov menggunakan
Microsoft Excel dan bahasa pemrograman Python.
REFERENSI
Ching, W. K., & Ng, M. K. (2006). Markov chains. Models, Algorithms and Applications.
Mulyono, S. (2007). Riset Operasi. Fakultas Ekonomi Universitas Indonesia.
Jakarta.
Taha, H. A. (2017). Operations Research: An Introduction Tenth Edition. England:
Pearson.
MIND MAP

74

S I P LABORATORY
MODUL SİPO 2022
O
MAT ERİ

DASAR TEORİ

Dalam kehidupan sehari-hari, tentunya kita akan dihadapi bagaimana memilih suatu
keputusan yang sudah kita tentukan dalam jangka panjang. Contoh masalah praktis
dalam kehidupan, yaitu adanya sebuah riset pemasaran yang menunjukkan bahwa
dalam sebuah kota hanya terdapat dua supermarket, yaitu Wellcome dan Park'n.
Kemudian riset tersebut menunjukkan bahwa konsumen Wellcome dapat beralih ke
Park'n untuk belanja berikutnya dengan probabilitas (u 0) dan konsumen dari Park
'n dapat beralih ke Wellcome untuk belanja berikutnya dengan kemungkinan (P O).
Hal ini yang akan menjadi penarik keputusan dari dua pertanyaan yang akan
menjadi pembuat keputusan. Oleh şebab itu, kita akan lihat bahwa masalah
pemasaran ini dapat dirumuskan dengan menggunakan model rantai markov (Ching
& Ng, 2006).

Pemrograman Dinamis Stokastik

Model stokastik merupakan model matematika dimana gejala-gejala dapat diukur


dengan derajat kepastian yang tidak stabil. Pada model stokastik disebut juga model
probabilistik peluang dari masing-masing kejadian benar-benar dihitung, menyusun
sebuah model stokastik cenderung lebih sulit dari model deterministik. Contoh
model stokastik adalah teori antrian dan teori permainan, dimana ini merupakan
pengembangan dari riset operasi modern. Permasalahan stokastik, dicirikan oleh
ketidakpastian nilai parameter-parameternya dan time-variant. Contoh penerapan
pemodelan stokastik adalah rantai markov dengan waktu diskrit, proses poisson,
rantai markov dengan waktu kontinu, dan lain-lain.

Rantai Markov

Rantai markov adalah teknik matematika yang biasa digunakan untuk melakukan
pemodelan (modelling) berbagai macam sistem dan proses bisnis. Analisis markov
adalah bentuk khusus dari model probabilistik yang lebih dikenal sebagai proses
stokastik. Teknik ini dapat digunakan untuk memperkirakan perubahan variabel
dinamis di masa mendatang ataş dasar perubahan dari variabel-variabel dinamis di
masa lalu. Teknik ini juga dapat digunakan untuk menganalisis peristiwa di masa

75

S I P LABORATORY
MODUL MATERI SIPO 2022

mendatang secara matematis. Rantai markov merupakan kumpulan variabel acak XI,
X2, ., Xn. Berikut merupakan penulisannya:

(Xtn X n Xtn—l = xn-l)

Penjelasan tentang rantai markov ini kemudian diuraikan pada gambar 7.I dimana
pergerakan sejumlah variabel di masa depan dapat diprediksi berdasarkan
pergerakan variabel tersebut di masa lalu. Kt4 dipengaruhi Oleh terjadinya Kt3, Kt3
dipengaruhi Oleh terjadinya Kt2, dan begitu seterusnya dimana perubahan ini
terjadi karena peran peluang transisi. Peristiwa Kt2 tidak akan memengaruhi
terjadinya
Kt4.

Probabilitas Probabilitas Probabilitas Transisional


Transisional Transisional

Gambar 7. I Peristiwa Rantai Markov

Peristiwa di atas adalah berantai dimana rantai markov akan menjelaskan


pergerakan beberapa variabel dalam suatu periode waktu di masa depan
berdasarkan pergerakan variabel tersebut di masa sekarang. Secara matematis dapat
dituliskan sebagai berikut:

76

SIPO
MODUL SİPO 2022
LABORA

77

S I P LABORATORY
MODUL MATERI SIPO 2022

Keterangan:

= Peluang kejadian saat t(j) P

— Probabilitas transisi

- Waktu ke-j
Matriks Probabilitas Transisi dan n-Step Probabilitas Transisi
Matriks probabilitas transisi merupakan suatu matriks yang berisi
probabilitasprobabilitas perpindahan (transisi) dari suatu perlakuan dalam suatu
sistem. Matriks probabilitas transisi dapat dituliskan sebagai berikut:

Matriks P tunggal mendefinisikan rantai markov, menyatakan bahwa semua


probabilitas transisi Pij tetap (stasioner) dan tidak bergantung dari waktu ke waktu.
Semua elemen yang terdapat pada matriks P bernilai tak negatif dan jumlah semua
elemen pada satu baris dalam matriks peluang transisi ini harus sama dengan I.

Probabilitas awal a(0) = {aj(0) } dimulai dari state j dan matriks transisi P dari rantai
markov. Markov dengan probabilitas mutlak a(n) = {aj(n)} berada pada state j
setelah n transisi (n > 0) dapat dihitung sebagai berikut:

78
IPO LABORATORY
MODUL MATERI SIPO 2022

Y
Matriks diketahui sebagai matriks transisi langkah ke-n. Dari perhitungan tersebut kita
mendapatkan bahwa:

Persamaan ini dikenal dengan nama Chapman-Kolmogorov.

Ketentuan Rantai Markov


Berłkut merupakan beberapa kondisi rantai markov:

l . Jumlah probabilitas transisi untuk keadaan awal sistem sama dengan satu.
2. Probabilitas ini berlaku untuk semua peserta dalam sistem.
3. Probabilitas transisi konstan sepanjang waktu.
4. Kondisi independen sepanjang waktu.

State Vector
State vector merupakan state yang terdapat dalam suatu rantai markov yang ditulis
dalam bentuk vektor. State vector untuk suatu pengamatan dalam rantai markov
dengan X(t) state adalah vektor baris x. Dapat ditulis dengan:

x = XI, x2, ., xi

Jika P adalah matrłks transisi rantai markov dan xn adalah state vector pada pengamatan ke-
n, maka:

x — pnx 0

Steady State
Mulyono (2007) mengemukakan bahwa proses markov akan mengarah pada kondisi steady
state. Steady state berarti setelah melalui suatu periode proses maka

79

SIP O LABORATORY
MODUL MATERI SIPO 2022

Y
peluang status akan selalu ada. Dalam rantai markov, probabilitas steady state didefinisikan
sebagai:

TTj — lima- ¯012


Probabilitas ini yang tidak bergantung pada {aj( 0)}, dapat ditentukan dari persamaan:

Apa yang dikatakan dalam persamaan TT = TIP adalah bahwa probabilitas 7T tetap
tidak berubah setelah transisi tambahan sehingga persamaan tersebut mewakili
distribusi steady state. Hasil dari probabilitas steady state adalah penentuan jumlah
transisi yang diharapkan sebelum sistem kembali ke state j untuk pertama kalinya.
Hal ini dikenal dengan the mean first return time atau the mean recurrence time dan
dihitung dalam rantai n-state dengan:

1
, j — 1,2,...,n

Penerapan Rantai Markov

I. Rantai Markov dalam Memperkirakan Cuaca


Perkiraan cuaca di suatu daerah dapat diramalkan dengan menggunakan rantai
markov. Pola cuaca yang akan tiba dapat diperkirakan dengan melihat kondisi
cuaca saat ini (kejadian pertama). Kemudian, berdasarkan kondisi cuaca hari
pertama, kita dapat memprediksi cuaca hari kedua dan seterusnya berdasarkan
probabilitas yang ada.

80
IPO LABORATORY
MODUL MATERI SIPO 2022

81

SIP O LABORATORY
MODUL MATERI SIPO 2022

2. Rantai Markov dalam Perpindahan Minat Customer


Rantai markov dapat digunakan untuk memprediksi peluang perpindahan
customer dalam pemilihan preferensi brand. Dari data penjualan yang sudah
ada, kita dapat melihat dan menemukan probabilitas kemungkinan customer
akan berpindah minat dari suatu brand ke brand Iain. Data ini dapat
dimanfaatkan untuk membantu perusahaan menentukan strategi pemasaran
yang harus dilakukan untuk periode selanjutnya.

3. Rantai Markov di Jaringan Internet


Rantai markov dapat dimanfaatkan untuk melihat aktivitas kunjungan
pengguna website di internet. Dengan mengamati kunjungan pengguna website
sebagai rantai markov, model markov dapat dibangun dan dicatat dalam file
log web. Rantai markov bersifat diskrit. Model rantai markov yang terbentuk
dapat digunakan untuk membuat suatu prediksi tautan untuk menentukan situs
atau laman yang paling sering dikunjungi sehingga dapat direkomendasikan
kepada pengunjung website agar kegiatan browsing dapat lebih efektif dan
efisien.

82

SIP O LABORATORY
MODUL MATERI SIPO 2022

MODUL 6A
PENGUJIAN HIPOTESIS

TUJUAN PRAKTIKUM

l . Praktikan mengetahui dan memahami perbedaan analisis univariat dan bivariat.


2. Praktikan mengetahui cara menguji dan memahami statistik paramterik.
3. Praktikan mengetahui dan memahami uji-uji yang digunakan dalam statistik
parametrik.
4. Praktikan mampu menyelesaikan contoh kasus terkait dengan statistik
parametrik.
REFERENSI
Irianto, A. (2006). Statistik: Konsep Dasar dan Aplikasinya. Jakarta: Kencana.

Kusuma, L. T., & Puspitas, D. (2016). Aplikasi Komputer dan Pengolahan Data:
Pengantar Statistika Industri. Malang: UB Press.

Santoso, S. (2010). Statistik Parametrik (Konsep dan Aplikasi dengan SPSS).


Jakarta: Elex Media Komputindo.

Sudjana. (1996). Metode Statistika Edisi Ke-6. Bandung: TARSITO.

MIND MAP

DASAR TEORI

83

SIP O LABORATORY
MODUL MATERI SIPO 2022

Statistika Industri merupakan salah satu applied statistics yang dikembangkan dari
teori probabilitas. 11mu ini mencakup aplikasi metode statistik untuk
menyelesaikan permasalahan di bidang industri. Proses pengolahan data dalam
Statistika berdasarkan parameternya dapat dibedakan menjadi dua jenis tipe
pengujian, yaitu statistik parametrik atau non-parametrik.

Statistik Parametrik
Statistik parametrik merupakan teknik statistik dengan cara pengumpulan,
pengolahan, dan penganalisisan terhadap data yang diperoleh untuk diambil suatu
kesimpulan dengan mempertimbangkanjenis sebaran atau distribusi data. Sampel
data pengujian statistik parametrik berasal dari populasi yang dapat dimodelkan
oleh distribusi probabilitas dengan parameter tetap. Ciri-ciri statistik parametrik,
yaitu:
I. Data berdistribusi normal.
2. Tipe data yang digunakan adalah data interval atau rasio.
3. Rata-rata (mean) digunakan sebagai parameter.

Berikut merupakan kelebihan dan kekurangan statistik parametrik:

• Kelebihan
1. Syarat-syarat parameter dari suatu populasi yang menjadi sampel biasanya
tidak diuji dan dianggap memenuhi syarat.
2. Observasi bebas satu sama lain dan ditarik dari populasi yang berdistribusi
normal serta memiliki varian yang homogen.

• Kekurangan
Populasi harus memiliki varian yang sama.
2. Variabel yang diteliti harus dapat diukur, setidaknya dalam skala interval.
3. Dalam analisis varian, ditambahkan persyaratan rata-rata dari populasi
normal dan bervarian sama serta harus merupakan kombinasi linier dari
efek-efek yang ditimbulkan.

84

SIP O LABORATORY
MODUL MATERI SIPO 2022

Statistik Non-Parametrik
Statistik non-parametrik berhubungan dengan statistika inferensia, yaitu teknik
pengambilan keputusan atas masalah tertentu yang tidak membahas
parameterparameter populasi. Teknik ini tidak mengasumsikan mengenai sebaran
populasi yang mendasarinya. Ciri-ciri statistik non-parameterik antara lain:
l . Tipe data yang digunakan adalah skala nominal atau ordinal.
2. Data populasi berdistribusi tidak normal.

Berikut merupakan kelebihan dan kekurangan statistik non-parametrik:

• Kelebihan
1. Tidak membutuhkan asumsi normalitas.
2. Walaupun tidak terikat pada distribusi normal, namun dapat digunakan pada
populasi berdistribusi normal.

• Kekurangan
1. Statistik non-parametrik terkadang mengabaikan beberapa informasi tertentu.
2. Hasil statistik non-parametrik tidak dapat diekstrapolasikan ke populasi studi
seperti pada statistik parametrik. Hal ini dikarenakan statistik nonparametrik
mendekati eksperimen dengan sampel kecil.

Pengelompokan uji statistik berdasarkan teknik statistik parametrik dan nonparametrik


dalam Statistika Industri digambarkan pada bagan berikut:

85

SİPO LABORATORY
MODUL MATERI SIPO 2022

Uji Tanda

Uji Kruskal
Wallis

Korelasi
Spearman Rank

Gambar 1. Pengelompokan Statistika Industri

Pengujian Hipotesis
Hipotesis merupakan asumsi atau dugaan yang dirumuskan untuk menjelaskan
mengenai sesuatu hal atau kondisi sehingga diperlukan adanya pengujian. Oleh
karena itu, pengujian hipotesis adalah suatu prosedur yang didasarkan pada bukti
sampel yang digunakan untuk menentukan apakah hipotesis merupakan suatu
pernyataan atau dugaan yang wajar dan oleh karenanya tidak ditolak, atau hipotesis

86
IPO LABORATORY
MODUL MATERI SIPO 2022

tersebut tidak wajar dan oleh karena itu harus ditolak. Pada pengujian hipotesis terdapat dua
rumusan hipotesis, yaitu:
Hipotesis nol (Ho)
Hipotesis ini sebagai hipotesis awal yang diharapkan akan ditolak dan
sering menyatakan kondisi yang menjadi dasar perbandingan, serta
menyatakan satu pernyataan mengenai nilai parameter populasi. Ho dalam
persamaan matematis dinyatakan dengan bentuk persamaan ('=').
2. Hipotesis alternatif (Hl)
Penolakan Ho mengakibatkan terjadinya penerimaan hipotesis alternatif,
yaitu suatu pernyataan yang diterima jika data sampel memberikan cukup
bukti bahwa hipotesis nol adalah salah. Hl dalam persamaan matematis
dinyatakan dengan bentuk pertidaksamaan ('<' , '>' , atau

Untuk melakukan pengujian hipotesis, dilakukan penelitian dari sampel acak yang
diambil, lalu nilai-nilai statistik dihitung dan dibandingkan melalui kriteria tertentu.
Adapun prosedur yang digunakan dalam melakukan uji hipotesis adalah sebagai
berikut:
1. Merumuskan hipotesis
Hipotesis nol (Ho) dan hipotesis alternatif (Hl).
2. Menentukan taraf nyata/signifikansi penelitian (u)
Probabilitas penolakan hipotesis.
3. Menentukan uji statistik
UJi yang digunakan berupa uji Z, uji T, uji F, dsb.
4. Menentukan daerah keputusan
Daerah yang menjadi penentuan Ho akan ditolak atau tidak ditolak.
5. Mengambil keputusan
Keputusan yang menentukan Ho ditolak atau tidak ditolak.

Uji Kenormalan
Uji kenormalan digunakan untuk menguji apakah sampel suatu variabel mengikuti
distribusi normal atau tidak. Salah satu uji yang dapat digunakan adalah Uji
Kolmogorov-Smirnov.
87

SİPO LABORATORY
MODUL MATERI SIPO 2022
Ho: Sampel berasal dari distribusi normal.
Perumusan Hipotesis
Hl: Sampel tidak berasal dari distribusi normal.

Kriteria Uji
Jika signifikansi penelitian a, maka tolak Ho.
Jika signifikansi penelitian > a, maka tidak tolak Ho.

A. Analisis Univariat
Analisis univariat merupakan pengukuran satu variabel terhadap sejumlah n
sampel atau pengukuran beberapa variabel dengan analisis masing-masing.
Contoh analisis univariat, yaitu uji T, uji F (ANOVA), koefisien korelasi, dan
uji Z. Uji yang akan dibahas pada modul ini adalah uji T, yaitu untuk mengetahui
apakah terdapat perbedaan yang signifikan antara rata-rata hitung beberapa
kelompok data.
Lebih lanjutnya, uji T merupakan jenis pengujian statistik untuk mengetahui
apakah terdapat perbedaan dari nilai yang diperkirakan dengan nilai hasil
perhitungan statistik. Ciri utama dari uji ini adalah jumlah sampel relatifkecil (n
< 30). Asumsi yang harus terpenuhi untuk melakukan uji T, yaitu:
l. Varian populasi yang diuji adalah sama.
2. Sampel yang diambil berdistribusi normal.

Uji T dibagi menjadi tiga jenis, yaitu.


a. One Sample T-Test
One sample t-test digunakan untuk menguji rata-rata dari sampel tunggal
dengan tujuan mengetahui perbedaan rata-rata sampel dengan nilai rata-rata
populasi yang diketahui. Pada uji ini, ukuran sampel harus lebih kecil dari
30 (n < 30).
Perumusan Hipotesis
Ho: Tidak terdapat perbedaan yang signifikan antara rata-rata
sampel dengan populasi.

Hl: Terdapat perbedaan yang signifikan antara rata-rata sampel


dengan populasi.

88

SİPO
MODUL MATERI SIPO 2022
Y
Kriteria Uji
Jika signifikansi penelitian a, maka tolak Ho.
Jika signifikansi penelitian > a, maka tidak tolak Ho.

b. Independent Sample TTest


Independent sample t-test merupakan pengujian dua sampel yang bertujuan
membandingkan rata-rata dua grup yang tidak saling berhubungan satu
dengan yang lain, apakah kedua grup tersebut memiliki nilai rata-rata yang
sama atau tidak. Perumusan Hipotesis

Ho: Tidak terdapat perbedaan nilai rata-rata antara kedua


sampel.

HI: Terdapat perbedaan nilai rata-rata antara kedua sampel.


Kriteria Uji

Jika signifikansi penelitian s a, maka tolak Ho.


Jika signifikansi penelitian > a, maka tidak tolak Ho.

c. Paired Sample T-
Test
Paired sample t-test digunakan untuk menguji sampel yang berpasangan
(subjek yang sama), namun mengalami dua perlakuan atau pengukuran yang
berbeda. Ciri dari sampel berpasangan, yaitu subjeknya sama dan diberikan
dua perlakuan. Perumusan Hipotesis

Ho: Nilai rata-rata dari dua sampel berpasangan adalah sama.

1--11: Nilai rata-rata dari dua sampel berpasangan adalah tidak


sama.
Kriteria Uji
Jika signifikansi penelitian S U, maka tolak Ho.

Jika signifikansi penelitian > U, maka tidak tolak Ho.

89

SİPO
MODUL SİPO 2022
MAT ERİ

B. Analisis Bivariat
Analisis bivariat merupakan teknik statistik yang digunakan untuk menganalisis
perbedaan atau hubungan dari dua variabel. Dua variabel tersebut terdiri dari
satu variabel independen dan satu variabel dependen. Variabel independen
(variabel bebas) adalah variabel yang memengaruhi atau memberikan pengaruh
pada variabel dependen (variabel terikat). Analisis bivariat ini biasanya
dilakukan untuk mengetahui apakah satu variabel berkaitan dengan variabel
lainnya. Maka, kegunaan dari analisis bivariat adalah untuk mengukur kekuatan
hubungan antara dua variabel atau lebih. Berikut merupakan contoh dari
pengukuran dua variabel, yaitu:
l. Kecepatan membaca dengan ketepatan bacaan.
2. Kecepatan menulis dengan ketepatan ejaan.

Uji Analisis Bivariat


Pada analisis bivariat ada beberapa uji yang dapat digunakan, seperti korelasi pearson
dan regresi linier.
l. Korelasi Pearson
Korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik
pengukuran asosiasi atau hubungan. Pengukuran asosiasi merupakan istilah
umum yang mengacu pada sekelompok teknik dalam analisis bivariat yang
digunakan untuk mengukur kekuatan hubungan antara dua variabel
(Sarwono, 2006). Korelasi mengukur kekuatan hubungan antara dua peubah
melalui sebuah bilangan yang disebut koefisien korelasi dan menentukan
arah yang dinyatakan dalam bentuk hubungan positif atau negatif. Berikut
kriteria kekuatan dan hubungan antara dua variabel menurut (Sarwono,
2006).
Tabel l. Kriteria Kekuatan Hubungan antara Dua Variabel (Sarwono, 2006)
Nilai Korelasi Keterangan
Tidak ada korelasi antar varıabel
»o - 0.25 Korelasi sangat lemah
»0.25 - 0.5 Korelasi cukup
»o.5 - 0.75 Korelasi kuat

90

SİPO
MODUL MATERI SIPO 2022
>0.75 - 0.99 Korelasi sangat kuat
Korelasi Sempurna
2. Korelasi Linier (Pearson Product Moment)
Uji ini untuk mengetahui apakah bentuk hubungan antara dua variabel linier
atau tidak, untuk melihat hal tersebut bisa menggunakan scatter diagram
dengan memplotkan data ke dalam grafik. Pada scatter diagram, terdapat tiga
kriteria untuk menyatakan korelasi linier, yaitu:
a. Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan
kemiringan positif, maka kedua peubah dinyatakan memiliki korelasi
positif.
b. Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan
kemiringan negatif, maka peubah dinyatakan memiliki korelasi negatif.
c. Bila titik-titik memencar atau menjauh dari suatu garis lurus mengikuti
sebuah pola acak atau bahkan tidak ada pola, maka kedua peubah
dinyatakan memiliki korelasi nol atau tidak ada hubungan linier.

Koefisien korelasi pada korelasi pearson product moment dapat dihitung dengan
menggunakan rumus:

Keterangan:
n = Jumlah data
Xi = Data variabel bebas ke-i
Yi = Data variabel terikat ke-i

3. Korelasi Parsial
Korelasi parsial (partial correlation) merupakan perluasan dari korelasi
sederhana atau korelasi pearson. Jika korelasi sederhana melibatkan satu
variabel terikat (dependen) dan satu variabel bebas (independen), maka

91

SİPO
MODUL SİPO 2022
O

92

SİPO
MODUL MATERI SIPO 2022

korelasi parsial melibatkan lebih dari satu variabel bebas dan satu variabel
terikat. Variabel bebas dari korelasi parsial terbagi atas dua penggunaan,
yaitu satu variabel bebas sebagai yang memiliki hubungan dengan variabel
terikat dan variabel bebas lainnya sebagai variabel kontrol dimana variabel
ini diduga mempengaruhi hubungan antara satu variabel bebas dan terikat.
Oleh karena itu, analisis korelasi parsial merupakan metode yang digunakan
untuk mengidentifikasi kuat atau lemahnya hubungan antar variabel bebas
dan terikat, dimana variabel lainnya dikontrol atau dianggap berpengaruh
(Irianto, 2006).

Untuk menghitung koefisien korelasi dengan korelasi parsial, dilakukan terlebih


dahulu perhitungan korelasi tunggal dengan rumus sebagai berikut:

Keterangan:
n = Jumlah data
X = Data variabel bebas
Y Data variabel terikat

Untuk menghitung koefisien korelasi parsial dapat digunakan rumus berikut:


ry.x1—x2 =

Keterangan:
ryx, = korelasi antara variabel terikat Y dengan variabel bebas XI
= korelasi antara variabel terikat Y dengan variabel bebas X2
rXIX2 = korelasi antara variabel bebas XI dengan variabel bebas X2

Analisis Regresi
Analisis regresi merupakan suatu teknik untuk membangun suatu persamaan yang
menghubungkan antara variabel terikat/dependen (Y) dengan variabel

SIPO
MODUL MATERI SIPO 2022

bebas/independen (X) dan digunakan juga untuk menentukan nilai ramalan atau
dugaannya. Persamaan regresi adalah persamaan yang menyatakan bentuk hubungan
antara variabel terikat (Y) dengan variabel bebas (X). Selain itu, persamaan regresi juga
merupakan suatu persamaan matematis yang mendefinisikan hubungan antara dua
variabel. Adapun persamaan regresi yang digunakan pada umumnya adalah:

y = a + bx

Keterangan:
y = Nilai dugaan atau ramalan dari variabel Y berdasarkan nilai variabel X yang diketahui,
bisa disebut Y topi (P).
a Intercept, yaitu titik potong garis dengan sumbu Y atau nilai perkiraan bagi Y
pada saat nilai X sama dengan nol.
b — Slope (kemiringan garis), yaitu perubahan rata-rata untuk setiap unit
perubahan pada variabel X.

Pada analisis regresi, dipelajari hubungan yang ada di antara variabel sehingga
dari hubungan yang diperoleh dapat menaksir variabel yang satu apabila harga
variabel lainnya diketahui. Berikut merupakan persamaan untuk mencari nilai a
dan b, yaitu.

Keterangan:
Yl Nilai variabel terikat Y ke-i a
= Intercept b = Slope
Xi = Nilai variabel bebas X ke-i
n = Jumlah sampel
Dalam regresi linier, terdapat beberapa asumsi yang harus dipenuhi, yaitu:
. Uji cek outlier

94

SİPO
MODUL MATERI SIPO 2022

Untuk membuktikan ada tidaknya outlier/pencilan, dilihat dari nilai


standar residual. Jika nilai standar residual berada antara -3 sampai 3,
maka tidak ada outlier/pencilan pada data tersebut.
2. Uji normalitas
Pengujian terhadap residual, apakah residual terdistribusi secara acak. Uji
normalitas dapat diuji dengan scatter plot residual dan uji Kolmogorov
Smirnov.
3. Uji heteroskedastisitas
Untuk mengetahui apakah pada model regresi terjadi ketidaksamaan
variansi residual. Jika terjadi kesamaan variansi residual dinamakan
homoskedastisitas. Model regresi yang baik tidak boleh terjadi
heteroskedastisitas. Untuk melihat model regresi terkena heteroskedastisitas
atau tidak, dapat dilihat dengan melihat scatter plot nilai prediksi dengan
residual.
a. Apabila terjadi titik-titik membentuk suatu pola yang teratur (melebar
kemudian menyempit atau bergelombang), maka terjadi
heteroskedastisitas.
b. Apabila tidak ada pola yang teratur dengan titik-titik yang menyebar
sepanjang sumbu Y positif dan Y negatif, maka dikatakan tidak terjadi
heteroskedastisitas.
Heteroskedastisitas juga bisa dilihat dari nilai residual pada scatter plot.
Jika nilai residual berada diantara -I .96 dan 1.96 maka tidak terjadi
heteroskedastisitas.

Adapun uji yang perlu dilakukan untuk membuktikan bahwa model regresi yang ada
sudah baik, yaitu:
1. Uji T
Untuk menguji signifikansi koefisien regresi dan untuk mengetahui pengaruh
koefisien regresi terhadap variabel independen.

95

SİPO
MODUL MATERI SIPO 2022

Perumusan Hipotesis
Ho: Koefisien regresi tidak signifikan terhadap variabel
independen.
Hl: Koefisien regresi signifikan terhadap variabel independen.

Kriteria Uji
Jika t penelitian > t tabel, maka tolak Ho.
Jika t penelitian < t tabel, maka tidak tolak Ho.

Berikut merupakan persamaan dari uji T, yaitu:

Keterangan:
b = Koefisien regresi
Sb = Simpangan baku koefisien regresi b
Bo = Mewakili nilai B tertentu sesuai hipotesisnya

2. Uji F (ANOVA)
Uji kelayakan model, apakah model regresi linier yang diajukan adalah
model yang layak untuk menguji pengaruh variabel independen terhadap
variabel dependen secara bersama-sama (simultan).
Perumusan Hipotesis Ho: Model regresi yang ada tidak tepat bila digunakan.
Hl: Model regresi yang ada tepat bila digunakan.

96

SİPO
MODUL MATERI SIPO 2022

Kriteria Uji
Jika F penelitian > F tabel, maka Ho ditolak.
Jika F penelitian < F tabel, maka Ho tidak ditolak.

Berikut merupakan persamaan Uji F (ANOVA), yaitu:

Keterangan:
b = Slope x = Rata-rata variabel
independen x Variabel
independen
SC Simpangan baku

3. Perhitungan koefisien determinasi


Menjelaskan seberapa jauh persentase variabel-variabel independen dapat
menjelaskan variabel dependen. Untuk melihat nilai koefisien determinasi,
maka dapat melihat nilai R2

97

SİPO
MODUL MATERI SIPO 2022

MODUL 6B
UJI ANOVA

TUJUAN PRAKTIKUM
l . Praktikan memahami konsep uji statistik dengan menggunakan ANOVA.
2. Praktikan mengetahui dan memahami perbedaan One Way ANOVA dan Two
way ANOVA.

3. Praktikan mampu menyelesaikan permasalahan terkait dengan uji one way


ANOVA menggunakan software R, IBM spss, dan Microsoft Excel.

REFRENSI
Ghozali, Imam. 2009. Aplikasi Analisis Multivariate dengan Program SPSS.
Semarang: Badan Penerbit UNDIP.
Mann, Prem S. 2010. Introductory Statistics Seventh Edition. USA: John Wiley &
Sons, Inc.
Walpole, Ronald E. 1995. Pengantar Statistika Edisi ke-3. Penerbit: PT. Gramedia
Pustaka Utama. Jakarta.

MIND MAP

98

S I P LABORATORY
MODUL MATERI SIPO 2022

S
DASAR TEORI
Pengertian ANOVA (Analysis of Variance)
Analisis varian (analysis of variance) atau ANOVA merupakan suatu prosedur yang
digunakan untuk menguji hipotesis nol tentang tiga atau lebih rata-rata populasi
yang sama (Mann, 2010). ANOVA adalah metode analisis statistika yang termasuk
ke dalam cabang statistika inferensia. Metode ini dikenal pula dengan sebutan
analisis ragam, sidik ragam, dan analisis variansi.
ANOVA digunakan untuk membandingkan rata-rata populasi bukan ragam
populasi dengan cara membandingkan variansi dari rata-rata lebih dari dua
kelompok data. Jenis data yang digunakan untuk variabel bebasnya (independen)
adalah nominal dan ordinal. Sedangkan untuk variabel terikatnya (dependen)
adalah data interval atau rasio. ANOVA lebih akurat digunakan untuk sejumlah
sampel yang sama pada setiap kelompoknya.
Asumsi Dasar Pengujian ANOVA
Adapun asumsi dasar yang harus terpenuhi dalam ANOVA (Ghozali, 2009) adalah:

a. Kesamaaan variansi (homogeneity ofvariance)


Asumsi lain yang mendasari analisis ragam yaitu kesamaan variansi residual
yang dinamakan homokedastisitas. Data yang ragamnya homogen akan
menyebar secara normal, maka variabel dependen memiliki varian yang sama
dalam setiap kategori variabel independen. Apabila banyaknya sampel pada
setiap kelompok sama maka kesamaan variansinya dapat diabaikan.

b. Kenormalan (normality)
Pengujian variabel pada uji varian harus mengikuti distribusi normal. Dalam
hal ini, variabel dependen terdistribusi normal dalam setiap kategori variabel
independen. Data berdistribusi normal dapat dipenuhi dengan cara
memperbanyak jumlah sampel dalam kelompok.

c. Pengamatan bebas (random sampling)


Pengambilan sampel pada setiap kelompok harus dilakukan secara acak
(random), sehingga nilai residual dan data setiap pengamatan satuan percobaan
saling bebas.
99
Variabilitas dan Derajat Kebebasan dalam Pengujian ANOVA

SİPO LABORATORY
MODUL MATERI SIPO 2022

a. Variabilitas
Terdapat tiga bagian pengukuran variabilitas pada data yang akan dianalisis
menggunakan ANOVA, yaitu:

1) Variabilitas antar kelompok (between treatments variability)


Variabilitas antar kelompok adalah variansi mean kelompok sampel
terhadap rata-rata total, sehingga variansi Iebih terpengaruh oleh adanya
perbedaan perlakuan antar kelompok, atau Jumlah Kuadrat antar
kelompok (JKA).
Rumusnya adalah:

JKA n [ye-
atau

JKA
Keterangan:

k = banyaknya kelompok
T = total X masing-masing kelompok
G = total X keseluruhan n = jumlah sampel
masing-masing kelompok
N = jumlah sampel keseluruhan

2) Variabilitas dalam kelompok (within treatments variability)


Variabilitas dalam kelompok adalah variansi yang ada dalam
masingmasing kelompok. Banyaknya variansi akan tergantung pada
banyaknya kelompok. Variansi tidak terpengaruh oleh perbedaan
perlakuan antar kelompok, atau Jumlah Kuadrat Dalam (JKD). Rumusnya
adalah:

JKD = JKSMK
Keterangan:
JKSMK merupakan Jarak kuadrat simpangan masing-masing kelompok.

100

SİPO LABORATORY
MODUL MATERI SIPO 2022

3) Jumlah kuadrat penyimpangan total (total sum ofsquares)


Jumlah kuadrat penyimpangan total adalah jumlah kuadrat selisih antara
skor individual dengan mean totalnya, atau variabilitas dalam kelompok
merupakan variasi yang ada dalam masing- masing kelompok. Banyaknya
variasi akan tergantung pada banyaknya kelompok, dan variasi ini tidak
terpengaruh oleh perbedaan perlakuan antar kelompok. Rumusnya adalah:

62
JKT=EX2
atau:

JKT - JKA + JKD

Derajat Kebebasan (degrees offreedom) dalam ANOVA dan Pengujiannya Derajat


kebebasan (degrees of freedom) dalam ANOVA akan sebanyak
variabilitasnya. Oleh karena itu, terdapat tiga macam derajat kebebasan, yaitu:
1) Derajat kebebasan untuk variabel antar kelompok atau JKT sebesar n-l.
2) Derajat kebebasan untuk variabel dalam kelompok atau JKD sebesar E(n-l)
yaitu jumlah dari derajat kebebasan masing-masing jumlah kuadrat
perkelompok. Disamping itu dk dalam kelompok dapat pula dicari dengan n-
k.
Keterangan:
k = banyaknya kelompok n =
jumlah sampel keseluruhan
3) Derajat kebebasan untuk variabel antar kelompok atau JKA sebesar k-1, hal ini
disebabkan karena derajat kebebasan disini terikat dengan banyaknya
kelompok seperti halnya variabel antar kelompok.

101

SİPO LABORATORY
MODUL MATERI SIPO 2022

Kriteria Pengujian ANOVA


ANOVA dapat digolongkan ke dalam dua kriteria yaitu:
1) Klasifikasi satu arah (One Way ANOVA)
ANOVA klasifikasi I arah merupakan ANOVA yang didasarkan pada
pengamatan I kriteria atau satu faktor yang menimbulkan variasi. ANOVA satu
arah (one way ANOVA) digunakan apabila yang akan dianalisis terdiri dari
satu variabel terikat dan satu variabel bebas. Interaksi suatu kebersamaan antar
faktor dalam mempengaruhi variabel bebas, dengan sendirinya pengaruh
faktor-faktor secara mandiri telah dihilangkan. Jika terdapat interaksi berarti
efek faktor satu terhadap variabel terikatakan mempunyai garis yang tidak
sejajar dengan efek faktor Iain terhadap variabel terikat sejajar (saling
berpotongan), maka antara faktor tidak mempunyai interaksi.
Tabel 5. 1 Langkah Pengujian One Way ANOVA
Langkah Pengujian Rumus

1. Menentukan formulasi hipotesis

2. Menentukan taraf signifikansi % Ftabel

3. Menentukan kriteria pengujian Ho ditolakjika Fhi tung tabel

4. Melakukan Uji Statistik

5. Analisis Kesimpulan

Dekomposisi variansi dapat dijabarkan:

SST = SSK + SSE

Adapun dalam pengujian One Way ANOVA, dipergunakan rumus hitung


sebagai berikut:

102

SİPO LABORATORY
MODUL MATERI SIPO 2022
Tabel 5. 2 Rumus Hitung One Way ANOVA
Sumber Jumlah Derajat Kuadrat hitung
Keragaman Kuadrat Bebas Tengah

Perlakuan SSK SSK MSK


MSK MSE
(k—l)
SSE (a) k(n SSE
Error
(a) MSE =
k(n—l)
(b) MSE =
-k
Total SST (a) k(n- 1) Keterangan:

(a) Uukuran sampel sama


(b) Ukuran sampel berbeda

Sumber: Walpole, Ronald E. (1995)


Keterangan:
SSK = Jumlah kuadrat perlakuan
SSE = Jumlah kuadrat error
SST = Jumlah kuadrat total
2) Klasifikasi dua arah (Two Way ANOVA)
ANOVA klasifikasi dua arah merupakan ANOVA yang didasarkan pada
pengamatan dua kriteria atau dua faktor yang menimbulkan variasi. Two Way
ANOVA digunakan bila sumber keragaman yang terjadi tidak hanya karena
satu faktor (perlakuan). Faktor Iain yang mungkin menjadi sumber keragaman
respon juga harus diperhatikan. Faktor lam ini bisa perlakuan Iain atau faktor
yang sudah terkondisi. Pertimbangan memasukkan faktor kedua sebagai
sumber keragaman ini perlu bila faktor itu dikelompokkan (blok), sehingga
keragaman antar kelompok sangat besar, tetapi kecil dalam kelompok sendiri.
Tujuan dan pengujian Two Way ANOVA adalah untuk mengetahui apakah ada
pengaruh dari berbagai kriteria yang diuji terhadap hasil yang diinginkan.
Berikut ini adalah langkah pengujian Two Way ANOVA:

103

SIPO
MODUL SİPO 2022
LABORA TORY
Tabel 5. 3 Langkah Pengujian Two way ANOVA
No Langkah Pengujian Rumus

I. Menentukan formulasi
hipotesis
2. Menentukan taraf signifikansi (1 % —-5 Fa (VI, 122). Dimana:

VI = (n — l)(k — 1)

3. Menentukan kriteria pengujian Ho ditolakjika (VI, 122)] >


Ftabel
4. Melakukan Uji Statistik

5. Analisis Kesimpulan

Dekomposisi varians dapat dijabarkan:

SST = SSB + SSK + SSE

Adapun dalam pengujian Two Way ANOVA, dipergunakan rumus hitung sebagai
berikut:
Tabel 5. 4 Rumus Hitung Two Way ANOVA
Sumber Jumlah Derajat Kuadrat Tengah hitung
Keragaman Kuadrat Bebas

Nilai Tengah SSR SSK


Baris
MSK =
k
-l
Nilai Tengah SSB SSB
Kolom MSB = n MSE

—l

104

SİPO
MODUL MATERI SIPO 2022
Galat (Error) SSE MSE = s 2

MAT ERİ
SSE MSE

Total SST İlk —


1
Sumber: Walpole, Ronald E. (1995)
Keterangan:
SSK Jumlah Kuadrat Kolom

SSB Jumlah Kuadrat Baris

SSE Jumlah Kuadrat Galat


SST Jumıah Kuadrat Total

SSB SSK
Namun dalam modül ini, kriteria pengujian ANOVA yang akan dibahas yaitu
ANOVA klasifikasi ı aralı (One way ANOVA).
Analisis Post Hoc
Analisis setelah ANOVA atau pasca ANOVA (Post Hoc) dilakukan apabila
hipotesis nol ditolak. Post Hoc dilakukan untuk mengetahui kelompok mana yang
berbeda dan yang tidak berbeda. Hal ini ditunjukkan oleh F hitung yang
menunjukkan adanya perbedaan. Apabila F hitung menunjukkan tidak ada
perbedaan, tentü analisis sesudah ANOVA tidak perlu dilakukan. Ada beberapa
teknik analisis yang dapat digunakan untuk melakukan analisis sesudah ANOVA,
yaitu:
a. LSD (Least Significant Difference) dilakukan untuk melakukan uji T diantara
seluruh pasangan kelompok mean. Uji ini sangat baik apabila pengujian mean yang
akan dibandingkan sebelumnya telah direncanakan.

105

SİPO
MODUL SİPO 2022
b. Tukey atau HSD (Honestly Significant Difference) uji ini
disebut uji beda nyata yang merupakan perbaikan dari LSD
karena uji ini untuk membandingkan mean tanpa perencanaan terlebih dahulu.
c. Tukey 's-b, merupakan alternatif dari uji Tukey.
d. Duncan digunakan untuk menguji perbedaan diantara semua pasangan perlakuan
yang ada dari percobaan tersebut serta masih dapat mempertahankan tingkat
signifikansi yang ditetapkan.
e. SNK (Student Newman Keuls) merupakan pengembangan dari LSD dan
Duncan.
f. Dunnet digunakan untuk membandingkan mean dari semua perlakuan dengan mean
perlakuan kontrol.
g. Scheffe digunakan untuk pembanding yang tidak perlu orthogonal.

106

SİPO
MODUL MATERI SIPO 2022
O

107

SİPO

Anda mungkin juga menyukai