Week ke - 2
LO1: Explain the data and statistics (data, variables, sample, population)
LO2: Calculate descriptive measures, probability, discrete and continuous distribution and
sampling distribution
OUTLINE MATERI :
1. Mengatur dan Menyajikan Variabel Kategori
• Tabel Frekuensi (Summary Table)
• Percent Frequency Distribution
• Diagram Batang dan Pie Chart
• Tabel Kontingensi
• Memvisualisasikan Dua Variabel Kategori
Seperti dijelaskan sebelumnya, variabel dapat berupa variabel numerik (kuantitatif) dan
variabel kategori (kualitatif). Dan telah dijelaskan juga bahwa statistik deskriptif berhubungan
dengan cara menyajikan data dengan cara membuat tabel, distribusi frekuensi, dan diagram/chart
atau grafik, dan menghitung rata-rata hitung, median, modus, standar deviasi, dan persen atau
proporsi. Pada sesi ini kita akan mengaplikasikan statistik deskripitif untuk mengatur dan
menyajikan variabel kategori.
Salah satu cara untuk menyajikan dan meringkas data kategori (kualitatitif) adalah dengan
membuat Tabel Ringkasan atau disebut juga Tabel Frekuensi.
TMajor Frekuensi
A = Accounting 20
C = Computer Information Systems 15
M = Marketing 5
Total 40
Dari Tabel di atas, kita dapat menyimpulkan bahwa 20 mahasiswa jurusan bisnis mempunyai
major Accounting, 15 mahasiswa mempunyai major Computer Information System dan 5
mahasiswa mempunyai major marketing.
Untuk mendapatkan informasi yang lebih general, langkah selanjutnya adalah menghitung:
Frekuensi Relatif = Frekuensi / Total Frekuensi, dan
Persen Frekuensi= Frekuensi Relatif x 100%
Dari Tabel di atas, kita dapat menyimpulkan bahwa 50% mahasiswa jurusan bisnis mempunyai
major Accounting, 37.5% mempunyai major Computer Information System dan 12.5%
mempunyai major marketing.
Tabel Kontingensi
Tabel kontingensi atau disebut juga Cross Tabulasi digunakan untuk meringkas 2 atau lebih
variabel kategori (variabel kualitatif) dalam satu tabel sehingga dapat dianalisis hubungan antara
variabel-variabel tersebut.
Untuk membuat table kontingensi tuliskan kategori dari variabel Jenis Kelamin (L dan P) dan
kategori variabel Major (A,C dan M) pada masing-masing pada kolom atau baris Tabel dan
hitung frekuensi dari setiap box (L-A, L-C, L-M, P-A, P-C dan P-M) dalam tabel sebagai
berikut:
Jenis Major
kelamin A C M Total
L 6 4 1 11
P 4 3 2 9
Total 10 7 3 20
Dari Tabel Kontingensi tersebut kita dapat menyimpulkan bahwa dari 20 sampel :
Jumlah mahasiswa laki-laki ada 11 orang dan perempuan ada 9 orang, jumlah mahasiswa dengan
major Accounting ada 10 orang, dengan major Computer Information Systems ada 7 orang dan
Marketing ada 3 orang. Jumlah mahasiswa dengan major Accounting yang laki-laki ada 6 orang
dan perempuan ada 4 orang. Jumlah mahasiswa dengan major Computer Information Systems
yang laki-laki ada 4 orang dan perempuan ada 3 orang. Jumlah mahasiswa dengan major
Marketing yang laki-laki ada 1 orang dan perempuan ada 2 orang.
Tabel kontingensi dapat juga disajikan dalam bentuk persentase terhadap total, persentase
terhadap total kolom, persentase terhadap total baris seperti terlihat pada Tabel-tabel di bawah
ini. Berikut adalah contoh tabel kontingensi dalam persentase terhadap total:
Jenis Major
kelamin A C M Total
L 30% 20% 5% 55%
P 20% 15% 10% 45%
Total 50% 35% 15% 100%
Berikut adalah contoh tabel kontingensi dalam persentase terhadap total baris:
Jenis Major
kelamin A C M Total
L 54.5% 36.4% 9.1% 100%
P 44.5% 33.3% 22.2% 100%
Dari Tabel di atas kita dapat menyimpulkan bahwa dari semua mahasiswa jurusan bisnis berjenis
kelamin laki-laki, yang memilih major Accounting ada 54.5% , yang memilih major Computer
Information Systems ada 36.4% dan yang memilih major Marketing yang laki-laki ada 9.1%.
Dari semua mahasiswa jurusan bisnis berjenis kelamin perempuan, yang memilih major
Accounting ada 44.5%, yang memilih major Computer Information Systems ada 33.3% dan yang
memilih major Marketing ada 22.2%.
Berikut adalah contoh tabel kontingensi dalam persentase terhadap total kolom:
Jenis Major
kelamin A C M
L 60.0% 57.1% 33.3%
P 40.0% 42.9% 66.7%
Total 100% 100% 100%
Dari Tabel di atas, kita dapat menyimpulkan bahwa dari kita dapat menyimpulkan bahwa dari
semua mahasiswa yang memilih major Accounting proporsi yang berjenis kelamin laki-laki ada
60% dan perempuan ada 40%, dari semua mahasiswa yang memilih major Computer
Information Systems proporsi yang berjenis kelamin laki-laki ada 57.1% dan perempuan ada
42.9%, dan dari semua mahasiswa yang memilih major Marketing proporsi yang berjenis
kelamin laki-laki ada 33.3% dan perempuan ada 66.7%.
Untuk memvisualisasikan dua variabel kategori perlu ditentukan pilihan tentang apa yang ingin
disorot. Untuk membandingkan kategori secara langsung satu sama lain, dapat digunakan
Diagram batang berdampingan (side by side Bar chart) seperti terlihat pada Gambar berikut:
Untuk menyoroti bagaimana kategori membentuk bagian dari keseluruhan, dapat digunakan
diagram donat (Doughnut Chart) seperti pada Gambar berikut:
Pada bab ini kita akan mengaplikasikan statistik deskripitif untuk mengatur dan menyajikan
variabel numerik.
Distribusi Frekuensi
Untuk membuat distribusi frekuensi dari data kuantitatif, susun data ke dalam kategori atau
kelas.
COMP6334 - Probability and Statistics
Prosedurnya adalah sebagai berikut:
a. Sebaiknya data diurutkan dari kecil ke besar terlebih dahulu untuk mempermudah
pengelompokannya.
b. Tentukan jumlah kategori/kelas.
Secara umum direkomendasikan membuat 5-20 kelas. Semakin banyak jumlah datanya
semakin banyak jumlah kelasnya dan sebaliknya. Tujuannya agar jumlah kelas cukup
dapat menunjukan keragaman data.
c. Tentukan lebar kelas
Lebar kelas = (data terbesar-data terkecil)/jumlah kelas
Contoh: berikut adalah data pengeluaran untuk makan siang dari 50 pelanggan di sebuah
restoran (dalam ribu rupiah)
29 29 88 58 29 62 64 65 54 29
36 78 45 40 67 49 33 83 76 63
29 32 60 22 40 63 45 56 76 64
50 99 48 56 34 59 69 53 71 69
35 56 40 75 43 93 46 72 95 57
a. Misalkan untuk data di atas kita buat 8 kelas dengan lebar setiap kelas adalah :
(99-22)/8= 9.625 dibulatkan menjadi 10.
Sehingga kelasnya menjadi 20-29, 30-39,40-49,50-59, 60-69,70-79,80-89,90-99
b. Dengan demikian kita dapat hitung frekuensi, frekuensi relatif dan persentase frekuensi
di masing-masing kelas sebagai berikut
Frekuensi %
Pengeluaran Frekuensi relatif Frekuensi
20-29 6 0,12 12
30-39 5 0,1 10
40-49 9 0,18 18
50-59 9 0,18 18
60-69 10 0,2 20
70-79 6 0,12 12
80-89 2 0,04 4
90-99 3 0,06 6
50 1 100
Distribusi Kumulatif
Pada data numerik, kita bisa menghitung frekuensi kumulatif sebagai berikut:
%
Pengeluaran Frekuensi Kumulatif Frekuensi relatif Frekuensi
<30 6 6 0,12 12
<40 6+5 11 0,22 22
<50 6+5+9 20 0,4 40
<60 6+5+9+9 29 0,58 58
<70 6+5+9+9+10 39 0,78 78
<80 6+5+9+9+10+6 45 0,9 90
<90 6+5+9+9+10+6+2+3 47 0,94 94
<100 6+5+9+9+10+6+3 50 1 100
Data numerik dapat disajikan dalam bentuk: diagram stem-and-leaf, histogram, dan the
cumulative percentage polygon (ogive).
Diagram stem-and-leaf
Contoh : berikut adalah data harga makan siang di sebuah fast-food restaurant ($) yang
dibayarkan oleh 15 mahasiswa :
7.42 6.29 5.83 6.50 8.34 9.51 7.10 6.80 5.90 4.89 6.50 5.52 7.90 8.30 9.60
Histogram
Data numerik yang telah disusun dalam table frekuensi dapat disajikan dalam
bentuk histogram. Pada histogram, kelas disusun dalam sumbu horizontal (X) dan pada
sumbu vertikal (Y) susun nilai frekuesi atau persen frekuensi per interval. Berbeda
dengan Bar Graph pada data non numerik, pada histogram tidak ada gap/jarak antar
setiap balok (bars). Data frekuensi yang telah disusun di atas dapat disajikan dalam
bentuk histogram sebagai berikut:
Data numerik yang telah disusun dalam table frekuensi kumulatif dapat disajikan dalam
bentuk Ogive di mana persentase kumulatif diplot sepanjang sumbu Y. Data frekuensi
kumulatif yang telah disusun di atas dapat disajikan dalam bentuk ogive sebagai berikut :
Scatter Plot
Dua variable numerik dapat disajikan dalam satu gambar sekaligus yang disebut scatter plot.
Scatter plot dapat menunjukan bentuk hubungan antara dua variable numerik dengan cara
membuat plot salah satu variable pada sumbu horizontal (X) dan variable lainnya pada sumbu
vertikal (Y). Contoh: berikut adalah scatter plot antara penghasilan tim NBA dan nilainya
Time-series Plot digunakan untuk menggambarkan dua variable numerik yang salah
satunya adalah variable waktu. Nilai data variable numerik di plot pada sumbu Y menurut
periode waktunya (X). Time series plot dapat membantu untuk menunjukkan trend data menurut
waktu. Contoh:
2. Anderson, David R., Sweeney, Dennis J., Williams, Thomas A. (2011). Statistics for
Business and Economics. 11th Ed. Cengage Learning. USA. ISBN 13: 978-0-324-78325-4.
3. https://towardsdatascience.com/intro-to-statistics-looking-at-data-1-23c49ef2bbd8
4. https://becominghuman.ai/an-introduction-to-probability-and-statistics-for-data-science-
8cbcdd3f266d