Anda di halaman 1dari 15

LECTURE NOTES

Week ke - 2

Organizing and Visualizing Variables

COMP6334 - Probability and Statistics


LEARNING OUTCOMES

LO1: Explain the data and statistics (data, variables, sample, population)
LO2: Calculate descriptive measures, probability, discrete and continuous distribution and
sampling distribution

OUTLINE MATERI :
1. Mengatur dan Menyajikan Variabel Kategori
• Tabel Frekuensi (Summary Table)
• Percent Frequency Distribution
• Diagram Batang dan Pie Chart
• Tabel Kontingensi
• Memvisualisasikan Dua Variabel Kategori

2. Mengatur dan Organizing Numerical Variables


• Distribusi Frekuensi
• Relatif Frekuensi dan Persen Frekuensi
• Stem dan Leaf
• Histogram
• Distribusi kumulatif
• Ogive
• Memvisualisasi 2 Variabel Numerik : Scatter Plot dan Time-Series Plot

COMP6334 - Probability and Statistics


ISI MATERI

1. Mengatur dan Menyajikan Variabel Kategori

Seperti dijelaskan sebelumnya, variabel dapat berupa variabel numerik (kuantitatif) dan
variabel kategori (kualitatif). Dan telah dijelaskan juga bahwa statistik deskriptif berhubungan
dengan cara menyajikan data dengan cara membuat tabel, distribusi frekuensi, dan diagram/chart
atau grafik, dan menghitung rata-rata hitung, median, modus, standar deviasi, dan persen atau
proporsi. Pada sesi ini kita akan mengaplikasikan statistik deskripitif untuk mengatur dan
menyajikan variabel kategori.

Tabel Frekuensi (Summary Table)

Salah satu cara untuk menyajikan dan meringkas data kategori (kualitatitif) adalah dengan
membuat Tabel Ringkasan atau disebut juga Tabel Frekuensi.

Perhatikan contoh berikut:


Sebanyak 40 mahasiswa jurusan bisnis diberi pertanyaan survey : “Apa major anda?” Pilihan
jawabannya adalah: A = Accounting; C = Computer Information Systems; M = Marketing.
Berikut adalah respon mereka:
ACCMACAACCAAAMCMAAACCCAAMMCAAACCAAAACCAC
Bagaimana cara meringkas data tersebut?
 Langkah pertama adalah buat daftar kategori yang ada pada data yaitu:
A = Accounting;
C = Computer Information Systems;
M = Marketing
 Langkah berikutnya hitung ada berapa frekuensi jawaban dari setiap kategori (bisa digunakan
turus), seperti pada Tabel Ringkasan berikut :

TMajor Frekuensi
A = Accounting 20
C = Computer Information Systems 15
M = Marketing 5
Total 40

Dari Tabel di atas, kita dapat menyimpulkan bahwa 20 mahasiswa jurusan bisnis mempunyai
major Accounting, 15 mahasiswa mempunyai major Computer Information System dan 5
mahasiswa mempunyai major marketing.

COMP6334 - Probability and Statistics


Percent Frequency Distribution

Untuk mendapatkan informasi yang lebih general, langkah selanjutnya adalah menghitung:
Frekuensi Relatif = Frekuensi / Total Frekuensi, dan
Persen Frekuensi= Frekuensi Relatif x 100%

Hasilnya sebagai berikut:


Major Frekuensi Frekuensi Relatif % Frekuensi
A = Accounting 20 =20/40=0.5 =0.5x100%=50%
C = Computer Information
Systems 15 =15/40=0.375 =0.375x 100%=37.5%
M = Marketing 5 =5/40=0.125 =0.1125x100%=12.5%
Total 40 1 100%

Dari Tabel di atas, kita dapat menyimpulkan bahwa 50% mahasiswa jurusan bisnis mempunyai
major Accounting, 37.5% mempunyai major Computer Information System dan 12.5%
mempunyai major marketing.

Diagram Batang dan Pie Chart


Agar lebih jelas dan menarik dalam mempresentasikannya, informasi dalam Tabel Ringkasan
tersebut dapat disajikan dalam bentuk diagram atau chart. Untuk membuatnya dapat digunakan
software statistik atau excel (yaitu dengan mengklik insert dan pilih chart yang diinginkan : bar
chart atau pie chart). Berikut adalah contoh Bar Chart:

COMP6334 - Probability and Statistics


Berikut adalah contoh Pie Chart:

Tabel Kontingensi
Tabel kontingensi atau disebut juga Cross Tabulasi digunakan untuk meringkas 2 atau lebih
variabel kategori (variabel kualitatif) dalam satu tabel sehingga dapat dianalisis hubungan antara
variabel-variabel tersebut.

Contoh: dua pertanyaan survey diberikan kepada 20 mahasiswa jurusan bisnis.


Pertanyaan 1: Jenis kelamin anda? (L=laki-laki, P =perempuan).
Pertanyaan 2: Apa major anda? (A = Accounting; C = Computer Information Systems; M =
Marketing).

Hasil surveynya adalah sebagai berikut:


Mhs Jenis Kelamin Major
1 L A
2 L C
3 L C
4 P M
5 L A
6 P C
7 P A
8 L A
9 P C
10 L C

COMP6334 - Probability and Statistics


11 P A
12 L A
13 L A
14 L M
15 L C
16 P M
17 P A
18 L A
19 P A
20 P C

Untuk membuat table kontingensi tuliskan kategori dari variabel Jenis Kelamin (L dan P) dan
kategori variabel Major (A,C dan M) pada masing-masing pada kolom atau baris Tabel dan
hitung frekuensi dari setiap box (L-A, L-C, L-M, P-A, P-C dan P-M) dalam tabel sebagai
berikut:
Jenis Major
kelamin A C M Total
L 6 4 1 11
P 4 3 2 9
Total 10 7 3 20

Dari Tabel Kontingensi tersebut kita dapat menyimpulkan bahwa dari 20 sampel :
Jumlah mahasiswa laki-laki ada 11 orang dan perempuan ada 9 orang, jumlah mahasiswa dengan
major Accounting ada 10 orang, dengan major Computer Information Systems ada 7 orang dan
Marketing ada 3 orang. Jumlah mahasiswa dengan major Accounting yang laki-laki ada 6 orang
dan perempuan ada 4 orang. Jumlah mahasiswa dengan major Computer Information Systems
yang laki-laki ada 4 orang dan perempuan ada 3 orang. Jumlah mahasiswa dengan major
Marketing yang laki-laki ada 1 orang dan perempuan ada 2 orang.
Tabel kontingensi dapat juga disajikan dalam bentuk persentase terhadap total, persentase
terhadap total kolom, persentase terhadap total baris seperti terlihat pada Tabel-tabel di bawah
ini. Berikut adalah contoh tabel kontingensi dalam persentase terhadap total:

Jenis Major
kelamin A C M Total
L 30% 20% 5% 55%
P 20% 15% 10% 45%
Total 50% 35% 15% 100%

COMP6334 - Probability and Statistics


Dari Tabel di atas kita dapat menyimpulkan bahwa dari total mahasiswa jurusan bisnis, yang
memilih major Accounting yang laki-laki ada 30% dan perempuan ada 20%, yang memilih
major Computer Information Systems yang laki-laki ada 20% dan perempuan ada 15%, yang
memilih major Marketing yang laki-laki ada 5% dan perempuan ada 10%.

Berikut adalah contoh tabel kontingensi dalam persentase terhadap total baris:

Jenis Major
kelamin A C M Total
L 54.5% 36.4% 9.1% 100%
P 44.5% 33.3% 22.2% 100%

Dari Tabel di atas kita dapat menyimpulkan bahwa dari semua mahasiswa jurusan bisnis berjenis
kelamin laki-laki, yang memilih major Accounting ada 54.5% , yang memilih major Computer
Information Systems ada 36.4% dan yang memilih major Marketing yang laki-laki ada 9.1%.
Dari semua mahasiswa jurusan bisnis berjenis kelamin perempuan, yang memilih major
Accounting ada 44.5%, yang memilih major Computer Information Systems ada 33.3% dan yang
memilih major Marketing ada 22.2%.
Berikut adalah contoh tabel kontingensi dalam persentase terhadap total kolom:

Jenis Major
kelamin A C M
L 60.0% 57.1% 33.3%
P 40.0% 42.9% 66.7%
Total 100% 100% 100%

Dari Tabel di atas, kita dapat menyimpulkan bahwa dari kita dapat menyimpulkan bahwa dari
semua mahasiswa yang memilih major Accounting proporsi yang berjenis kelamin laki-laki ada
60% dan perempuan ada 40%, dari semua mahasiswa yang memilih major Computer
Information Systems proporsi yang berjenis kelamin laki-laki ada 57.1% dan perempuan ada
42.9%, dan dari semua mahasiswa yang memilih major Marketing proporsi yang berjenis
kelamin laki-laki ada 33.3% dan perempuan ada 66.7%.

COMP6334 - Probability and Statistics


Memvisualisasikan Dua Variabel Kategori

Untuk memvisualisasikan dua variabel kategori perlu ditentukan pilihan tentang apa yang ingin
disorot. Untuk membandingkan kategori secara langsung satu sama lain, dapat digunakan
Diagram batang berdampingan (side by side Bar chart) seperti terlihat pada Gambar berikut:

Untuk menyoroti bagaimana kategori membentuk bagian dari keseluruhan, dapat digunakan
diagram donat (Doughnut Chart) seperti pada Gambar berikut:

2. Mengatur dan Menyajikan Variabel Numerik

Pada bab ini kita akan mengaplikasikan statistik deskripitif untuk mengatur dan menyajikan
variabel numerik.

Distribusi Frekuensi
Untuk membuat distribusi frekuensi dari data kuantitatif, susun data ke dalam kategori atau
kelas.
COMP6334 - Probability and Statistics
Prosedurnya adalah sebagai berikut:
a. Sebaiknya data diurutkan dari kecil ke besar terlebih dahulu untuk mempermudah
pengelompokannya.
b. Tentukan jumlah kategori/kelas.
Secara umum direkomendasikan membuat 5-20 kelas. Semakin banyak jumlah datanya
semakin banyak jumlah kelasnya dan sebaliknya. Tujuannya agar jumlah kelas cukup
dapat menunjukan keragaman data.
c. Tentukan lebar kelas
Lebar kelas = (data terbesar-data terkecil)/jumlah kelas

Contoh: berikut adalah data pengeluaran untuk makan siang dari 50 pelanggan di sebuah
restoran (dalam ribu rupiah)

29 29 88 58 29 62 64 65 54 29
36 78 45 40 67 49 33 83 76 63
29 32 60 22 40 63 45 56 76 64
50 99 48 56 34 59 69 53 71 69
35 56 40 75 43 93 46 72 95 57

a. Misalkan untuk data di atas kita buat 8 kelas dengan lebar setiap kelas adalah :
(99-22)/8= 9.625 dibulatkan menjadi 10.
Sehingga kelasnya menjadi 20-29, 30-39,40-49,50-59, 60-69,70-79,80-89,90-99
b. Dengan demikian kita dapat hitung frekuensi, frekuensi relatif dan persentase frekuensi
di masing-masing kelas sebagai berikut

Frekuensi %
Pengeluaran Frekuensi relatif Frekuensi
20-29 6 0,12 12
30-39 5 0,1 10
40-49 9 0,18 18
50-59 9 0,18 18
60-69 10 0,2 20
70-79 6 0,12 12
80-89 2 0,04 4
90-99 3 0,06 6
50 1 100

COMP6334 - Probability and Statistics


Tabel di atas dapat memberikan informasi antara lain bahwa kebanyakan (20 persen)
pelanggan mengeluarkan biaya makan siang dari 60-69 ribu rupiah. Hanya 6% pelanggan
mengeluarkan biaya makan siang 90-99 ribu rupiah.

Distribusi Kumulatif

Pada data numerik, kita bisa menghitung frekuensi kumulatif sebagai berikut:

%
Pengeluaran Frekuensi Kumulatif Frekuensi relatif Frekuensi
<30 6 6 0,12 12
<40 6+5 11 0,22 22
<50 6+5+9 20 0,4 40
<60 6+5+9+9 29 0,58 58
<70 6+5+9+9+10 39 0,78 78
<80 6+5+9+9+10+6 45 0,9 90
<90 6+5+9+9+10+6+2+3 47 0,94 94
<100 6+5+9+9+10+6+3 50 1 100

Frekuensi kumulatif menjelaskan berapa pelanggan mengeluarkan biaya makan lebih


kecil dari jumlah tertentu. Sebagai contoh dari tabel di atas dapat kita ketahui bahwa ada
58% pelanggan mengeluarkan biaya makan kurang dari 60 ribu rupiah

Menyajikan Data Numerik

Data numerik dapat disajikan dalam bentuk: diagram stem-and-leaf, histogram, dan the
cumulative percentage polygon (ogive).

Diagram stem-and-leaf

Diagram stem-and-leaf menggambarkan distribusi data dan urutannya. Serupa dengan


histogram tetapi dalam bentuk data aslinya. Digit pertama dari setiap data disusun dalam
garis vertikal (stem) dan disamping kanan dari garis vertikal tersebut disusun digit
terakhir dari setiap data yang sudah tersusun dalam bentuk urutan (leaf).

Contoh : berikut adalah data harga makan siang di sebuah fast-food restaurant ($) yang
dibayarkan oleh 15 mahasiswa :
7.42 6.29 5.83 6.50 8.34 9.51 7.10 6.80 5.90 4.89 6.50 5.52 7.90 8.30 9.60

COMP6334 - Probability and Statistics


Data tersebut dapat disusun dalam diagram stem and leaf dengan cara sebagai berikut:
1. Data diurutkan terlebih dahulu sbb:
4.89 5.52 5.83 5.90 6.29 6.50 6.50 6.80 7.10 7.42 7.90 8.30 8.34 9.51 9.60
2. Susun digit pertama pada garis vertikal
3. Susun satu digit berikutnya di samping setiap digit pertama (hanya untuk 1 digit).
Karena ada dua digit setelah digit pertama, maka digit dua dan tiga dibulatkan
menjadi sebagai berikut :
4.9 5.5 5.8 5.9 6.3 6.5 6.5 6.8 7.1 7.4 7.9 8.3 8.3 9.5 9.6
4. Hasilnya adalah diagram stem and leaf di mana stem unitnya adalah 1 satuan dan leaf
unitnya adalah 0.1 satuan :

Diagram tersebut menunjukkan bahwa kebanyakan mahasiswa membayar makan siang


$6 an.

Histogram

Data numerik yang telah disusun dalam table frekuensi dapat disajikan dalam
bentuk histogram. Pada histogram, kelas disusun dalam sumbu horizontal (X) dan pada
sumbu vertikal (Y) susun nilai frekuesi atau persen frekuensi per interval. Berbeda
dengan Bar Graph pada data non numerik, pada histogram tidak ada gap/jarak antar
setiap balok (bars). Data frekuensi yang telah disusun di atas dapat disajikan dalam
bentuk histogram sebagai berikut:

COMP6334 - Probability and Statistics


Histogram menunjukan bahwa kebanyakan pelanggan mengeluarkan biaya makan siang
dari 60-69 ribu rupiah.

The Cumulative Percentage Polygon (Ogive)

Data numerik yang telah disusun dalam table frekuensi kumulatif dapat disajikan dalam
bentuk Ogive di mana persentase kumulatif diplot sepanjang sumbu Y. Data frekuensi
kumulatif yang telah disusun di atas dapat disajikan dalam bentuk ogive sebagai berikut :

Menyajikan 2 Variabel Numerik

Scatter Plot
Dua variable numerik dapat disajikan dalam satu gambar sekaligus yang disebut scatter plot.
Scatter plot dapat menunjukan bentuk hubungan antara dua variable numerik dengan cara
membuat plot salah satu variable pada sumbu horizontal (X) dan variable lainnya pada sumbu
vertikal (Y). Contoh: berikut adalah scatter plot antara penghasilan tim NBA dan nilainya

COMP6334 - Probability and Statistics


Time-Series Plot

Time-series Plot digunakan untuk menggambarkan dua variable numerik yang salah
satunya adalah variable waktu. Nilai data variable numerik di plot pada sumbu Y menurut
periode waktunya (X). Time series plot dapat membantu untuk menunjukkan trend data menurut
waktu. Contoh:

COMP6334 - Probability and Statistics


SIMPULAN
Variabel dapat berupa variabel variabel kategori (kualitatif) dan variabel numerik (kuantitatif).
Variabel kategori dapat disusun dan disajikan dalam bentuk: Tabel frekuensi (Summary Table),
Diagram Batang (Bar Graph) dan Pie Chart. Dua variable kategori dapat diringkas dalam
bentuk tabel kontingensi dan dan disajikan dalam bentuk Diagram Batang Berdampingan dan
diagram donut. Variabel numerik dapat disusun dan disajikan dalam bentuk : Tabel frekuensi
(Summary Table), Diagram Stem and Leaf, histogram, dan Ogive. Dua variable numerik dapat
disajikn dalam Scatter Plot atau Time Series Plot.

COMP6334 - Probability and Statistics


DAFTAR PUSTAKA
1. Levine, D.M., Stephan, D. F., and Szabat, K. A. (2017). Statistics for Managers using
Microsoft Excel. 8th Ed. Global Edition Pearson Education. New Jersey. ISBN 13: 978-1-
292-15634-7.

2. Anderson, David R., Sweeney, Dennis J., Williams, Thomas A. (2011). Statistics for
Business and Economics. 11th Ed. Cengage Learning. USA. ISBN 13: 978-0-324-78325-4.

3. https://towardsdatascience.com/intro-to-statistics-looking-at-data-1-23c49ef2bbd8

4. https://becominghuman.ai/an-introduction-to-probability-and-statistics-for-data-science-
8cbcdd3f266d

COMP6334 - Probability and Statistics

Anda mungkin juga menyukai