Anda di halaman 1dari 9

BAB II DESKRIPSI DATA 1

2.1 Pendahuluan : Pentingnya Mendeskripsikan Data


1. Seorang sejarawan ingin memperkirakan usia rata-rata wanita saat menikah di Inggris pada
awal abad-19. Dalam sebuah arsip, sejarawan tersebut menemukan catatan pernikahan
untuk tahun 1800 – 1820, catatan tersebut dijadikan sebagai sampel dari semua catatan
pernikahan dari awal abad-19. Usia rata-rata wanita menikah dalam catatan tersebut adalah
24.1 tahun. Dengan menggunakan metode statistika, sejarawan tersebut memperkirakan
bahwa usia rata-rata pengantin wanita di Inggris adalah antara 23.5 dan 24.7 tahun.
(Agresti, 2007)
a. Bagian mana dari contoh ini yang menunjukkan ringkasan deskriptif dari data?
b. Bagian mana yang digunakan untuk menarik kesimpulan dari sebuah populasi?
c. Populasi apa yang diduga dengan hasil kesimpulan pada bagian b?
d. Usia rata-rata sampel adalah 24.1. apakah 24.1 merupakan statistik atau parameter?

Jawaban:
a. Usia rata-rata wanita menikah dalam catatan adalah 24.1
b. Usia rata-rata pengantin wanita di Inggris antara 23.5-24.7
c. Usia wanita menikah
d. Statistik

2. International Shark Attack File (ISAF) mengumpulkan data serangan hiu mendadak di
seluruh dunia. Ketika ada laporan serangan hiu, wilayah tersebut langsung dicatat. Untuk
rentang sepuluh tahun dari 2004-2013, tercatat total 689 serangan hiu mendadak telah
dilaporkan, dan sebagian besar terjadi di Florida, dengan total 203 kasus. Pada tabel
frekuensi di bawah, menunjukan jumlah kasus di Florida, dan jumlah kasus dari beberapa
wilayah lainnya (negara bagian di Amerika Serikat dan beberapa negara lain yang memiliki
frekuensi serangan hiu mendadak). Di dalam tabel terdapat angka (frekuensi) dari serangan
hiu yang telah dilaporkan di setiap wilayah. (Agresti, 2007)
a. Apa peubah yang diamati? Apakah kategorik atau numerik?
b. Ada berapa observasi? Tunjukkan bagaimana cara menghitung nilai proporsi dan
presentase untuk Florida?
c. Jelaskan distribusi data serangan hiu!
Jawaban:
a. Daerah yang terkena serangan hiu, kategorik
b. Jumlah observasi : 689
Contoh menghitung proporsi:
Florida:
203/689 = 0.295
Contoh menghitung persentase:
Florida:
0.295 x 100 = 29.5
c. Histogram sebaran banyak daerah yang terkena serangan hiu

Berdasarkan histogram diatas, terlihat bahwa distribusi data menjulur ke kanan. Hal
tersebut menunjukkan bahwa terdapat wilayah yang memiliki jumlah kasus serangan hiu
jauh lebih besar dibandingkan daerah lainnya. Secara lebih detail, berikut data jumlah
serangan hiu di masing-masing wilayah:
2.2 Menyajikan Data Kategorik
1. Beberapa serangan hiu terdaftar di Tabel 2.1 berakibat fatal. Secara keseluruhan, 63
serangan hiu mematikan dicatat di ISAF dari 2004 hingga 2013, dengan 2 dilaporkan di
Florida, 2 di Hawaii, 4 di California, 15 di Australia,13 di Afrika Selatan, 6 di Pulau
Réunion, 4 di Brasil, dan 6 di Bahamas. Sisanya terjadi di wilayah lain. (Agresti, 2007)
a. Buat tabel frekuensi untuk wilayah yang melaporkan serangan hiu yang fatal.
b. Jelaskan distribusi serangan hiu yang fatal di seluruh daerah.

Jawaban:
a. Tabel frekuensi serangan hiu yang fatal
Region Frekuensi Frekuensi Kumulatif
Florida 2 2
Hawaii 2 4
California 4 8
Australia 15 23
Afrika 13 36
Selatan
Reunion 6 42
Brasil 4 46
Bahamas 6 52
Lainnya 11 63
b. Distribusi serangan hiu yang fatal:

Berdasarkan distribusi diatas terlihat bahwa wilayah dengan sebaran hiu terbanyak yaitu
Australia. Antar wilayah memiliki jumlah kasus yang berbeda beda.

2. Dalam General Social Survey (GSS) 2018, sebanyak 2020 responden menjawab
pertanyaan “Berapa banyak anak yang anda miliki?” dan hasilnya (Agresti, 2007)
a. Apakah peubah banyaknya anak kategorik atau numerik?
b. Apakah peubah banyaknya anak diskret atau kontinu?
c. Hitunglah nilai proporsi dan presentase dari tabel frekuensi ini.

Jawaban:
a. Numerik
b. Diskret
c. Tabel nilai proporsi dan persentase:

3. Untuk Amerika Serikat saja, total 387 serangan hiu yang tidak beralasan dilaporkan antara
2004 dan 2013. Tabel 2.2 menunjukkan perincian menurut negara bagian; negara bagian
seperti Oregon, Alabama, atau Georgia dengan hanya sedikit serangan dikelompokkan
dalam kategori lainnya. (Agresti, 2007)

a. Tunjukkan distribusi data serangan hiu dalam pie chart dan bar chart!
b. Berapa persen total serangan yang terjadi di Florida, Carolina, Carolina Utara?
c. Jelaskan distribusi serangan hiu di seluruh negara bagian AS!
Jawaban:
a. Distribusi data:

b. 66.9% (
c. Berdasarkan hasil pada point a terlihat bahwa jumlah serangan hiu pada masing-masing
daerah sangat beragam. Adapun daerah dengan frekuensi serangan hiu sangat tinggi
dibanding daerah lainnya yaitu Florida dengan total kasus sebesar 203.

4. Pada tahun 2012 di Amerika Serikat, sebagian besar listrik dihasilkan dari batu bara (37%),
gas alami (30%), atau pembangkit listrik tenaga nuklir (19%). Tenaga air menyumbang 7%
dari total listrik yang diproduksi; sumber terbarukan lain seperti angin atau tenaga surya
diperhitungkan untuk 5%. Sumber tak terbarukan lainnya (seperti minyak bumi) membuat
sisa 2%. (Sumber: http://www.eia.gov/listrik / tahunan / html / epa_01_01.html) (Agresti,
2007)
a. Tampilkan informasi ini dalam grafik batang dan pie chart!.
b. Mana yang lebih layak digunakan, pie chart atau diagram batang?
c. Apa keuntungan menggunakan grafik dibandingkan menyampaikan data dalam bentuk
presentase untuk mengambil kesimpulan?

Jawaban :

a. Diagram kueh dan Diagram Batang Sumber Energi


b. Diagram batang lebih baik digunakan dibandingkan dengan pie chart. Hal tersebut
dikarenakan jumlah kategori yang cukup banyak dan frekuensi dari masing-masing
kategori berbeda-beda.
c. Jika data disampaikan dalam bentuk grafik, informasi akan lebih mudah untuk dipahami
oleh pembaca. Selain itu, penyajian data menggunakan grafik lebih menarik
dibandingkan menggunakan angka.

5. Diagram batang tersebut menjelaskan penelitian tentang faktor apa saja yang
mempengaruhi cara buaya dalam memilih makanan. Dari 219 buaya yang diambil dari 4
danau di Florida, peneliti mengklasifikasikan sumber makanan utama yang ditemukan pada
perut buaya ke dalam beberapa kategori yaitu ikan, hewan invertebrata (siput, serangga,
udang), reptil (kura-kura, anak buaya), burung, dan lainnya (hewan amfibi, mamalia, dan
tumbuhan) (Agresti, 2007)
a. Apakah peubah makanan utama termasuk peubah kategorik atau numerik?
b. Berapa persen buaya yang memilih ikan sebagai makanan utama pilihan?

Jawaban:

a. Kategorik
b. Sekitar 45% (perhatikan bar chart)

6. Pie chart berikut menunjukkan sebaran stasiun cuaca di United States di masing-masing
region. (Agresti,2007)

a. Apakah peubah stasiun cuaca termasuk jenis peubah kategorik atau numerik?
b. Identifikasi apa maksud dari kedua angka yang terdapat pada pie chart?
c. Dengan mengabaikan angka yang terdapat pada pie chart, menurut Anda manakah yang
lebih mudah digunakan untuk mengidentifikasi wilayah yang memiliki stasiun cuaca
terbanyak? Mengapa?

Jawaban:

a. Kategorik
b. Angka tersebut menunjukkan frekuensi jumlah stasiun cuaca per region dan persentase
stasiun cuaca pada masing-masing region
c. Piechar, dengan menggunakan pie chart visualisasi data menjadi lebih menarik dan
bagus. Selain itu, region yang memiliki banyak stasiun cuaca dapat langsung
diidentifikasi berdasarkan luas area.
2.3 Menyajikan Data Numerik
1. Buatlah diagram dahan daun dari 20 kandungan sodium pada sereal sarapan! (Agresti,
2007)

Jawaban:

2. Data dibawah ini menunjukkan berbagai harga kamar hotel (dollar) per malam dalam
perjalan ke Miami, Florida selama liburan musim semi tahun 2014 (Agresti, 2007)
239 237 245 310 218 175 330 196 178
245 255 190 330 124 162 190 386 145
a. Buat diagram dahan daun. Pangkas data menjadi dua digit pertama untuk membuat
diagram. Misalnya, 239 menjadi 23.
b. Buat diagram dahan daun pada bagian a dengan menggunakan batang belah; yaitu, dua
batang 1, dua batang 2, dan seterusnya. Bandingkan kedua diagram dahan daun.
Jelaskan diagram dahan daun yang mana yang lebih informatif.
c. Buat sketsa histogram dengan tangan (atau gunakan perangkat lunak), menggunakan 6
interval dengan panjang 50, mulai dari 100 dan berakhir pada 400. Apa yang dapat
dijelaskan plot tentang distribusi harga hotel? (Sebutkan di mana sebagian besar harga
cenderung turun
Jawaban:
a. Diagram dahan daun:

c. Histogram harga hotel:

Berdasarkan gambar diatas terlihat bahwa distribusi harga hotel cenderung menjulur ke
kanan dengan rata-rata berada di sekitar 150-200.
3. Gambar berikut menunjukkan diagram dahan daun dari kandungan gula pada sereal.
(Agresti, 2007)

a. Berapa kandungan gula terkecil dan terbesar pada 20 sereal tersebut?


b. Berapa kandungan gula yang ditunjukkan pada garis ke 6 pada plot diatas?
c. Berapa banyak sereal yang memiliki kandungan gula kurang dari 5 gram?

Jawaban:
a. Terbesar : 18 gram
Terkecil : 0 gram
b. 10 dan 11 gram
c. 6 jenis sereal

Anda mungkin juga menyukai