Anda di halaman 1dari 7

05/10/2021

Topik
• Pengantar
DATA DAN PUSTAKA (SIP107) •

Tidy data dan Pivoting (panjang [long] vs lebar [wide])
Membuat tabel distribusi frekuensi
• Membuat tabel kontijensi (cross tabulation)
• Menghitung probabilitas, persentase kolom dan baris, proporsi, rasio, dan
rate dari tabel kontijensi
Pertemuan 4: Membaca, Menyusun, dan Menginterpretasi Data yang • Visualisasi dan tata letak tabel
Disajikan dalam Tabel

1 2

Pengantar Apa perbedaannya?


• Tabel prinsipnya adalah sekumpulan data yang disusun dalam baris (row) Hari Jeruk Apel Buah Naga
dan kolom (column).
Senin 10 12 15
• Baris merupakan record yang dapat berisi informasi mengenai unit analisis Tabel Hasil Panen A
Selasa 15 14 16
(case), mulai dari usia, gender, hasil pengukuran, atau yang lainnya.
• Baris dalam tabel biasanya bersifat granular, artinya mewakili informasi yang Rabu 15 11 19
paling rendah levelnya dan paling detail. dengan
• Kolom merupakan representasi dari variabel. Bulan Jeruk Apel Buah Naga
• Pastikan tiap variabel terdiferensiasi dengan variabel lainnya.
• e.g. Tabel yang baik memiliki kolom “penjualan” dan “keuntungan” secara
Januari 453 637 234 Tabel Hasil Panen B
terpisah, bukan menyatukannya dalam kolom “uang” karena “penjualan” dan Februari 456 674 245
“keuntungan” adalah dua variabel yang berbeda. Maret 543 654 236

3 4

Unit Analisis Mana yang Lebih Tepat?


• Tabel A dan Tabel B merupakan dua tabel dengan unit analisis yang berbeda.
• Tabel A adalah hasil panen per hari, sedangkan Tabel B adalah hasil panen per ID Hari Jeruk Apel Buah Jumlah
bulan. Naga

• Namun variabelnya (kolom) sama, yaitu jumlah buah jeruk, apel, dan buah 001 Senin 10 12 15 37 Diurutkan
naga yang dipanen dalam satuan waktu. 002 Selasa 15 14 20 49 berdasarkan ID
• Beberapa tips!
003 Rabu 15 11 19 45
• Berikan nomor unik (unique identifier) pada setiap baris (case) agar setiap
baris mewakili unit analisis yang benar-benar unik. (e.g. kalau hanya ada nama
ID Hari Jeruk Apel Buah Jumlah
hari, bagaimana membedakan jumlah panen pada hari Selasa minggu ini dengan Naga
minggu depan?)
001 Senin 10 12 15 37
Diurutkan
• Urutkan data dalam tabel dengan aturan tertentu yang cocok dengan
003 Rabu 15 11 19 45
berdasarkan jumlah
konteks data. Misalnya, diurutkan secara alfabetis, berdasarkan kategori
tertentu, atau dari data yang terkecil ke terendah. 002 Selasa 15 14 20 49

1
5 6
05/10/2021

Prinsip tidy data (Wickham, 2014)


Dalam menyimpan data dalam bentuk tabel (set data/dataset), gunakan prinsip tidy
Long vs wide
1. Satu kolom memuat satu variabel 1. Long form (vertikal) → tiap variabel mendapat kolom sendiri, paling
2. Satu baris mewakili satu unit analisis (case) sesuai dengan prinsip tidy. Pada banyak kesempatan, lebih disarankan untuk
3. Satu tabel mewakili satu observational unit digunakan karena memudahkan data untuk diproses lebih lanjut. Sebagian
perangkat lunak statistik (e.g. SPSS, jamovi, JASP, STATA, dsb. memproses
Dengan tidy data, maka.. data dalam bentuk long form, bukan wide.
1. Mudah membuat visualisasinya 2. Wide form (horizontal) → tiap baris berisi data hasil observasi satu unit
2. Memudahkan eksplorasi data analisis (case) dan biasanya mengandung pengukuran berulang. Model wide
3. Mudah “dibersihkan” form sangat sesuai apabila peneliti ingin melihat tren (berdasarkan
4. Tidak berantakan apabila dilakukan koreksi/penyesuaian periode/waktu tertentu) sehingga sering digunakan untuk mengolah data dari
Contoh-contoh tabel/set data yang sesuai/melanggar prinsip tidy [klik disini]. studi time series atau longitudinal.

7 8

Contoh long form Contoh wide form


Nama Kucing Senin Selasa
Nama Kucing Waktu Pemberian Jumlah Makanan (gr)
Makanan Lorenz 100 gr 120 gr
Lorenz Senin 100 Sale 123 gr 125 gr
Lorenz Selasa 120
Wolfgang 132 gr 130 gr
Sale Senin 123

Sale Selasa 125

Wolfgang Senin 132

Wolfgang Selasa 130

9 10

Cara Penyusunan Tabel Perhatikan!


Penyajian tabel ini bergantung dengan jenis informasi yang diinginkan. Terdapat banyak 1. Teknik penyusunan tabel
Pemilihan teknik penyusunan harus disesuaikan dengan informasi yang diinginkan dalam
cara penyusunan tabel antara lain :
pembuatan tabel.
1. Penyusunan secara alfabetis
2. Judul tabel
2. Penyusunan secara geografis Judul tabel harus jelas menggambarkan karakteristik data dalam tabel.
3. Penyusunan menurut besaran angka-angkanya
4. Penyusunan secara historis 3. Judul kepala tabel
5. Penyusunan atas dasar kelas-kelas yang lazim Judul kepala tabel disesuaikan dengan uraian di bawahnya.
6. Penyusunan secara progresif 4. Sumber data
7. Tabel distribusi frekuensi Sumber data harus jelas dan lengkap diletakkan di bawah tabel.
8. Tabulasi silang
2
11 12
05/10/2021

Penyusunan Secara Alfabetis


Perhatikan! Jumlah kecelakaan akibat kerja di 9 negara tahun 2005
5. Persentase
Negara Jumlah Jika data jumlah kecelakaan akibat
Jika angka persentase dibutuhkan harus dihitung dengan perincian yang jelas.
kerja tersebut meliputi seluruh negara-
Amerika Serikat 2160
6. Jumlah negara di dunia, maka teknik
Australia 2280
Jika angka jumlah dalam tabel merupakan sesuatu yang penting harus ditonjolkan. Belanda 780
penyusunan secara alfabetis ini
Cina 940 memudahkan pembaca untuk mencari
7. Unit pengukuran India 2760 data yang diinginkan
Unit pengukuran data harus dicantumkan, e.g. tahun, Kg, Km, dsb. Inggris 960
Jepang 2150 Contoh lain tabel alfabetis
8. Keterangan Kanada 1960
Hal-hal lain yang perlu dicantumkan sebagai bentuk penjelasan. Pada umumnya berbentuk Spanyol 410 https://febpwt.webhosting.rug.nl/Dmn/
catatan kaki (footnote) di bawah tabel. AggregateXs/PivotShow#
Jumlah Total 14400
Sumber : data hipotetik

13 14

Penyusunan Secara Geografis Penyusunan menurut besaran angkanya

https://www.sjkdt.org/viewimage.asp?img=SaudiJKidneyDisTranspl_2020_31_1_10_279928_t5.jpg

https://www.pewresearch.org/fact-tank/2019/06/17/worlds-population-is-projected-to-nearly-stop-growing-by-the-end-of-the-century/

15 16

Penyusunan secara historis Penyusunan atas dasar kelas lazim

https://www.semanticscholar.org/paper/A-comparative-study-on-application-of-time-series-Jha-
Sinha/1d2e15c7db73604cf3c0159735bf24222bb60d15/figure/0

3
17 18
05/10/2021

Penyusunan secara progresif


Tabel distribusi frekuensi
Tabel distribusi frekuensi adalah tabel yang memuat data frekuensi tadi tiap
variabel sehingga setiap case dalam tabel memuat frekuensi (atau kejadian -
occurrence) dari nilai tertentu.

Tabel distribusi frekuensi dapat memudahkan peneliti untuk memvisualisasikan


data yang tersaji dalam tabel menjadi, misalnya, line graph, bar chart, histogram,
dan lain-lain.

Berikut adalah contoh cara membuat tabel distribusi frekuensi.


https://ec.europa.eu/eurostat/statistics-explained/index.php?title=File:World_population_(mid-year)_(million).png

19 20

Tabel Kontijensi
• Tabel distribusi frekuensi cocok digunakan untuk menyajikan data dari satu
Informasi dalam tabel kontijensi
1
variabel (univariat). Umumnya, tabel kontijensi berisi:
• Namun seringkali peneliti berkutat dengan data lebih dari satu variabel 1. Kolom dan baris mewakili variabel yang berbeda. Misalnya, variabel
(multivariat). “menyukai/tidak menyukai K-Pop” sebagai kolom dan “gender” sebagai
• Dalam kasus dua variabel (bivariat), maka tabel kontijensi adalah teknik baris.
terbaik dalam menyajikan, bahkan untuk memproses data dalam kasus tertentu. a. Oleh karena itu, jenis variabel yang dapat disajikan dalam tabel kontijensi
• Tabel kontijensi merupakan tabel (dalam format matriks) yang menyajikan adalah variabel nominal (kategorikal -- ingat materi minggu lalu tentang jenis
distribusi frekuensi dari dua variabel. variabel!)
• Tabel kontijensi dapat membantu peneliti untuk mengestimasi kemungkinan 2. Jumlah kolom dan baris mengikuti jumlah kategori di tiap variabel.
adanya keterkaitan antara dua variabel dan interaksi antara (kedua) variabel Misalnya, variabel “gender” (untuk diletakkan sebagai baris) memiliki dua
tersebut. kategori (laki-laki dan perempuan), sehingga akan ada dua baris.
• Peneliti juga dapat menghitung probabilitas kondisional.

21 22

Informasi dalam tabel kontijensi Menghitung berbagai bentuk probabilitas


4. Berisi nets atau netts, yang artinya subtotal pada bagian baris dan kolom. Tabel kontijensi memungkinkan peneliti untuk menghitung berbagai bentuk
5. Memuat informasi (seluruhnya atau sebagian); persentase, persentase kolom, probabilitas, misalnya:
dan persentase baris. 1. Rasio
6. Jumlah sampel (n) a. Rasio adalah besaran relatif atau perbandingan dari dua nilai.
b. Dapat dihitung dengan membagi satu variabel skala interval atau rasio dengan
variabel lainnya, namun pembilang dan penyebut tidak harus berhubungan.
Berikut ini adalah contoh tabel kontijensi dengan persentase baris dan kolom. c. Oleh karena itu, kita dapat membandingkan rasio laki-laki dengan perempuan
dan rasio laki-laki dengan penggemar K-Pop.
d. Contoh rasio → “Rasio antara remaja putri yang menyukai K-Pop dengan yang
tidak adalah 5 : 1”

4
23 24
Slide 22

1 Jenis/tipe variabel ada 4:


1. Nominal/kategorikal/diskrit - yaitu variabel yang tidak memiliki
urutan. Kalaupun menggunakan angka sebagai value, hal tersebut
hanya penanda/kode saja. Misalnya, 1 adalah kode untuk
perempuan, sedangkan 2 untuk laki-laki, sehingga bukan berarti
laki-laki lebih tinggi/rendah daripada perempuan karena angka
hanya sebagai kode saja.

2. Ordinal/ranking - yaitu variabel yang sudah memiliki urutan,


namun selisih antara satu nilai dengan nilai di atas/atau di
bawahnya tidak diketahui. Misalnya, ukuran baju (S, M, XL, dst.)
Kita tahu bahwa M lebih besar dari S dan lebih kecil dari L, namun
kita tidak tahu berapa selisih antara S dengan M, atau M dengan L.

3. Interval - yaitu variabel yang memiliki urutan dan selisih antara


satu nilai dengan nilai di atas/atau di bawahnya dapat diketahui.
Misalnya, IPK mahasiswa X diketahui 3.0 sedangkan mahasiswa Y
sebesar 3.5. Kita dapat simpulkan bahwa IPK mahasiswa Y lebih
baik dari X dengan selisih 0.5. Namun, variabel interval tidak
memiliki 0 mutlak, artinya nilai 0 bukan mengindikasikan ketiadaan.
Misalnya, ketika mahasiswa memiliki IPK sebesar 0, bukan berarti
mahasiswa tersebut tidak punya hasil belajar, tetapi bisa jadi ia
tidak lulus pada semua MK yang ia ambil di semester itu sehingga
mendapat IPK 0.

Contoh lainnya adalah suhu. Apabila termometer menunjukkan


angka 0 derajat celcius hal tsb bukan berarti bisa disimpulkan
bahwa suatu benda tidak memiliki suhu.

4. Rasio - yaitu variabel yang memiliki ciri-ciri yang sama dengan


interval namun bedanya memiliki nol mutlak. Contohnya adalah
berat. Apabila timbangan menunjukkan berat 0 kg, maka dapat
disimpulkan memang tidak ada benda yang diukur beratnya.
Rizqy Amelia Zein; 24/09/2021
05/10/2021

Menghitung berbagai bentuk probabilitas Menghitung berbagai bentuk probabilitas


3. Rate
2. Proporsi a. Rate merupakan salah satu bentuk pengukuran frekuensi yang menggambarkan
a. Proporsi adalah perbandingan sebagian dengan keseluruhan. suatu kejadian di suatu populasi dalam satu periode waktu tertentu.
b. Proporsi adalah jenis rasio di mana pembilang termasuk dalam penyebut. b. Dalam Ilmu Epidemiologi, rate merupakan ukuran yang sangat informatif
c. Proporsi dapat dinyatakan sebagai desimal, pecahan, atau persentase. karena rate memberikan informasi berapa banyak orang yang menderita
d. Contoh proporsi → “35% penduduk Indonesia berusia 18-30 tahun mengalami penyakit pada satu kelompok demografi (subpopulasi) tertentu.
buta aksara fungsional.” c. Oleh karena itu, rate sering digunakan untuk menggambarkan tingkat risiko
(dalam menderita penyakit).
d. Contoh rate → “perempuan lebih berisiko menjadi korban begal karena pada
tahun 2020 saja, ada sekitar 300 perempuan korban begal per 1000 perempuan
di Indonesia.”
Berikut ini adalah contoh penghitungan dan interpretasi dari proporsi, rasio, dan
rate.

25 26

Korelasi dan tabel kontijensi Latihan Mandiri


Tabel kontijensi juga dapat memungkinkan peneliti mengukur korelasi antara 1. Silakan kerjakan tugas yang ada di spreadsheet ini secara mandiri, diluar jam
dua variabel (nominal) dengan berbagai teknik, misalnya: perkuliahan, sebagai latihan mandiri.
1. Odds ratio (OR) 2. Tugas tidak perlu dikumpulkan ke dosen pengampu.
2. Phi coefficient 3. Tugas tidak dinilai oleh dosen pengampu.
3. Cramer’s V
4. Koefisien lambda
5. Tetrachoric dan polychoric correlation

Namun kelimanya tidak dicakup dalam mata kuliah ini.

27 28

Visualisasi dan tata letak tabel


Visualisasi dan tata letak tabel
Berikut ini adalah beberapa tips mengatur tata letak tabel:
1. Perhatikan gaya penulisan ilmiah yang diikuti 3. Gunakan petunjuk visual
a. Misalnya, tata letak tabel yang mengikuti gaya American Psychological a. Anda dapat menggunakan warna latar (shading) yang berbeda untuk masing-
Association (APA) mungkin berbeda dengan American Medical Association masing baris (atau sel) agar memudahkan pembaca untuk memeriksa tabel.
(AMA). 4. Gunakan tabular numeral ketika menyajikan informasi berupa angka agar
2. Kapan saatnya menggunakan garis vertikal sebagai batas antar kolom? informasi lebih mudah dibaca
a. Umumnya, tabel disajikan dengan garis horizontal yang tegas (tanpa garis a. Gunakan font seperti Courier, Courier New, Lucida Console, Monaco, dst.
vertikal). Itupun hanya untuk baris pertama sebagai pemisah antara nilai dengan
label kolom.
b. Anda hanya disarankan untuk menggunakan model spreadsheet (yaitu tabel
dengan garis vertikal dan horizontal yang tegas) ketika menyajikan tabel dengan
informasi yang padat.

5
29 30
05/10/2021

TERIMA KASIH

31

Anda mungkin juga menyukai