2018
Kata pengantar
1
Bab 3: Menerima dan Mengatur Data
Sekali lagi, jika Anda telah berhasil berkomunikasi selama pengumpulan data, ini harus cukup
sederhana. Namun, seringkali masih membutuhkan beberapa pekerjaan.
BERTANYA:
Apa yang ingin kamu tunjukkan?
Tingkat spesifisitas apa yang Anda butuhkan untuk menunjukkan itu?
Bagaimana seharusnya data dikelompokkan dan diatur untuk mendapatkan informasi atau
perbandingan tertentu?
2
3b. Melihat Data dalam Beberapa Dimensi
Saat mengatur data Anda, dalam buku kerja Excel misalnya, Anda mungkin ingin mengingat ide
Simpson's Paradox. Pada dasarnya, dalam beberapa kasus, tren yang muncul dalam kelompok
data yang terisolasi menghilang ketika kelompok digabungkan dan dilihat secara agregat. Ini
mengajarkan kita pentingnya melihat data dalam berbagai dimensi dan dalam berbagai format.
Itulah mengapa ide pengelompokan data yang tepat sangat penting. Satu ide yang bermanfaat
adalah mencoba mengubah data Anda secara terbalik dan melihatnya secara berbeda. Mungkin
Anda pertama kali menyusun tabel yang menunjukkan data X berdasarkan grup Y. Tetapi
bagaimana jika Anda mengubah periode waktu? Bagaimana jika Anda menggabungkan data ke
dalam grup yang berbeda? Cukup melihat data dengan berbagai cara akan membantu Anda
memahami dengan tepat apa yang sedang terjadi, dan juga akan melindungi Anda dari hal-hal
yang hilang.
Pertimbangkan 2 grafik ini, membandingkan tingkat keberhasilan 2 perawatan untuk batu ginjal,
Pengobatan A termasuk prosedur bedah terbuka yang lebih kompleks, dan Pengobatan B
termasuk perawatan dengan hanya tusukan kecil:
Ketika melihat perawatan dengan tingkat keparahan kondisi (tabel kiri), kesimpulannya tampak
jelas bahwa Pengobatan A lebih berhasil. Ini memiliki tingkat keberhasilan yang lebih tinggi
dengan kondisi umum dan dengan kondisi yang parah.
Tapi, ketika melihat perawatan dikombinasikan untuk semua batu ginjal (tabel kanan),
kesimpulannya kelihatannya adalah bahwa Pengobatan B adalah perawatan keseluruhan yang
lebih sukses. Ini memiliki tingkat keberhasilan keseluruhan yang lebih tinggi.
3
Dalam contoh ini, ada faktor tersembunyi yang menciptakan gambar yang menyesatkan ini. Pada
dasarnya, Perawatan A (perawatan yang lebih serius dan kompleks) paling sering digunakan
untuk kondisi yang lebih parah, sementara Treatment B (perawatan yang lebih sederhana) paling
sering digunakan untuk kondisi umum.
Ini jelas terlihat pada angka-angka di atas tabel.
Penyimpangan data ini menciptakan skenario ini di mana kita mungkin tertipu untuk memikirkan
sesuatu yang tidak benar, jika kita tidak menggali lebih dalam untuk mengungkap perbedaan ini
dengan melihat data ini dalam berbagai format dan dimensi.
Jangan khawatir jika Anda tidak memahami detail dari contoh spesifik tersebut.
Tetapi pahami maksudnya:
1 set data dapat mewakili dirinya dalam berbagai cara, karena variabel tersembunyi, atau karena
format presentasi yang berbeda. Jadi kita harus berhati-hati.
Ide ini juga akan muncul lagi di Bab 5: Grafik dan Presentasi Visual Data.