MODUL PERKULIAHAN
W542100001 –
Analisis Data
Pendahuluan
Abstrak Sub-CPMK
Analisis Teks
Analisis Statistik
Analisis Diagnostik
Analisis Prediktif
Analisis Preskriptif
Analisis Teks
Analisis Teks juga disebut sebagai Data Mining. Ini adalah salah satu metode
analisis data untuk menemukan pola dalam kumpulan data besar menggunakan database
atau alat data mining . Ini digunakan untuk mengubah data mentah menjadi informasi
bisnis. Alat Business Intelligence hadir di pasar yang digunakan untuk mengambil
keputusan bisnis strategis. Secara keseluruhan ia menawarkan cara untuk mengekstrak
dan memeriksa data dan menurunkan pola dan akhirnya interpretasi data.
Analisis statistik
Analisis Statistik menunjukkan "Apa yang terjadi?" dengan menggunakan data
masa lalu berupa dashboard. Analisis Statistik meliputi pengumpulan, Analisis,
interpretasi, penyajian, dan pemodelan data. Ini menganalisis satu set data atau sampel
data. Ada dua kategori dari jenis Analisis Statistik ini, yaitu Analisis Deskriptif dan Analisis
Inferensial.
Analisis Deskriptif
Analisis Deskriptif merupakan data lengkap atau sampel data numerik yang
diringkas. Analisa ini dapat menunjukkan rata-rata dan deviasi untuk data kontinu serta
prosentasi dan frekuensi untuk data kategori.
Metode ini menganalisis sampel dari data yang lengkap. Dalam jenis Analisis ini,
Kita dapat menemukan kesimpulan yang berbeda dari data yang sama dengan memilih
sampel yang berbeda.
Analisis Diagnostik
Analisis Prediktif
Analisis Preskriptif
Pertama-tama, Kita harus memikirkan mengapa Kita ingin melakukan analisis data
ini? Yang Kita butuhkan untuk mengetahui maksud atau tujuan dari melakukan Analisis
data. Kita harus memutuskan jenis analisis data yang ingin Kita lakukan! Pada fase ini,
Kita harus memutuskan apa yang akan dianalisis dan bagaimana mengukurnya, Kita
harus memahami mengapa Kita menyelidiki dan ukuran apa yang harus Kita gunakan
untuk melakukan Analisis ini.
Pengumpulan data
Setelah pengumpulan kebutuhan, Kita akan mendapatkan ide yang jelas tentang
hal-hal apa yang harus Kita ukur dan apa yang harus menjadi temuan Kita. Sekarang
saatnya untuk mengumpulkan data Kita berdasarkan persyaratan. Setelah Kita
mengumpulkan data Kita, ingatlah bahwa data yang dikumpulkan harus diproses atau
diatur untuk Analisis. Saat Kita mengumpulkan data dari berbagai sumber, Kita harus
menyimpan log dengan tanggal pengumpulan dan sumber data.
Pembersihan Data
Sekarang data apa pun yang dikumpulkan mungkin tidak berguna atau tidak relevan
dengan tujuan Analisis Kita, oleh karena itu harus dibersihkan. Data yang dikumpulkan
mungkin berisi catatan duplikat, spasi atau kesalahan. Data harus dibersihkan dan bebas
Analisis data
Setelah data dikumpulkan, dibersihkan, dan diproses, data siap untuk Analisis. Saat
Kita memanipulasi data, Kita mungkin menemukan bahwa Kita memiliki informasi yang
tepat yang Kita butuhkan, atau Kita mungkin perlu mengumpulkan lebih banyak data.
Selama fase ini, Kita dapat menggunakan alat dan perangkat lunak analisis data yang akan
membantu Kita memahami, menafsirkan, dan menarik kesimpulan berdasarkan
persyaratan.
Interpretasi data
Visualisasi data
Visualisasi data sangat umum dalam kehidupan Kita sehari-hari; mereka sering
muncul dalam bentuk bagan dan grafik. Dengan kata lain, data ditampilkan secara grafis
sehingga akan lebih mudah bagi otak manusia untuk memahami dan mengolahnya.
Visualisasi data sering digunakan untuk menemukan fakta dan tren yang tidak diketahui.
Dengan mengamati hubungan dan membandingkan kumpulan data, Kita dapat
menemukan cara untuk menemukan informasi yang berarti.
Analisis data berarti proses pembersihan, transformasi, dan pemodelan data untuk
menemukan informasi yang berguna untuk pengambilan keputusan bisnis
Jenis Analisis Data adalah Teks, Statistik, Diagnostik, Prediktif, Analisis Preskriptif
Analisis Data terdiri dari Pengumpulan Kebutuhan Data, Pengumpulan Data,
Pembersihan Data, Analisis Data, Interpretasi Data, Visualisasi Data
Seperti tampak pada gambar 1.2., analisis data terkait dengan beberapa proses
lainnya. Tentu saja, lingkaran sadar ini memiliki banyak cabang. Untuk memetakan
semuanya akan membuat fraktal rekursif tak terbatas, di mana setiap langkah tunduk
pada pemeriksaan, tindakan, dan perubahan lebih lanjut .
Dalam model lingkaran sadar yang disederhanakan dan disarikan, kehebatan suatu
analisis hanya dapat dipertimbangkan dari segi efeknya. Analisis data dapat dikatakan
berhasil jika:
1. Data yang dikumpulkan diperiksa kualitasnya
2. Analisis dilakukan dengan ketelitian
3. Kesimpulan mengalir dari premis
4. Tindakan yang berguna diambil (atau dapat diambil)
Jika ada langkah yang hilang, analisis itu sendiri akan berantakan. Dengan
pemikiran ini, saya menyajikan beberapa contoh sepanjang sejarah, analisis data yang
efektif. Berikut ini adalah contoh-contoh tersebut.
Kita tidak akan pernah tahu kapan atau di mana orang pertama memutuskan untuk
merekam data tentang apa atau untuk tujuan apa. Kami tahu itu berguna karena idenya
bertahan lama. Catatan data tertulis dimulai dengan catatan perdagangan kuno, tercatat
pada lempengan tanah liat sekitar lima ribu tahun yang lalu.
Pertama kali ( yang kita ketahui ) analisis data tertulis semacam ini dapat
berdampak tidak proporsional pada banyak orang ketika kerajaan Sumeria (Babilonia)
mulai mencatat populasinya untuk mendistribusikan stok pangan. Beberapa tablet yang
digunakan untuk sensus ini bertahan hingga hari ini dan dipajang di The British Museum.
Masih banyak yang tidak kita ketahui tentang Sumeria, tetapi kita tahu mereka
mencapai kesuksesan dalam arsitektur, teknik, matematika, peperangan, hukum,
administrasi, dan bahasa tertulis paling awal. Berapa banyak dari ini dapat dikaitkan
dengan pengumpulan dan analisis data mereka, kita mungkin tidak akan pernah tahu.
Pada waktunya, pengambilan sensus berlangsung di Mesir kuno, di mana ia
digunakan untuk menghitung dan mengatur angkatan kerja. Kitab Bilangan dalam Taurat
Yahudi mencatat pengambilan sensus untuk tujuan militer, dan orang Romawi mulai
merekam data demografis sekitar 600 SM.
Sensus data kuno lainnya terjadi di masa dinasti Han di Cina selama abad kedua,
rekaman populasi 59.600.000. Sensus kuno dan analisis datanya merupakan pencapaian
sosial dan organisasi yang luar biasa, mungkin membantu banyak penguasa kuno dalam
mengatur tanah dan masyarakat mereka.
Florence Nightingale dikenal sebagai perawat, tetapi dia juga salah satu yang
pertama menggunakan infografis untuk menampilkan hasil analisis statistik. Menurut
Nightingale :
"Diagram sangat berguna untuk mengilustrasikan pertanyaan-pertanyaan tertentu
terkait info penting dalam statistik dengan menyampaikannya secara isual, yang tidak
dapat dengan mudah dipahami ketika disajikan dalam bentuk angka." Saat ini, kita
biasanya menyebutnya info grafis.
Nightingale menggunakan statistik dan koneksinya dengan kelas penguasa Inggris
untuk secara mendasar mereformasi dan memodernisasi perawatan kesehatan di akhir
abad kesembilan belas dengan mengidentifikasi sanitasi dan kebersihan sebagai hal yang
sangat penting untuk kesehatan. Dia sampai pada kesimpulan ini melalui pengumpulan
dan analisis data. Tetapi presentasinya tentang data kekaisaran begitu fenomenal
sehingga data tersebut dapat mempengaruhi pihak wewenang untuk memberlakukan
perubahan yang berdampak langgeng pada praktik perawatan kesehatan.
5. Perubahan Iklim
Sulit untuk menulis artikel tentang analisis data tanpa menyebutkan perubahan
iklim. Akan tetapi, juga sulit untuk menggambarkan analisis data yang sejauh ini berhasil.
Meskipun telah ada banyak kesadaran publik tentang isu-isu seputar dampak iklim global,
faktanya masih samar bagi sebagian orang lainnya.
Perhitungan pertama dari efek rumah kaca, di mana panas terperangkap dekat
dengan permukaan bumi, dimulai pada tahun 1896, dilakukan oleh ilmuwan Swedia,
Svante Arrhenius, menyimpulkan bahwa dua kali lipat karbon dioksida atmosfer (CO2)
akan memberikan pemanasan total 5-6 derajat Celcius . Ide-ide Arrhenius dikembangkan
lebih lanjut pada tahun 1899, oleh Thomas Crowder Chamberlin .
Sebelum menggunakan fungsi sortir atau Pivot Table, data harus “dibersihkan”. Ini
berarti bahwa langkah pertama dalam analisis data adalah menelusuri data dan
memastikan bahwa gaya entri data konsisten dalam kolom. Dalam hal ini, untuk
diagnosis, penting untuk memastikan bahwa hanya satu kata, frasa, atau singkatan yang
digunakan untuk menggambarkan setiap diagnosis. Jika beberapa kata digunakan untuk
menggambarkan hal yang sama—misalnya, jika "alergi" ditulis dalam database sebagai
"allerg", "allergy", dan "allergies" — analisisnya akan lebih sulit, jadi yang terbaik adalah
memilih satu istilah dan menggunakannya secara konsisten. Mungkin perlu untuk
mengubah terminologi yang digunakan dalam kumpulan data agar konsisten, perubahan
tersebut harus dilakukan pada tahap awal ini. Jika ada beberapa diagnosis untuk satu
subjek, penting untuk membuat daftar diagnosis secara terpisah. Mungkin perlu membuat
kolom tambahan berlabel “Diagnosis 2” dan “Diagnosis 3”, yang mencantumkan satu
diagnosis di setiap kolom. (Jika demikian, dimungkinkan untuk membuat beberapa Tabel
Pivot dan menambahkan hasilnya secara manual.)
https://www.uipath.com/blog/digital-transformation/top-10-examples-successful-data-
analysis
http://www.uniteforsight.org/global-health-university/data-analysis