Anda di halaman 1dari 11

Memahami Pesan di balik Data, Instalasi dan Analisis Data

Sederhana Menggunakan Python untuk Windows 10

Apa yang terpikirkan di benak anda jika mendengar kata “data”?


beberapa orang yang pernah saya tanyakan hal ini yang menjawab data
adalah kumpulan angka, tidak salah hanya saja kurang tepat. Data tidak
hanya berisikan angka saja melainkan gambar, teks, video, suara dll yang
menggambarkan sebuah fakta atau peristiwa.
Lantas bagaimana caranya kita memahami pesan dari data? Hal
yang harus dilakukan adalah mengolah data tersebut agar menjadi
sebuah informasi. Akan sangat menyulitkan jika proses pengolahan data
di lakukan secara manual. Saat ini banyak sekali software pengolah data
yang dapat kita instal baik itu gratis maupun berbayar.
Salah satu software pengolahan data yang cukup populer dalam
analisis data adalah python. Python merupakan software open source
yang diciptakan oleh Guido van Rossem pada tahun 1991 dan lebih
menekankan pada produktivitas juga proses pembacaan kode. Python
sendiri tidak memiliki IDE (Integrated Development Environment) yang
jelas seperti Spyder dan Jupyter Notebook. Python IDE yang saya sering
gunakan adalah Jupyter Notebook. Jupyter Notebook adalah aplikasi web
open-source yang memungkinkan kita membuat dan berbagi dokumen
interaktif yang berisi kode live, persamaan, visualisasi, dan teks naratif
yang kaya. Untuk menginstall Jupyter Notebook akan lebih mudah
menggunakan Anaconda.

Instalasi Anaconda

Sekarang kita akan mencoba instalasi anaconda di Windows 10.


1. Download installer anaconda disini. Pilih Python 3.7 version dan
sesuai dengan windows kalian 32bit atau 64bit.
2. Setelah terdownload double klik pada installer, kemudian klik next.
3. Klik „I Agree‟ untuk melanjutkan, klik Just Me, kemudian klik next
4. Pilih lokasi yang diinginkan atau bisa dengan default lalu, klik next.

5. Centang Register Anaconda as my default, lalu klik install.

6. Tunggu proses instalasi sampai selesai lalu klik finish


7. Setelah instalasi selesai, Jika terdapat kendala pada proses
instalasi silahakan kesini.
8. Jalankan Anaconda Navigator. Klik Start dan klik folder Anaconda
kemudian klik Anconda Navigator.
9. Tampilan Anconda akan terlihat seperti gambar dibawah ini.
Kemudian Klik Lunch Jupyter Notebook.

Atau lansung menjalankan Jupyter langsung tanpa harus membuka


Anaconda Navigator. Seperti gambah di bawah ini.

10. Tunggulah sampai Jupyter terbuka di di browser kita, Klik New


kemudian pilih python 3.
Jika langkah diatas dilakukan dengan benar maka tampilan Jupyter
Notebook akan terlihat seperti gambar dibawah ini. Hore! Jupyter
Notebook siap kita gunakan untuk analisis.
Analisis Data

Langkah pertama yang dilakukan dalam proses analisis data adalah


eksplorasi data. Dalam statistik, eksplorasi data merupakan pendekatan
untuk menganalisis data untuk merangkum karakteristik utama data. Pada
tutorial ini kita akan menggunakan data WHO.csv. Kumpulan data ini
merupakan statistik dari Organisasi Kesehatan Dunia (WHO) dari seluruh
negara Berikut adalah detail dari variable dari data WHO :
 Country, nama negara,
 Region
 Population, Populasi per 1.000 penduduk,
 Under15, presentase populasi di bawah 15 tahun
 Over 60, presentase populasi lebih dari 60 tahun,
 FertilityRate, tingkat kesuburan atau jumlah rata-rata anak per
wanita,
 LifeExpectancy, angka harapan hidup,
 ChildMortality, jumlah anak yang meninggal pada usia 5 tahun per
1.000 kelahiran,
 CellularSubribers jumlah pelanggan seluler per 100 populasi,
 LiteracyRate adalah tingkat melek huruf di kalangan orang dewasa
berusia lebih besar dari atau sama dengan 15,
 GNI adalah pendapatan nasional bruto per kapita,
 PrimarySchoolEnrollMale persentase anak laki-laki yang terdaftar
di sekolah dasar, dan
 PrimarySchoolEnrollfemale adalah persentase anak perempuan
terdaftar di sekolah dasar.)

Loading data set

Ketikan kode dibawah ini kemudian tekan Shift + Enter untuk run kode
Dengan info() kita dapat melihat struktur dataset, dataset WHO memiliki
194 observasi dan 13 variabel, dan didataset terdapat 3 tipe data yaitu
object, int64 dan float64. Silahkan kesini untuk penjelasan lebih lanjut
mengenai tipe data di python.

Syntax describe() menampilkan summary statistik terdapat count yang


merupakan jumlah observasi/data, mean (rata-rata), std (standar deviasi),
min (nilai terkecil data), max (nilai terbesar data), 25% (kuartil 1) , 50%
(median) dan 75%(kuartil 3). Jika diperhatikan syntax ini hanya
menghitung tipe data numerical/angka, terlihat variabel Country dan
Region tidak termasuk karena keduanya bukan data numerik/angka. Mari
kita investigasi lebih lanjut!

Dari output diatas kita dapat menarik kesimpulan bahwa negara terbanyak
yaitu pada benua Eropa sebanyak 53 negara dan yang terkecil
merupakan Asia Tenggara sebanyak 11 negara (dalam dataset yang kita
miliki).
Kembali ke output describe(), untuk variabel Population (selanjutnya
disebut populasi) didapat mean = 36359.974 per 1,000 penduduk atau
sebanyak 3,6359,974 penduduk, dengan populasi terbesar sebanyak
1,390,000,000 penduduk, dan populasi terkecil sebanyak 1,000 penduduk.
Dari sini kita sudah mendapatkan nilai mean,min dan max dari populasi,
akan tetapi kita tidak mendapatkan informasi secara spesifik negara
manakah memiliki nilai tersebut. maka dari itu kita perlu mengeksplor lebih
dalam.
Terlihat jelas bahwa negara China memiliki polulasi terbesar dan negara
Niue memiliki populasi terkecil. Sejauh ini kita sudah mendapatkan
informasi dari populasi, dengan syntax yang sama seperti diatas kita akan
coba mengeksplor variabel Under15 dan Over 60.
Untuk populasi di bawah 15 tahun negara Jepang adalah negara yang
memiliki presentase terkecil sebesar 13% dan negara Niger memiliki
presentase sebesar 49.99 % dari populasi penduduk negaranya. Untuk
Populasi lebih dari 60 tahun negara United Arab Emirates adalah negara
yang memiliki presentase terkecil sebesar 1% dan negara Japan memiliki
presentase sebesar 31.92% dari populasi penduduk negaranya.

Kita akan mencoba visualisasi di python sebelum itu silihkan install library
matplotlib dengan mengetikan kode pip install matplotlib (pastikan
terkoneksi ke internet)

Dari grafik terlihat banyak negara dengan GNI < 20,000 memiliki fertility
rate yang cenderung tinggi.
Kesimpulan
Dari analsis sederhana yang telah dilakukan dapat kita tarik
kesimpulan bahwa China merupakan negara dengan populasi terbesar
dan negara Niue merupakan negara dengan populasi terkecil, lebih
lengkapnya lihat tabel berikut
Dibawah 15 tahun Diatas 60 tahun Usia Produktif
Negara Populasi
Populasi presentase populasi presentase populasi presentase

Japan 127.000.000 16.662.400 13,12% 40.538.400 31,92% 69.799.200 54,96%


Niger 1.715.700 857.678 49,99% 73.089 4,26% 784.933 45,75%
United Arab
9.206.000 1.326.585 14,41% 74.569 0,81% 7.804.847 84,78%
Emirates

Negara niger hampir setengah penduduknya berusia di bahwa 15 tahun,


berbanding terbalik dengan jepang yang hanya 1/8 penduduknya yang
berusia dibawah 15 tahun dan United Arab Emirates yang hampir seluruh
penduduknya berusia produktif. Banyak negara dengan GNI yang rendah
cenderung memiliki fertility rate yang tinggi.

Analisis sederhana ini hanya sebagian yang baru saja kita gali, masih
banyak informasi yang bisa kita temukan dari dataset ini. Untuk analisis
lebih lanjut akan dibahas di lain kesempatan. Terima Kasih.

Anda mungkin juga menyukai