Anda di halaman 1dari 16

“MAKALAH METODE PENELITIAN MANAJEMEN

ANALISIS DATA”
Makalah ini disusun untuk memenuhi tugas pada mata pelajaran
informatika yg di bimbing oleh ibuk sri sudiarti, S.E.I

DISUSUN
O
L
E
H
KELOMPOKK :
L.ZAINAL ARIFIN
FARIZA AFANDI
NAJIB YUSAER
PERDI SAPUTRA

Jl. Pendidikan No.35, Aikmel, Kec. Aikmel,


Kabupaten Lombok Timur, Nusa Tenggara Bar. 83653
Puji syukur kehadirat Allah swt.atas nikmat
dan karunianya sehingga kami dapat menyelesaikan
makalah metodologi penelitian tentang “Analisis
Data”tidak lupa pula kami mengucapkan
terimakasih kepada ibuk guru pembimbing mata
pelajaran,yang telah memberikan arahan dan
bimbingan demi terselesaikanya makalah ini tepat
pada waktunya.
Kami berharap makalah ini dapat berguna
dalam rangka menambah wawasan serta
pengetahuan para pembaca mengenai materi yang
kami bahas.dalam penulisan kami menyadari bahwa
dalam makalah yang kami tulis terdapat kekurangan
dan jauh dari kata sempurna,kami mohon maaf atas
kesalahan dalam penulisan makalah oleh sebab itu,
kami berharap adanya kritik,saran dan usulan yang
bersifat membangun demi perbaikan makalah yang
telah kami buat dimasa yang akan datang.
Semoga makalah yg kami buat dapat dipahami
dan bermanfaat bagi kami sendiri maupun yang
mendengarkanya.
BAB I
PENDAHULUAN
A.LATAR BELAKANG
Penelitian merupakan kegiatan yang terencana untuk mencari jawaban yang
obyektif atas permasalahan manusia melalui prosedur ilmiah.untuk itu dalam suatu
penelitian dibutuhkan suatu proses analisis data yang berguna untuk menganalisis data-
data yang telah terkumpul. Data yang terkumpul banyak sekali dan terdiri dari berbagai
catatan di lapangan, gambar,foto, dokumen,laporan, biografi,artikel,dan sebagainya,
pekerjaan analisis data dalam hal ini ialah mengatur, mengurutkan, mengelompokkan,
memberi kode,dan mengategorikan. Pengorganisasian dan pengolaan data tersebut
bertujuan menemukan tema dan hipotesis kerja yang akhirnya diangkat menjadi teori
substantif oleh karena itu. Data yang telah di kumpulkan oleh penelitian tidakk akan ada
gunanya apabila tidak dianalisis terlebih dahulu.

Penelitian merupakan kegiatan yang terencana untuk mencari jawaban yang


obyektif atas permasalahan manusia melalui prosedur ilmiah(Tri Wahyulis,2010).

Selanjutnya untuk lebih memahami mengenai instrumen penelitian dalam


makalah ini yang berjudul “Teknik analisis data”akan di bahas mengenai macam,jenis
instrumen pengumpulan Data dan sebagainya.

B.RUMUSAN MASALAH
Rumusan masalah dari makalah ini adalah sbb.

1. Apa pengertian analisis data


2. Bagaimana teknik analisis data kuantitatif
3. Bagaimana teknik analisis data kualitatif

C.TUJUAN PENULISAN
Tujuan penulisan dari makalah ini adalah sbb.

1.Untuk mengetahui pengertian analisis data

2.Untuk mengetahui teknik analisis data kuantitatif

3.Untuk mengetahui teknik analisis data kualitatif


A.PENGERTIAN ANALISIS DATA

P enggunaan teknologi sekarang hampir menyentuh segala aktivitas kita.teknologi

ini tentu berhubungan dengan data yang akan teruss bertambah setiap waktu.pada era
digital sekarang, analisis data merupakan suatu hal yang sering di lakukan untuk
berbagai macam keperluan. Metode yang digunakan untuk melakukan analisis data
tergantung pada ukuran data hingga pelaku analisis. Jika melihat jumlah data yang
diperlukan sedikit dan dilakukan secara manual, observasi biasanya menjadi
pilihan.namun, jika jumlah data sangat besar dan bersifat numerik, analisis cenderung
dilakukan dengan sistem komputasi.

Analisis data adalah pengolahan data dengan tujuan untuk menemukan informasi
yang berguna yang dapat dijadikan dasar dalam pengambilan keputusan untuk solusi
suatu permasalahan. Proses analisis ini meliputi kegiatan pengelompokan data
berdasarkan karakteristiknya, melakukan pembersihan data, mentranformasi data,
membuat model data untuk menemukan informasi penting dari data tersebut. Data yang
sudah melalui proses tersebut harus disajikan dalam bentukk menarik dan mudahh
dipahami olehh orang lain dalam bentuk grafik atau plot. Secara umum,tujuan analisis
data adalah untuk menjelaskan suatu data agar lebihh mudahh dipahami, selanjutnya
dibuat kesimpulan. Suatu kesimpulan dari analisis data didapatkan dari sampel yang
umumnya dibuat berdasarkan pengujian hipotesis atau dugaan.

Terdapat dua jenis analisis data untuk melakukan penelitian, yaitu analisis
kualitatif dan kuantitatif. Analisis kualitatif adalah analisis secara sistematis yang tidak
menggunakan model matematika atau statistika. Dengan kata lain, analisis ini dilakukan
dengan membaca tabel,grafik, atau data lainnya yang sudah tersedia yang diperoleh dari
berbagai sumber dengan teknik pengumpulan data tertentu. Tujuan analisis data
kualitatif adalah untuk menemukan makna dari data-data tersebut. Sedangkan, analisis
kuantitatif adalah analisis yang menggunakan model matematika atau statiska dalam
memproses data. Tujuan analisis kuantitatif adalah menjelaskan hubungan
antarvariabel,menguji teori, melakukan generalisasi fenomena sosial yang teliti. Hasil
analisis biasanya berupa angka-angka yang akan disajikan dan diuraikan oleh peneliti.
Adapun teknik yang digunakan dalam analisis kuantitatif, yaitu teknik analisis deskriptif
dan teknik analisis inferensial yang memiliki fungsi masing-masing.

Sebelum melakukan analisis data, ada langkah-langkah yang harus dilalui, yaitu
pengolahan data terlebih dahulu. Langkah-langkah dalam menuliskan teknik analisis
data sbb.
1.Pengolahan Data

Data yang telah selesai dikumpulkan melalui pengumpulan data, selanjutnya


diolah. Pengolahan data bertujuan menjadikannya menjadi lebih sederhana.sehingga
seluruh data yang telah terkumpul dapat disusun dengan baik dan rapi, kemudian
dianalisis. Dalam melakukan pengolahan data, tahap-tahapnya sbb.

a. Penyuntingan (Editing)
Editing disebut penyuntingan, yaitu kegiatan memeriksa seluruh daftar
pertanyaan yang dikembalikan responden penelitian.
b. Pengodean (Coding)
Pengodean atau coding, yaitu kegiatan yang dilakukan dengan
menggunakan cara memberikan simbol atau tanda berupa angka terhadap
jawaban responden yang diterima. Pengodean dapat dijelaskan sebagai
kategorisasi data. Ada tiga jenis pengodean sbb.
1) Pengodean terbuka (open coding), yaitu bagian analisis yang
secara khusus berkaitan dengan pemberian nama dan kategorisasi
pada suatu fenomena melalui pengujian data.
2) Pengodean berporos (axial coding), yaitu seperangkat prosedur
penempatan data kembali dengan cara-cara baru dengan membuat
kalian antarkategori yang diawali dari penentuan jenis kategori
kemudian dilanjutkan dengan penemuan hubungan antarkategori
atau antarsubkategori.
3) Pengodean selektif(selective coding), yaitu pada tahapan ini
kemungkinan peneliti menemukan sejumlah besar dara dengan
kategori dan hubungan antarkategori/subkategori yang banyak serta
bervariasi sangat besar. Bahkan disisi lain, pada tahapan pengodean
dapat dilakukan secara manual atau menggunakan perangkat lunak
analisis data kualitatif, seperti NVivo. Atlas ti 6.0, HyperResearch 2.8,
Max QDA, dan lainnya.

C.Tabulasi (Tabulating)

Tabulasi bisa dikatakan kegiatan menyusun dan menghitung data dari


Hasil pengodean, kemudian akan ditampilkan dalam wujud daftar tabel.
Tabulasi merupakan kegiatan lanjutan setelah pemeriksaan dan pemberian
Kode. Dalam tahap ini data disusun dalam bentuk tabel agar lebih mudah
Dalam menganalisis data sesuai tujuan penelitian. Tabel hasil tabulasi
Dapat berbentuk sbb.
1) Tabel pemindahan adalah tabel tempat memindahkan kode-kode
dari kuesioner atau percatatan pengamatan. Tabel ini berfungsi
sebagai arsib
2) Tabel biasa adalah tabel yang disusun berdasar sifat responden
dan tujuan tertentu.
3) Tabel analisis adalah tabel yang memuat suatu jenis informasi
yang telah dianalisis
2.Penganalisisan data
Jika pengolahan data telah selesai,langkah berikutnya adalah menganalisis data.
Analisis data bertujuan untuk mengungkapkan data yang masih perlu dicari, hipotesis
penelitian yang perlu diuji, pertanyaan yang perlu dijawab, metode yang harus digunakan
untuk mendapatkan informasi baru, dan kesalahan yang harus segera diperbaiki. Setelah
terkumpul maka dikelompokkan menjadi dua, yakni data kuantitatif dalam bentuk
angka-angka dan data kualitatif dalam bentuk kata-kata atau simbol.
3.penafsiran hasil analisis
Jika data telah selesai dianalisis, selanjutnya adalah menafsirkan hasil analisis
data tersebut. Penafsiran hasil analisis data bertujuan untuk memberikan kesimpulan
dari penelitian kualitatif yang sudah dikerjakan. Sehingga, dapat dilakukan pengambilan
kesimpulan dengan cara membandingkan anggapan yang telah dirumuskan sebagai
hasil analisis data yang telah diperoleh. Dengan penelitian dapat mengambil kesimpulan
apakah menerima atau menolak anggapan yang sudah dirumuskan.
Salah satu tren baru didunia informasi digital adalah pengolahan big data. Untuk
menjalankan dibutuhkan tools pendukung. Apabila ingin belajar coding dengan format
notebook, Anda dapat menggunakan google colab. Apabila ingin mengolah big data,
Anda bisa belajar coding Python untuk menganalisis data. Lalu, bagaimana cara
menggunakanya dan manfaat apa saja yang diperoleh. Untuk lebih jelas, simak
pembahasan sbb
1.Google Colaboratory ( Google colab)
Google cobal adalah layanan atau tools yang dikembangkan oelh Google
Research dan dikenal sebagai software yang apik sebagai penunjang keperluan dara
sience dan machine learning. Google Colab dapat digunakan seperti halnya instalasi
desktop jupyter Notebook. Google Colab dpat dijalankan menggunakan browser, seperti
opera,mozilla dan Google Chrome. Google Colab atau Google Colaboratory adalah
sebuah executable document yang dapat digunakan untuk menyimpan, menulis, serta
membagikan program yang telah ditulis melalui Google Drive.
a. Manfaat Google Colab
Google Colab merupakan aplikasi yang diciptakan untuk operasi machine
learning dan deep learning. Manfaat Google Colab menurut Towards Data Science
sebagai berikut.
1) Built-in-library machine learning yang lengkap.
2) Berbasis, cloud sehingga tidak memakan tempat dalam memori
komputer.
3) Data dalam Google Colaboratory dapat diakses dan diedit dengan mudah.
4) Mempermudah proses kolaborasi antartim.
5) Memiliki fitur GPU dan TPU yang dapat dimanfaatkan secara gratis.
b. Kelebihan Google Colab
Pada dasar Google Colab sama dengan jupyter Notebook. Bisa dikatakan
Google Colab adalah jupyter Notebook yang dijalankan secara online dan
gratis.berikut beberapa kelebihan menggunakan Google Colab.
1) Free Access (akses gratis)
Penggunaan Google colab ditujukan bagi para peneliti yang sedang
mengembangkan penelitian dan membutuhkan spesifikasi komputer yang
tinggi. Perlu diingat bahwa Google Colab membutuhkan koneksi internet.
2) Good Spesification ( spesifikasi yang baik)
Ketika pertama kali menginstall Google Colab, maka akan diberikan
akses cloud komputer dengan spesifikasi.
3) Zero Configuration (konfigurasi nol)
Dalam menggunakan Google Colab kita tidak memerlukan
konfigurasi apapun. Namun ketika ingin menambahkan library baru, kita
perlu melakukan install Library Package.
4) Easy Sharing (berbagi dengan mudah)
Kita dapat melakukan integrasi dengan Google Drive kemudian
menyimpan script ke dalam project github ataupun berbagai link dengan
orang lain.
c. Menu pada Google Colab
Google colab merupakan salah satu tools Google yang membantu pengguna
dalam pemrograman dan pengolahan data. Pada Google Colab terdapat
beberapa menu yang dapat anda gunakan. Menu pada Google Colab, seperti File,
Edit, View, Insert, Runtime, Tools, dan Help. Untuk lebih jelas, simak pembahasan
tersebut.
1) File
1. Locate in Drive berfungsi untuk melihat lokasi file Notebook pada
Google Drive
2. Open in Playground mode berfungsi untuk mengubah notebook ke
dalam mode Playground. Perubahan yang dibuat dalam mode ini tidak
akan disimpan.
3. Open notebook berfungsi membuka file Notebook lain yang telah
disimpan sebelumnya.
4. Upload notebook berfungsi untuk mengunggah file python pada pc
untuk ditampilkan pada Google Colab.
5. Rename berfungsi untuk mengganti nama file python.
6. Move to transh berfungsi untuk menghapus file yang sedang dibuka.
Notebook yang telah dihapus masih bisa dikeluarkan dari Trash.
7. Save a copy in Drive berfungsi untuk menyimpan file Notebook ke
Google Drive.
8. Save a copy as a Github Gist berfungsi untuk menyimpan file Notebook
dalam bentuk Github Gist.
9. Save a copy in Github berfungsi untuk menyimpan file Notebook
kedalam Github.
10. Save berfungsi untuk menyimpan file Notebook kedalam Google
Colab.
11. Save and pin revision berfungsi untuk menyimpan file Notebook yang
telah direvisi dengan cara di-pin.
12. Revision history berfungsi untuk melihat data yang sudah direvisi
sebelumnya pada Google Colab
13. Download .ipynb berfungsi untuk mengunduh file Notebook ke PC
dalam format. Ipynb.
14. Print berfungsi untuk mencetak hasil notebook
2) Edit
1. Undo berfungsi untuk membatalkan perintah yang telah diberikan.
2. Redo berfungsi untuk mengulang perintah yang telah dibatalkan.
3. Select all cells berfungsi untuk mengeblok seluruh sel yang berisi
source code dalam notebook.
4. Cut selection berfungsi untuk memotong source code yang sudah
dipilih pada notebook.
5. Copy selection berfungsi untuk menyalin source code yang sudah
dipilih pada notebook.
6. Paste berfungsi untuk menempelkan kata, paragraf, tabel, gambar, dan
objek lain yang telah dikopi.
7. Delete selected cells berfungsi untuk menghapus sel yang dipilih pada
notebook.
8. Find and replace berfungsi untuk mencari kata pada notebook dan
menggantinya dengan yang diinginkan.
9. Find text berfungsi untuk mencari kata pada lembar kerja notebook.
10. Notebook settings berfungsi untuk mengubah setting dari notebook.
11. Clear all outputs berfungsi untuk menghapus isi dari outputs pada
notebook.
3) View
1. Table of content berfungsi untuk menampilkan daftar isi secara
otomatis.
2. Notebook info berfungsi untuk menampilkan informasi terkait owner,
notebook size, dan private outputs.
3. Executed code history berfungsi untuk riwayat kode yang dieksekusi.
4) Insert
1. Code cell berfungsi untuk menambah sel baru untuk membuat baris
source code baru.
2. Text cell berfungsi untuk menambah sel baru yang hanya berisi text.
Biasanya digunakan untuk memberikan keterangan atau judul sebelum
isi source code.
3. Selection header cell berfungsi untuk menambah section baru dalam
notebook.
4. Scratch code cell berfungsi untuk menggoreskan kode sel dan
membuat skrip.
5. Code snippet berfungsi untuk menampilkan cuplikan code sesuai yang
sedang dicari.
6. Add a from field berfungsi untuk menambah field baru. Anda harus
mengisi bagian form field tyoe, variable name, variable type.
5) Runtime
1. Run before berfungsi untuk menjalankan source code sebelumnya
atau dimulai lagi dari awal.
2. Run the focused cell berfungsi untuk melakukan running pada cell yang
difokuskan.
3. Run selection berfungsi untuk menjalankan running source code yang
diseleksi saja
4. Run after berfungsi untuk menjalankan source code sebelumnya.
5. Interrupt execution berfungsi untuk menjalankan eksekusi interupsi
sesuai perintah.
6. Restart and run berfungsi untuk memulai kembali running source code.
7. Restart and run all berfungsi untuk memulai kembali dan setelah itu
menjalankan semua source code pada notebook.
8. Factory reset runtime berfungsi untuk mengatur ulang runtime. Semua
variabel dan file lokal akan hilang.
9. View runtime logs berfungsi untuk menjalankan source code pada
notebook melalui colab-jupyter.log.
6) Tools
1. Command palette berfungsi untuk menampilkan palet perintah yang
berisi daftar perintah yang sering dipakai.
2. Settings berfungsi untuk menampilkan pengaturan pada Google Colab,
seperti mengatur editor, site, dan miscellaneous.
3. Keyboard shortcuts berfungsi untuk menunjukkan keyboard shortcut
yang dapat digunakan untuk mempermudah pengguna.
2. Python
Python merupakan bahasa pemrograman yang digunakan untuk membuat
aplikasi, perintah komputer dan melakukan analisis data. Python menjadi salah satu
bahsa pemrograman yang dapat melakukan eksekusi sejumlah instruksi multiguna
secara langsung (interpretatif) dengan metode orientasi objek (objek Oriented
Programming) serta menggunakan semantik dinamis untuk memberikan tingkat
keterbacaan syntax. Python diartikan sebagai bahasa yang memiliki kemampuan,
menggabungkan kapabilitas , dan sintaksis kode yang sangat jelas. Python juga
dilengkapi dengan fungsionalitas pustaka setandar yang besar serta komprehensif.
Walaupun tergolong bahasa pemrograman dengan level tinggi, python dirancang
sedemikian rupa agar mudah dipelajari dan dipahami.
Python bersifat open-source atau dibuka gratis untuk publik. Artinya, terdapat fitu
dan kode kreator yang makin memperluas kapabilitas python. Python memiliki tata
bahasa dan script yang sangat mudah untuk dipelajari. Python juga memiliki sistem
pengelolaan data dan memori otomatis. Selain itu, modul pada Python selalu update.
Python memiliki banyak fasilitas pendukung. Python banyak diaplikasikan pada berbagai
sistem operasi, seperti linux, Microsoft Windows, Mac OS, Android, Symbian OS, Amiga,
Palm.
Kelebihan dari bahasa pemrograman Python dianggap mudah untuk dipelajari,
sekalipun oleh pemula. Kode kode-kode didalamnya mudah dibaca dan dapat
menjalankan banyak pungsi kompleks dengan mudah kerena banyaknya standard
library. Pengembangan program pada Python dapat dilakukan dengan cepat dan
menggunakan lebih sedikit kode. Bahkan Python mampu menjadikan program dengan
skala sangat rumit menjadi mudah. Python mendukung multilplatform dan multisistem
serta memiliki sistem pengelolaan memori otomatis seperti java. Namun, terdapat
kekuranganya, Python cukup lambat dijalankan. Pengembangan paltform Android dan
IOS terbilang kurang support. Python memiliki keterbatasan dengan akses basis data.
Selain itu, Python tidak cocok untuk melakukan tugas-tugas intensif memori dan
pekerjaan multi-core atau multi-processor.
Python merupakan salah satu bahasa pemrograman yang paling populer. Python
memiliki bahsa pemrograman yang fleksibel, mudah dipahami, dan mudah pelajari.
Manfaat dan skill menggunakan Python.
a. Manfaat menggunakan Python
1. Python membuat developer lebih produktif karena dapat menulis program Python
menggunakan baris kode yang lebih sedikit dibandingkan bahasa lainnya.
2. Developer dapat dengan mudah membaca dan memahami program Python
karena memiliki sintaksis dasar
3. Python memiliki pustaka setandar besar berisi kode yang dapat digunakan
kembali untuk hampir semua tugas. Sehingga, developer tidak perlu menulis kode
dari awal.
4. Developer dapat dengan mudah menggunakan Python dengan bahsa
pemrograman populer lain, seperti Java, C, dan C++
5. Python portabel untuk beragam sistem operasi komputer, seperti windows,
macOS, Linux, dan Unix.
6. Komunitas Aktif Python memiliki jutaan developer pendukung di seluruh dunia.
Jika mengalami kesulitan, Anda bisa mendapatkan dukungan cepat dari
komunitas.
7. Tersedia banyak sumber daya bermanfaat di internet jika Anda ingin mempelajari
Python. Contohnya, Anda dapat dengan mudah menemukan vidio, tutorial,
dokumentasi, dan panduan developer.
c. Skill yang Diperlukan Menggunakan Python
1. Memahami teknologi Front End
2. Harus Detail
3. Kemampuan Komunikasi
4. Memahami AI ( Articial Intelligence) dan Machine Learning

B. Koleksi Data
Pentingnya koleksi, pengumpulan atau data collection memungkinkan Anda
menyimpan dan menganalisis informasi yang penting. Pengumpulan Data atau
collection didefinisikan sebagai prosedur mengumpulkan, mengukur, dan menganalisis
wawasan yang akurat untuk penelitian menggunakan teknik yang divalidasi standar.
Koleksi atau pengumpulan data adalah pengumpulan observasi atau pengukuran yang
sistematis. Pengumpulan atau koleksi data yang akurat sangat penting dan bertujuan
untuk menjaga integritas penelitian, membuat keputusan bisnis yang tepat dan
memastikan jaminan kualitas. Proses koleksi data (data collection) terdiri atas langkah
langkah-langkah berikut.
1. Menentukan informasi
Memilih detail yang ingin dikumpulkan. Anda harus memutuskan topik yang akan
dicakup, informasi, dari siapa dikumpulkan, dan dan berapa banyak data yang anda
butuhkan.
2. Menentukan jangka waktu untuk pengumpulan data
Anda dapa mulai merumuskan rencana tentang cara pengumpulan data. Pada
tahap awal perencanaan, anda harus menetapkan kerangka waktu untuk pengumpulan
data.
3. Menentukan metode pengumpulan
Anda akan memilih metode pengumpulan data yang akan menjadi inti dari
strategi pengumpulan data. Untuk memilih metode pengumpulan yang tepat, Anda perlu
mempertimbangkan jenis informasi yang ingin dikumpulkan, jangka waktu untuk
mendapatkan, dan aspek lain.
4. Mulai Mengumpulkan data
Anda dapat menerapkan strategi pengumpulan data dan mulai mengumpulkan
data. Anda dapat menyimpan dan mengatur data. Pastikan untuk tetap berpegang pada
rencana dan periksa kemajuanya secara teratur.
Terdapat dua jenis pengumpulan data, yaitu pengumpulan data primer dan
pengumpulan data sekunder. Pengumpulan data primer dalam melibatkan partisipasi
aktif dari peneliti. Sedangkan, pengumpulan data sekunder merupakan metode
pengumpulan data dengan menggunakan bahan dokumen. Pada bagian ini kita akan
membahas teknik pengumpulan data sekunder yang sering digunakan Dibandingkan
pengambilan data primer yang memakan lebih banyak waktu,biaya, dan tenaga. Sama
seperti pengumpulan data primer yang memiliki beberapa teknik, data sekunder juga
demikian. Salah satu teknik yang bisa digunakan adalah web scraping.
a. Pengertian web scraving
Web scraving merupakan pengumpulan data dan informasi dalam
sebuah website secara otomatis dan spesifik. Dikatakan spesifik karena data yang
diambil hanya dibagian tertentu sesuai kebutuhan. Secara umum, web scraving
adalah pengumpulan data web terstruktur yang dilakukan Secara otomatis
dengan menggunakan aplikasi atau kode pemrograman khusus. Umumnya
halaman web yang bisa dilakukan scraving merupakan halaman web yang dibuat
dalam bahasa markup XHTML atau HTML, namun ada juga add-ins di Google
Chrome yang bisa diinstal untuk melakukan scraving.
b. Manfaat Web Scraving
Pengguna web scraving mempunyai beberapa manfaat. Berikut manfaat
utamanya.
1. Mendapatkan leads, yaitu mencari leads mungkin bisa dilakukan
dengan membeli data. Namun, data tersebut belum tentu benar-
benar berkualitas. Web Scraving akan membantu anda untuk
mendapatkan leads sesuai niche dengan tingkat konversi yang
tinggi, sehingga hasilnya akan lebih efektif.
2. Competitor monitoring, pada hal ini anda menggali informasi
bahkan menganalisisnya. Jika pada bisnis, anda menggali
informasi seperti produk baru, strategi market kompetitor, bahkan
menganalisis audiens yang dituju dalam media sosial. Data
tersebut dapat digunakan untuk mencari tahu tentang pelanggan
potensial sebuah bisnis.
3. Penentuan harga, harga adalah kunci untuk menarik hati calon
pelanggan. Memantau harga kompetitor adalah cara yang paling
efektif sehingga anda dapat menentukan harga yang tepat dan
sesuai produk.
C. Cara kerja web scraving
Terdapat empat langkah cara kerja dari web scraving. Pertama, membuat
program yang akan digunakan untuk mempelajari dokumen HTML di website
menjadi tujuan diambil data kedua, pembuatan program digunakan untuk
mempelajari teknik navigasi pada website tersebut, sehingga kita dapat
mengaplikasikannya pada aplikasi web scraper yang dibuat. Ketiga, pengambilan
data secara otomatis dari website yang telah ditentukan. Keempat, menyimpan
data tersebut pada database.

C. VISUALISASI DATA
Visualisasi data dilihat oleh banyak bidang ilmu sebagai komunikasi visual
modern. Visualisasi data tidak berada dibawah bidang manapun, melainkan interpretasi
dari banyak bidang. Misalnya, terkadang dilihat sebagai cabang modern dari statistik
deskriptif oleh beberapa orang, tetapi juga sebagai dasar alat pengembangan oleh yang
lain. Visualisasi data mengikutkan pembuatan dan kajian dari representasi visual dari
data. Artinya, informasi yang telah diabstraksikan dalam bentuk skematis, termasuk
atribut atau variabel dari unit informasi.
Tujuan utama dari visualisasi data adalah untuk mengomunikaeikan informasi
secara efisien dan jelas kepada pengguna lewat grafik informasi yang dipilih, seperti
tabel dan grafik. Visualisasi yang efektif membantu pengguna dalam menganalisis dan
penalaran tentang data dan bukti. Ia membuat data yang kompleks bisa diakses,
dipahami, dan berguna. Penggunaan bisa melakukan pekerjaan analisis tertentu, seperti
melakukan pembandingan atau memahami kausalitas dan prinsip perancangan dari
grafik contohnya, memperlihatkan perbandingan atau kausalitas mengikuti pekerjaan
tersebut. Tabel pada umumnya digunakan saat pengguna akan melihat ukuran tertentu
dari sebuh variabel, sementara grafik dari berbagai tipe digunakan untuk melihat pola
atau keterkaitan dalam data untuk satu atau lebih variabel.
1. Prapemprosesan Data
Prapemprosesan data atau data preprocessing merupakan proses
mengubah data mentah kedalam bentuk yang lebih mudah dipahami. Data
mentah yang sering kali tidak lengkap dan memiliki format yang tidak teratur
perlu untuk melakukan prapemprosesan data untuk memperbaiki
kesalahan.prspemrosesan data melibatkan proses validasi dan imputasi
data. Validasi bertujuan untuk menilai tingkat kelengkapan dan akurasi data
yang tersaring. Sedangkan, imputasi bertujuan memperbaiki kesalahan dan
memasukkan nilai yang hilang, baik secara manual maupun otomatis melalui
program BPA( Business Process Automation)
Dalam Machine Learning, prapemprosesan data berperan memastikan
bid data sudah diformat dan informasi didalamnya dapat dipahami oleh
algoritma perusahaan sehingga bisa mengeluarkan hasil yang akurat.
Tahapan kerja prapemprosesan data atau data preprocessing dibagi menjadi
empat tahapan yaitu sbb.
a.Data Cleaning
Pada tahapan data cleaning, data mentah akan dibersihkan melalui
beberapa proses, seperti mengisi nilai yang hilang. Menghaluskan noisy data,
dan menyelesaikan inkonsestensi yang ditemukan. Data juga dibersihkan dan
dirapikan menggunakan bagian-bagian yang memiliki ukuran serupa lalu
dihaluskan (binning), dengan pungsi regresi linear atau berganda (regression),
atau dengan mengelompokkan kelam kelompok data yang serupa (grouping).
d.Data Integration
Data integration adalah tahap yang menggabungkan data dari
berbagai sumber menjadi kesatuan data( dataset). Dalam proses
penggabungan tersebut, data dengan format harus diubah terlebih dahulu
ke format yang sama. Secara keseluruhan, proses integrasi data ini ditujukan
untuk menyatukan dan membuat data menjadi lebih halus melalui upaya-
upaya seperti, memastikan data memiliki format dan atribut yang sama,
menghapus atribut yang tidak dibutuhkan dari semua sumber data, dan
mendeteksi nilai data yang konflik.
C. Data Transformation
Pasa tahapan data Transformation, data akan dinormalisasi dan
digeneralisasi. Normalisasi data dilakukan untuk memastikan bahwa tifak
ada data yang berlebihan, sementara generalisasi data dilakukan untuk
menyeragamkan data. Transformation memungkinkan anda untuk mengubah
struktur data, format data, dan nilai data menjadi menjadi sebuah dataset
yang sesuai untuk proses mining ataupun algoritma yang sudah dirancang.
Terdapat setidaknya lima langkah yang dapat dilakukan dalam proses data
Transformation, yaitu:
• Agregation: langkah untuk menggabungkan semua data dalam format
yang seragam.
• Normalization: langkah mengubah data kedalam skala yang teratur
sehingga dapat dibandingkan dengan lebih akurat.
• Feature Selection: langkah untuk menentukan variabel apa saja yang
paling penting untuk analisis, dimana variabel ini juga akan digunakan
untuk melatih model Machine Learning atau kecerdasan buatan.
• Discreditization: langkah untuk mengumpulkan data kedalam interval
yang lebih kecil
• Concept Hierarchy Generation: langkah untuk menambahkan hirarki
baru didalam dataset.
d.Data Reduction
Pada tahapan data Reduction atau pengurangan jumlah data.data mining
menggunakan data dalam jumlah besar yang dikhawatirkan dapat menyebabkan
tingkat akurasinya menjadi rendah. Oleh karena utu, sampai data perlu
direduksi,namun dengan tetap memperhatikan bahwa proses tersebut tidak akan
mengubah hasil analisis data. Terdapat tiga teknik yang bisa diterapkan saat
mereduksi data, yakni dengan dimensionality Reduction (pengurangan dimensi),
numerosity Reduction (pengurangan jumlah), dan data compression (komperasi
data). Ketiga teknik tersebut bisa disesuaikan dengan kebutuhan, seperti apakah
data yang diolah besar, sedang, atau perlu dikompresi atau berisiko merugikan.
2. Visualisasi Data
Library andalan python, yaitu Plotly. Library ini dikembangkan oleh sebuah
perusahaan yang bergerak di bidang AI (Kecerdasan buatan) dan analitik. Plotly biasa
digunakan untuk visualisasi data, terutama untuk data yang sifatnya interaktif. Plotly
merupakan open-source library dari Python. Plotly menyediakan berbagai objek grafik,
mulai dari diagram garis hingga plot sebar (scattered plots). Keunggulan utama Plotly
terletak pada interaktivitasnya, yang membuat visualisasi data akan lebih
interaktif,Audiens bisa berinteraksi dengan grafik yang ditampilkan sehingga
memberikan kapabilitas storytelling yang lebih baik. Baik memperbesar data maupun
menampilkan nilai poin. Plotly juga menawarkan fleksibilitas tinggi. Anda bisa mengatur
semua elemen yang ingin diplot. Plotly bekerja dengan pandas sehingga para pengguna
bisa melakukan transformasi, bahkan yang tergolong kompleks sekalipun. Misalnya,
menerapkan operasi aritmetika pada kolom data sebelum Anda melakukan visualisasi.
Jenis-jenis yang dapat dibuat dengan Plotly
a. Bar Chart
Bar Chart atau diagram batang digunakan untuk membandingkan beberapa
kelompok data yang berbeda. Selain untuk menampilkan perbedaan jumlah, diagram ini
biasanya digunakan untuk mengukur perfoma.
b. Pie Chart
Pie Chart atau diagram lingkaran digunakan untuk mewakili beberapa variabel
berbeda dalam satu kelompok besar. Keseluruhan lingkaran menggambarkan jumlah
total dan garis -garis yang membaginya menjadi beberapa variabel yang lebih kecil. Tiap
irisan dalam lingkaran menunjukkan kontribusinya terhadap jumlah total (keseluruhan
lingkaran)
c. Histogram
Histogram merupakan visualisasi data yang digunakan untuk menampilkan
ringkasan data. Bentuknya secara sekilas mirip dengan diagram batang. Perbedaan
Terletak pada posisi batang yang saling berdempetan. Posisi tersebut menunjukkan
bahwa visualisasi merupakan ringkasan data. Histogram merupakan diagram yang
berkaitan dengan range yang digunakan untuk melihat distribusi, penyebaran, varian
suatu produk, proses atau layanan.
d. Box Plot
Box Plot atau diagram kotak garis digunakan untuk menampilkan distribusi data.
Box Plot dapat membantu pengguna untuk memahami karakteristik dari distribusi data.
3.Prapemrosesan Data
Setelah melakukan input data mulai dari data mentah kemudian diubah menjadi
bentuk yang lebih mudah dipahami oleh mesin untuk diproses ke Unit pemrosesan.
Kemudian mengirimkan hasil dan menampilkannya kepada pengguna sudah dalam
bentuk yang dapat dengan mudah dibaca dan dipahami. Selanjutnya, prapemprosesan
data lanjut yang harus dilakukan dalam langkah data preprocessing adalah mengurangi
data atau dikenal dengan data Reduction. Mengurangi data yang dimaksud yakni
mengurangi sampel yang diambil. Pengurangan ini tidak boleh mengubah hasil dari
analisis data.
4.Visualisasi Data dengan Diagram Lain
Setiap diagram memiliki kegunaan masing-masing sesuai karakteristiknya.
Misalnya, diagram histogram, mencirikan bentuk tampilan diagram tiap tampilan batang
menunjukkan proporsi frekuensi pada masing-masing deret kategori yang berdampingan
dengan interval yang tidak tumpang tindih. Histogram dapat dipahami dengan tampilan
bentuk grafis untuk menunjukkan distribusi data secara visual atau seberapa sering
suatu nilai yang berbeda itu terjadi dalam suatu kumpulan data. Histogram merupakan
salah satu alat dari 7 alat pengendalian kualitas (QC tujuh tools yaitu diagram pareto
(Pareto Chart, check sheet, diagram kontrol (control Chart), diagram Ishikawa (cause-
and-effect diagram), diagram alir (flowchart), dan scatter diagram).
Histogram juga dapat diartikan sebagai salah satu teknik visualisasi paling besar
untuk memahami frekuensi kemunculan nilai. Histogram menunjukkan distribusi data
dengan plot frekuensi kejadian dalam suatu rentang. Dalam histogram, atribut inkuiri
ditampilkan pada sumbu horizontal dan frekuensi kemunculanya pada sumbu vertikal.
Untuk tipe data numerik kontinu, rentang atau nilai binning untuk mengelompokkan
rentang nilai perlu ditentukan.

Anda mungkin juga menyukai