Anda di halaman 1dari 45

Data analytics

untuk Pengembangan
Organisasi

Melepaskan Potensi Data Anda

Uwe H. Kaufmann
Amy B.C. Tan

Daftar Isi
Pendahuluan: Mengapa Data analytics Penting x
Mengapa Buku Ini Ditulis x
Bagaimana Buku Ini Distruktur x
Alat Apa yang Digunakan x
Apa yang Disediakan x
Kasus Mana yang Harus Saya Pelajari? x
Bab 1 Pengantar Data analytics dan Data science
Komponen Data analytics
Big Data dan Hubungannya dengan Data analytics
Data Analytics – Landasan Data science dan Kecerdasan Buatan
Tahapan Data analytics
Bab 2 Customer Domain– Customer analytics
Mengapa Customer analytics?
Dengarkan Suara Pelanggan Anda yang Ada
Memahami Harapan Pelanggan
Mempelajari Pengalaman Pelanggan yang Lengkap
Merancang Survei Pelanggan
Kesimpulan
Kasus 1: Hebat, Kami Telah Meningkat. . . atau tidak?
Kasus 2: Apa yang Mendorong Kepuasan Pasien kita?
Kasus 3: Bagaimana Menciptakan Dasbor Kepuasan Pasien
Kesimpulan
Bab 3 Domain Proses – Operations analytics
Mengapa Operations Analytics?
Dimensi Operations Analytics
Peran dan Penerapan Operations analytics
Kesimpulan
Kasus 4: Pemasok Mana yang Lebih Baik Kualitas produk?
Kasus 5: Mengapa Keuangan Membayar Vendor Kami Terlambat?
Kasus 6: Mengapa Kita Membuang-buang Darah?
Bab 4 Workforce Domain– Workforce Analytics
Mengapa Workforce Analytics?
Dimensi Workforce Analytics
Menerapkan Workforce Analytics ke dalam Praktik
Mendapatkan Niat yang Benar
Analis Tenaga Kerja (Surga adalah Karyawan) Mimpi Buruk – Mengelola
Perubahan
Ringkasan
Kasus 7: Apakah Kita Memiliki Cukup Orang untuk Menjalankan Kita?
Organisasi? – Perencanaan Tenaga Kerja Inside-Out
Kasus 8: Apa yang Membuat Staf Kami Berinovasi?
Kasus 9: Apa Survei Keterlibatan Kami?
Hasil Berarti?
Kasus 10: Apa yang Membuat Staf Kami Keluar? – Logistic Regression untuk
Prediksi dan Pengambilan Keputusan
Bab 5 Menerapkan Data analytics untuk Pengembangan Organisasi
Membuat Keputusan Lebih Baik – Mengetahui Risikonya dari Menjadi Salah
Memastikan Keberhasilan Perjalanan Data Analisis Anda
Langkah-langkah untuk Menerapkan Data analytics
Memastikan Manajemen Walks and Talks Analytics
Menciptakan Kegembiraan untuk Data Analytics dan Manfaatnya
Mengembangkan Tubuh Pengetahuan – Mulai Dari Yang Kecil
Menggunakan Analytics untuk Memecah Silo s
Menutup Analytics Loop – Mempertahankan Keuntungan
Pandangan

Pendahuluan: Mengapa Data


Analisis itu Penting

Semua orang mengetahui proses yang merepotkan untuk mengajukan


permintaan dengan orang IT atau vendor untuk tugas kecil tentang data analytics
bisa menunggu sampai berhari-hari atau bahkan berminggu-minggu sebelum
mendapatkan hasilnya. Biasanya, hasilnya tidak disajikan dengan cara yang paling
baik atau hanya menimbulkan pertanyaan lebih lanjut yang membutuhkan data
baru untuk dijawab dan permintaan baru untuk IT atau vendor. Selama beberapa
dekade, para manajer mengandalkan proses semacam ini karena mereka tidak
punya pilihan. Proses ini memiliki kelemahan mendasar yaitu jika Anda ingin
membuat keputusan tepat waktu, informasi yang tertinggal dan informasi yang
ketinggalan zaman tidak dapat digunakan. Oleh karena itu, keputusan yang tepat
waktu harus dilakukan tanpa memiliki dasar data real-time dan terkadang
berdasarkan firasat.
Waktu telah berubah. Kuantitas data yang tersedia di semua fungsi
organisasi tumbuh setiap hari. Akses ke data ini semakin mudah. Hampir setiap
orang dapat memperoleh data yang diperlukan untuk menjalankan analisis mereka
sendiri. Dan hampir setiap orang memiliki komputer yang canggih dengan alat
analitis canggih yang terbaru. Pertanyaannya sekarang adalah, bagaimana
mengubah data menjadi informasi yang relevan dengan bisnis untuk membuat
keputusan yang tepat saat dibutuhkan (Data Never Sleeps, 2020).
Oleh karena itu, inilah saatnya untuk memastikan bahwa data yang tepat
dikumpulkan dengan cara yang sesuai, disaring, diubah, dan telah dianalisis
menggunakan metode yang valid dengan cara yang memberikan informasi yang
relevan dengan bisnis yang diubah menjadi kecerdasan untuk membuat keputusan
yang tepat untuk kesuksesan bisnis.
Data analytics atau data analisis adalah proses mengumpulkan, memproses,
dan menganalisis data dengan tujuan menemukan informasi yang berguna,
memberi kesimpulan, dan mendukung pemecahan masalah serta pengambilan
keputusan. (Wikipedia, n.d.; Payne, 1976).

☞ Data analytics adalah praktik bisnis yang semua manager harus terbiasa dengannya.

Data analytics meliputi komponen utama: Descriptive analytics (analisis


post-mortem), Predictive analytics, dan Prescriptive analytics.
Big Data dicirikan oleh tiga Vs, Volume, Velocity, Variety (Russom, 2011).
Ini terlalu banyak dan rumit untuk ditangani oleh hardware dan software
konvensional. Pada awal tahun 2000-an, volume data yang tersedia meningkat
secara eksponensial dan penanganan data tersebut hanya dilakukan oleh beberapa
perusahaan dan organisasi yang mengandalkan data analytics untuk bertahan dalam
bisnis.
Namun saat ini, komputer dengan kapasitas penyimpanan dan penanganan
data yang besar tersedia untuk hampir semua organisasi, baik itu dengan
memasang hardware dan software secara internal atau dengan menyewa kapasitas
eksternal. Dua trend ini tampaknya menjadi hasil dari perubahan ruang lingkup IT.
Pertama, makin banyak organisasi yang memiliki sarana dan melihat kebutuhan
untuk mengumpulkan data tentang lingkungan operasional mereka. Kedua,
organisasi-organisasi ini memperluas cakupan kegiatan data analytics mereka
untuk memasukkan semua fungsi.
Tidak hanya ada perpindahan dari big data analytics ke analitis beberapa
jenis data, ada juga trend yang sehat untuk melibatkan semua tingkat manajemen
dan bahkan staf junior ke dalam bidang manajemen informasi yang tidak terlalu
baru ini. Manajer progresif akrab dengan jenis data yang tersedia dan dengan trend,
pergeseran, atau pola lain dalam data mereka dan dapat menggunakannya untuk
pengambilan keputusan.
Data analytics khusus sebelumnya makin populer di antara semua manajer
organisasi. Oleh karena itu, inilah saatnya untuk memastikan bahwa data yang
tepat dikumpulkan dengan cara yang tepat, disaring, diubah, dan dianalisis
menggunakan metode yang valid dengan cara yang memberikan informasi yang
relevan dengan bisnis yang diubah menjadi kecerdasan yang mempersiapkan
keputusan yang tepat untuk kesuksesan bisnis.

"Kemampuan untuk mengambil data – agar dapat memahaminya, memprosesnya,


mengekstrak nilai darinya, memvisualisasikannya, mengomunikasikannya – itu akan
menjadi keterampilan yang sangat penting dalam beberapa dekade mendatang."

Google’s Chief Economist Dr Hal R. Varian (2009)

Kenapa buku ini ditulis


Sejujurnya, saya tidak terlalu suka statistik. Setelah saya fokus statistik
selama studi saya di teknik, saya memastikan saya lulus semua tes dan ujian dan
tidak akan pernah lagi.
Setelah bergabung dengan General Electric (GE) pada 1990-an, saya harus
mempelajari kembali statistik. Di GE, memperoleh pengetahuan dalam statistik
didorong oleh tujuan, yaitu, itu adalah masalah bisnis nyata yang harus saya
selesaikan menggunakan angka. Akibatnya, saya mulai mendapatkan beberapa
tingkat minat untuk matematika dan statistic
Seperti yang ditunjukkan oleh contoh-contoh berikut, memiliki angka-angka
itu baik tetapi tidak cukup. Selain itu, kita perlu memastikan data dikumpulkan
dengan benar, dibersihkan, dan dianalisis sebelum membuat keputusan apa pun.
Beberapa tahun yang lalu, direktur bank darah kembali dari pertemuan
dengan kepala bank darah lainnya. Dia tidak senang karena dia memiliki
kesempatan untuk membandingkan indikator kinerja bank darah tertentu
dengan yang lain dan menyadari bahwa bank darahnya sendiri jelas
membuang lebih banyak produk darah daripada beberapa bank darah
lainnya. Dia berbicara tentang tas dengan trombosit yang diambil dari
donor darah, diuji, dan kemudian dibuang karena tidak memenuhi standar
kualitas. Menurut kriterianya, situasi seperti ini tidak dapat diterima.
Sebuah tim dibentuk untuk menyelidiki akar penyebab pemborosan produk
darah yang berharga tersebut. Setelah pengumpulan data dan beberapa
analisis dasar, sehingga dapat diketahui dengan jelas bahwa produk darah
kualitasnya tidak lebih rendah daripada di negara lain. Akar penyebabnya
adalah dalam proses evaluasi kualitas kantong darah – pengumpulan data.
Contoh kasus ini dijelaskan kemudian dalam buku ini.
Kasus ini sendiri menghasilkan beberapa pembelajaran seumur hidup yang
ingin kami ubah menjadi rekomendasi:
Pertama, jangan percaya angka secara membabi buta. Bahkan angka-
angka yang dihasilkan oleh komputer bisa salah, bias, atau bias saja tidak
berguna. Periksa bagaimana angka-angka ini dihasilkan dan bagaimana
mereka masuk ke komputer di tempat pertama.
Kedua, sebelum Anda melakukan data analytics apa pun, pastikan datanya
dikumpulkan mengikuti prosedur yang benar. Oleh karena itu, buku ini tidak
mulai dengan analisis data. Buku ini dimulai dari pengumpulan data
dipikirkan tentang dan dirancang.
Ketiga, seperti kepala bank darah dengan kasus bisnisnya yang sangat kuat,
konfirmasikan bahwa data analytics Anda memiliki tujuan, kebutuhan untuk
mengetahui dengan siapa anda bekerja, mengerti, dan berbagi. Hanya
dengan kebutuhan ini untuk kasus bisnis tersebut, dan dapatkah data
analytics Anda lebih dari sekadar bermain-main dengan angka.
Bab-bab berikut menguraikan penggunaan data analytics untuk
menyelesaikan masalah bisnis, untuk membuat keputusan penting, dan untuk
mendorong strategi organisasi. Kami akan mengidentifikasi beberapa jebakan dan
solusi khas dalam prosesnya.
Saat ini, ada banyak kursus Data analytics yang tersedia. Menariknya,
banyak dari mereka memiliki judul yang mirip dengan Data analytics untuk HR
Profesional atau untuk Customer Relationship Management. Buku ini memiliki
cakupan yang lebih luas dan menunjukkan penerapan data analytics dalam situasi
organisasi apa pun, di mana penggunaan data yang tepat adalah sangat penting.
Oleh karena itu, kami menyebutnya “Data analytics untuk Pengembangan
Organisasi: Melepaskan Potensi Data Anda”.
Buku ini ditulis dengan maksud untuk menutup celah terkenal yang
disebutkan oleh Amy Gallo (Gallo, 2018). Setiap manajer harus mengetahui empat
konsep analitis yang kuat untuk mendapat informasi tentang organisasinya dan
untuk membuat keputusan berbasis data. Konsep-konsep ini sama sekali bukan hal
baru. Namun, mereka menjadi lebih penting dengan meningkatnya jumlah data
yang tersedia dan kebutuhan yang nyata, dan merupakan kesempatan untuk
mengubah data ini menjadi informasi yang relevan dengan bisnis. Hal ini didukung
oleh ketersediaan banyak alat yang mudah ditangani untuk analisis data dan
visualisasi data.
Alat-alat ini hanya dapat digunakan oleh para manajer jika para manajer ini
memahami dasar-dasar data analytics mulai dari akuisisi data hingga data
analytics. Oleh karena itu, seperti yang diidentifikasi oleh Gallo (2018), manajer
perlu mengetahui konsep dasarnya.

Konsep-konsep ini adalah eksperimen terkontrol acak (randomised


controlled experiments), pengujian hipotesis, analisis regresi, dan signifikansi
statistik.
Eksperimen terkontrol acak mencakup teknik pengumpulan data seperti
segala jenis survei, studi percontohan, eksperimen lapangan, dan penelitian
laboratorium. Alih-alih mengalihdayakan layanan semacam itu kepada spesialis
dan mengandalkan mereka untuk menganalisis hasil dan mengembangkan
rekomendasi, akan bermanfaat bagi manajer untuk memahami data analytics.
Pengetahuan ini tentu akan membantu menarik kesimpulan yang disesuaikan untuk
organisasi; kesimpulan yang tidak dapat ditarik dengan mudah oleh orang luar.
Eksperimen juga terdiri dari pengujian rutinitas atau produk baru pada kinerjanya.
Bereksperimen dengan proses adalah cara yang ampuh untuk meningkatkan output
sambil mengamati dan mengubah pengaturan pada saat yang sama dengan cara
yang terkendali.
Pengujian hipotesis berisi alat statistik yang membandingkan data relevan
bisnis bertingkat dan menjawab pertanyaan untuk "yang lebih baik" termasuk
risiko bawaan bahwa keputusan ini salah. Tes hipotesis menemukan penerapannya
di semua unit organisasi mana pun. Menganalisis hasil survei menggunakan uji
hipotesis untuk menjawab pertanyaan seperti “Apakah ada perbedaan antara
peringkat tahun lalu dan tahun ini?” atau “Apakah Departemen A memiliki kinerja
lebih baik daripada Departemen B?” Hasil uji hipotesis bisa lebih dari sekedar
“Ya” atau “Tidak”. Tes hipotesis selalu menginformasikan tentang risiko yang
datang dengan membuat keputusan seperti risiko untuk membuat keputusan yang
salah. Banyak pengujian hipotesis bahkan memberikan indikasi tentang perbedaan
yang minim atau peningkatan yang minim, yang mengarah pada keputusan yang
jauh lebih baik dengan berdasarkan dari dampak perubahan atau peningkatan.
“Apa peningkatan yang paling minim jika kita membeli persediaan dari Pemasok B
dibandingkan ke Pemasok A?” dapat dijawab dengan uji hipotesis.
Analisis regresi terdiri dari alat statistik yang digunakan untuk tugas serupa
sebagai uji hipotesis. Sementara pengujian hipotesis biasanya menjawabpertanyaan
tentang hubungan antara dua variabel, model regresi dapat mencakup beberapa
variabel pada saat yang bersamaan. Dengan ini, interaksi antara beberapa faktor
(variabel independen) untuk hasil yang sama (variabel terikat) dapat dianalisis,
yang mana hal tersebut kurang efektif daripada tes hipotesis. Oleh karena itu,
model regresi membantu menjelaskan hubungan yang kompleks antara banyak
variabel pada saat yang bersamaan. Selain itu, ini alat sering diterapkan dalam
statistik prediktif, dengan menggunakan data yang ada untuk meramalkan perilaku
mesin, perangkat, unit organisasi, dan bahkan tenaga kerja.
Kelompok metode yang disebutkan di atas didasarkan pada satu konsep
penting yaitu signifikansi statistik. Konsep yang sering disalahpahami ini adalah
faktor esensial dari semua statistic dan faktor esensial dari semua data analytics.
Statistik signifikansi menginformasikan tentang risiko yang harus diambil ketika
membuat keputusan bisnis berdasarkan data analytics.
Dalam statistic kata "tidak pernah" dan "selalu" itu tidak ada; “Kemungkinan
0%” dan "Probabilitas 100%" biasanya bukan hasil acak, terkontrol eksperimen, uji
hipotesis, ataupun regresi. Kemungkinan besar, hasil dari analisis terletak di antara
keduanya. Kemudian, kembali kepada manajer untuk membuat pilihan yang
cerdas, terinformasi, dan berbasis data. Memahami konsep signifikansi adalah
kunci menuju keputusan yang berkualitas.
Bagaimana buku ini terbentuk
Karena buku ini membahas tentang penerapan data analytics untuk desain
organisasi, kasus-kasus yang dibahas kemudian membahas situasi data analytics
yang berbeda dalam domain mana pun dari rantai nilai organisasi (Gambar 0.1).
Di bawah customer domain, itu mencakup pengumpulan, pemrosesan, dan
analisis data terkait pelanggan. Ini termasuk data survei dari l pelanggan yang
berbeda dan data yang mengukur "moment of truth", saat pelanggan mengalami
produk atau layanan yang ditawarkan.

Gambar 0.1 Domain dari Rantai Nilai Organisasi


Domain Proses (Operations Domain) mencakup pengumpulan data dari
banyak proses operasional yang berbeda dan mengubah data menjadi informasi
yang krusial untuk pengambilan keputusan.
Domain Tenaga Kerja menawarkan ide untuk menangani data organisasi
yang digunakan untuk menarik kesimpulan tentang berbagai aspek terkait tenaga
kerja, bisa juga perencanaan tenaga kerja, perekrutan, keterlibatan, pengembangan,
atau pengurangan.
Pada beberapa kasus, kami mengikuti semua langkah dari pertanyaan,
hipotesis, atau kasus bisnis melalui semua tahap data analytics untuk mencapai
keputusan yang tepat. Langkah-langkah yang disebutkan dalam bab-bab berikut
adalah (Gambar 0.2) merumuskan pertanyaan bisnis, Menampilkan Data Akuisisi,
Melakukan Persiapan Data, Melaksanakan Data analytics, dan Membuat
Keputusan Bisnis.
Pertanyaan Bisnis
Pada langkah pertama ini, masalah yang terkait dengan bisnis harus
diidentifikasi dengan jelas. Dan, itu harus diterjemahkan ke dalam sebuah
indikator, Key Performance Indicator (KPI) yang membuat masalah menjadi
terukur. Lebih baik lagi, indikator ini diketahui dan diamati oleh anggota
manajemen, dengan kata lain hal tersebut penting.
Akuisisi Data
Ada banyak cara mengumpulkan data untuk menjawab Pertanyaan Bisnis.
Biasanya perlu untuk memvalidasi metode pengumpulan data untuk memastikan
data yang berguna untuk dianalisis, seperti data yang representatif, dapat
direproduksi, dan cukup akurat untuk memberikan informasi yang cukup untuk
menjawab Pertanyaan Bisnis. Ada alat statistik yang membantu mengidentifikasi
potensi masalah dalam proses pengumpulan data.
Persiapan Data
Sekalipun metode pengumpulan datanya terbukti dan instrumennya diterima
secara statistik, tetap saja data itu kemungkinan tidak berguna.
Dalam survei, misalnya beberapa peserta survei mungkin tidak memberikan
masukan yang berguna. Sebagian alasannya mungkin karena mereka dipaksa atau
diberi insentif untuk berpartisipasi dalam survei. Secara umum, kita dapat
berasumsi bahwa mereka tidak tertarik. Oleh karena itu, mereka mungkin telah
memberikan masukan yang valid ke penyelenggara survei yang mapan, tetapi
masukannya mungkin tidak berguna. Atau lebih buruk lagi, input dapat merusak
langkah-langkah analisis berikut. Masukan tersebut dapat berupa peringkat acak
atau peringkat yang sama untuk semua pertanyaan atau pernyataan..
Oleh karena itu, persiapan data diperlukan untuk menemukan dan
menghilangkan input tersebut untuk memasukkan data ke dalam analisis yang
benar-benar bernilai.
Penyiapan data juga mencakup pemformatan data agar dapat digunakan
dengan software analisis yang disukai. Biasanya, data yang diunduh dari sistem
tidak sesuai dengan formatnya untuk dimasukkan ke dalam software analisis, Excel
misalnya. Namun, dalam banyak kasus bahwa data dapat diatur ulang, diformat
ulang, atau diubah sehingga software dapat menanganinya.
Software analisis tidak akan selalu berhenti bekerja hanya karena format
data yang salah. Dalam kasus terburuk, itu mungkin tetap berfungsi namun
menghasilkan hasil yang tidak valid.

Gambar 0.2 Langkah-langkah Kasus Data Analisis


Data Analysis
Umumnya, data analysis ditampilkan secara grafis dan statistik. Biasanya,
keduanya diperlukan untuk memastikan kesimpulan yang tepat. Selain itu, analisis
grafis mungkin diperlukan untuk memvisualisasikan data dan storytelling data.
Namun, analisis grafis tanpa dukungan statistik dapat menyebabkan
keputusan yang buruk. Ini sama ketika menjalankan analisis statistik tanpa
dukungan grafis.
Oleh karena itu, semua data analytics harus dilakukan dalam pendekatan dua
langkah. Pertama, satu atau lebih grafik harus diplot untuk memvisualisasikan data.
Visualisasi ini saja mungkin memiliki kekuatan untuk mendorong keputusan.
Kedua, bagaimanapun, ini adalah praktik yang baik untuk mendukung analisis
grafis dengan statistik.
Untuk data analytics, berbagai alat tersedia. Pemilihan alat yang sesuai
tergantung pada pertanyaan bisnis yang perlu dijawab, jenis data yang
dikumpulkan dan karakteristiknya. Faktor stratifikasi yang mendorong suatu
keputusan biasanya disebut "X". Hasil yang dihasilkan biasanya disebut "Y".
Ketika, misalnya, tingkat penolakan suatu produk dibandingkan antara
pemasok A dan B, maka pemasok menandakan sebagai variabel independen X
sedangkan tingkat penolakan menandakan sebagai variabel dependen Y. Hampir
semua tugas data analytics menggunakan struktur ini. Penerapan alat tergantung
pada tipe data yang ditemukan di X dan Y.
Sementara penerapan alat grafis yang sesuai (Tabel 0.1) dan alat statistik
(Tabel 0.2) akan ditunjukkan, alat tersebut tidak akan dijelaskan secara rinci.
Pemasok misalnya, sebagai diskrit X dan tingkat penolakan sebagai diskrit Y yang
dihasilkan dengan menghitung pelanggan yang puas dan pelanggan yang tidak
puas. Oleh karena itu, bagian kiri dan atas pada Tabel 0,2 diisi sebagai kategori.
Karena kami hanya memiliki dua kategori, Pemasok A dan Pemasok B sebagai X,
alat statistik yang sesuai adalah Two-Proportion-Test.
Tabel-tabel ini akan dirujuk dalam kasus berikut untuk memilih alat grafis
dan statistik yang berlaku.
Tabel 0.1 Alat Analisis Grafis untuk Berbagai Situasi Tipe Data
X
Diskrit Continuous
Y Diskrit Bar Chart, Pie Chart Plot Probabilitas Terbalik
Plot Frekuensi Bertingkat
Continuous Plot Frekuensi Bertingkat Plot Scatter

Tabel 0.2 Alat Analisis Statistik untuk Berbagai Situasi Tipe Data
X
Diskrit Continuous
Diskrit Tes Proporsi Plot Probabilitas Terbalik
Plot Frekuensi Bertingkat
Y
Continuous Tes Parametrik dan Regresi Linier dan Regresi
NonParametrik untuk Non-Linear
Kecenderungan Sentral
dan Varians
Hypothesis Test Regresi

Keputusan Bisnis
Sangat sering, data analytics menghasilkan output yang sulit dipahami oleh
staf yang tidak terlatih dalam data science. "P-value" misalnya, output utama dari
banyak alat statistik namun mungkin tidak mudah untuk dipahami.
Namun, terjemahan output analisis seperti "p-value = 0,03" menjadi hasil
seperti "Risiko membuang-buang uang kita dengan membeli dari Pemasok A yang
lebih mahal hanya 3%" mengubah pembahasan tentang data science.
Ini bukan lagi kasus yang mengandalkan Data Analyst atau Data Scientist
untuk membuat terjemahan tersebut. Manajemen harus memahami dasar-dasar data
science untuk mengubah data menjadi informasi dan dapat digunakan untuk
menarik kesimpulan yang tepat.
Setiap kasus yang disajikan dalam buku ini didasarkan pada kasus klien
nyata. Namun, untuk melindungi klien kami, kami telah mengubah nama dan telah
mengubah semua data.
Tools Apa yang Digunakan
Niat kami adalah untuk menyediakan buku referensi yang dapat diikuti oleh
pembaca selangkah demi selangkah. Dengan maksud agar software populer ini
dapat digunakan. Dalam pekerjaan kami dengan klien kami, kami menyadari
persyaratan mereka untuk software yang ingin mereka gunakan:
Software harus tersedia dengan mudah. Hampir semua orang di dunia
memiliki versi Microsoft Office di komputer. Bagian yang tidak terpisahkan
dari ini adalah MS Excel. MS Excel mencakup banyak fungsi yang
membantu melakukan sebagian besar tugas akuisisi data, persiapan data, dan
data analytics yang dijelaskan dalam buku ini. Beberapa pengguna tidak
mengetahui add-in "Analysis ToolPak" yang menambahkan lebih banyak
alat ke tampilan MS Excel. Kami akan memperbaikinya.
MS Power BI memperluas lingkup MS Office dengan visualisasi yang kuat
dan interaktif serta fasilitas intelijen bisnis. MS Power BI menawarkan
gudang data, persiapan data, dan kemampuan penemuan data untuk
membangun dasbor kolaboratif yang dinamis. Ini tersedia untuk banyak
pengguna MS Office secara gratis.
R adalah bahasa pemrograman untuk komputasi statistik dan grafik. R
Studio menawarkan antarmuka pengguna dan l pengembangan untuk R.
Kedua paket software tersedia secara gratis.
Software harus mudah digunakan. MS Excel adalah paket software yang telah
digunakan banyak orang sebelumnya. Ini berarti ahli analis dapat bekerja dengan
lingkungan yang sudah dikenal, hanya dengan menambahkan beberapa alat baru.
Hampir sama berlaku untuk MS Power BI. Ini mungkin baru bagi banyak analis,
tetapi sekali lagi ia memiliki antarmuka pengguna Microsoft dan banyak fungsi
yang diadaptasi dari MS Excel. Pembelajaran untuk MS Power BI biasanya cukup
mahal tetapi mudah dipelajari.
R adalah bahasa pemrograman dan termasuk dalam lingkup software bebas
untuk komputasi statistik dan grafik. R banyak digunakan oleh ahli statistik
dan penambang data untuk mengembangkan software untuk pertengkaran
dan data analytics (Wikipedia, 2020). Belajar R (melalui R Studio) lebih
mudah bagi orang-orang dengan latar belakang pemrograman yang ringan.
Kurva belajar untuk R mungkin lebih lama bagi banyak orang, tetapi benefts
sangat baik. R memiliki koleksi fungsi siap pakai tanpa akhir yang tumbuh
setiap hari. R bahkan dapat diintegrasikan ke MS Power BI sehingga fungsi
dan grafik khusus dapat diproduksi dalam R dan ditampilkan di tampilan
MS yang lebih familiar dan lebih rapi.
Software harus kompatibel dengan software lain yang umum digunakan.
Integrasi tabel dan grafik MS Excel ke dalam presentasi MS PowerPoint apa pun
semulus mungkin. Bahkan ada kemungkinan menghubungkan MS Excel atau MS
Power BI secara dinamis dengan sumber data di server atau situs web mana pun
dan memasukkan output terkait analisis ke MS PowerPoint. Hal ini memungkinkan
analyst untuk memiliki template/tampilan PowerPoint yang mengesankan atau
dasbor Power BI yang biasa dengan data aktual kapan pun digunakan.
Setiap kali kami memperkenalkan software lain seperti Minitab, SigmaXL,
SAS, atau SPSS, ketersediaan terbatas paket software ini merupakan hambatan
untuk menerapkan alat yang baru dipelajari ke dalam organisasi.
Oleh karena itu, jika Anda ingin sukses dalam upaya perubahan Anda,
pastikan Anda mempertimbangkan poin-poin yang disebutkan di atas. Jika saya
adalah pemilik bisnis atau manajer yang bertanggung jawab atas untung dan rugi,
saya akan mempertimbangkan dengan hati-hati, apakah saya perlu membeli
sejumlah lisensi dengan biaya lisensi tahunan software baru jika MS Excel dan R
atau Python dapat melakukan pekerjaan itu dan tersedia secara gratis, atau dalam
biaya lisensi Microsoft Office saya saat ini.
Oleh karena itu, kasus-kasus dalam buku ini menunjukkan analisis yang
dilakukan menggunakan MS Excel, MS Power BI, dan R Studio. Untuk
menindaklanjuti, Anda perlu menonaktifkan Add-In MS Excel dan menginstal
software lain. Berikut adalah petunjuk langkah demi langkah.
Mengaktifkan dan Menggunakan Alat Analisis MS Excel ToolPak
Banyak pengguna MS Excel tidak mengetahui alat yang dimuat ke dalam
office package yang sudah dikenal ini. MS Excel tidak hanya memiliki fungsi
untuk hampir setiap tugas manipulasi dan analisis data yang mungkin dibangun di
dalamnya tetapi juga dilengkapi dengan paket alat Analisis yang hampir tidak
digunakan.
Dan, itu hanya perlu diaktifkan untuk membuatnya muncul sebagai
kumpulan makro yang memiliki potensi membuat analisis Anda bekerja lebih
mudah.
Setelah memuat MS Excel, tekan File – Options – Add-ins – Go dan klik
centang kotak Analysis ToolPak (Gambar 0.3). Hanya ini yang perlu Anda lakukan
untuk menambahkan kumpulan alat analisis yang umumnya diperlukan ke Excel
Anda (Tabel 0.3). Alat-alat ini dapat ditemukan di Data – Data Analysis (Gambar
0.4).

Gambar 0.3 Mengaktifkan MS Excel Analysis ToolPak


Gambar 0.4 Analysis ToolPak dalam MS Excel
Setelah mengaktifkan Analysis ToolPak, fungsi yang ditunjukkan pada
Tabel 0.3 tersedia.
Tabel 0.3 alat yang tersedia dalam MS Excel Analysis ToolPak

Mari kita lebih mengenal seperangkat Tools yang baru ditemukan.


Langkah 0.1 Menghasilkan data acak
1. Buka Sheet Excel baru.
2. Berikan Nama kolom A ‘Grup’ dan kolom B ‘Data’.
3. Pilih Data – Data Analysis – Random Number Generation.
4. Pilih 1 untuk Jumlah Variabel, 1000 untuk Jumlah Bilangan Acak, Normal
untuk Distribusi, 100 untuk Rata-rata (Mean) dan 5 untuk Deviasi Standar dan
tempatkan kursor di B2 setelah memilih Rentang Output (Gambar 0,5).
5. Pilih Data – Data Analysis– Random Number Generation.
6. Pilih 1 untuk Jumlah Variabel, 1000 untuk Jumlah Angka Acak, pilih Patterned
(berpola) untuk Distribusi, from 1 to 2 in steps of 1, repeating each number : 5
kali, repeating sequence : 100 kali dan tempatkan kursor di A2 setelah memilih
Output Range (Gambar 0,5).
7. Pilih Coloumn Group, Home – Find & Select – Replace. Find what: 1, ganti
dengan : Grup 1, Replace all. Find what : 2, Ganti dengan : Grup 2, Replace all.
Gambar 0.5 Menghasilkan Dua Kolom dengan Data Acak
Setelah Anda menghasilkan data (Gambar 0.6), Anda akan memiliki hasil
yang berbeda pada lembar kerja Anda.

Gambar 0.6 Menentukan Statistik Deskriptif


Langkah 0.2 Menganalisis Statistik Deskriptif
1. Pilih Data – Data analytics – Statistik Deskriptif.
2. Pilih $B$1:$B$1001 untuk Rentang Input. Atau, cukup pilih B1 dengan kursor
Anda dan pilih Control + Shift + ⇩ untuk menandai seluruh rentang data.
3. Pilih New Worksheet Ply dan pilih Summary Statistics dan Confidence Level
untuk Mean pada 95% (Gambar 0.6).
Akibatnya, statistik deskriptif dengan daftar indikator paling dasar untuk
data Anda dalam Data (Gambar 0,7, statistik deskriptif Anda akan berbeda).
Statistik deskriptif akan dijelaskan nanti dalam buku ini.
Gambar 0.7 Output Statistik Deskriptif
Langkah 0.3 Plot Histogram
1. Pilih Data pada Sheet1 (Mark B1 dan pilih Control + Shift + ⇩).
2. Pilih Insert – Chart –Histogram.
3. Simpan pekerjaan Anda dengan nama Norm.xlsx di desktop atau di folder
pilihan Anda.

Gambar 0.8 Histogram


Histogram untuk Data akan dibuat (Gambar 0.8). Histogram ini telah
ditingkatkan dengan mengubah sumbu X di Bin Width dan Tick Marks dan dengan
menambahkan Chart Title. Histogram ini siap untuk dimasukkan ke dalam
presentasi PowerPoint, Dokumen Word, atau bahkan Email atau Chat.
Langkah 0.4 Menampilkan Boxplot per Group
1. Pilih Data and Group pada Sheet1 (Tandai A1:B1 dan pencet tombol Control +
Shift + ⇩).
2. Pilih Insert – Chart – Box and Whisker.

Gambar 0.9 Plot Box and Whisker per Group


Download dan Menggunakan MS Power BI
MS Power BI tersedia untuk diunduh dari Microsoft Store jika MS Offce berjalan
di komputer Anda. Microsoft Power BI menempatkan visualisasi di fingertips
Anda. Jika layanan web Power BI tersedia untuk Anda, Anda bahkan dapat berbagi
visualisasi, yaitu dasbor Anda dengan tim Anda melalui server Power BI.
Langkah 0.5 Memuat Data Dari file Power Bi
1. Buka MS Power BI Desktop.
2. Pilih Get Data– Excel – Connect.
3. Pilih Open norm.xlsx di lokasi tempat Anda menyimpannya.
4. Centang kotak di depan Sheet1 – Load (Sheet1 membawa tabel data).
Tidak seperti Excel, data tidak akan muncul dalam tabel di layar. Tabel dan kolom
data tercantum di bawah Bidang di sebelah kanan.
Langkah 0.6 Memuat Visual Untuk Histogram Dari Data di Power BI
1. Pilih ". . ." di bawah Visualisations– Dapatkan lebih banyak visual
2. Cari histogram
3. Tambahkan Histogram Chart (atau histogram lain pilihan Anda)
4. Pilih ikon histogram yang baru diimpor
5. Tingkatkan ukuran area plot sesuai keinginan Anda
6. Pastikan area plot histogram dipilih.
7. Tarik bidang Normdari kanan ke dalam Nilai kotak di bawah Visualisasi.
8. Ubah format Title, Axes, etc, dll. (Gambar 0.10)

Gambar 0.10 Power BI Histrogram


Power BI ada untuk desktop dan perangkat seluler. Semua versi tersedia dari
Microsoft Store.
Mengunduh dan Menggunakan R dan R Studio
Pertama, instal R dan R Studio dari server mana pun yang disediakan di situs web:
■ Unduh R dari https://www.r-project.org/.
■ Unduh R Studio dari https://www.rstudio.com/.
■ Mulai R Studio.
Pemrograman R menawarkan serangkaian pustaka besar dan terus
berkembang yang membantu rutinitas pemrograman, menganalisis data, dan
memvisualisasi plot dengan kode minimal dan fleksibilitas yang besar. Sebagian
besar pustaka ini perlu dimuat sebelum fungsi dapat digunakan. Kami akan
menguraikan ini secara rinci selama aplikasi kasus kami dalam buku ini.
Langkah 0.7 Memuat Data Dari Norm. Xlsx Ke R Studio Dan Memuat Analisis
Dasar Dan Paket Grafis "Pastecs" (Gambar 0.11).
1. Buka R Studio.
2. Pilih File – Impor Dataset– Dari Excel.
3. Pilih Browse – norm.xlsx dari lokasi tempat Anda menyimpannya.
4. Pilih Lembar: Data – Import.
5. Tabel data Normditampilkan di Tab norm dan di Environment.
6. Di Tab Packages, Cari "pastecs", jika ditemukan, pilih.
7. Jika tidak ditemukan, pilih Install.
8. Install Packages – Packages: pastecs – Install.
Gambar 0.11 Tampilan R-Studio
Langkah 0.8 Menganalisis Statistik Deskriptif Norma.
Ketik yang berikut ini di Konsol:
# See all packages installed and available in Tab Packages library() # If package
pastecs is part of the list, do install.packages("pastecs")
# Show packages currently loaded search() # If package pastecs is not loaded, do
library(pastecs)
# Show descriptive statistics for all columns at data frame (table)
Normstat.desc(Norm)
# Show descriptive statistics for column Data at data frame (table)
Normstat.desc(Norm$Data)
Output :
1. Semua kolom dalam tabel Normtermasuk dalam statistik deskriptif (Gambar
0,12).
2. Hanya kolom Data dalam tabel Normyang termasuk dalam statistik deskriptif
(Gambar 0,12).
Output dari statistik deskriptif memberikan gambaran umum tentang parameter
yang menggambarkan himpunan data. Ini adalah analisis paling dasar untuk
menarik kesimpulan tentang kecenderungan sentral, variasi, dan bentuk distribusi
himpunan data.
Langkah 0.9 Melakukan Tes Normalitas (Tes Shapiro–Wilk)
# Melakukan pengujian pada normalitas data kolom pada bingkai data norm
shapiro.test(Norm$Data)

Gambar 0.12 Statistik Deskriptif untuk contoh file ‘norm’ pada R console
Gambar 0.13 Statistik Deskriptif, Tes Normalitas dan Histogram untuk file norm
Output :
Indikator normalitas untuk Norm ditunjukkan menunjukkan bahwa Norm
mengikuti distribusi normal (Gambar 0,13), yaitu p-value > 0,05.
Langkah 0.10 Plot Histogram Sederhana Untuk Norm
# Merencanakan histogram untuk Norm hist(Norm$Data)
Output :
Histogram dasar untuk Norm ditampilkan di tab Plot (tidak ditampilkan).
Karena kita baru saja mengkonfirmasi bahwa data kita di kolom Data
memang didistribusikan secara normal, kita juga dapat menambahkan bentuk bel
ke histogram.
Langkah 0.11 Plot Simple Histogram Untuk Norm Dengan Bell Shape
# Moving column Data into variable Data
data <- Norm$Data
# Calculating mean and standard deviation of data
m <- mean(data)
std <- sqrt(var(data))
# Plotting histogram for Norm
hist(data, density=20, breaks=20, xlab="Norm", main="Normal Curve over
Histogram", cex.main=2.00, col="lightblue", cex. lab=1.50, cex.axis=1.50,
prob=TRUE,)
# Set margin
par(mar = c(5, 5, 5, 5))
# Plot bell shape
curve(dnorm(x, mean=m, sd=std), lwd=2, add=TRUE, yaxt="n",
col="darkblue")
Output :
Histogram dasar untuk Norm termasuk bell shape yang mewakili normalitas
ditampilkan di tab Plots (Gambar 0.14).
Pilih Plots – Export – Copy ke Clipboard membuat histogram tersedia untuk
digunakan di program lain. Gambar 0,14 telah disisipkan dengan cara ini.
Contoh dasar ini menunjukkan bagaimana R Studio dapat membantu
menghasilkan analisis dan visualisasi dengan cepat dan dengan input minimal. Tes
Shapiro–Wilk pada normalitas tidak ada di MS Excel dan oleh karena itu
merupakan tambahan yang sangat baik untuk koleksi alat Anda.
Khususnya analisis data yang sangat kompleks seperti analisis faktor
eksplorasi atau exploratory factor analysis (EFA), analisis faktor konvertitori atau
confrmatory factor analysis (CFA), pemodelan persamaan struktural atau structural
equation modelling (SEM) dan banyak lagi prosedur yang agak rumit dapat
dijalankan di R Studio dengan sedikit usaha. Mungkin paket tambahan perlu
dimuat untuk membuat alat lain tersedia. Semua paket ini dapat diakses untuk
diunduh dan diinstal.
Gambar 0.14 Histogram dan Bell Shape untuk Norm
Tab Bantuan menawarkan informasi untuk fungsi yang tersedia dan paket
tempat mereka berada.
Fungsi-fungsi yang disebutkan di atas tidak ada di MS Excel dan akan
sangat sulit untuk diprogram dalam Visual Basic. R Studio mengepakkan celah ini
dan sangat memperkaya kotak peralatan Anda.
BAB 1
PENGENALAN DATA ANALYTICS DAN DATA SCIENCE
Data science adalah "konsep untuk menyatukan statistik,
data analytics, pembelajaran mesin dan metode terkaitnya" untuk
"memahami dan menganalisis fenomena aktual" dengan data.
(Hayashi, 1998)

Data Science bukanlah bidang penelitian baru. Ini adalah ilmu pengetahuan
lama yang harus kita temukan kembali, segarkan, dan digunakan untuk mengubah
jumlah data yang terus meningkat di semua aspek kehidupan profesional dan
pribadi menjadi informasi yang berguna bagi organisasi, pelanggan, dan anggota
mereka.
Dalam bab ini, kami akan memperkenalkan berbagai komponen data science
dan fase-fasenya: dari pertanyaan organisasi hingga informasi yang bernilai, hingga
kesimpulan berbasis data. Kami akan memperkenalkan alat grafis dan alat statistik
yang umum digunakan untuk tipe data yang berbeda. Selain itu, kita akan
membahas kompetensi yang diperlukan yang harus diperoleh seorang data scientist
untuk mengikuti perkembangan yang fas-moving dalam disiplin ilmu analitis dan
bidang terkait.
ISI

➤ Komponen Data analytics

➤ Big Data dan Hubungannya dengan Data analytics

➤ Data analytics – Dasar untuk Data science dan Kecerdasan Buatan

➤ Fase Data analytics

➤ Kompetensi Seorang Data analyst


Bagian Alat yang Digunakan
Persiapan Data Ex, R
Data analytics Ex, R
Penceritaan Analitis Ex
Alat Analisis yang digunakan : Ex = Ms Excel, R = R Studio
Highlights
Setelah menyelesaikan bab ini, Anda akan dapat . . .
■ Memahami akan Big Data dan data science, dan memahami cara
menghubungkan ke data analytics.
■ Pahami pentingnya memulai tugas data analytics dengan pertanyaan atau
hipotesis yang relevan dengan bisnis.
■ Pahami tanda mempersiapkan, mengubah, dan membersihkan semua set data
sebelum menganalisisnya dan menarik kesimpulan.
■ Realisasikan nilai dari terjemahan data analyst "jargon" ke dalam bisnis untuk
mendukung penggunaan data yang tepat untuk benefit organisasi Anda.
■ Merekomendasikan kompetensi yang perlu diperoleh dan diperkuat oleh
ilmuwan data Anda untuk dipersiapkan pada pekerjaan tersebut.

Komponen Data analytics


Data analytics adalah disiplin yang secara menyeluruh mencakup
pengelolaan data yang lengkap termasuk mengumpulkan, memvalidasi,
membersihkan, mengatur, menyimpan, dan menganalisis data. Data analysis
adalah proses memeriksa secara rinci mengenai komponen-komponen dari
sekumpulan data tertentu, memisahkannya dan mempelajari bagian-bagian secara
terpisah dan hubungannya antara satu sama lain. Data analysis seperti itu
merupakan fase data analytics. Baik data analytics maupun data analysis digunakan
untuk menunjukkan pola, tren, dan anomali yang ada di dalam data, dan dengan
demikian memberikan wawasan yang dibutuhkan organisasi untuk memungkinkan
pengambilan keputusan berbasis bukti. Sederhananya, data analysis melihat masa
lalu, sementara data analytics mencoba memprediksi masa depan (Xia, 2015).
Data analytics terdiri dari komponen utama berikut:
1. Descriptive Analytics (analisis post-mortem): memberikan ringkasan data
historis untuk menghasilkan informasi yang berguna bagi kesimpulan yang
relevan dengan organisasi. Ini memberikan koneksi yang menghubungkan
sebab dan akibat pada peristiwa masa lalu.
2. Predictive Analytics : memberikan ringkasan tokoh historis untuk
memahami pola dalam data dengan tujuan untuk menghasilkan prediksi
tentang peristiwa di masa depan. Analisis prediktif didasarkan pada analitis
deskriptif.
3. Prescriptive Analytics : didasarkan pada prediksi dan akar penyebab yang
mendasarinya. Prescriptive Analytics membantu memberikan saran tindakan
dan mengevaluasi potensi akan manfaatnya. Prescriptive Analytics sering
kali mencakup sebagai bagian yang tak terpisahkan dari Predictive
Analytics.
4. Text Analytics : menggunakan metode statistik dan non-statistik untuk
mengekstrak informasi dan kesimpulan yang berguna dari data yang tidak
terstruktur dari sumber tekstual.
Buku ini mencakup semua komponen ini dalam kedalaman yang berbeda,
dan mereka diilustrasikan dalam studi kasus.
Tidak hanya perpindahan dari apa yang disebut Big Data Analytics ke segala
jenis data Analytics. Ada juga tren yang sehat untuk melibatkan semua tingkat
manajemen dan staf organisasi ke dalam feld manajemen informasi yang tidak
begitu baru ini. Manajer progresif terbiasa dengan data yang tersedia dan dengan
tren, pergeseran, atau pola lain dalam data mereka dan menggunakannya dalam
pengambilan keputusan. Oleh karena itu, sudah saatnya untuk memastikan bahwa
data yang tepat dikumpulkan dengan cara yang tepat, disaring, diatur, dan
dianalisis dengan alat yang sesuai untuk memberikan wawasan yang dibutuhkan
organisasi untuk membuat keputusan.

Big Data dan Hubungannya dengan Data Analytics


Big Data menjelaskan kumpulan data yang begitu banyak dan kompleks
sehingga aplikasi pemrosesan data tradisional tidak dapat menanganinya. Big Data
ditangguhkan oleh tiga Vs, Volume, Velocity, Variety (Russom, 2011).
Pada awal tahun 2000-an, Big Data menimbulkan masalah serius bagi
organisasi. Di satu sisi, volume data yang tersedia naik secara eksponensial. Di sisi
lain, kecepatan CPU dan kapasitas penyimpanan tidak dapat mengimbangi jumlah
data yang ada. Pada saat itu, penanganan big data dicadangkan untuk beberapa
perusahaan dan organisasi yang mengandalkan data analytics untuk tetap berbisnis.
Seberapa besar Big Data? Berikut adalah beberapa contoh data yang dibuat
atau digunakan setiap menit (Data Never Sleeps 7.0, 2020):
- 511,000 tweet dikirim di Twitter,
– 694.444 jam video ditonton melalui Netflix,
– 4.500.000 video ditonton oleh pengguna di YouTube,
– 4,500,000 pencarian dilakukan di Google,
– 18.100.000 pesan dikirim.
Secara total, diperkirakan bahwa informasi yang disimpan di seluruh dunia
akan melebihi 40 byte Zeta pada tahun 2020 (NodeGraph, 2020). Yaitu 40 kali
1.0007 byte atau 40 x 1021 byte. Cukup sulit membayangkan angka semacam ini.
Pada tahun 2010, Google memperkirakan jumlah total buku yang pernah
diterbitkan lebih dari 129 juta (Parr, 2010). Di bawah asumsi tertentu, buku-buku
ini akan cukup apabila dimasukkan pada hard drive dengan kapasitas sekitar 60
Tera byte. Ini akan mencakup semua buku, termasuk ajaran filsafat Plato yang
masih kita sukai, buku-buku scientific oleh Albert Einstein tentang fisika, pidato
oleh John F Kennedy yang masih diingat dunia dan semua omong kosong terkait
penggambaran diri otobiografi, umat manusia tentu tidak perlu itu. Dan itu adalah
ruang penyimpanan, beberapa dari kita miliki itu di rumah dan apalagi di
perusahaan.
Jumla
h
inform

Ini terdengar sangat besar dan seperti pencapaian teknologi yang hebat bagi
umat manusia. Untuk menyimpan semua data ini, gugus server atau data center
yang luas telah dibangun di seluruh dunia. Server ini perlu ditenagai. Diperkirakan
internet saja menggunakan lebih dari 10% energi dunia (McKenzie, 2021). Dan
semua angka ini meningkat dengan cepat. Mempertimbangkan, bahwa hanya
sekitar 20% dari semua energi yang dikonsumsi oleh pusat data yang dihasilkan
oleh sumber terbarukan – 80% dari energi yang dibutuhkan masih menguras
sumber daya alam kita secara besar-besaran – pencapaian ini harus dilihat dalam
cahaya yang berbeda.
Informasi yang tersedia sebagian berisi detail penting tentang pelanggan
kami dan perilaku pembelian mereka, atau pesaing kami, penawaran mereka, calon
karyawan baru dan banyak media sosial mereka, dan banyak aspek lain dari
kehidupan pribadi dan bisnis. Sebagian besar informasi ini tersedia untuk di akses
secara gratis atau dengan biaya yang relatif murah.
Ini adalah pertanyaan tentang waktu apakah informasi ini termasuk dalam
kategori "Big Data". Jika melakukannya hari ini, mungkin bukan besok, dan
pastinya bukan lusa. Saat ini, bisnis dan bahkan orang dirumah dapat mengakses
komputer dengan penyimpanan data yang sangat besar dan kapasitas penanganan,
baik itu dengan menginstal hardware dan software di rumah atau baik itu dengan
menghubungkan ke kapasitas eksternal. Akibatnya, lebih banyak organisasi
memiliki sarana dan melihat kebutuhan untuk mengumpulkan data tentang
pelanggan dan pesaing mereka, tentang lingkungan operasional mereka, dan
tentang semua aspek tenaga kerja mereka. Organisasi-organisasi ini memperluas
cakupan aktivitas data analytics mereka dan membangun skill mereka untuk
melakukannya.
Beberapa peneliti biasanya menyarankan bahwa data analytics terutama
menggambarkan penanganan data pengguna yang dihasilkan oleh CRM dan sistem
serupa berubah menjadi customer intelligence. Saat ini, cakupan data analytics
terbuka untuk mencakup semua fungsi organisasi. Big data analytics dapat
digunakan untuk membantu bisnis dalam membangun profile pelanggan untuk
menciptakan layanan yang dipersonalisasi dan meningkatkan kepuasan pelanggan.
Meskipun Big Data memiliki beberapa karakteristik khusus yang mungkin
memerlukan beberapa peralatan khusus untuk memperoleh, membersihkan, dan
mengubah data, aturan dan alat untuk Data analytics akan berlaku sama.

Data analytics – Dasar untuk Data science dan Kecerdasan Buatan


Ada banyak istilah yang muncul saat menangani data. Selain "Big Data", ada
istilah seperti "data science", "data analytics", "penambangan data", "kecerdasan
buatan", "pembelajaran mesin", "pembelajaran mendalam", "pengenalan pola",
"jaringan saraf" , dll. Berikut adalah beberapa upaya untuk disambiguasi:
Jika data science adalah rumah bagi semua metode dan alat, maka data
analytics adalah ruangan di rumah itu. Data analytics lebih spesifik dan
terkonsentrasi daripada data science (Springboard India, 2019). Data analyst
memeriksa kumpulan data besar untuk mengidentifikasi tren, mengembangkan
bagan, dan membuat presentasi visual untuk membantu bisnis membuat lebih
banyak keputusan berdasarkan data. Ilmuwan data, di sisi lain, merancang dan
membangun proses baru untuk pemodelan data, dan produksi menggunakan
prototipe, algoritma, model prediktif, dan analisis khusus (Burnham, 2019). Oleh
karena itu, data analytics adalah dasar untuk data science.
Kecerdasan buatan (Artificial Intelligence) didorong oleh pembelajaran
mesin dan pembelajaran mendalam dan banyak bidang lainnya. AI didasarkan pada
banyak disiplin ilmu yang merupakan bagian dari data science, dan begitu juga
data analytics (Gambar 1.1).

Gambar 1.1 Gambaran Dasar Kecerdasan Buatan


Meskipun sulit untuk membedakan dengan baik antara data science dan data
analytics, namun bisa dikatakan apabila memiliki skill data analytics maka itu
sebuah dasar untuk semua bidang terkait lainnya. Tanpa data analytics, mereka
tidak akan berfungsi.
Latihan
■ Apa saja komponen utama data Analytics?
■ Apa saja karakteristik Big Data? Apa tiga V itu?
■ Apa hubungan antara Kecerdasan Buatan, Data science, dan Data analytics?
Fase Data analytics
Selama waktu kami di universitas, kami lebih banyak berurusan dengan data
analytics. Sayangnya, Profesor sering menghabiskan waktunya untuk menjelaskan
derivation dan detail alat data analytics. Misalnya, banyak dari kita mempelajari
segala sesuatu tentang Uji-t termasuk t-distribution, p-value, dll. Fakta yang paling
menarik tampaknya berasal dari tempat pembuatan bir Guinness dan siswa
William Gossett yang mengembangkannya, yang mana itu merupakan alasan dia
tidak diizinkan untuk menerbitkannya dengan nama aslinya tetapi dengan nama
aliasnya atau nama samarannya. Oleh karena itu, tes tersebut disebut student test
sejak saat itu. Dalam pengalaman kami, contoh penerapannya cukup sedikit,
sehingga banyak dari kami keluar dari universitas dengan berpikiran untuk
menghindari statistik di masa depan karena jelas tidak banyak penerapan
praktisnya. Kami ingin menekankan bahwa dengan hanya mengetahui alat dan
latar belakangnya merupakan kompetensi yang tidak akan membawa data analyst
menjadi cukup baik kedepannya. Seorang ahli statistik yang baik belum tentu
seorang data analyst yang baik. Di sisi lain, dari lima fase dari setiap kasus data
analytics (Gambar 1.2), langkah data analytics, yaitu, penerapan alat ini seringkali
lebih mudah. Berikut ini, lima fase untuk data analytics dijelaskan. Fase-fase ini
dipertimbangkan – dalam tingkat kedalaman yang berbeda – dalam kasus aplikasi
dalam buku ini.
Pertanyaan Bisnis
Analytics tidak menghasilkan wawasan dari data. Agar bermanfaat, Analytics
harus diarahkan oleh pertanyaan bisnis yang dipilih secara sengaja dan penting
secara strategis. Misalnya, “Mengapa kita membuang lebih banyak darah
berharga kita yang dikumpulkan daripada banyak bank darah lainnya?”
Pertanyaan ini tidak hanya terkait dengan masalah yang diturunkan dari efisiensi
proses. Ini juga menyampaikan pesan akan pengeluaran sumber daya yang lebih
banyak daripada yang diperlukan. Ini selalu menarik bagi manajemen.

Gambar 1.2 Fase Data analytics


Pada langkah pertama ini, masalah yang terkait dengan bisnis harus
diidentifikasi dengan jelas. Dan itu harus diterjemahkan ke dalam key performance
indicator (KPI) atau kriteria kinerja yang membuat isu tersebut terukur. Dengan
cara ini, kami akan memiliki kontrol atas hasil kinerja, dan seiring waktu kami
dapat memantau perubahan hasil kinerja ini. Selain itu, dengan mendefinisikannya
dengan jelas dan terukur, akan memungkinkan kami mengidentifikasi konteks
yang tepat untuk membandingkan antara hasil kinerja saat ini dan yang seharusnya
dilakukan. Secara keseluruhan, penting untuk terlebih dahulu menjawab
pertanyaan “Apakah kita memiliki kontrol atas hasil kinerja?” sebelum menjawab
pertanyaan lain melalui analisis. Tanpa kontrol, upaya perbaikan yang datang dari
analisis dapat menjadi upaya yang sia-sia.
Tabel 1.1 menunjukkan beberapa contoh menerjemahkan masalah bisnis ke
dalam pertanyaan atau hipotesis terkait data.
Tabel 1.1 Penerjemahan Masalah Bisnis ke dalam Pertanyaan Data analytics
Permasalahan Bisnis Pertanyaan Data analytics
■ Mengapa kita menyia-nyiakan ■ Apakah kita benar-benar membuang
produk darah yang berharga? lebih banyak produk darah daripada
■ Bagaimana kita bisa mengurangi bank darah lainnya? Apa perbedaan
pemborosan seperti itu? yang signifikan?
■ Apa saja yang membuat pemborosan
menjadi tinggi?
■ Bisakah kita mengubah akar
penyebab yang mendasarinya untuk
mengurangi pemborosan?
■ Apakah skor keterlibatan karyawan ■ Apakah ada perbedaan mencolok
meningkat setelah investasi kami antara skor keterlibatan karyawan
tahun lalu? tahun ini dibandingkan tahun lalu?
■ Mengapa kita membutuhkan waktu ■ Apa waktu penyelesaian untuk
lama untuk memutuskan tentang memutuskan tentang ide-ide inovasi
ide-ide inovasi? kami?
■ Berapa persentase ide yang diterima
atau ditolak setelah waktu target?
■ Apa pembalap untuk waktu
penyelesaian yang lama?

Akuisisi Data
Ada banyak cara mengumpulkan data untuk menjawab Pertanyaan Bisnis. Dan
tidak diperlukan alat yang canggih atau hardware dan software yang mahal untuk
mendapatkan data ini di komputer Anda untuk dianalisis. MS Excel dan MS Power
BI sendiri memiliki akuisisi data interface yang kuat untuk menjangkau ke sumber
data yang tersedia secara umum serta ke server dengan berbagai desain. Sebuah
interface yang cocok untuk server organisasi Anda tersedia di antaranya.
Seperti yang diilustrasikan Gambar 1.4, MS Excel dan MS Power BI
memungkinkan kita untuk memuat data dari beberapa jenis file seperti dari file
Text/CSV, dari R dan Python Scrips dll. Selain itu, data dapat diambil dari
database internal dan eksternal, bisa dari MS Access, SQL, atau MySQL atau dari
IBM, SAP, MS Azure Salesforce, Google. Ini termasuk file Big Data di jaringan
komputer dalam format Hadoop dan lainnya. Selain itu, data dapat diunduh dari
hampir semua situs web seperti Wikipedia, Facebook, LinkedIn, Departemen
Statistik, dan banyak lainnya. Secara praktiknya tidak ada batasan untuk hal
tersebut.
MS Excel dan MS Power BI memungkinkan kita tidak hanya mengunduh data dari
ini dan banyak sumber lainnya. Mereka juga memungkinkan tautan menjadi "hot"
atau dapat diakses dengan cepat, yakni segera setelah file tujuan di MS Excel atau
MS Power BI di-refresh, data yang diperbarui diunduh ulang dari sumbernya. Ini
memastikan bahwa data di komputer selalu yang terbaru (Microsoft, 2020).
Tugas 1.1 akan menunjukkan contoh untuk mengunduh data dari URL langsung ke
Excel dan menautkan data ke tabel yang tersedia di URL.
Tugas 1.1 Mengunduh Contoh Data Donasi Trombosit Dari Situs Web
1. Buka MS Excel dengan lembar kerja baru
2. Pilih Data – Get & Transform Data – From Web
3. Masukkan URL https://coe-data.com/platelet-donation/–OK
4. Pilih Platelet Donation Data
5. Pilih Load (Lihat Gambar 1.3).
6. Lembar baru di Excel akan menampung tabel data Platelet Donation
Gambar 1.3 Download Data dan Tautkan Excel ke Website
Jika data di situs web diperbarui, data di MS Excel Anda akan diperbarui
juga setelah lembar kerja di-refresh.
Namun, memiliki data aktual tidak secara otomatis berarti data tersebut
benar. Semua sumber data perlu diperiksa keabsahannya.
Biasanya perlu untuk memvalidasi metode pengumpulan data yang
dilakukan untuk memastikan bahwa datanya cukup berguna untuk dianalisis, yakni
datanya representatif, dapat direproduksi, dan cukup akurat dalam memberikan
informasi yang cukup untuk menjawab pertanyaan yang ada. Alat statistik yang
ada dapat membantu mengidentifikasi potensi masalah dalam proses pengumpulan
data.
Sampel data adalah subset data, yang dipilih dari populasi data yang lebih
besar dengan tujuan mencerminkan karakteristik populasi secara dekat. Alih-alih
mengumpulkan data seluruh populasi, sampel lebih sering diambil untuk
mengurangi waktu dan upaya dalam pengumpulan data.
Suatu sampel dapat dikatakan representatif, jika setiap unit dari populasi
mempunyai kesempatan untuk menjadi bagian dari sampel.

☞ Misalnya, jika Anda ingin memprediksi angkatan kerja, jumlah agen


panggilan yang diperlukan untuk ditempatkan di pusat panggilan untuk setiap
hari dalam seminggu dan setiap slot waktu, Anda harus memiliki semua data
panggilan selama beberapa minggu untuk setiap slot waktu. operasi, atau
Anda memerlukan sampel yang mencakup periode yang sama. Jika jumlah
panggilan biasanya meningkat di awal setiap bulan, Anda perlu memastikan
bahwa Anda memiliki data historis selama beberapa bulan. Umumnya,
sampel yang representatif mewujudkan semua variasi yang diketahui dengan
data.
Jika Anda ingin merencanakan tenaga kerja untuk departemen keuangan
berdasarkan data volume untuk faktur, tagihan, laporan, dll. dan Anda tahu
bahwa periode sibuk mereka dimulai pada akhir November, Anda perlu
memastikan kumpulan data Anda mencakup periode ini.
Metode akuisisi data harus dapat direproduksi. Bahkan dalam lingkup
layanan, akuisisi data sering menggunakan metode subjektif. Data dihasilkan
melalui evaluasi oleh operator. Untuk memberikan hasil analisis yang baik, kita
harus memastikan bahwa semua operator memiliki pemahaman yang sama tentang
definisi operasional, akan apa itu “Ok” dan apa itu “defect”.
Di bank darah, evaluasi akan kualitas salah satu produk akhir yaitu kantong
trombosit, dilakukan oleh operator setelah semua tes laboratorium menunjukkan
hasil yang baik. Semua operator harus memiliki pemahaman yang sama tentang
definisi operasional untuk memastikan bahwa mereka memberikan hasil yang
dapat diulang ketika mengevaluasi kembali kantong darah yang sama.
Akuisisi data perlu memberikan hasil yang akurat, yakni tidak hanya semua
operator harus menyetujui hasilnya. Namun mereka juga harus mematuhi semua
standar dan ambang batas yang telah ditetapkan. Tes akhir selalu mengenai standar
yang ditetapkan, apakah pelanggan akan setuju atau tidak dengan hasil prosesnya.
Sebagai tambahan mengenai metode pengumpulan data tradisional, ada cara
baru yang sangat menarik dalam memanfaatkan data yang tersedia (Lihat daftar
antarmuka pada Gambar 1.4) dengan sedikit usaha, seperti yang ditunjukkan
sebelumnya. MS Excel, MS Power BI, dan R memungkinkan Anda
menghubungkan komputer Anda ke kumpulan data apapun itu (tabel data HTML)
di Wikipedia, Facebook, LinkedIn, dll. Anda dapat memilih untuk membuat tautan
ini lebih dinamis, yakni dengan memperbarui data di komputer Anda setiap kali
dataset online diperbarui.

Gambar 1.4 MS Excel dan MS Power BI Menawarkan Interface yang Kuat untuk
Akuisisi Data
Namun, perlu diingat, jika data tersedia pada apa yang disebut sebagai
sumber data yang kredibel, itu bukan jaminan bahwa data itu sendiri representatif,
dapat direproduksi, dan akurat, yang mana bermanfaat untuk apa yang ingin Anda
analisis.

☞ Jika data dipublikasikan di internet, itu bukan berarti Anda langsung dapat
mempercayai data ini. Validasi data atau sumbernya dahulu sebelum menggunakannya.

Persiapan data
Mengonversi Stacked dalam Data Tidak Bertumpuk
Saat server membatasi input pelanggan dari situs web survei, kemungkinan
besar mereka mengunduh data dalam format yang tertumpuk, yang mana akan
membuat setiap input membuat baris baru dalam tabel yang dihasilkan.
Beberapa alat analisis, seperti ANOVA dan uji hipotesis lainnya,
memerlukan data bertumpuk (stacked data), beberapa alat lain seperti regresi
berfungsi dengan data yang tidak bertumpuk (unstacked data), beberapa alat seperti
statistik deskriptif, berfungsi dalam dua keadaan tersebut.
Penumpukan (stacking) atau pelepasan tumpukan data (unstacking data)
mungkin merupakan langkah yang dibutuhkan dalam data analysis apa pun.
Unstacked data juga disebut sebagai "short data" karena informasi untuk
variabel yang berbeda diatur dalam kolom yang bersebelahan. Stacked data juga
disebut “long data” karena informasi untuk variabel yang berbeda diatur dalam
kolom yang sama (pada Tabel 1.2 disebut Rating), sedangkan nama variabel
ditempatkan pada kolom di sebelahnya (Tabel 1.2 , itu disebut Langkah).
Menggunakan data kepuasan pasien dari kasus yang dibahas kemudian
menunjukkan tabel data yang tidak ditumpuk untuk peringkat untuk langkah
dengan 514 baris (514 pasien), sedangkan versi bertumpuk membutuhkan 5 x 514
= 2570 baris (5 langkah x 514 pasien), maka alasan untuk beri nama "data
panjang".
Melakukan transformasi atau konversi ini di Excel dimungkinkan:
Tugas 1.2 Konversi Stacked Data Menjadi Unstacked Data
1. Buka MS Excel.
2. Buka data di ClinicSurveyStacked.xlsx di sheet Stacked.
3. Jika tabel ini belum diformat sebagai tabel Excel, lakukan langkah-langkah
berikut:
a. Pilih seluruh tabel dengan kursor di A1 dan Shift + Ctrl + dan Shift + Ctrl + ⇩
b. Home – Format as Table. Gaya yang dipilih tidak membuat perbedaan.
c. Karena Anda telah menyertakan baris tajuk dalam pilihan Anda, pastikan untuk
mencentang kotak " My table has headers".
4. Dengan kursor di tabel, pilih Insert – PivotTable – OK. Tabel Pivot dibuat pada
Worksheet baru.
5. Di Worksheet baru ini dengan kursor di templat PivotTable, pilih ID dari
PivotTable dan seret ke Baris, Step ke Kolom dan Rating ke Nilai.
6. Jika Rating tidak dialihkan ke Average of Rating, pilih Sum of Rating atau
Count of Rating dan alihkan Value Field Settings ke Average of Rating.
7. Pada langkah yang sama, Anda mungkin ingin mengubah Format Angka.
8. Dengan kursor di Pivot Table, klik kanan PivotTable Options dan lakukan
beberapa pemformatan. Misalnya, di tab Total & Filter, hapus centang kedua
grand totals.
Tabel 1.2 Membandingkan Data Bertumpuk dan Tidak Bertumpuk

Hasilnya, PivotTable yang telah dibuat akan terlihat seperti Data yang Tidak
Ditumpuk (Unstacked Data) di Tabel 1.2. Dalam contoh kasus kami nanti dalam
buku ini, kami akan menunjukkan cara mengkonversi ini menggunakan R.
Membersihkan Data
Sekalipun metode pengumpulan datanya terbukti dan instrumennya
divalidasi secara statistik, data tersebut masih bisa dikatakan tidak berguna.
Dalam survei, misalnya, beberapa peserta survei mungkin tidak memberikan
masukan yang berguna. Sebagian alasannya mungkin karena mereka dipaksa atau
diberi insentif untuk berpartisipasi dalam survei. Kemudian, kita dapat berasumsi
bahwa beberapa peserta tidak tertarik dengan survei kami. Mereka mungkin telah
memberikan masukan yang valid ke penyelenggara survei yang mapan, tetapi
masukannya mungkin tidak berguna. Atau lebih buruk lagi, input dapat merusak
langkah-langkah analisis berikut. Masukan tersebut dapat berupa peringkat acak
atau peringkat yang sama untuk semua pertanyaan atau pernyataan.
Oleh karena itu, persiapan data diperlukan untuk menemukan dan
menghilangkan input tersebut untuk memasukkan data ke dalam analisis yang
benar-benar bernilai.
Penyiapan data juga mencakup pemformatan data agar dapat digunakan
dengan software analisis yang disukai. Biasanya, data yang diunduh dari sistem
tidak sesuai dengan formatnya untuk dimasukkan ke dalam software analisis, Excel
misalnya (gambar 1.5). Namun, dalam banyak kasus bahwa data dapat diatur
ulang, diformat ulang, atau diubah sehingga software dapat menanganinya.. Tabel
data yang diformat dengan sempurna ditunjukkan pada Gambar 1.6.
Tidak selalu software analisis akan berhenti bekerja karena format data yang
salah. Dalam kasus terburuk, software mungkin masih berfungsi namun
memberikan hasil yang salah.
Konversi data dan transformasi data akan ditampilkan nanti dalam contoh
kasus di buku ini. Kami akan menggunakan software yang tersedia secara luas
seperti MS Excel dan R Studio.
Gambar 1.5 Tabel Data Sebelum di Format Ulang

Gambar 1.6 Tabel Data Setelah di Format Ulang


Data analytics
Descriptive Statistics
Tujuan dari sebagian besar prosedur data analytics kami adalah untuk
mengenali pola dalam data. Pola-pola ini terbuat dari variasi. Akar penyebabnya
dapat diperoleh dengan menjelaskan variasi yang ada, dan itu memiliki arti bagi
organisasi yang mana hal tersebut menjadi tugas utama bagi setiap data analyst.
Langkah pertama dalam setiap data analytics yaitu harus menentukan
statistik deskriptif. Gambar 1.7 menunjukkan statistik deskriptif dari proses
ekstraksi trombosit di fasilitas donor darah. Rata-rata, dibutuhkan sekitar 73 menit
untuk menyelesaikan satu siklus donor trombosit.
Mengapa ini dirasa penting untuk mengetahui statistik deskriptif? Dalam hal
ini, merupakan dasar untuk penjadwalan donor atau perencanaan kebutuhan
perawat, dll. Banyak keputusan yang dapat dibuat berdasarkan angka ini. Sebagai
contoh, setelah perawat menyiapkan donor dan proses berjalan, dia tahu bahwa
tidak banyak yang perlu dilakukan untuk donor ini selama lebih dari satu jam.
Tabel 1.3 Aturan untuk Memformat Tabel Data
ATURAN UNTUK MEMFORMAT TABEL DATA
1. Hindari data agregat. Jika memungkinkan, dapatkan data mentah dalam tabel
sederhana, terkadang disebut data frame.
2. Tabel ini biasanya menampilkan variabel yang diatur dalam kolom tabel sedangkan
baris tabel menampilkan dataset, yakni catatan data yang termasuk dalam unit yang
sama. Pada tabel yang ditunjukkan pada Gambar 1.5, ID Kantong Darah menandai
baris dengan semua data yang terkumpul untuk kantong darah ini.
3. Pastikan data Anda memiliki nomor ID untuk setiap unit. Ini memungkinkan untuk
mencari hubungan ke tabel lain. Selain itu, hal ini membantu saat menganonimkan
data.
4. Tabel data untuk analisis tidak boleh memuat data pribadi. Pertama, ini diwajibkan
oleh hukum di banyak negara. Kedua, menunjukkan nama ke penganalisis dapat
menyebabkan bias selama analisis. Anonimkan data Anda.
5. Pastikan tabel data Anda hanya memiliki satu baris header. Sebagian besar software
akan otomatis memilih tabel lengkap, bahkan dengan beberapa baris header
(Gambar 1.5) secara default. Jika tidak memungkinkan dengan beberapa baris
header (Gambar 1.5), software akan menampilkan pesan error selama analisis.
6. Gunakan header pendek yang sederhana, bisa dengan nama untuk variabel. Software
analisis dapat memotong nama variabel yang panjang setelah sejumlah karakter
tertentu. Mungkin sulit untuk membedakannya dalam hasil analisis.
7. Akan lebih baik jika tidak ada spasi di nama variabel, misalnya di header. Dengan
begitu, beberapa software analisis memberikan output yang lebih mudah dipahami.
8. Pastikan semua data yang digunakan pada kolom yang sama memiliki format yang
sama. Misalnya, MS Excel membaca Tanggal "14 Nov 2019" di tabel kami untuk
disimpan sebagai tanggal atau sebagai teks. Kedua format mungkin terlihat persis
sama. Namun, analisis yang melibatkan kolom ini tidak akan berhasil. Hal tersebut
membuat kita harus berhati-hati sejak awal pengumpulan data. Kegagalan semacam
ini jarang ditemukan.
9. Standarisasi semua nama. Terutama bidang teks seperti "CentrifugeType" harus
menunjukkan nama yang sama untuk jenis yang sama. “H10” dan “H 10” akan
menandai jenis yang berbeda dan akan membagi kumpulan data Anda menjadi
sampel yang lebih kecil per jenis.
Gambar 1.7 Statistik Deskriptif untuk Durasi Donasi Trombosit per menit
Seberapa baik kesimpulan ini? Kesimpulan berdasarkan rata-rata, bisa
dikatakan cukup buruk. Biasanya, kesimpulan ini bisa sangat menyesatkan.
Hampir tidak pernah terjadi bahwa siklus ini memakan waktu 73,05 menit. Dan
hanya membutuhkan waktu paling sedikit 28 menit dan paling banyak 119 menit.
Indikator yang lebih baik untuk menggambarkan apa yang sebenarnya
terjadi dalam situasi bisnis adalah indikator yang dapat menjelaskan variasi seperti
Minimum, Maksimum, range, dan standar Deviasi. Sedangkan Minimum dan
Maksimum, sebagai contoh Rentang = Maksimum – Minimum, dapat dihitung
untuk setiap set data dengan arti yang selalu sama, arti Dari standar deviasi
tergantung pada distribusi data, dan pada bentuk dari histogram.
"Sebuah gambar memiliki arti seribu kata" juga berlaku di sini. Histogram
data donasi trombosit kami, yang ditunjukkan pada Gambar 1.8, memberi tahu
Anda lebih dari sekadar descriptive statistics yang pernah ada. Hal ni memberi tahu
Anda bahwa sebagian besar, sumbangan trombosit membutuhkan waktu sekitar 74
menit. Terkadang, prosesnya bisa membutuhkan waktu waktu sekitar satu jam.
Terkadang, proses ini bisa memakan waktu satu setengah jam. Semakin kita
menyimpang dari rata-rata 73,05 menit, maka semakin kecil kemungkinan
durasinya.
Gambar 1.8 Histogram Durasi Proses Donasi Trombosit dalam menit

Anda mungkin juga menyukai