Anda di halaman 1dari 8

Former Banker - Data Analyst Enthusiast (+62) 812 3199 2234 | vikkoputra@gmail.

com
https://www. linkedin.com/in/vikko-putra
Vikko Putra Hasian Hutapea Portfolio: https://bit.ly/3FbaOpg
Depok - 16434, Indonesia

UPSCALE - TECHNICAL TEST DATA ANALYST

Bagian 1: Analisis Data

ID Gender Age Education Income

1 Male 35 Bachelor Rp 50.000

2 Female 28 Master Rp 75.000

3 Male 45 PhD Rp 100.000

4 Female 32 Bachelor Rp 60.000

5 Male 27 Bachelor Rp 40.000

6 Female 41 Master Rp 90.000

7 Female 34 PhD Rp 120.000

8 Male 39 Master Rp 80.000

9 Male 44 Bachelor Rp 95.000

10 Female 26 Bachelor Rp 35.000

Berdasarkan data yang diberikan, telah dilakukan pengerjaan test pada Microsoft SQL Server
Management dengan menggunakan query berikut:

1. Berapa rata-rata usia dari data set tersebut?


Jawaban:

BEGIN
SELECT CAST(AVG(Age) AS INT) AS AverageAge
FROM UPSCALE;
END
Dalam query tersebut, saya mencari rata-rata umur dengan menggunakan fungsi AVG dan
melakukan fungsi CAST untuk mengubah hasil menjadi bilangan bulat tanpa koma. Hasil dari
query tersebut menunjukkan bahwa rata-rata umur adalah 35 tahun.

2. Berapa median dari pendapatan (income) dari data set tersebut?


Jawaban:

SELECT Income
FROM
(SELECT Income, ROW_NUMBER() OVER (ORDER BY Income)
AS RowNum, COUNT(*) OVER () AS TotalCount
FROM UPSCALE
)AS SubQuery
WHERE RowNum = (TotalCount + 1)/2 OR RowNum = (TotalCount + 2)/2;

Query di atas digunakan untuk mencari median dari data yang diberikan. Median adalah nilai
tengah dalam kumpulan data yang diurutkan secara menaik. Pada query tersebut, fungsi
ROW_NUMBER() digunakan untuk mengurutkan data berdasarkan pendapatan (Income),
sementara fungsi COUNT()OVER() digunakan untuk menghitung total jumlah data. Subquery
kemudian digunakan untuk mencari nilai median dengan memilih data pada posisi (TotalCount
+ 1) / 2 dan (TotalCount + 2) / 2.

Namun, jika jumlah data genap, median tidak dapat diwakili oleh satu nilai tengah, sehingga
akan ada dua nilai median. Dalam kasus ini, nilai median yang didapatkan dari data yang
diberikan adalah 75000 dan 80000.

Jika menginginkan hanya satu nilai median, maka dapat melakukan upgrade query menjadi
seperti ini:

SELECT AVG(Income) AS Median


FROM
(SELECT Income, ROW_NUMBER() OVER (ORDER BY Income)
AS RowNum, COUNT(*) OVER () AS TotalCount
FROM UPSCALE
)AS SubQuery
WHERE RowNum = (TotalCount + 1)/2 OR RowNum = (TotalCount + 2)/2;

Dalam pernyataan di atas, telah ditambahkan fungsi AVG() untuk menghitung rata-rata dari
nilai median yang ditemukan. Dengan menghilangkan kondisi OR RowNum = (TotalCount + 2)
/ 2, query ini akan mengambil hanya satu nilai pada posisi median yang benar-benar tengah.
Sehingga, hasil yang akan diberikan adalah rata-rata dari nilai median tersebut menjadi 77500.
3. Berapa persentase laki-laki (Male) dalam data set tersebut?
Jawaban:

SELECT
(COUNT(CASE WHEN Gender = 'Male' THEN 1 END) *100/COUNT(*))
AS Percentage_Male,
(COUNT(CASE WHEN Gender = 'Female' THEN 1 END) *100/COUNT(*))
AS Percentage_Female
FROM
UPSCALE;

Query di atas digunakan untuk menghitung persentase jumlah pria (Percentage_Male) dan
wanita (Percentage_Female) dalam tabel. Persentase dihitung dengan membagi jumlah pria
atau wanita dengan total data, kemudian dikalikan dengan 100. Dalam query ini, digunakan
fungsi COUNT dan CASE WHEN untuk menghitung jumlah masing-masing jenis kelamin
(Gender). Berdasarkan pengolahan data menggunakan query tersebut, hasil persentase
jumlah laki-laki (Male) dalam data ditemukan sebesar 50%.

4. Berapa persentase orang dengan gelar Master dalam data set tersebut?
Jawaban:

SELECT
Education,
COUNT(*) AS Total,
COUNT(*) * 100 / (SELECT COUNT(*) FROM UPSCALE) AS Percentage
FROM
UPSCALE
GROUP BY
Education;

Setelah melakukan pengelompokan (GROUP BY) berdasarkan kolom Education, query ini
menghitung jumlah data dalam setiap kelompok menggunakan fungsi COUNT(*). Selain
itu, persentase juga dihitung untuk setiap kelompok dengan membagi jumlah data dalam
kelompok tersebut dengan total jumlah data dalam tabel, kemudian dikalikan dengan 100.
Hasil dari query ini akan menghasilkan informasi yang berguna mengenai jumlah data dan
persentase dalam setiap tingkat pendidikan, dengan persentase orang dengan gelar Master
sebesar 30%.
5. Berapa usia rata-rata dari orang-orang dengan gelar PhD dalam data set tersebut?
Jawaban:

BEGIN
SELECT Education, AVG(Age) AS AverageAge
FROM UPSCALE
GROUP BY Education;
END

Pada query ini, data pendidikan (Education) diambil bersama dengan rata-rata usia
(AverageAge) dari tabel. Data tersebut dikelompokkan berdasarkan pendidikan, sehingga
setiap kelompok pendidikan memiliki rata-rata usia yang terkait. Berdasarkan hasil dari
pengolahan query diatas, maka usia rata-rata dari orang-orang dengan gelar PhD dalam data
set adalah 39.5 tahun.

Bagian 2: Pemecahan Masalah

1. Anda diberikan tugas untuk menghitung rata-rata pendapatan dari setiap jenis kelamin
(gender) dalam suatu perusahaan. Bagaimana cara Anda melakukannya?
Jawaban:
• Mengumpulkan Data: Pertama, saya akan mengumpulkan data yang diperlukan untuk
analisis ini.

• Membersihkan Data: Selanjutnya saya akan mulai membersihkan data. Ini termasuk
memeriksa keberadaan data yang hilang, menghapus data yang tidak relevan atau
tidak lengkap, dan menormalisasi format data agar sesuai dengan analisis yang akan
dilakukan.

• Menganalisis Data: Saya akan menggunakan alat atau bahasa pemrograman seperti
Python atau SQL untuk melakukan analisis data. Saya akan menggunakan operasi
pengelompokan berdasarkan jenis kelamin dan menghitung rata-rata pendapatan
untuk setiap kelompok tersebut.

• Memberikan Kesimpulan: Langkah terakhir adalah menyusun kesimpulan berdasarkan


analisis yang dilakukan. Saya akan menuliskan temuan-temuan penting mengenai
perbedaan rata-rata pendapatan antara jenis kelamin dan memberikan rekomendasi
jika diperlukan.
2. Dalam proyek terbaru, Anda harus menemukan alasan mengapa penjualan produk
tertentu menurun. Apa yang akan Anda lakukan untuk menemukan akar permasalahan
tersebut?
Jawaban:
• Memahami dan merumuskan masalah: Pertama-tama, saya akan berkomunikasi
dengan tim atau pihak terkait untuk mendapatkan pemahaman yang jelas tentang
penurunan penjualan produk tertentu. Saya akan mengumpulkan informasi tentang
produk tersebut, periode waktu penurunan penjualan, dan setiap perubahan yang
terjadi di perusahaan.

• Mengumpulkan data penjualan: Langkah selanjutnya adalah mengumpulkan data


penjualan produk tersebut. Saya juga akan mencari data historis penjualan untuk
membandingkan tren penjualan sebelumnya dengan periode penurunan penjualan
saat ini.

• Menganalisis tren penjualan: Saya akan menggunakan metode statistik dan visualisasi
data untuk memahami perubahan penjualan dari waktu ke waktu. Hal ini dapat
melibatkan penggunaan grafik, diagram, atau metode lainnya untuk
memvisualisasikan data penjualan.

• Mengeksplorasi faktor internal: Saya akan menganalisis data internal seperti strategi
pemasaran, harga produk, promosi, dan perubahan internal lainnya yang dapat
mempengaruhi minat dan permintaan pelanggan terhadap produk tersebut.

• Mengeksplorasi faktor eksternal: Saya akan mencari data dan informasi terkait dari
sumber eksternal seperti laporan industri, analisis pasar, dan sumber informasi
lainnya.

• Melakukan analisis komparatif: Saya akan melakukan analisis komparatif untuk


membandingkan data penjualan dengan data terkait. Misalnya, jika ada penurunan
penjualan pada periode yang sama dengan peningkatan pesaing, saya akan
membandingkan tren penjualan kami dengan pesaing untuk melihat apakah ada
hubungan antara keduanya.

• Mengidentifikasi akar permasalahan: Saya akan mencoba membuat hipotesis atau


kesimpulan tentang apa yang mungkin menjadi penyebab penurunan penjualan.

• Membuat rekomendasi dan tindakan perbaikan: Rekomendasi ini dapat meliputi


perubahan dalam strategi pemasaran, penyesuaian harga, peningkatan kualitas
produk, pengembangan fitur baru, atau langkah-langkah lainnya yang dapat
meningkatkan minat dan permintaan pelanggan terhadap produk tersebut.
3. Sebuah perusahaan memiliki data pelanggan dan ingin meningkatkan konversi penjualan.
Apa strategi yang akan Anda sarankan untuk mencapai tujuan tersebut?
Jawaban:
• Memahami Data Pelanggan: Analisis data pelanggan akan memberikan wawasan
tentang profil pelanggan, perilaku pembelian, preferensi produk, dan pola pembelian
yang mungkin ada.
• Segmentasi Pelanggan: Melakukan segmentasi pelanggan berdasarkan variabel untuk
memahami dengan lebih baik preferensi dan kebutuhan pelanggan di setiap segmen.

• Analisis Kesengajaan Churn: Menganalisis perilaku pembelian sebelumnya, pola


kunjungan ke situs web, atau interaksi dengan perusahaan. Hal ini akan memungkinkan
perusahaan untuk mengambil langkah-langkah pencegahan untuk mempertahankan
pelanggan.

• Personalisasi dan Penawaran Khusus: Menggunakan data pelanggan yang ada untuk
membuat strategi personalisasi agar dapat meningkatkan konversi penjualan.
Misalnya, dengan mengirimkan penawaran khusus atau rekomendasi produk yang
relevan kepada pelanggan.

• Pengujian A/B: Melakukan pengujian A/B pada strategi pemasaran yang berbeda dapat
membantu perusahaan untuk terus mengoptimalkan strategi pemasaran berdasarkan
data yang diperoleh.

• Analisis Penggunaan Media Sosial: Melakukan analisis penggunaan media sosial dapat
memberikan wawasan tentang apa yang pelanggan bicarakan tentang perusahaan dan
produk. Perusahaan dapat menggunakan wawasan ini untuk menyesuaikan strategi
pemasaran, memperbaiki kelemahan, atau merespons secara proaktif terhadap
umpan balik pelanggan.

• Monitoring dan Pemantauan: Terakhir, penting untuk terus melakukan analisis reguler
dan memantau hasil dari strategi yang diimplementasikan. Jika diperlukan, perusahaan
dapat melakukan penyesuaian atau perubahan strategi berdasarkan temuan dari
analisis dan pemantauan.
Bagian 3: Keterampilan Analisis

1. Anda diberikan sebuah data set yang berisi informasi tentang penggunaan aplikasi seluler.
Bagaimana cara Anda memahami data tersebut dan menemukan insight yang dapat
membantu perusahaan untuk meningkatkan penggunaan aplikasi tersebut? (gender)
dalam suatu perusahaan. Bagaimana cara Anda melakukannya?
Jawaban:
• Analisis Deskriptif: Saya akan melakukan analisis deskriptif untuk memberikan
gambaran umum tentang penggunaan aplikasi berdasarkan gender.

• Segmentasi Pengguna: Membagi pengguna berdasarkan gender (pria dan wanita) dan
melakukan segmentasi berdasarkan karakteristik lainnya seperti usia, wilayah
geografis, atau preferensi penggunaan. Hal ini dapat membantu mengidentifikasi pola
dan perbedaan penggunaan aplikasi antara kelompok gender yang berbeda.

• Analisis Perbandingan: Melakukan analisis perbandingan antara pengguna pria dan


wanita untuk mengidentifikasi perbedaan perilaku penggunaan aplikasi. Misalnya,
apakah ada perbedaan dalam waktu penggunaan aplikasi antara pengguna pria dan
wanita? Apakah ada fitur aplikasi yang lebih populer di antara pengguna pria atau
wanita?

• Analisis Korelasi: Saya akan menganalisis korelasi antara variabel-variabel yang ada
dalam dataset, misalnya korelasi antara usia pengguna dan waktu penggunaan
aplikasi. Ini dapat memberikan wawasan tentang faktor-faktor yang mungkin
mempengaruhi penggunaan aplikasi oleh pengguna berbeda.

2. Bagaimana cara Anda menyelesaikan masalah ketika data yang diberikan tidak lengkap
atau tidak valid?
Jawaban:
• Memahami kebutuhan bisnis: Ini akan membantu saya menentukan jenis data yang
diperlukan dan memahami bagaimana data yang tidak lengkap atau tidak valid dapat
mempengaruhi analisis.

• Memeriksa keabsahan data: Saya akan melakukan pemeriksaan keabsahan data untuk
mengidentifikasi apakah ada data yang tidak valid atau tidak memenuhi kriteria yang
ditetapkan.

• Mengeksplorasi sumber data tambahan: Saya akan berkomunikasi dengan tim atau
departemen terkait untuk memeriksa apakah ada data tambahan yang dapat
digunakan untuk melengkapi data yang tidak lengkap.

• Membersihkan data: Ini melibatkan tindakan seperti menghapus atau mengisi nilai
yang hilang, mengoreksi kesalahan atau inkonsistensi data, dan menormalisasi format
data agar konsisten.
• Menganalisis dampak data yang tidak valid: Saya akan menganalisis dampak dari data
yang tidak valid terhadap hasil analisis. Hal ini dapat melibatkan menguji skenario yang
berbeda, misalnya menghapus data yang tidak valid dan melihat bagaimana itu
mempengaruhi hasil atau melakukan imputasi nilai yang hilang untuk melihat
pengaruhnya.

• Mengkomunikasikan temuan: Setelah data telah diperbaiki dan analisis telah


dilakukan, langkah terakhir adalah mengkomunikasikan temuan kepada pemangku
kepentingan yang relevan. Saya akan menjelaskan masalah data yang ditemukan,
tindakan yang diambil untuk memperbaikinya, serta dampaknya terhadap hasil analisis
dan rekomendasi yang mungkin diberikan.

3. Apa tindakan yang akan Anda ambil ketika Anda menemukan outlier dalam data? Bagaimana
Anda menentukan apakah outlier tersebut valid atau tidak?
Jawaban:
• Mengidentifikasi outlier: Pertama, melakukan eksplorasi data dan mencari nilai-
nilai yang secara signifikan berbeda dari pola umum data atau dari nilai-nilai lainnya.

• Memahami konteks data: Saya akan mempelajari konteks data, termasuk sumber
data, variabel yang diamati, dan tujuan analisis. Ini membantu saya memahami
apakah ada faktor-faktor khusus yang dapat menjelaskan kemunculan outlier yang
valid.

• Mengevaluasi validitas outlier: Untuk menentukan apakah outlier tersebut valid


atau tidak, saya akan melibatkan beberapa pertimbangan, seperti:
✓ Kesalahan pengukuran: Saya akan memeriksa apakah ada kesalahan
pengukuran atau kesalahan input data yang mungkin terjadi.
✓ Penjelasan domain: Saya akan mempertimbangkan penjelasan dari para ahli
domain terkait data tersebut.
✓ Konteks bisnis: Saya akan melihat apakah outlier tersebut konsisten dengan
tujuan bisnis atau mungkin merupakan hasil dari peristiwa atau kejadian
khusus yang relevan.
✓ Metode analisis: Saya akan menguji dampak outlier terhadap hasil analisis
dengan dan tanpa outlier.

• Mengambil tindakan yang sesuai: Tindakan yang diambil dapat bervariasi


tergantung pada hasil evaluasi. Beberapa tindakan yang dapat diambil antara lain:
✓ Menghapus outlier atau memasukkan kategori outlier.
✓ Melakukan analisis lanjutan: Jika outlier ditemukan valid dan penting, saya
dapat melakukan analisis tambahan untuk memahami lebih lanjut faktor yang
menyebabkan kemunculan outlier tersebut.

Anda mungkin juga menyukai