com
https://www. linkedin.com/in/vikko-putra
Vikko Putra Hasian Hutapea Portfolio: https://bit.ly/3FbaOpg
Depok - 16434, Indonesia
Berdasarkan data yang diberikan, telah dilakukan pengerjaan test pada Microsoft SQL Server
Management dengan menggunakan query berikut:
BEGIN
SELECT CAST(AVG(Age) AS INT) AS AverageAge
FROM UPSCALE;
END
Dalam query tersebut, saya mencari rata-rata umur dengan menggunakan fungsi AVG dan
melakukan fungsi CAST untuk mengubah hasil menjadi bilangan bulat tanpa koma. Hasil dari
query tersebut menunjukkan bahwa rata-rata umur adalah 35 tahun.
SELECT Income
FROM
(SELECT Income, ROW_NUMBER() OVER (ORDER BY Income)
AS RowNum, COUNT(*) OVER () AS TotalCount
FROM UPSCALE
)AS SubQuery
WHERE RowNum = (TotalCount + 1)/2 OR RowNum = (TotalCount + 2)/2;
Query di atas digunakan untuk mencari median dari data yang diberikan. Median adalah nilai
tengah dalam kumpulan data yang diurutkan secara menaik. Pada query tersebut, fungsi
ROW_NUMBER() digunakan untuk mengurutkan data berdasarkan pendapatan (Income),
sementara fungsi COUNT()OVER() digunakan untuk menghitung total jumlah data. Subquery
kemudian digunakan untuk mencari nilai median dengan memilih data pada posisi (TotalCount
+ 1) / 2 dan (TotalCount + 2) / 2.
Namun, jika jumlah data genap, median tidak dapat diwakili oleh satu nilai tengah, sehingga
akan ada dua nilai median. Dalam kasus ini, nilai median yang didapatkan dari data yang
diberikan adalah 75000 dan 80000.
Jika menginginkan hanya satu nilai median, maka dapat melakukan upgrade query menjadi
seperti ini:
Dalam pernyataan di atas, telah ditambahkan fungsi AVG() untuk menghitung rata-rata dari
nilai median yang ditemukan. Dengan menghilangkan kondisi OR RowNum = (TotalCount + 2)
/ 2, query ini akan mengambil hanya satu nilai pada posisi median yang benar-benar tengah.
Sehingga, hasil yang akan diberikan adalah rata-rata dari nilai median tersebut menjadi 77500.
3. Berapa persentase laki-laki (Male) dalam data set tersebut?
Jawaban:
SELECT
(COUNT(CASE WHEN Gender = 'Male' THEN 1 END) *100/COUNT(*))
AS Percentage_Male,
(COUNT(CASE WHEN Gender = 'Female' THEN 1 END) *100/COUNT(*))
AS Percentage_Female
FROM
UPSCALE;
Query di atas digunakan untuk menghitung persentase jumlah pria (Percentage_Male) dan
wanita (Percentage_Female) dalam tabel. Persentase dihitung dengan membagi jumlah pria
atau wanita dengan total data, kemudian dikalikan dengan 100. Dalam query ini, digunakan
fungsi COUNT dan CASE WHEN untuk menghitung jumlah masing-masing jenis kelamin
(Gender). Berdasarkan pengolahan data menggunakan query tersebut, hasil persentase
jumlah laki-laki (Male) dalam data ditemukan sebesar 50%.
4. Berapa persentase orang dengan gelar Master dalam data set tersebut?
Jawaban:
SELECT
Education,
COUNT(*) AS Total,
COUNT(*) * 100 / (SELECT COUNT(*) FROM UPSCALE) AS Percentage
FROM
UPSCALE
GROUP BY
Education;
Setelah melakukan pengelompokan (GROUP BY) berdasarkan kolom Education, query ini
menghitung jumlah data dalam setiap kelompok menggunakan fungsi COUNT(*). Selain
itu, persentase juga dihitung untuk setiap kelompok dengan membagi jumlah data dalam
kelompok tersebut dengan total jumlah data dalam tabel, kemudian dikalikan dengan 100.
Hasil dari query ini akan menghasilkan informasi yang berguna mengenai jumlah data dan
persentase dalam setiap tingkat pendidikan, dengan persentase orang dengan gelar Master
sebesar 30%.
5. Berapa usia rata-rata dari orang-orang dengan gelar PhD dalam data set tersebut?
Jawaban:
BEGIN
SELECT Education, AVG(Age) AS AverageAge
FROM UPSCALE
GROUP BY Education;
END
Pada query ini, data pendidikan (Education) diambil bersama dengan rata-rata usia
(AverageAge) dari tabel. Data tersebut dikelompokkan berdasarkan pendidikan, sehingga
setiap kelompok pendidikan memiliki rata-rata usia yang terkait. Berdasarkan hasil dari
pengolahan query diatas, maka usia rata-rata dari orang-orang dengan gelar PhD dalam data
set adalah 39.5 tahun.
1. Anda diberikan tugas untuk menghitung rata-rata pendapatan dari setiap jenis kelamin
(gender) dalam suatu perusahaan. Bagaimana cara Anda melakukannya?
Jawaban:
• Mengumpulkan Data: Pertama, saya akan mengumpulkan data yang diperlukan untuk
analisis ini.
• Membersihkan Data: Selanjutnya saya akan mulai membersihkan data. Ini termasuk
memeriksa keberadaan data yang hilang, menghapus data yang tidak relevan atau
tidak lengkap, dan menormalisasi format data agar sesuai dengan analisis yang akan
dilakukan.
• Menganalisis Data: Saya akan menggunakan alat atau bahasa pemrograman seperti
Python atau SQL untuk melakukan analisis data. Saya akan menggunakan operasi
pengelompokan berdasarkan jenis kelamin dan menghitung rata-rata pendapatan
untuk setiap kelompok tersebut.
• Menganalisis tren penjualan: Saya akan menggunakan metode statistik dan visualisasi
data untuk memahami perubahan penjualan dari waktu ke waktu. Hal ini dapat
melibatkan penggunaan grafik, diagram, atau metode lainnya untuk
memvisualisasikan data penjualan.
• Mengeksplorasi faktor internal: Saya akan menganalisis data internal seperti strategi
pemasaran, harga produk, promosi, dan perubahan internal lainnya yang dapat
mempengaruhi minat dan permintaan pelanggan terhadap produk tersebut.
• Mengeksplorasi faktor eksternal: Saya akan mencari data dan informasi terkait dari
sumber eksternal seperti laporan industri, analisis pasar, dan sumber informasi
lainnya.
• Personalisasi dan Penawaran Khusus: Menggunakan data pelanggan yang ada untuk
membuat strategi personalisasi agar dapat meningkatkan konversi penjualan.
Misalnya, dengan mengirimkan penawaran khusus atau rekomendasi produk yang
relevan kepada pelanggan.
• Pengujian A/B: Melakukan pengujian A/B pada strategi pemasaran yang berbeda dapat
membantu perusahaan untuk terus mengoptimalkan strategi pemasaran berdasarkan
data yang diperoleh.
• Analisis Penggunaan Media Sosial: Melakukan analisis penggunaan media sosial dapat
memberikan wawasan tentang apa yang pelanggan bicarakan tentang perusahaan dan
produk. Perusahaan dapat menggunakan wawasan ini untuk menyesuaikan strategi
pemasaran, memperbaiki kelemahan, atau merespons secara proaktif terhadap
umpan balik pelanggan.
• Monitoring dan Pemantauan: Terakhir, penting untuk terus melakukan analisis reguler
dan memantau hasil dari strategi yang diimplementasikan. Jika diperlukan, perusahaan
dapat melakukan penyesuaian atau perubahan strategi berdasarkan temuan dari
analisis dan pemantauan.
Bagian 3: Keterampilan Analisis
1. Anda diberikan sebuah data set yang berisi informasi tentang penggunaan aplikasi seluler.
Bagaimana cara Anda memahami data tersebut dan menemukan insight yang dapat
membantu perusahaan untuk meningkatkan penggunaan aplikasi tersebut? (gender)
dalam suatu perusahaan. Bagaimana cara Anda melakukannya?
Jawaban:
• Analisis Deskriptif: Saya akan melakukan analisis deskriptif untuk memberikan
gambaran umum tentang penggunaan aplikasi berdasarkan gender.
• Segmentasi Pengguna: Membagi pengguna berdasarkan gender (pria dan wanita) dan
melakukan segmentasi berdasarkan karakteristik lainnya seperti usia, wilayah
geografis, atau preferensi penggunaan. Hal ini dapat membantu mengidentifikasi pola
dan perbedaan penggunaan aplikasi antara kelompok gender yang berbeda.
• Analisis Korelasi: Saya akan menganalisis korelasi antara variabel-variabel yang ada
dalam dataset, misalnya korelasi antara usia pengguna dan waktu penggunaan
aplikasi. Ini dapat memberikan wawasan tentang faktor-faktor yang mungkin
mempengaruhi penggunaan aplikasi oleh pengguna berbeda.
2. Bagaimana cara Anda menyelesaikan masalah ketika data yang diberikan tidak lengkap
atau tidak valid?
Jawaban:
• Memahami kebutuhan bisnis: Ini akan membantu saya menentukan jenis data yang
diperlukan dan memahami bagaimana data yang tidak lengkap atau tidak valid dapat
mempengaruhi analisis.
• Memeriksa keabsahan data: Saya akan melakukan pemeriksaan keabsahan data untuk
mengidentifikasi apakah ada data yang tidak valid atau tidak memenuhi kriteria yang
ditetapkan.
• Mengeksplorasi sumber data tambahan: Saya akan berkomunikasi dengan tim atau
departemen terkait untuk memeriksa apakah ada data tambahan yang dapat
digunakan untuk melengkapi data yang tidak lengkap.
• Membersihkan data: Ini melibatkan tindakan seperti menghapus atau mengisi nilai
yang hilang, mengoreksi kesalahan atau inkonsistensi data, dan menormalisasi format
data agar konsisten.
• Menganalisis dampak data yang tidak valid: Saya akan menganalisis dampak dari data
yang tidak valid terhadap hasil analisis. Hal ini dapat melibatkan menguji skenario yang
berbeda, misalnya menghapus data yang tidak valid dan melihat bagaimana itu
mempengaruhi hasil atau melakukan imputasi nilai yang hilang untuk melihat
pengaruhnya.
3. Apa tindakan yang akan Anda ambil ketika Anda menemukan outlier dalam data? Bagaimana
Anda menentukan apakah outlier tersebut valid atau tidak?
Jawaban:
• Mengidentifikasi outlier: Pertama, melakukan eksplorasi data dan mencari nilai-
nilai yang secara signifikan berbeda dari pola umum data atau dari nilai-nilai lainnya.
• Memahami konteks data: Saya akan mempelajari konteks data, termasuk sumber
data, variabel yang diamati, dan tujuan analisis. Ini membantu saya memahami
apakah ada faktor-faktor khusus yang dapat menjelaskan kemunculan outlier yang
valid.