Anda di halaman 1dari 16

Laporan Tugas Pelatihan Data Science Fundamental

Nama Tugas : Data Asosiasi Tanggal : 21/03/2023


Nama Lengkap : Syarif Hidayatullah
Asal Instansi : Pemerintah Kota Semarang

STUDI KASUS – DATA TRANSAKSI


Persaingan di dunia bisnis, menuntut para pengembang bisnis menemukan suatu strategi yang
dapat meningkatkan penjualan. Salah satu caranya yaitu dengan memberikan potongan harga
pada kombinasi produk tertentu yang sering dibeli secara bersamaan. Hal tersebut dapat
dilakukan dengan menganalisis kebiasan belanja konsumen. Berikut data transaksi Supermarket
XYZ yang terdiri dari 10 produk yang paling sering dibeli, yaitu Gula, Kopi, Aqua, Popok, Sprei,
Sabun, Sampo, Kemeja, Celana, dan Boneka.

STUDI KASUS – DATA TRANSAKSI


1. Drag data transaksi yang telah di import
2. Tambahkan id pada customer

3. Tambahkan operator numeric to binominal

hasilnya adalah sebagai berikut:


4. Tambahkan model Asosiasi FP-Growth

5. Tentukan jumlah minimum support 0.2 dan Unchecklist “find min number of itemset”
pada parameter
6. Klik run

Terdapat 14 set data yang dihasilkan dari penerapan Frequent Item Sets dengan
minimum size 1 dan maximum size 2
Studi Kasus – Data Transaksi
1. Tambahkan Association Rules
untuk selanjutnya, terlihat min confidetnya 0,8 adalah kopi.
kita buat aturan rulenya

80% orang beli barang A dan barang b, yaitu kopi dan gula dan nilai confidenntya adalah 1
sudah ok. Begitu juga dengan Boneka dan Spre ada support 20% dan keduanya mempunyai
hungan yang kuat

2. Tentukan nilai minimum confidence


sebagai contoh kita atur menjadi 20%

maka hasilnya adalah sebagai berikut :


untuk confident 80%, berikut descriptionnya
TUGAS STUDI KASUS – DATA TRANSAKSI
1. Setelah dipahami studi kasus pada data transaksi
2. Ubah dataset dari transaksi.xls menjadi belanja_v2.xlsx
3. Pada dataset belanja_v2.xlsx terdiri dari 7500 transaksi, lakukan setting support dan
confidence yang memungkinkan untuk melihat keterkaitan antar items
4. Jika pada pembuatan associate rules tidak ditemukan, aktifkan find min number
itemsets
5. Lakukan analisis hasil perubahan tersebut, mana items yang paling banyak terjual dan
asosiasi rulesnya.

ada 7501 data dan 31 atribut regular. Dari 31 Atribut ini kita akan ambil mana yang
paling laku

maka hasilnya
oh ternyata dari 3000 produk yang terjual air mineral yang paling banyak terjual,
makalakukna cek pada fp-growt min support 20% , maka hasilnya adalh sebagai berikut

dengan cek list find min number of items


maka hasilnya adalah
HEATING OIL

ada 6 atribut dan 1.218 data , kita cek misingnya

misingnya aman, buat seperti ini, dengan yang dikeluarkan outputnya adalah matrix
maka didapatkan hasilnya

dari sini kita bisa melihat, ingat bahwa kolerasi tersebut ada korelasai negative dan
kolerasi positif. Terilahat angka satu yang membuat satu garis miring (cara bacanya bisa
dari atas kebawah/ kanan ke kiri).
sebagai contoh ada Heating oli dengan insultation 0.736 artinya ada kolerasi positif
dengan heating oil dengan insulatin sebear 73%, namun saat dikolerasikan dengan
temperature negatgif/ -0.744 . Sedangnya dengan Num Occupation bernilai negatef,
sedangkan avg_agenya positif dan nilainya 80% lebih dan sangat kuat, dan Home_Size
juga positif meskipun kecil.
Korelasi Positif terjadi jika heating oil naik, insulin naik, maka heatng oil dan insulation
turun
Korelasi Negatif jika temperature naik, insulation turun , maka tempertaur turun dan
insulation naik

EVALUASI
Evaluation
• Atribut (faktor) yang paling signifikan berpengaruh (hubungan positif) pada
konsumsi minyak pemanas (Heating Oil) adalah Average Age (Rata-Rata Umur)
penghuni rumah
• Atribut (faktor) kedua yang paling berpengaruh adalah Temperature (hubungan
negatif)
• Atribut (faktor) ketiga yang paling berpengaruh adalah Insulation (hubungan positif)
• Atribut Home Size, pengaruhnya sangat kecil, sedangkan Num_Occupant boleh
dikatakan tidak ada pengaruh ke konsumsi minyak pemanas
Terlihat dari sisi penggunaan tadi dikatakan, missal pada rata-rata umur 40 s.d. 70.
Penggunaan Heating oilnya sedikit (padahahal bisadilihat korealsinya positif terlihat dari
bar kanan kekiri naik). Maka Semakin tua kebutuhan heating oilnya semakin sedikit.
Sedangkan terlihat anak muda usia dibawah 30 tahun sudah menggunakan heating oli
sebanyak 280
KETERKAITAN TEMPERATUR DAN INSULATION

Semaikn reendah temperature, maka insulation semakin tinggi


Evaluasi
• Grafik menunjukkan hubungan antara temperature dan insulation, dengan warna
adalah konsumsi minyak (semakin merah kebutuhan minyak semakin tinggi)
• Secara umum dapat dikatakan bahwa hubungan temperatur dengan insulation
dan konsumsi minyak adalah negatif. Jadi temperatur semakin rendah,
kebutuhan minyak semakin tinggi (kolom kiri bagian atas) ditunjukkan dengan
banyak yang berwarna kuning dan merah.
• Insulation juga berhubungan negatif dengan temperatur, sehingga makin rendah
temperatur, semakin butuh insulation.
• Beberapa anomali terdapat pada Insulation yang rendah nilainya, ada beberapa
yang masih memerlukan minyak yang tingg
HUBUNGAN TEMPERATUR DENGAN AGE

• Grafik tiga dimensi menunjukkan hubungan antara temperatur, rata-rata usia dan
insulation.
• Warna menunjukkan kebutuhan minyak, semakin memerah maka semakin tinggi.
• Temperatur semakin tinggi semakin tidak butuh minyak (warna biru tua)
• Rata-rata usia dan insulation semakin tinggi semakin butuh minyak.
TUGAS
• Ani adalah salah satu konsultan pendidikan luar negeri. Dia ingin meningkatkan
pelayanan dengan mengetahui faktor yang dapat meningkatkan kesempatan bagi para
pemburu beasiswa untuk diterima di kampus yang diinginkan.
• Bantulah Ani dengan menginvestigasi hubungan antar faktor dengan
• kesempatan beasiswa diterima menggunakan dataset Admission.csv
• Gunakan metode CRISP-DM (Business Understanding – Evaluation)
Keterangan Atribut pada dataset Admission.csv

• GRE : Graduate Record Examination adalah sebuah tes standar yang diambil agar dapat
masuk ke program Pascasarjana (S-2) di Amerika
• LOR : Letter of Recommendation
• SOP : Statement Of Purpose
• CGPA : Cumulative Grade Point Average adalah nilai yang digunakan setiap semester dalam
mata kuliah secara kumulatif

Modeling pertama

Terlihat pada CGPA memiliki pengaruh besar pada Chace of Admit yang sebesar 87%
Modeling kedua

EVALUASI

Pengaruh CGPA: semakin tinggi CGPA semakin berpeluang diterima beasiswa

Semakin besar nilai GRE Scorenya semakin berpeluang juga

Lor terhadapat peluang Beasiswa


SOP terhadap peluang beasiswanya

Anda mungkin juga menyukai