1. Tujuan
2. Dasar Teori
Hasil dari proses pembuatan tabel partition akan tersimpan dalam bentuk sub-
direktori dibawah direktori tabel di sistem penyimpanan HDFS. Tiap partition yang
dibuat terkait dengan folder di HDFS dan merupakan bagian metadata. Jumlah sub-
direktori yang akan terbuat berdasarkan unique value dari partition key. Tiap unique
value pada partition key mendefiniskan sebuah partition dalam tabel. Dan tiap isian
sub-direktori akan berisikan file data didalamnya.
Sebelum melakukan pembuatan model tabel dengan metode partition,
konfigurasi parameter yang diberikan dibawah harus di set pada Hive shell :
set hive.exec.dynamic.partition = true;
set hive.exec.dynamic.partition.mode = nonstrict;
5. Langkah Kerja
Untuk melihat mekanisme metode partition dari Hive pada Hadoop, hal yang
dilakukan yakni mempersiapkan file dataset yang akan di eksekusi.
1. Transfer file dataset dari client ke local master dengan menggunakan WinsCp
Setelah file masuk di lokal master, maka tahapan selanjutnya mengimport dataset
dari lokal master ke dalam HDFS. Pastikan lokasi file yang diterima dari client,
dalam percobaan ini, file disimpan dalam folder /home/hduser/.
3. Dataset kemudian disalin kedalam sistem Hadoop cluster yang telah dibuat dengan
menjalankan perintah berikut pada komputer master:
hadoop fs -put /home/hduser/userid5.csv /data
Pada praktikum ini, Gambar diatas dilakukan penyalinan file dataset kedalam
folder “/data” yang telah dibuat di HDFS dengan cara hadoop fs mkdir /data.
4. Jika dilakukan pengaksesan pada alamat URL master (192.168.11.3) :
http://192.168.11.3:50070/explorer.html#/data, akan muncul tampilan pada
website seperti pada Gambar dibawah:
Pada Gambar diatas merupakan file dataset yang telah berhasil dilakukan
penyalinan ke sistem Hadoop cluster. Oleh karena dataset telah disalin pada sistem
Hadoop cluster, selanjutnya dataset ini sudah bisa dikelola oleh sistem Hive