Anda di halaman 1dari 7

JUDUL:

PENGOLAHAN AWAL DATA DAN PENERAPAN ALGORITMA


SINGULAR VALUE DECOMPOSITION (SVD) UNTUK
MEMAKSIMALKAN VARIANCE SCORES PRINCIPAL COMPONENT
DAN EFISIENSI PROSES PADA ALGORITMA PRINCIPAL
COMPONENT ANALYSIS (PCA) Commented [i1]: PADA JUDUL PENELITIAN HARUS
DIJAWAB “WHY” / Mengapa.? Seperti contoh judul ini.
1.Harus dijawab Mengapa Pengolahan Data
2.Mengapa Algorima SVD
3.Mengapa Memaksimalkan Variance Score Principal Component
4.Mengapa efisiensi Proses , dan
5.Mengapa Algoritma PCA.

1.1 Latar Belakang Masalah


Commented [i2]: Menyusun Latar Belakang Masalah mengikuti
pola OMKKMASASOLTU
1. O (Objek) Membahas Objek secara Umum
2.. M (Metode) Membahas Metode2 yang ada
Dewasa ini bidang informatika biomedis telah menunjukkan peningkatan 3. KK (kelebihan-kekurangan) pada metode yang ada
4. MASA (Masalah) pada Objek PENELITIAN
popularitas dan perhatian, serta telah berkembang dengan cepat selama dua 5. SOL (Solusi) pemecahan masalah pada objek, pilih salah satu
METODE pada nomor 2
dekade. Namun para peneliti dan praktisi biomedis menghadapi masalah “info- 6. TU (Tujuan) membahas tentang Tujuan Penelitian anda

glut”, yaitu berlimpah informasi yang belum terorganisir, disebabkan sejumlah


besar data penelitian biomedis dihasilkan setiap hari, dimulai dari usaha-usaha
penelitian individu dan praktek-praktek klinik, dan juga data biomedis ini tersedia
dalam ratusan basis data publik dan pribadi. Tersedia juga berupa digitisasi
informasi medis seperti laporan lab, data pasien, paper penelitian, gambar
anatomik dan sejumlah data perawatan pasien. [1]. Dimana data ini harus
diorganisir dan dianalisis secara efektif untuk membantu peneliti dan praktisi di
bidang biomedis, agar dapat bermanfaat bagi masyarakat umum. Commented [i3]: 1. O (Objek( Membahas Objek Secara
Umum

Pada data di bidang biomedis memiliki ribuan atribut serta ribuan jumlah record
yang saling berkorelasi (multicolinearity) dan menghasilkan data yang kompleks
[2]. Data yang kompleks memiliki banyak kebisingan (noise), anomali (outlier),
elemen yang hilang (missing value), tidak konsisten dan juga entitas data tidak
berhubungan [3] [4] sehingga membutuhkan pengolahan awal data [5].
Pengolahan awal data diterapkan sebelum masuk ke model datamining yang
sesungguhnya dan secara substansial dapat meningkatkan kualitas keseluruhan
dari pola datamining [6]. Commented [i4]: Menjawab mengapa perlu Pra Pengolahan data
Teknik pengurangan dimensi merupakan bagian dari pengolahan awal data, yang
merupakan teknik penting dan menjadi teknik mendasar dalam sebagian besar
proses data mining ketika menghadapi data yang kompleks [7] [8]. Tujuan dari
teknik pengurangan dimensi adalah untuk mendapatkan representasi data baru
yang dikelola menjadi dimensi lebih rendah [9]. Representasi data baru ditinjau
dari sudut waktu dan kompleksitas komputasi yang jauh lebih efektif untuk
pengolahan data berikutnya, misalnya untuk klasifikasi, assosiasi, prediksi,
estimasi dan analisis pengelompokan [10]. Commented [i5]: 1. Mengapa perlu efisiensi waktu
2.Teknik yang diapakai dalam pra pengolahan data

Teknik pengurangan dimensi dapat dikelompokkan menjadi seleksi atribut dan


ekstraksi atribut [11] [12]. Seleksi atribut bertujuan untuk menemukan atribut
terbaik (k) pada (d) dimensi untuk mendapatkan informasi dan membuang atribut
yang tidak signifikan pada dimensi lain [13] [14] namun kelemahan seleksi atribut
memerlukan pelatihan satu set data besar untuk mendapatkan transformasi yang
dapat diandalkan [15] [16]. Ekstraksi atribut bertujuan untuk mencari satu set
atribut yang baru di (k) dimensi yang merupakan kombinasi dari ukuran asli [13]
[14] dengan cara mengubah dimensi tinggi ke dalam dimensi yang lebih rendah
[17] [16]. Commented [i6]: Membahas Teknik Pengurangan Dimensi

Ekstraksi atribut secara umum diklasifikasikan menjadi linier dan nonlinier [13].
ISOM AP (Isometric Feature M apping) LLE (Local Linear Embedded) [5]
kernelPCA, Generalised Singular Value Decomposition (GSVD), Generaised
Partial Leat Square (GPLS) dan Maximum Variancesce Unfolded (M VU)
tergolong algoritma nonlinier [18] [19]. Principal component analysis (PCA),
linear discriminant analysis (LDA), independent component analysis (ICA)
singular value decomposition (SVD) [13] Canonical Correletion Analysis (CCA),
Partial Least Square (PLS) dan Latent Semantic Indexing (LSI) tergolong
algoritma linier [20] [21] .
Algoritma Latent Semantic Indexing (LSI), adalah teknik aljabar linier yang
menggunakan algoritma Singular value decomposition (SVD) untuk menguraikan
matriks [18] [19]. Algoritma Canonical Correlation Analysis (CCA) adalah
eksplorasi korelasi antara dua set sampel variabel kuantitatif, namun kekurangan
algoritma CCA kurang akurat ketika jumlah unit data kurang dari jumlah variable
terbesar dari kedua data set [21]. Algoritma Partial Least Squares (PLS) adalah
teknik yang terkenal untuk ektraksi atribut, metode untuk menganalisis hubungan
antara data set melalui variabel laten, namun lemah di proyeksi linier [22].
Algoritma Linear Discriminant Analysis (LDA) termasuk teknik ekstraksi atribut
yang banyak digunakan [20] namun LDA tidak stabil pada data yang berdimensi
tinggi pada kasus class scetter matrix untuk dijadikan nlai matrix singular
(matriks tunggal) [23]. Algoritma Independent Component Analysis (ICA) dan
FastICA (extension of ICA) termasuk teknik analisa komponen dasar sama seperti
PCA, namun lemah di teknik pengurangan dimensi [24]. Commented [i7]: Membahas METODE-METODE /MODEL
yang ada termasuk kelebihan dan kekuurangan Metode/model

Teknik aljabar linier secara signifikan lebih sederhana dari Canonical Correlation
Analysis (CCA), Partial Least Square (PLS) dan Linear Discriminant Analysis
(LDA) [7]. Algoritma yang termasuk teknik aljabar linier adalah algoritma
Singular Value Decomposition (SVD) dan Principal Component Analysis (PCA) Commented [i8]: Mengapa Memilih Algoritma PCA dan SVD

Algoritma Singular Value Decomposition (SVD) pertama kali diusulkan oleh


Eckartand Young [25] termasuk metode eksplorasi statistik multidimensi dengan
latar belakang metematika aljabar linier. Termasuk algoritma teknik pengurangan
dimensi yang paling cepat proses kerjanya dibanding teknik pengurangan dimensi
lainnya seperti PCA, ICA dan fastICA (extensionICA) [26] dan merupakan
metode matematis untuk menguraikan matriks tunggal [27], dengan mengkompres
menjadi tiga matriks yang lebih kecil dengan ukuran yang sama [28]. Cara
kerjanya mengurangi data pada kolom dan baris [29] [30]. Salah satu alat analisis
numerik yang efektif digunakan untuk menganalisis matriks [27] beroperasi di
jantung algoritma seperti pada algoritma PCA dan LSI dan tergolong metode
machine learning yang banyak dipakai [5] dan banyak diterapkan pada berbagai
bidang, termasuk clustering pada data klinik [31], image compresing [32],
wetermarking, [33] [34], klasifikasi dokumen [35], mapping gen [2] dan
pencarian data series [36].

Algoritma Singular Value Decomposition (SVD) mempunyai kelebihan pada


efisiensi waktu proses [26] untuk digunakan pada dataset yang berskala besar [37]
[38], dapat digunakan untuk memaksimalkan data ekstraksi pada algoritma PCA
[31] serta dapat beroperasi dijantung algoritma PCA untuk mendapatkan nilai left
eigenvector [37] [38]. Namun kekurangan SVD selain tidak dapat melakukan
perhitungan jika dataset memiliki elemen yang hilang (missing value) [31] juga
hasil data ekstraknya kurang maksimal disebabkan korelasi antar atribut belum
bersih 100% dibanding dengan algoritma Principal Component Analysis (PCA)
[39] [40]. Commented [i9]: Mengapa Memilih Algoritma SVD dan
menjawab mengapa perlu memaksimalkan Varince score pada
algoritma PCA serta masalah pada METODE

CATATAN:
Algoritma Principal Component Analysis (PCA) diperkenalkan oleh Pearson dan UNTUK ANAK Strata 1 (S1) CUKUP MASALAH PADA
OBJEK PENELITIAN
Hotelling termasuk metode eksplorasi statistik multidimensi dengan latar
belakang matematika aljabar linier dan eigen analysis. Cara kerja PCA adalah
menemukan himpunan bilangan orthogonal dengan menggunakan teknik SVD
[37]] [38] dari proyeksi matriks vektor pada atribut ekstraksi dengan
memaksimalkan variancess data, kemudian mengurangi dimensi melalui
kombinasi linear dari variabel awal tanpa mengorbankan akurasi [17] [3].

Kelebihan algoritma Principal Component Analysis (PCA) mampu menghasilkan


data ekstrak yang lebih signifikan dibandingkan dengan SVD, menghilangkan
korelasi 100% [39] [40] dan mampu mengolah hasil data ekstrak algoritma SVD
dengan cara meningkatkan pemisahan antara sampel dari kelas yang berbeda serta
mengurangi pemisahan antara sampel dari kelas yang sama [40] [25],
menghasilkan variable baru (principal component) yang berisi scores principal
component hasil kombinasi linier dari variable asli, namun kekurangan algoritma
Principal Component Analysis (PCA) lambat memproses dataset dibanding
dengan algoritma SVD [26] [38]. Commented [i10]: Mengapa Meilih PCA
Berdasarkan dari paparan kelebihan dan kekurangan dari metode yang ada pada
teknik pengurangan dimensi, maka dapat dirangkumkan bahwa teknik aljabar
linier secara signifikan lebih sederhana dari beberapa teknik pengurangan dimensi
yang ada seperti Canonical Correlation Analysis (CCA), Partial Least Square
(PLS) dan Linear Discriminant Analysis (LDA).

Algoritma Principal Component Analysis (PCA) dan Singular Value


Decomposition (SVD) adalah dua algoritma yang menggunakan teknik aljabar
linier, kedua keunggulan algoritma ini dapat digabungkan untuk memproses data
yang kompleks dan berskala besar.

Algoritma Singular Value Decomposition (SVD) memiliki kelebihan pada


efisiensi waktu proses, dan menghasilkan data ekstrak (left eigenvectors), dimana
pada algoritma PCA disebut sebagai principal component, namun kurang
maksimal hasil data ekstraknya dibanding dengan algoritma PCA, dan juga
kekurangan algoritma SVD tidak dapat melakukan perhitungan jika dataset
memiliki elemen yang hilang (missing value), oleh karena itu memerlukan proses
pengolahan awal data.

Algoritma Principal Component Analysis (PCA) mampu memproses data ekstrak


dari algoritma SVD, dengan menghasilkan variable baru (principal component)
yang berisi scores principal component, namun kekurangan algoritma PCA sangat
lambat memproses dataset yang berskala besar dibanding dengan algoritma SVD. Commented [i11]: SOLUSI PADA MASALAH

Berdasarkan dari paparan pada rangkuman diatas, maka pada penelitian ini
mengusulkan “Pengolahan Awal Data dan Penerapan Algoritma Singular Value
Decomposition (SVD) untuk M emaksimalkan Variances Score Principal Analysis
dan Efisiensi Waktu pada Algoritma Principal Component Analysis (PCA)”. Commented [i12]: TUJUAN penelitian,..pada tahap inilah
muncul JUDUL/THEMA

JADI JUDUL/THEMA MUNCUL PADA LATAR BELAKANG


MASALAH...
1.2 Rumusan Masalah

Dari latar belakang masalah, maka permasalahan yang dirumuskan yaitu:

Masalah umum:
Tersedianya jumlah basis data biomedis yang berlimpah, berupa basis data publik
(internet) dimana datasetnya dari peneliti-peneliti individu dan dari praktek-
praktek klinik, dan juga tersedia berupa digitisasi informasi, seperti laporan lab,
data pasien, paper penelitian, gambar anatomik dan sejumlah data perawatan
pasien. Namun dataset biomedis memiliki ribuan atribut serta ribuan jumlah
record yang saling berinteraksi yang menghasilkan data kompleks dan berskala
besar. Commented [i13]: Masalah umum yang dijabarkan adalah obejk
penelitian,.masalah umum ini untuk anak S1 diterapkan MASALAH
pada OBJEK ATAU masalah ini yang digarap oleh ANAK
STRATA 1 (SI)
Masalah spesifik:
Algoritma Singular Value Decomposition (SVD) tepat digunakan untuk
memproses dataset yang berskala besar dan kompleks, dan cepat dalam
memproses dataset yang berskala besar, namun hasil data ekstrak SVD kurang
maksimal dibanding dengan PCA.

Algoritma Principal Component Analysis (PCA) mampu memproses score left


eigenvector (data ekstrak ) dari algoritma SVD, yang disebut sebagai score
principal component, namun algoritma PCA sangat lambat memproses dataset
berskala besar. Commented [i14]: MASALAH SPESIFIK ini yang digarap oleh
anak S2

Pertanyaan penelitian ini yaitu, seberapa cepat waktu proses dan seberapa
maksimal nilai variances score principal component pada algoritma PCA, jika
dataset diproses terlebih dahulu menggunakan algoritma Singular Value
Decomposition (SVD). Commented [i15]: Pertanyaan Penelitian yang harus dijawan
pada BAB V Kesimpulan dan saran.
1.3 Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk memaksimalkan variances score principal
component dan efisiensi waktu proses pada algoritma Principal Component
Analysis (PCA) Commented [i16]: 1.Tujuan Penelitian nyambung dengan
TUJUAN pada latar belakang masalah
2. Tujuan penelitian sama dengan JUDUL/Thema yang anglat diteliti.

Commented [i17R16]:
1.4 Manfaat Penelitian
M anfaat dari penelitian ini adalah:
1. M anfaat Umum:
Penelitian ini sangat membantu para peneliti dan praktisi biomedis, untuk
memproses informasi yang belum terorganisir, dimana penelitian ini
menghasilkan data yang telah siap pakai atau siap diproses pada model
datamining, agar nantinya bermanfaaat pada masyarakat umum.
2. M anfaat ilmu pengetahuan
Jumlah atribut yang telah dikurangi dan hasil nilai varian pada scores principal
component yang lebih maksimal serta atribut yang tidak saling berkorelasi dapat
dijadikan sebagai input variable, dan sangat berpengaruh pada efisiensi waktu
proses serta dapat meningkatkan akurasi, antara lain:
a) M odel cluster
b) Analisa regresi berganda
c) Analisa diskriminan
d) Analisa factor
e) Klasifikasi dengan menggunakan Neural Net Commented [i18]: MANFAAT adalah setelah TUJUAN
TERCAPAI,.manfaat kepada masyarakat tidak bisa diukur,..jadi yang
diukur adalah Hasil pada Penerapan METODE

Anda mungkin juga menyukai