Anda di halaman 1dari 7

Seminar Nasional Informatika 2009 (semnasIF 2009) ISSN: 1979-2328

UPN ”Veteran” Yogyakarta, 23 Mei 2009

TEKNIK VISUALISASI DALAM DATA MINING

Sri Mulyana, Edi Winarko


Program Studi Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Gadjah Mada
Email: {smulyana, ewinarko}@ugm.ac.id

Abstrak
Kemajuan teknologi informasi, khususnya di bidang pengumpulan dan penyimpanan data, mengakibatkan
perusahaan-perusahaan, lembaga pemerintah maupun non pemerintah memiliki koleksi data dalam jumlah yang
cukup besar. Salah satu tantangan dari keberadaan data yang besar ini adalah bagaimana menemukan
informasi dari data tersebut. Data mining adalah cabang ilmu baru di bidang ilmu komputer yang ditujukan
untuk menjawab tantangan ini. Dua pendekatan yang sering digunakan dalam data mining adalah pendekatan
berbasis algoritma dan berbasis visualisasi.
Pendekatan berbasis algoritma antara lain menggunakan aturan induksi, analisa asosiasi, pohon keputusan,
jaringan saraf tiruan, dan lain-lain. Tujuan dari pendekatan ini adalah untuk memprediksi suatu variabel dari
variabel yang lain atau mencari pola yang menunjukkan hubungan antar variabel. Pendekatan berbasis
visualisasi menggunakan teknik visualisasi untuk menggali informasi yang terkandung dalam data. Banyak
teknik visualisasi yang sudah dikembangkan untuk keperluan data mining.
Dalam paper ini disajikan survei atau review tentang teknik-teknik visualisasi tersebut. Secara garis besar
teknik-teknik visualisasi ini dapat dikelompokkan ke dalam dua kelompok, yaitu teknik untuk visualisasi data dan
teknik untuk visualisasi pengetahuan.

Kata kunci: Data mining, visualisasi data, visualisasi pengetahuan

1. PENDAHULUAN
Dalam membuat keputusan yang tepat sangat dibutuhkan dukungan informasi yang benar dan pada
waktu yang tepat. Ketersediaan informasi sebagai pendukung pengambilan keputusan telah meningkat dengan
cepat sebagai dampak perkembangan teknologi yang sangat cepat. Salah satu sebab terjadinya peningkatan data
adalah adanya automatisasi aktifitas pada berbagai area yang meliputi kegiatan bisnis, rekayasa, ilmu
pengetahuan maupun pemerintah. Pada saat ini, berbagai aktifitas telah dapat direkam dengan menggunakan
komputer seperti pembayaran dengan kartu kredit dan penggunaan telepon. Berbagai penelitian pada bidang
fisika, kimia maupun kesehatan yang menghasilkan sejumlah data telah dikumpulkan secara otomatis dengan
menggunakan sensor dan sistem monitoring. Bahkan data dalam jumlah yang besar telah dikumpulkan dengan
sistem pengamatan satelit yang mungkin dapat menghasilkan data dalam ukuran terabyte per harinya. Namun,
bagaimana memperoleh makna (value) dari data tersebut merupakan masalah yang masih perlu dicari solusinya.
Jumlah data yang sangat besar sebenarnya merupakan sumberdaya yang sangat penting, namun sangatlah sulit
bagaimana menggali informasi yang relevan [Keim dan Kreigel, 1996].
‘Data Mining’ dapat didefinisikan sebagai rangkaian proses eksplorasi dan analisis data untuk
mendapatkan informasi potensial yang tersembunyi [Frawly, 1991]. Pada konteks yang lebih luas, ‘data mining’
tidak hanya mencakup pekerjaan pada area data mining dan knowledge discovery saja tetapi juga berhubungan
dengan penelitian lain, yang meliputi statistik multivariat (komponen analisis utama, analisis klaster dan
penskalaan multidimensi [Dunn, 1982]), antarmuka pada database (cooperative database interfaces [Gasterland,
1992], interfaces for imprecise querying [Anwar, 1992], intelligent data browsing [Motto, 1990]) dan
penyampaian kembali informasi (approximate matching algorithm [Salton, 1988] [Frei, 1991]). Pambahasan
permasalahan data mining difokuskan pada eksplorasi pengetahuan secara semi otomatis. Pada beberapa tahun
terakhir, telah dilakukan berbagai penelitian sehingga mencapai kemajuan penting, bahkan teknik-teknik data
mining serta beberapa sistem berbasis data mining telah diimplementasikan (Frawly, 1991; Matheus, 1993).
Pada paper ini disajikan konsep dasar visualisasi dan beberapa teknik visualisasi pada data
multidimensi. Teknik-teknik tersebut meliputi teknik visualisasi berbasis pixel, visualisasi dengan teknik
proyeksi geometri, visualisasi dengan teknik berbasis icon dan visualisasi dengan teknik hirarki dan teknik
berbasis graf beserta karakteristik masing-masing.

2. KONSEP DASAR
Menurut Olivera (2003), terdapat dua konsep visualisasi, yaitu scientific visualisation dan information
visualisation. Keduanya membuat model grafis dan menyajikan data secara visual yang berinteraksi langsung
dengan pengguna untuk melakukan eksplorasi dan memperoleh informasi yang terdapat dalam data. Pada
scientific visualisation, model grafis biasanya dibangun dari pengukuran atau simulasi data yang mewakili objek
E-1
atau konsep yang terkait dengan fenomena yang sebenarnya. Pada information visualization, model grafis
menyatakan konsep abstrak dan hubungan yang tidak selalu memiliki keterkaitan di dunia nyata (Olivera, 2003).
Data mentah dapat berasal dari berbagai format, dan untuk memetakan sekumpulan data menjadi format
visual cukup dengan mentransformasi menjadi sebuah relasi terstuktur atau kumpulan relasi (tupples). Card dkk
mendefinisikan ‘tabel model data’ sebagai sebuah format data terstruktur yang tersusun dalam baris dan kolom
yang menunjukkan relasi [Card at all, 1999]. Dalam hal ini baris menyatakan variabel dan kolom menyatakan
sebuah kasus.
Hoffman menggunakan istilah ‘tabel visualisasi’ untuk mendefinisikan visualisasi atas himpunan data
yang disajikan dalam tabel-tabel [Hoffman, 1999]. Istilah ‘dimensi’ digunakan untuk merujuk pada variabel
independen yang dinyatakan dalam tupel, sedangkan ‘variat’ merujuk pada variabel dependen [Wong dan
Bergeron, 1997]. Pada paper ini digunakan istilah ‘data item’ untuk mendefinisikan sebuah tupel yang
menyatakan hubungan antar banyak variabel dan ‘atribut’ dari dimensi untuk mendefinisikan varibel-variabel
baik dependen maupun independen. ‘Nilai atribut’ merujuk pada informasi yang berhubungan dengan variavel
tertentu. ‘Atribut range’ merujuk pada range nilai yang diasumsikan oleh atribut tertentu dalam himpunan data.
Untuk karakterisasi himpunan data berdimensi tinggi merupakan hal yang tidak mudah. Sebagai sebuah
konsep, batas antara data berdimensi rendah dan berdimensi tinggi adalah sekitar 3 sampai 4 atribut data. Pada
umumnya, pembahasan di luar dimensi 3 atau 4 sudah merupakan permasalahan yang sangat kompleks. Sebagai
panduan, dimensi data dibedakan sebagai berikut, ‘rendah’ untuk dimensi 1 sampai 4, ‘sedang’ untuk dimensi 5
sampai 9 dan ‘tinggi’ untuk yang dimensi 10 ke atas, namun demikian hal ini hanya merupakan sebuah pilihan.
Hal yang sama juga terjadi pada istilah ‘besar’, ‘sangat besar’ dan ‘masif’ yang digunakan untuk
kualifikasi himpunan data. Sebagai panduan, kualifikasi data tersebut dibedakan sebagai berikut : ‘besar’ untuk
item data dengan ukuran hingga 100.000, ‘sangat besar’ untuk item data dengan ukuran hingga 1.000.000 dan
‘masif’ untuk data yang berukuran ratusan juta. Sasaran pada DM biasanya adalah pada himpunan data ‘masif’
[Oliveira, 2003].
Metode-metode DM mempunyai tujuan yang berbeda dan beberapa metode telah diterapkan
sebelumnya untuk mencapai hasil yang dikehendaki. Kebanyakan aplikasi DM ditujukan untuk hal-hal sebagai
berikut : pemrosesan data, prediksi, regresi, klasifikasi, klastering, penentuan makna hubungan antas atribut,
visualisasi model, dan analisis data eksplorasi [Goebel dan Gruenwald, 1999].

3. TEKNIK-TEKNIK VISUALISASI DATA MULTIDIMENSI


Visualisasi data pada struktur dua atau tiga dimensi telah dibuat sebelum komputer digunakan untuk
membuat visualisasi. Dalam buku-bukunya Edward R. Tufte memberikan beberapa contoh teknik visualisasi dan
telah digunakan dalam kurun beberapa tahun [Tufte, 1983] [Tufte, 1990]. Sejak komputer digunakan untuk
membuat visualisasi, banyak teknik visualisasi yang dikembangkan, dengan teknik-teknik yang telah diperluas
untuk mengolah sekumpulan data dalam jumlah yang besar dan menampilkannya secara interaktif. Kebanyakan
data yang disimpan dalam database, tidak memiliki standard pemetaan dengan sistem koordinat Cartesian,
karena data tidak lagi dalam bentuk dua atau tiga dimensi. Secara umum, database relasional dapat
merepresentasikan himpunan data multidimensi, yang mana atribut-atribut dari database berhubungan dengan
dimensi dari basisdata tersebut. Terdapat teknik-teknik yang sudah terkenal untuk visualisasi sekumpulan data
multidimensi antara lain : scatterplot matrices and coplots, prosection matrice, parallel coordinates, projection
pursuite, dan teknik-teknik proyeksi geometik (misalnya: hyperbox, hyperslice), teknik-teknik berbasis icon,
teknik-teknik hierarki, teknik-teknik berbasis graph, teknik-teknik dinamik), teknik-teknik berorientasi pixel, dan
kombinasi dari beberapa teknik yang ada. Penelitian-penelitian lain juga telah dihasilkan dalam ekplorasi data
dan analisis sistem yang mengimplementasikan beberapa teknik yang telah disebutkan.
Teknik-teknik visualisasi data mining tersebut merupakan teknik visualisasi yang kebanyakan
diaplikasikan pada tahap pre-processing pada data mining. Sedangkan teknik visualisasi pada tahap post-
prosessing tidak dibahas.

3.1 Teknik-teknik berbasis pixel


Ide dasar dari teknik-teknik yang berorientasi pixel adalah memetakan tiap-tiap data value ke titik
tertentu dan setiap data value memiliki satu atribut dalam jendela terpisah seperti pada gambar-1 berikut :
Gambar-1 : Pengaturan jendela atribut untuk data dengan enam atribut

Secara umum teknik ini menggunakan satu titik setiap satu data value, maka teknik ini dapat mengalokasikan
visualisasi data dalam ukuran yang sangat besar, yaitu memungkinkan untuk menampilkan lebih dari 1.000.000
data value. Atribut yang berbeda ditampilkan pada sub jendela yang berbeda dan range nilai data yang mungkin
dipetakan pada titik sesuai warna tertentu [Keim, 2000] [Keim dan Kreigel, 1996] [Keim dan Kreigel, 1994]
seperti pada gambar-2 berikut :

Gambar-2 : Visualisasi berbasis pixel menggunakan spiral(kiri) dan sumbu(kanan) [Keim dan Kreigel, 1994]

Jika pengguna ingin memvisualisasi data yang besar, maka harus menggunakan teknik visualisasi
query-independent, yaitu mengurutkan data berdasarkan beberapa atribut dan menggunakan pencocokan pola
layar untuk mengatur data value pada tampilan. Teknik visualisasi query-independent ini sangat bermanfaat
khususnya pada data yang terurut secara alamiah berdasarkan satu atribut (misalnya data runtun waktu). Namun,
apabila terdapat data yang tidak terurut secara alamiah dan tujuan utamanya adalah ekplorasi interaktif pada
database, maka yang lebih diperhatikan adalah umpan balik untuk beberapa query. Dalam masalah ini, harus
dikembalikan pada teknik visualisasi query-independent yang memvisualisasikan item data yang sesuai.
Gambar-2 di atas mengilustrasikan visualisasi menggunakan metode pengaturan pixel yang disebut
pengaturan spiral dan pengaturan sumbu. Pengaturan tersebut dihasilkan dari sekumpulan data dengan distribusi
seragam dan lima klaster yang terdiri atas 7000 item data dengan delapan atribut. Warna diambil dari rentang
kuning cerah hingga hijau, biru, merah tua dan beberapa hitam, bergantung pada jarak dari item data dengan
jawaban query yang benar. Item data yang lebih baik dalam suatu query diberi warna kuning cerah dan yang
paling tidak sesuai diberi warna hitam.
Semua teknik yang berorientasi pixel, membagi layar menjadi banyak jendela. Untuk kelompok data
dengan m attribut/dimensi, layar akan terbagi dalam m jendela, masing-masing untuk satu atribut. Untuk teknik
visualisasi query-dipendent, ditambah jendela ke (m+1) yang disediakan untuk jarak secara keseluruhan. Di
dalam jendela-jendela tersebut, data value diatur berdasarkan urutan seluruh data yang diberikan.
Karakteristik Teknik berbasis Pixel :
 Dapat menangani himpunan data yang besar dan sangat besar dengan tampilan beresolusi tinggi.
 Dapat menangani secara wajar untuk data menengah dan dimensi yang tinggi
 Tiap-tiap data item dipetakan secara tunggal dengan sebuah titik, sehingga tidak terjadi record yang overlap
dan kekacauan secara visual.

3.2 Teknik Proyeksi Geometri


Tujuan dari teknik proyeksi geometri adalah memperoleh proyeksi yang menarik atas sekumpulan data
multidimensi. Klas dari teknik proyeksi geometri mencakup teknik pengujian statistik seperti komponen utama
analisis, analisis faktor dan penskalaan multidimensional, yang merupakan bagian dari istilah ‘projection
pursuit’ [Hurber, 1985] [Friedman dan Turkey, 1974]. Karena terdapat jumlah kemungkinan yang tak hingga
untuk memproyeksikan data berdimensi tinggi ke tampilan dua dimensi, sistem ‘projection pursuit’ sebagaimana
tujuan dari ‘the grand tour systems’ [Asimov, 1985] adalah pada otomasi dalam perolehan proyeksi yang penting
atau paling tidak membantu pengguna untuk memperoleh proyeksi tersebut.
Teknik proyeksi geometri yang lain adalah teknik visualisasi koordinat paralel [Inselberg, 1985]
[Inselberg dan Dimsdale, 1990]. Teknik koordinat paralel, memetakan ruang berdimensi k ke tampilan dua
dimensi dengan menggunakan k sumbu yang berjarak sama dan saling paralel dengan sumbu tampilan. Sumbu-
sumbu tersebut disesuaikan dengan dimensinya dan diberi skala dari nilai terkecil hingga terbesar. Tiap-tiap data
item dinyatakan sebagai garis poligon, tiap-tiap sumbu akan berpotongan pada suatu titik sesuai dengan nilai
dimensi yang dikehendaki, seperti pada gambar-3 berikut ini :

Gambar-3 : Teknik koordinat paralel

Meskipun ide dasar dari teknik visualisasi koordinat paralel cukup sederhana, tetapi sangat bagus untuk
mengungkapkan berbagai karakteristik data seperti perbedaan sebaran data dan kebertgantungan fungsional.
Karena garis poligon sering kali overlap, maka jumlah data item yang dapat divisualisasi pada layar pada saat
yang sama adalah terbatas, kira-kira hanya 1000 data item. Contoh visualisasi data berdimensi tiga dapat dilihat
pada gambar-4 berikut :

Gambar-4 : Contoh visualisasi data berdimensi tiga

Karakteristik teknik Geometri :


 Dapat menangani himpunan data yang besar dan sangat besar ketika dipasangkan dengan teknik-teknik
interaksi yang sesuai, tetapi kekacauan secara visual dan record yang overlap sangat parah untuk himpunan
data yang besar.
 Dapat menangani secara wajar untuk data menengah dan dimensi yang tinggi
 Semua dimensi data dianggap sama, namun urutan sumbu yang ditampilkan mempengaruhi apa yang dapat
dirasakan.
 Sangat efektif untuk menentukan data pencilan dan hubungan antara dimensi-dimensi yang berbeda.

3.3 Teknik-teknik berbasis icon


Klas lain dari teknik visualisasi data mining adalah teknik berbasis icon (iconic display techniques) atau
iconographic. Idenya adalah memetakan setiap data item multidimesi ke sebuah icon. Pendekatan pertama
tampilan iconic yang terkenal adalah ‘wajah Chernoff’ [Tufte, 1983] [Chernoff, 1973]. Pada visualisasi ‘wajah
Chernoff’, dua atribut data dipetakan pada tampilan dua dimensi icon wajah. Sedangkan dimensi sisanya
dipetakan ke berbagai bagian dari wajah (bagian hidung, mulut, mata dan bagian wajah itu sendiri). Visualisasi
‘wajah Charnoff’ memberi modal kepekaan manusia pada wajah dan fitur wajah. Banyaknya data item yang
dapat divisualisasi dengan teknik ‘wajah Carnoff’ hanya terbatas.
Sebuah teknik tampilan berbasis icon yang memungkinkan untuk visualisasi data yang besar dan lebih
memadai untuk data mining adalah teknik ‘stick figure’ [Pickett dan Greintein, 1988] [Pickett, 1970] [Greinstein
dkk, 1991]. Sesuai dengan namanya, icon merupakan beberapa tipe dari ‘stick figure’. Dalam teknik ini, dua
atribut data dipetakan ke tampilan dua dimensi dan dimensi yang lain dipetakan ke sudut dan panjang sayap dari
icon ‘stick figure’ seperti pada gambar-5 berikut :
Gambar-5 : Icon ‘stick figure’

Jika data item relatif padat dibandingkan dengan dimensi tampilan, hasil visualisasi menunjukkan
tekstur pola yang sangat sesuai dengan karakteristik data dan dapat terdeteksi berdasarkan persepsi sebelumnya.
Beberapa Icon ‘stick figure’ yang berbeda dengan berbagai ukuran dimensi dapat pula digunakan seperti yang
ditampilkan pada gambar-6 berikut :

Gambar-6 : Sebuah himpunan ‘stick figure’

Gambar-7 berikut menunjukkan visualisasi ‘stick figure’ dari data sensus berdimensi lima berdasarkan hasil
sensus di Amerika tahun 1980. Selain untuk pendapatan dan umur, maka tribut pekerjaan, tingkat pendidikan,
status perkawinan dan jenis kelamin dapat divisualisasian dengan ‘stick figure’.

Gambar-7 : Visualisasi ‘stick figure’ dari data sensus

Yang menarik adalah perubahan tekstur yang jelas pada layar yang mengindikasikan kebergantungan fungsional
atribut-tribut yang lain terhadap penghasilan dan umur.
Banyak pemikiran lain tentang visualisasi berbasis icon yang telah dikembangkan dalam beberapa tahun
teakhir. Satu pendekatan yang menyediakan visualisasi sembarang dimensi adalah pendekatan shape-coding
[Beddow, 1990]. Icon yang digunakan pada pendekatan shape-coding memetakan setiap dimensi dengan sebuah
larik kecil dari titik/pixel dan mengatur semua larik pixel dari setiap data item menjadi bentuk kotak. Kotak-
kotak kecil yang berhubungan dengan data item diatur dalam mode baris demi baris.

Karakteristik teknik Visualisasi Iconographic :


 Dapat menangani himpunan data kecil hingga menengah dengan ribuan item data, sebagai icon cenderung
hanya menggunakan ruang tampilan yang terdiri dari beberapa piksel saja.
 Dapat diterapkan pada himpunan data yang berdimensi tinggi, tetapi interpretasinya tidak mudah dan
memerlukan pelatihan.
 Dimensi dianggap berbeda, beberapa penampilan atribut dari icon lebih menarik perhatian daripada yang
lain. Dimensi data yang dipetakan ke atribut icon sangat ditentukan dari tampilan yang dihasilkan dari
visualisasi. Penentuan pemetaan yang sesuai mungkin sangat sulit dan untuk dimensi data yang lebih tinggi
dapat menyebabkan kemacetan proses.
 Record yang overlap hanya terjadi jika dimensi data dipetakan ke posisi tampilan dari icon.

3.4 Teknik Hirarki dan Teknik Berbasis Graf


Selain proyeksi geometri dan visualisasi berbasis icon, terdapat dua klas lagi dalam teknik visualisasi,
yaitu teknik hirarki dan teknik berbasis graf. Representasi yang terkenal dari teknik hirarki adalah teknik n-
Vision [Beshers dan Feiner, 1990], dimensional stacking [LeBlanc dkk, 1990] dan treemaps [Shneiderman,
1992]. Teknik hirarki membagi ruang k-dimensi dan menyajikan sub ruang dalam sebuah mode hirarki. Sebagi
contoh adalah teknik dimensional stacking yang membagi ruang k-dimensi ke dalam sub ruang 2 dimensi.
Kecuali treemaps, teknik hirarki memfokuskan pada visualisasi fungsi multivariat, hal ini menjadi suatu yang
tidak menarik untuk aplikasi data mining.
Ide dasar dari teknik berbasis graf adalah mengefektifkan penyajian graf yang besar dengan
menggunakan algoritma layout khusus, bahasa query dan teknik abstraksi. Contoh dari teknik berbasis graf
adalah Hy+ [Consens dan Mendelzon, 1993], Margritte [Vesudevan, 1994] dan SeeNet [Becker dkk, 1995].
Gambar-8 berikut meberi gambaran sebuah pendekatan pada himpunan yang terdiri atas 100 objek tunggal
yang diambil dari hasil query dokumen dalam sebuah intranet. Sebuah hirarki klastering obyek dokumen dengan
20 kluster disajikan pada pohon hiraraki kluster dengan tingkat yang berbeda. Pada tingkat paling atas, satu
pengamatan terhadap seluruh himpunan data yang disajikan dalam satu klaster, gambar selanjutnya
menunjukkan tingkat yang lebih rendah dari pohon hirarki dan yang paling rendah terdiri atas 20 klaster seperti
terlihat di bagian kanan bawah.

Gambar-8 : Visualisasi pada klastering dengan Hierarki [Sprenger dkk, 2000]

Karakteristik teknik Hierarki dan Graf :


 Dapat menangani himpunan data dengan ukuran kecil hingga sedang
 Lebih sesuai untuk penanganan himpunan data dengan dimensi rendah hingga sedang.
 Atribut-atribut dianggap berbeda, pemetaan yang berbeda menghasilkan tampilan data yang berbeda.
 Interpretasi dari gambar yang dihasilkan membutuhkan palatihan

4. KESIMPULAN
Dari Survey yang dilakukan berkenaan dengan Visual Data Mining dapat diambil kesimpulan antara lain :
 Usaha untuk menampilkan hasil eksplorasi data mining secara visual terus mengalami peningkatan. Hal
tersebut ditujukan untuk memberikan dukungan yang kuat untuk meningkatkan interpretasi dari pengguna.
 Penggabungan berbagai teknik eksplorasi data secara visual dan algoritma-algoritma analisis pada data
mining dalam sebuah tool yang komprehensif akan menghasilkan sebuah strategi DM yang lebih kuat.

5. DAFTAR PUSTAKA
Anwar T.M., Beck H.W., Navathe S.B., 1992, Knowlwdge Mining by Imprecise Querying : A Classification-
Based Approach, Proc. 8th Int. Conf. On Data Engineering, Tempe, AZ. Pp. 622-630
Becker R.A., Eick S.G., Wills G.J., 1995, Visualization Network Data, IEEE Transactions on Visualizations
graphics, Vol. 1, No. 1, pp. 16-28
Beshers C.G., Feiner S., 1990, Visualization n-Dimensional Virtual Worlds with n-Vision, Computer Graphics,
Vol. 24, No. 2, pp. 37-38
Card S.K., Mackinlay J.D. Shneiderman B. (eds), 1999, Reading in Information Visualization – Using Vision to
Think, San Francisco : Morgan Kaufmann
Chernoff H., 1973, The Use of Faces to Represent Point in k-Dimensional Space Graphically, Journal American
Statistical Association, Vol. 68, pp. 361-368
Consens M.P., Mondelzon A.O., 1993, Hy+ : A Hygraph-bases Query and Visualization Systems, Proc. ACM
SIG-MOD Inn. Conf. on Management of Data, Washington, DC, pp. 511-516
Dunn G., Everitt B., 1982, An Introduction to Mathematical Taxonomy, Cambridge University Press,
Cambridge, MA
Fawley W.J, Shapiro G.P., Matheus C.J., 1991, ‘Knowledge Discovery in Database : An Overviw’, in
Knowledge Discovery in Database, AAAI Press, Menlo Park, CA, pp. 1-27
Frei H.P., Meienderg S., 1991, Evaluation Weighted Search Terms as Boolean Qeuries, Proc. GI/GMD-
Workshop Darmstadt, in : Informatik-Fachberichte, Vol. 289, pp. 11-22
Friedman J., Turkey J., 1974, A Projection Pursuit Algorithm for Exploratory Data Analysis, IEEE Transactions
on Computer, Vol. 23, pp. 881-890
Gasterland T., Godfrey P., Minker J., 1992, An Overview of Cooperative Answering, Journal of Intelligent
Information Systems, Vol. 1, pp. 123-157
Goebel M., Gruenwald L., 1999, A Survey of Data Mining and Knowledge Discovery Software Tools, ACM
SIGKDD Exploration, Vol. 1, No. 1, pp. 20-23
Greinstein G., Sieg J.C., Smith S., Williams G.M., 1991, Visualization for Knowledge Discovery, Technical
Report, Computer Science Department, University of Massachusetts at Lowell, MA
Hoffman P.E., 1999, Table Visualizations : A Formal Model and Its Applications, doctoral dissertation,
Computer Science Dept., Univ. Of Massachusette at Lowel
Huber P.J., 1985, Projection Pursuit, The Annals of Statistics, Vol. 13, No. 2, pp. 435-474
Inselberg A., 1985, The Plane with Parallel Coordinates, The Visual Computer, Vol. 1, special issue on
computational geometry, pp. 69-91
Inselberg A., Domsdale B., 1990, Parallel Coordianates : A Tool for Visualizing Multi-Dimensional Geomety,
Proc. Visualization ’90, San Francisco, CA, pp. 361-370
Keim D.A., Kreigel H.P., 1994, Databases Exploration using Multidimensional Visualization, Computer
Graphics & Applications, pp. 40-49
Keim D.A., Kreigel H.P., 1996, Visualization Techniques for Mining Large Databases : A Comparison, IEEE
Transactions on Knowledge and Data Engineering, Vol. 8, No. 6, pp. 923-936
Keim D.A., 2000, Designing Pixel-Oriented Visualization Techniques : Theory and Applications, IEEE
Transactions Visualization and Computer Graphics, Vol. 6, No. 1, pp. 59-78
LeBlanc J., Ward M.O., Wittels N., 1990, Exploring N-Dimensional Databases, Proc. Visualization ’90, San
Francisco, CA, pp. 230-237
Matheus C.J., Chan P.K., Shapiro G.P., 1993, Systems for Knowledge Discovery in databases, IEEE IEEE
Transaction on Knowledge and Data Engineering, Vol. 5, No. 6, pp. 903-913
Motto A., 1990, FLEX : A Tolerant and Cooperative User Interface to Database, IEEE Transaction on
Knowledge and Data Engineering, Vol. 2, No. 2, pp. 231-246
Oliveira M.C.F., Levkowitz H., 2003, From Visual Data Exploration to Visual Data Mining : A Survey, IEEE
Transactions on Visualization and Computer Graphics, Vol. 9, No.3
Pickett R.M., 1970, Visual Analysis of Texture in the Detection and Recognition of Object, in : Picture
Precessing ang Psyco-Pictorics, Lipkin B.S., Rosenfeld A. (eds), Academic Press, New York
Pickett R.M., Greinstein G.G., 1988, Iconographic Displays for Visualizing Multidimensional Data, Proc. IEEE
Conf. on Systems, Man and Cybernetics, IEEE Press, Piscataway, NJ, pp. 514-519
Salton G., Buckley C., 1988, Term Weighting Approaches in Automatic Text Retrieval, Information Processing
and Management, Vol. 4, No. 5, pp. 513-523
Shnedermann B., 1992, Tree Visualization with Treemaps : A 2D Space-Filling Approach, ACM Transactions
on Graphis, Vol. 11, No. 1, pp. 92-99
Sprenger T.C., Brunella R., Gross M.H., 2000, A Hierarchical Visual Clustering Method Using Implicit Surface,
CS Tech. Report #341, Computer Science Dept. ETH Zurich, Switzerland
Tufte E.R., 1983, The Visual Display of Quantitative Information, Graphics Press, Cheshire, CT
Tufte, E.R., 1990, Envisioning Information, Graphics Press, Cheshire, CT
Vasudevan V., 1994, Supporting High Bandwidth Navigation on Object Bases, Proc. 10th Int. Conf. on Data
Engineering, Houston, TX, pp. 294-301
Wong P.C., Bergeron R.D., 1997, 30 Years of Multidimensional Multivariate Visualization, Scientific
Visualization Overviews, Methodologies and Techniques, Nelson G.M., at all, eds., pp. 3-33. Los
Alamitos, Calif. : IEEE CS Pres

Anda mungkin juga menyukai