Anda di halaman 1dari 7

DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal.

62-68

ESTIMASI ARAH TATAPAN MATA DENGAN MENGGUNAKAN


AVERAGE POOLING CONVOLUTIONAL NEURAL NETWORK

William Sugiarto, Yosi Kristian, Eka Rahayu Setyaningsih


Teknik Informatika Sekolah Tinggi Teknik Surabaya
e-mail: williamsugiarto2011@gmail.com, yosi@stts.edu, eka@stts.edu

ABSTRAK

Studi arah tatapan mata adalah salah satu masalah yang cukup menantang dalam bidang computer
vision. Pengetahuan akan arah tatapan mata dapat memberikan informasi berharga yang dapat dimanfaatkan
untuk berbagai macam keperluan di beberapa bidang lainnya. Dalam paper ini nantinya akan meneliti arah
tatapan mata menggunakan average pooling convolutional neural network dengan menggunakan dataset
CAVE (Columbia Gaze Dataset). Convolutional neural netwok merupakan sebuah bidang keilmuan dalam
bidang machine learning yang akhir-akhir ini berkembang dan sangat baik untuk mengklasifikasi citra.
Nantinya, paper ini akan menganalisa dan membandingkan hasil F1 score dan weighted kappa (w-kappa)
score dari klasifikasi dengan menggunakan 3 dan 9 kelas. Dengan menggunakan channel RGB sebagai
gambar input, menghasilkan hasil yang lebih baik daripada menggunakan greyscale. Dan juga dengan seen
responden dataset menghasilkan hasil yang juga lebih baik daripada unseen responden dataset.

Kata kunci: Gaze Estimation; Eye Gaze; Average Pooling CNN

PENDAHULUAN dan diharapkan dengan menggunakan metode ini


dapat menghasilkan tingkat akurasi yang lebih baik
Mata adalah salah satu bagian yang cukup daripada metode-metode sebelumnya.
menonjol dari wajah manusia dan merupakan salah CNN adalah kategori Neural Networks yang
satu fitur komunikasi dengan tampilan antarmuka. telah terbukti sangat efektif di area seperti
Mata dan pergerakannya menyatakan perhatian pengenalan dan klasifikasi citra. Perbedaan utama
seseorang dan memainkan peran yang penting CNN dengan MLP adalah CNN memiliki layer
dalam mengkomunikasikan informasi sosial untuk convolution dan pooling. Berarti bahwa
maupun emosional [1]. Tatapan mata menentukan lapisan pertama yang muncul setelah input, tidak
arah dari pandangan seseorang dan untuk menggunakan semua input fitur pada saat yang
selanjutnya dari data tersebut dapat diolah untuk bersamaan, melainkan fitur yang saling terhubung.
berbagai macam keperluan lainnya.
Penelitian tentang pelacakan arah tatapan mata TEORI DASAR
berfokus pada menginterpretasikan posisi mata
pada layar secara akurat. Dari mata yang terdeteksi 1. Convolutional Neural Network
tersebut, nantinya akan diproses dan menghasilkan Convolutional Neural Network (CNN)
estimasi posisi dari apa yang dilihat oleh user. Hasil merupakan pengembangan dari Multilayer
dari analisa tersebut bisa sangat berharga untuk Perceptron (MLP) yang dirancang untuk mengolah
pengembangan dalam bidang interaksi manusia citra dua dimensi. CNN dianggap mampu
dengan komputer, user experience, bidang menghasilkan klasifikasi yang lebih baik daripada
sosiologi, edukasi, simulasi untuk industri MLP karena MLP tidak memiliki kemampuan
penerbangan, marketing, dan juga bidang lainnya. untuk menyimpan informasi spasial dari data citra
Sebagian besar pendekatan tracking maupun dan menganggap setiap pixel merupakan fitur yang
estimasi tatapan mata menggunakan pendekatan independen [9].
berbasis fitur [2]–[6] atau berbasis tampilan [7], [8]. Pada MLP, setiap neuron akan direpresentasikan
Dalam penelitian ini, akan menggunakan metode ke dalam bentuk satu dimensi. Akan tetapi, pada
average pooling convolutional neural network CNN, setiap neuron akan direpresentasikan ke
(CNN) yang merupakan metode yang relatif baru

Dinamika Teknologi
62 Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327
DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal. 62-68

dalam bentuk lebih dari satu dimensi yang dimana 2 Fungsi Aktivasi
memiliki lebar, tinggi, dan juga kedalaman. Dalam CNN terdapat beberapa macam fungsi
CNN terdiri dari beberapa layer. Terdapat tiga aktivasi yang dapat digunakan diantaranya adalah
macam layer utama pada sebuah CNN yaitu, Rectified Linear Unit (ReLU) dan softmax.
convolution layer, subsampling layer, dan fully ReLU merupakan fungsi aktivasi yang akan
connected layer. Tujuan dilakukannya konvolusi menghasilkan nilai nol apabila x < 0 dan kemudian
pada data citra adalah untuk mengekstraksi fitur dari linier dengan kemiringan 1 ketika x > 0
citra input.

Gambar 1. Operasi Konvolusi Gambar 3. Fungsi Aktivasi Rectified Linear


Unit (ReLU)
Konvolusi pada CNN berati mengaplikasikan
sebuah kernel pada citra untuk semua offset yang Aktivasi softmax biasanya diterapkan pada
memungkinkan [9] seperti yang ditunjukkan pada lapisan terakhir pada convolutional neural network.
gambar 1. Kernel akan bergerak dari sudut kiri atas Softmax lebih sering digunakan daripada
menuju kanan bawah. menggunakan ReLU, sigmoid, tanh, ataupun fungsi
Subsampling merupakan proses untuk aktivasi lainnya. Alasan mengapa softmax berguna
mereduksi ukuran sebuah data citra. Metode karena mengubah output dari lapisan terakhir di
subsampling pada CNN dapat menggunakan max neural network Anda menjadi distribusi probabilitas
pooling ataupun average pooling. Akan tetapi, dasarnya. Persamaan softmax yaitu:
metode subsampling yang paling umum digunakan
pada CNN yaitu menggunakan max pooling. Max
( ⃗) = = 1,2,3, … , (1)
pooling akan mengambil sebuah grid kecil dari ∑
output convolutional layer semisal berukuran 2x2
untuk diambil nilai maksimalnya seperti yang Keuntungan utama menggunakan Softmax
ditunjukan pada gambar 2. Sedangkan pada metode adalah rentang probabilitas output. Rentangnya 0
subsampling average pooling akan diambil sebuah sampai 1, dan jumlah semua probabilitasnya sama
grid kecil dari output convolutional layer untuk dengan satu. Keunggulan softmax yang lainnya
diambil nilai rata-ratanya. ialah, dapat digunakan untuk multiple classification
logistic regression model, sedangkan pada sigmoid
1 2 3 1 hanya untuk klasifikasi biner.
6 7 1 2 7 3

2 5 2 9 5 9

4 3 7 6

Gambar 2. Perhitungan Max Pooling Gambar 4. Contoh Output Softmax

Pada akhir proses, setiap neuron pada DATASET


convolution layer perlu ditransformasi menjadi data
satu dimensi terlebih dahulu sebelum dapat Pada penelitian ini, akan menggunakan dataset
dimasukkan ke dalam sebuah fully connected layer. yang bersumber dari Columbia Gaze Dataset
Karena fully connected layer tersebut dapat (CAVE). Dataset ini berisi 5.880 gambar dengan 32
menyebabkan data kehilangan informasi spasialnya subyek pria dan 24 subyek wanita dengan rentang
dan sifatnya yang tidak reversibel, maka fully usia 18 hingga 36 tahun dengan resolusi 5.184 x
connected layer hanya diimplementasikan pada 3.456.
akhir jaringan.

Dinamika Teknologi
Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327 63
DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal. 62-68

Untuk setiap subyek, diambil gambar dengan Sistem pelabelan kelas dimulai dari huruf “A”
lima horisontal head pose (0°, ±15°, ±30°) dengan dan dimulai dari kiri atas ke kanan bawah seperti
tujuh arah tatapan secara horisontal (0°, ±5°, ±10°, yang ditunjukan pada gambar 8 untuk pelabelan 9
±15°) dan tiga arah tatapan secara vertikal (0°, kelas.
±10°).
A B C

D E F

G H I
Gambar 8. Pelabelan Pada 9 Kelas

Pembagian kelas berdasarkan sudut arah tatapan


mata mengikuti kaidah sesuai yang tertera pada
tabel 1.

Tabel 1. Pembagian Kelas


Gambar 5. Contoh Columbia Gaze Dataset Jumlah Label Sudut
Sudut Vertikal
Kelas Kelas Horisontal
METODE PENELITIAN -10 -15, -10
A 0 -15, -10
Dalam paper ini prosesnya akan dipecah menjadi 10 -15, -10
tiga bagian terlebih dahulu yaitu mata kiri, kanan,
-10 -5, 0, 5
dan kedua mata, dan kemudian hasil dari ketiga
CNN tersebut akan dirata-rata dan nilai tertinggi 3 B 0 -5, 0, 5
akan diambil sebagai hasil klasifikasi seperti yang 10 -5, 0, 5
ditunjukan pada gambar 6. -10 10, 15
C 0 10, 15
10 10, 15
A 10 -15, -10
B 10 -5, 0, 5
C 10 10, 15
D 0 -15, -10
Gambar 6. Skema yang Digunakan 9 E 0 -5, 0, 5
F 0 10, 15
Pada tahap eye region localization, gambar
dipotong menjadi tiga bagian yaitu mata kiri, mata G -10 -15, -10
kanan, dan juga kedua mata. Untuk mata kiri dan H -10 -5, 0, 5
kanan, diberi latar belakang berwarna hitam dan I -10 10, 15
juga putih sebagai pembanding. Dari 5.880 gambar,
hanya 5.833 gambar yang bisa diproses eye region Train set yang digunakan untuk penelitian ini
localization dan yang dipakai sebagai train maupun sebesar 80% dan sisanya sebesar 20% akan diambil
test set. sebagai test set. Dari 5.833 gambar hasil eye region
localization tersebut, akan dibagi menjadi dua
macam metode train and test split, yaitu unseen
responden test set dan seen responden test set. Pada
(a) (b) metode pertama, test set hanya terpusat pada bagian
akhir dari dataset. Akan tetapi berbeda pada metode
kedua, test set tersebar secara merata pada setiap
(c) orang yang ada sehingga dapat dipastikan pada saat
Gambar 7. Eye Region Localization untuk proses training pernah melihat mata orang tersebut.
(a) Mata Kiri, (b) Mata Kanan, (c) Kedua Mata Pada gambar 9 mengilustrasikan perbedaan kedua
metode tersebut.

Dinamika Teknologi
64 Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327
DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal. 62-68

Untuk proses CNN dengan kedua mata, digunakan


Train Train ... Train Train Test arsitektur yang berbeda. Dimensi filter yang
digunakan yaitu 24 @ 7 x 7, 28 @ 7 x 7, 32 @ 5 x
5, dan 36 @ 3 x 3 dan masing-masingnya dilakukan
Orang ke-1 Orang ke-2 Orang ke-54 Orang ke-55 Orang ke-56
proses ReLU dan max pooling yang sama seperti
(a)
pada proses CNN untuk mata kanan dan mata kiri.
Test Test Test Test Test

Train Train ... Train Train Train

Orang ke-1 Orang ke-2 Orang ke-54 Orang ke-55 Orang ke-56
(b)
Gambar 9. (a) Unseen Responden Test Set
(b) Seen Responden Test Set

Kemudian akan dilakukan proses CNN sebanyak


300 epoch pada masing-masing gambar mata
tersebut secara independen. Hasil dari ketiga
jaringan tersebut akan digunakan untuk menentukan Gambar 11. Arsitektur CNN untuk Kedua
label kelas. Persamaan yang digunakan untuk Mata
menghitung score akhir adalah sebagai berikut:
Jumlah saluran pada gambar 10 dan 11 yaitu jumlah
= (2) saluran yang dipakai sebagai gambar input. Untuk
grayscale berarti 1 saluran, dan untuk RGB berarti
3 saluran. Hasil akhirnya, berupa hasil softmax dari
Score L merupakan hasil dari perhitungan softmax 3 ataupun 9 kelas tergantung dari apa yang sedang
untuk mata kiri, score R untuk mata kanan, dan diuji cobakan.
score B untuk kedua mata. Kelas yang dipilih Untuk perhitungan akurasi, digunakan
ditentukan dengan probabilitas maksimum yaitu: perhitungan menggunakan F1 score atau yang biasa
juga disebut dengan F-score ataupun F-measure.
= arg max( ) (3) F1-score adalah ukuran akurasi tes yang
mempertimbangkan baik presisi p maupun recall r
Untuk proses CNN pada mata kiri dan kanan dari tes untuk menghitung skor dimana p adalah
akan diaplikasikan dengan arsitektur seperti pada jumlah hasil positif yang benar dibagi dengan
gambar 10. Pada convolutional layer tahap pertama, jumlah semua hasil positif, dan r adalah jumlah hasil
digunakan 24 filter dengan dimensi 7 x 7. Kemudian positif yang benar dibagi dengan jumlah positif.
diikuti dengan ReLU dan 2 x 2 max pooling layer. Nilai F1-score memiliki nilai terbaiknya yaitu 1 dan
Sedangkan untuk convolutional layer tahap kedua terburuk adalah 0.
dan ketiga, keduanya menggunakan 24 filter dengan
dimensi 5 x 5 dan 3x 3, serta proses Relu dan max
pooling yang sama seperti pada tahap sebelumnya. =2 (4)

Selain F1-score, penelitian ini juga


menggunakan w-kappa untuk mengukur akurasi.
Dengan menggunakan w-kappa, maka jarak jauh
dekatnya error akan mempengaruhi nilai yang
dihasilkan.


= 1− ∑, (5)
,

Untuk menetapkan nilai bobotnya, maka


digunakan teorema pythagoras. Sebagai contoh jika
Gambar 10. Arsitektur CNN untuk Mata kelas “A” ditebak sebagai kelas “H” akan memiliki
Kanan dan Mata Kiri

Dinamika Teknologi
Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327 65
DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal. 62-68

nilai bobot w-kappa sebesar 2,236 seperti yang Pada Tabel 2, hasil testing dengan klasifikasi 3
diilustrasikan pada Gambar 12. kelas terbaik ditunjukan dengan penanda berwarna
hijau. F1 score dapat mencapai 0.8481426, dan w-
kappa score sebesar 0.8059620.

Tabel 2. Hasil Training dan Testing


dengan Klasifikasi 3 Kelas
Saluran Warna Latar Metode Hasil Hasil
Tipe
Gambar 12. Perhitunggan Bobot W-Kappa Warna Belakang Pengukuran Training Testing
F1 Score 0.9867762 0.8514038
Black
Hasil perhitungan tersebut akan dibulatkan W-Kappa 0.9828318 0.8084728
Grayscale
menjadi tiga angka dibelakang koma. Pada gambar White
F1 Score 0.9861901 0.8403506
W-Kappa 0.9823394 0.7950908
13 menunjukan nilai bobot kappa untuk klasifikasi Seen
F1 Score 0.9955851 0.8476812
3 kelas. Black
W-Kappa 0.9942187 0.8054516
A B C RGB
F1 Score 0.9941246 0.8481426
White
W-Kappa 0.9923664 0.8059620
A 0 1 2 F1 Score 0.9962076 0.8341968
Black
W-Kappa 0.9950057 0.7881076
Grayscale
F1 Score 0.9907395 0.8251216
B 1 0 1 White
W-Kappa 0.9878771 0.7736768
Unseen
F1 Score 0.9951573 0.8372558
Black
C 2 1 0 W-Kappa 0.9936850 0.7871269
RGB
F1 Score 0.9944961 0.8291279
White
Gambar 13. Bobot W-Kappa untuk Klasifikasi W-Kappa 0.9926325 0.7800724

dengan Tiga Kelas


Pada Gambar 15, confusion matrix untuk 3 kelas
HASIL UJI COBA dengan hasil testing terbaik terlihat sangat lemah
pada kelas C yaitu pada sudut horisontal 10 dan 15
derajat.
Pada penelitian ini, hasil yang didapat untuk
klasifikasi dengan hanya 3 kelas mendapatkan hasil
yang jauh lebih baik dibanding klasifikasi dengan 9
kelas, baik dalam hasil F1 score dan w-kappa score.
Pada Gambar 14, terlihat bahwa untuk klasifikasi
dengan 3 kelas, hasil F1 score dan w-kappa dari
seen responden dataset memiliki hasil yang relatif
lebih tinggi daripada unseen responden dataset.
Hasil testing terbaik untuk klasifikasi 3 kelas yaitu
menggunakan RGB seen responden dataset dengan
warna latar belakang putih.

Gambar 15. Confusion Matrix 3 Kelas Hasil


Testing Terbaik

Hasil klasifikasi 9 kelas juga menunjukan hal


yang sama dengan klasifikasi untuk 3 kelas, yaitu
seen responden dataset memberikan hasil yang
relatif lebih baik daripada unseen responden dataset.
Jika pada klasifikasi dengan menggunakan 3 kelas,
hasil testing terbaik yaitu RGB seen responden
dataset dengan warna latar belakang putih, pada
klasifikasi dengan menggunakan 9 kelas, yang
terbaik menggunakan warna latar belakang hitam.
Juga pada klasifikasi dengan 3 kelas, hasil F1 score
selalu lebih tinggi dibanding dengan hasil w-kappa,
pada klasifikasi dengan 9 kelas, hasil F1 score selalu
lebih rendah dibanding dengan hasil w-kappa.
Gambar 14. Grafik Hasil Klasifikasi 3 Kelas

Dinamika Teknologi
66 Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327
DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal. 62-68

Tabel 3. Hasil Training dan Testing


dengan Klasifikasi 9 Kelas
Saluran Warna Latar Metode Hasil Hasil
Tipe
Warna Belakang Pengukuran Training Testing
F1 Score 0.9775302 0.7465469
Black
W-Kappa 0.9829411 0.8013939
Grayscale
F1 Score 0.9709991 0.7534991
White
W-Kappa 0.9778674 0.8056500
Seen
F1 Score 0.9906609 0.7989052
Black
W-Kappa 0.9928674 0.8415281
RGB
F1 Score 0.9778487 0.7928245
White
W-Kappa 0.9831743 0.8386308
F1 Score 0.9783437 0.6067918
Black
W-Kappa 0.9837883 0.7006925
Grayscale
F1 Score 0.9794360 0.6125322
White
W-Kappa 0.9846917 0.7002599
Unseen
F1 Score 0.9891877 0.6483071
Black
W-Kappa 0.9918502 0.7265770
RGB
F1 Score 0.9826409 0.6498830
White
W-Kappa 0.9869977 0.7320744
Gambar 16. Grafik Hasil Klasifikasi 9 Kelas
dibandingkan hanya menggunakan mata kiri atau
Hasil testing klasifikasi 9 kelas terbaik
mata kanan saja, bahkan jika dibandingkan dengan
ditunjukan dengan penanda berwarna hijau pada
kedua mata.
tabel 3 dengan F1 score sebesar 0.7989052, dan
kapa score sebesar 0.8415281.
Confusion matrix untuk 9 kelas dengan hasil Tabel 4. Perbandingan Hasil Testing Mata Kiri,
testing terbaik juga menunjukan bahwa akurasi Mata Kanan, Kedua Mata, dan Kombinasi
Jumlah Metode Mata Kedua
terendah berada pada sudut horisontal 10 dan 15 Kelas Pengukuran
Mata Kiri
Kanan Mata
Kombinasi
derajat (kelas C, F, dan I). F1 Score 0.7430179 0.7380311 0.8237536 0.8372558
Kappa 0.6648537 0.6581481 0.7726310 0.7871269
3 MSE 0.2615780 0.2667238 0.1801029 0.1655232
Epoch ke /
169 / 250 134 / 165 108 / 152 300 / 300
Jml. Epoch
F1 Score 0.5246622 0.5562340 0.6053949 0.6483071
Kappa 0.6235832 0.6370779 0.6868553 0.7265770
9 MSE 0.4691252 0.4502573 0.3987993 0.3516295
Epoch ke /
197 / 262 352 / 364 99 / 177 300 / 300
Jml. Epoch

KESIMPULAN

Berikut ini adalah beberapa hal yang dapat


disimpulkan dari penelitian ini, antara lain:
1. Hasil testing klasifikasi dengan menggunakan 3
kelas lebih baik dibanding dengan
menggunakan 9 kelas. Hal ini dikarenakan pada
klasifikasi dengan menggunakan 3 kelas hanya
memperhatikan sudut secara horisontal dan
mengabaikan sudut secara vertikal, sehingga
Gambar 17. Confusion Matrix 9 Kelas Hasil jaringan saraf dapat memprediksi dengan lebih
Testing Terbaik mudah.
2. Seen responden dataset memberikan hasil yang
Sebagai data pembanding, pada tabel 4 akan lebih baik daripada unseen responden dataset,
digunakan unseen responden dataset dengan saluran karena pada seen responden dataset, mata orang
RGB berlatar belakang hitam untuk klasifikasi tersebut setidaknya pernah dilihat sebelumnya.
dengan 3 kelas dan 9 kelas. Terjadi peningkatan F1 Berbeda dengan unseen responden dataset
score dan juga w-kappa jika menggunakan dimana data testing belum pernah dilihat
kombinasi dari mata kiri, mata kanan, dan juga sebelumnya.
kedua mata

Dinamika Teknologi
Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327 67
DINAMIKA TEKNOLOGI Oktober 2017 Vol. 9; No. 2; Hal. 62-68

3. Dengan gambar input menggunakan gambar Wild,” pp. 1–10, 2015.


RGB, akan menghasilkan hasil yang lebih baik 9. I. W. S. E. P, A. Y. Wijaya, and R. Soelaiman,
dibanding dengan gambar grayscale. “Klasifikasi Citra Menggunakan
4. Warna latar belakang pada mata kiri dan kanan Convolutional Neural Network ( Cnn ) pada
tidak memiliki pengaruh yang signifikan antara Caltech 101,” vol. 5, no. 1, 2016.
warna hitam dan putih.
5. Pada klasifikasi dengan menggunakan 3 kelas,
hasil F1 score lebih tinggi dibandingkan dengan
nilai w-kappa. Sedangkan pada klasifikasi
dengan menggunakan 9 kelas, terjadi
sebaliknya. Hal ini dikarenakan pada klasifikasi
dengan menggunakan 3 kelas, kesalahan
prediksi akan menghasilkan error yang lebih
berarti jika dibandingkan dengan klasifikasi
menggunakan 9 kelas.
6. Dengan menggunakan gabungan antara mata
kanan, mata kiri, dan kedua mata, akan
meningkatkan hasil F1 score dan w-kappa,
terutama pada klasifikasi dengan menggunakan
9 kelas.

DAFTAR PUSTAKA

1. G. M. STEPHENSON and D. R. RUTTER,


“Eye-Contact, Distance and Affiliation,” Br. J.
Psychol., vol. 61, no. 3, pp. 385–393, 1970.
2. A. Villanueva, R. Cabeza, and S. Porta, “Eye
tracking: Pupil orientation geometrical
modeling,” Image Vis. Comput., vol. 24, no. 7,
pp. 663–679, Jul. 2006.
3. A. VILLANUEVA, R. CABEZA, and S.
PORTA, “GAZE TRACKING SYSTEM
MODEL BASED ON PHYSICAL
PARAMETERS,” Int. J. Pattern Recognit.
Artif. Intell., vol. 21, no. 5, pp. 855–877, Aug.
2007.
4. C. H. Morimoto, A. Amir, and M. Flickner,
“Detecting eye position and gaze from a single
camera and 2 light sources,” in Object
recognition supported by user interaction for
service robots, vol. 4, pp. 314–317.
5. A. Meyer, M. Böhme, T. Martinetz, and E.
Barth, “A Single-Camera Remote Eye
Tracker,” Springer, Berlin, Heidelberg, 2006,
pp. 208–211.
6. S.-W. Shih and J. Liu, “A novel approach to 3-
D gaze tracking using stereo cameras.,” IEEE
Trans. Syst. Man. Cybern. B. Cybern., vol. 34,
no. 1, pp. 234–245, 2004.
7. S. V Sheela, P. A. Vijaya, and B. M. S. College,
“An Appearance based Method for Eye Gaze
Tracking,” vol. 7, no. 8, pp. 1194–1203, 2011.

8. X. Zhang, Y. Yusuke, M. Fritz, and A. Bulling,


“Appearance-Based Gaze Estimation in the

Dinamika Teknologi
68 Jurnal Ilmiah Teknologi dan Rekayasa, ISSN: 1907-7327

Anda mungkin juga menyukai