Anda di halaman 1dari 22

Jurnal Reading METODE ANALISIS FOTO XRAY LUTUT UNTUK DETEKSI AUTOMATIS OSTEOARTHRITIS DITERJEMAHKAN DARI:

KNEE X-RAY IMAGE ANALYSIS METHOD FOR AUTOMATED DETECTION OF OSTEOARTHRITIS


Lior Shamir_, Shari M. Ling, William W. Scott, Angelo Bos, Nikita Orlov Member, IEEE, Tomasz Macura Student Member, IEEE, D. Mark Eckley, Luigi Ferrucci, and Ilya G. Goldberg Member, IEEE

Oleh :

Adriyani Hartayanti A.A. Yunda Prabundari A.A. Intan Pramesti

(0502005046) (0502005057) (0502005130)

PEMBIMBING :

dr. Firman P. Sitanggang, Sp.Rad (K)

DALAM RANGKA MENGIKUTI KEPANITERAAN KLINIK MADYA BAGIAN/SMF RADIOLOGI FAKULTAS KEDOKTERAN UNUD RSUP SANGLAH DENPASAR 2012

METODE ANALISIS FOTO XRAY LUTUT UNTUK DETEKSI AUTOMATIS OSTEOARTHRITIS


Lior Shamir_, Shari M. Ling, William W. Scott, Angelo Bos, Nikita Orlov Member, IEEE,Tomasz Macura Student Member, IEEE, D. Mark Eckley, LuigiFerrucci, and Ilya G. Goldberg Member, IEEE

Abstrak-Kami menjelaskan sebuah metode untuk deteksi Osteoarthritis (OA) pada gambar X-ray lutut. Deteksi didasarkan pada nilai klasifikasi Kellgren-Lawrence, yang sesuai dengan berbagai tahap keparahan OA. Klasifikasi ini dibentuk berdasarkan X-ray yang diklasifikasikan secara manual yang mewakili empat nilai KL (normal, diragukan, minimal dan berat). Analisis foto dilakukan dengan mengidentifikasi seperangkat deskriptor konten foto dan mengubah foto yang informatif untuk mendeteksi OA dalam Xray, dan penilaian gambar ini menggunakan skor Fisher. Kemudian, aturan tetangga terdekat sederhana tertimbang digunakan untuk memprediksi nilai KL dimana tes X-ray yang diberikan pada suatu sampel. Dataset yang digunakan dalam percobaan berisi 350 gambar X-ray diklasifikasikan secara manual dengan nilai KL mereka. Hasil penelitian menunjukkan bahwa OA sedang (KL kelas 3) dan OA minimal (KL kelas 2) dapat dibedakan dari kasus normal dengan akurasi 91,5% dan 80,4% masing-masing. OA Diragukan (KL kelas 1) terdeteksi secara otomatis dengan akurasi yang jauh lebih rendah dari 57%. Kode sumber dikembangkan dan digunakan dalam penelitian ini yang tersedia untuk download gratis di www.openmicroscopy.org. Indeks__Syarat-Osteoarthritis, klasifikasi citra, deteksi otomatis, X-ray, Kellgren-Lawrence klasifikasi.

I. PENDAHULUAN Radiografipertama kali diperkenalkan dalam dunia medispada tahun 1985. Sejaksaat itu,perkembangannya mengalami peningkatan. Pada saat itu

masihdigunakanfilm yang mengandungperak,namun saat iniyang dipakai adalah teknik radiografi yang digital, dimana ada yang disebut tidak langsung

(menggunakan piring photostimulable) atau langsung(menggunakandetektorpanel

datar). Pemeriksaanradiografiharus dilakukandengan hati-hati, dan hasil yang optimalseringdicapai dengan menggunakanfluoroskopivideo.2 Osteoarthritis (OA) adalah suatu kondisi kronis yang sangat umum yang menyebabkan cacat substansial dalam kehidupan lanjut. Diperkirakan ~80% penduduk berusia di atas 65 memiliki bukti radiografi Osteoarthritis, dan harapan hidup yang berkepanjangan di Amerika Serikat dan penuaan dari kelompok "baby boomer", dan prevalensi osteoarthritis diperkirakan terus meningkat. Radiologi merupakan hal yang penting untuk memeriksa ruang sendi. Semua ruang dibandingkan dengan lutut kontralateral. Hal tersebut dapat diukur sebagai bagian dari pemeriksaan cartilage dengan lup secara bertahap atau secara langsung dengan menggunakan gambaran radiografik dengan ukuran yang sebenarnya. Mengukur ruang sendi merupakan alat untuk mengakses ketebalan cartilage. Sebagaimana dikatakan oleh Dacre dkk, menunjukkan ruang sendi tibiofemoral menurun secara fisiologis seiring umur. Ukuran rata rata ruang sendi pada laki-laki berumur 35 tahun adalah 7,03 mm, dimana pada umur 65 tahun, hanya 4,9 mm. Padaosteoarthritis, rata-rataberkurangnyaruang sendi tibio-femoral adalah 0,3mm per tahun: kecepatan dalam penyempitan ruang sendi ini memungkinkan kitauntuk membedakanantara adanya prosesosteoarthritis tipe lambat atau progresif cepat.Selainpenyempitanruang sendi, tiga tandalainnyayang

sangatmenunjukkanosteoarthritisperludiselidiki, seperti keadaan klinis dibawah ini : Subkondral sklerosis, hasil dari perkembangantrabekulapada

tulangcancellous, yang mengalami tekanan trauma mekanik. Kista Subkondral, yang sering mengakibatkan adanya hubungan antara rongga sendi dan tulang subkondral karena adanya lubang pada kartilage dan lempeng subkondral. Osteofit, tanda klasik dariosteoarthritis, yang biasanya terdapatdi daerahterluar dariepiphyses.2

gambar 1. Gambaranradiografidariperpanjanganlututkanan.Osteoarthritis tibiofemoral medial denganpenyempitanruangsendidanosteofitosisringan. Genu varum gambar 2. Gambaranradiografipadalututkanan yang diflexikansebesar 30 padapasien yang sama

Meskipun metode baru, seperti MRI, menawarkan penilaian hingga periarticular serta struktur artikular, adanya radiografi polos membuat mereka menjadi alat yang paling umum digunakan dalam evaluasi sendi OA, meskipun keterbatasannya dalam mendeteksi dini penyakit dan perubahan halus dikenal dari waktu ke waktu. Sementara beberapa metode telah diusulkan, sistem KellgrenLawrence (KL) adalah metode divalidasi yang mengklasifikasi sendi individu menjadi salah satu dari lima nilai, dengan 0 mewakili normal dan 4 menjadi penyakit radiografi paling parah. Klasifikasi ini didasarkan pada fitur dari ostephytes (pertumbuhan tulang yang berdekatan dengan ruang sendi), penyempitan sebagian atau seluruh ruang sendi tibialis-femoral, dan sclerosis tulang subkondral. Klasifikasi Kellgren-Lawrence (KL) dibagi menjadi : Grade 0: radiografi tampak normal Grade 1: terdapat penyempitan ruang sendi dengan atau tanpa osteofit Grade 2: terdapat osteofit, penyempitan ruang sendi yang normal atau masih dipertanyakan

Grade 3: terdapat osteofit berukuran sedang, penyempitan sedang pada ruang sendi, terdapat kista atau subkondral sklerosis, kemungkinan adanya deformitas Grade 4: terdapat osteofit yang berukuran besar, penyempitan ruang sendi yang sangat menonjol, adanya sklerosis yang parah, adanya deformitas.2 Klasifikasi ini didasarkan pada fitur dari ostephytes (pertumbuhan tulang yang berdekatan dengan ruang sendi), penyempitan sebagian atau seluruh ruang sendi tibialis-femoral, dan sclerosis tulang subkondral. Berdasarkan ketiga indikator, klasifikasi KL dianggap lebih informatif daripada salah satu dari tiga elemen individual. Karena parameter yang digunakan untuk klasifikasi OA adalah kontinu, orang ahli mungkin berbeda dalam penilaian OA, hingga mencapai kesimpulan yang berbeda mengenai keberadaan dan tingkat keparahan. Ini menandakan tingkat subjektivitas yang tinggi untuk diagnosis, dan membutuhkan cukup banyak pengetahuan dan pengalaman untuk membuat diagnosis OA yang valid. Karena tingginya prevalensi OA, diperlukannya alat klinis dan ilmiah yang dipercaya bisa mendeteksi keberadaan OA dan tingkat keparahannya. Boniatis dkk. mengusulkan sebuah metode yang menggunakan computer dalam penilaian osteoarthritis pinggul berdasarkan deskriptor tekstur dan bentuk radiografi ruang sendi pinggul, yang menunjukkan akurasi 95,7% dalam deteksi dari OA pinggul dari 64 X-ray pinggul (18 normal dan 46 OA). Cherukuri dkk. menjelaskan metode berdasarkan convex hull untuk mendeteksi taji tulang anterior (osteofit) dengan akurasi ~90% menggunakan 714 gambar X-ray tulang belakang lumbal. Browne dkk. mengusulkan sebuah sistem yang memantau perubahan dalam sendi jari berdasarkan satu set radiografi yang diambil pada waktu yang berbeda, yang dapat mendeteksi perubahan dalam jumlah dan ukuran dari osteofit, dan Mengko dkk. mengembangkan metode otomatis untuk mengukur penyempitan ruang sendi di lutut OA. Meskipun tingginya prevalensi OA lutut, alat untuk mendeteksi berdasarkan komputer dengan gambar tunggal X-ray belum tersedia baik untuk tujuan klinis atau penelitian. Di sini kita menjelaskan sebuah metode untuk

deteksi otomatis OA dengan menggunakan analisis gambar X-ray lutut berbasis komputer. Sementara pada saat ini kami tidak menyarankan bahwa metode yang diusulkan dapat sepenuhnya menggantikan seorang pembaca manusia, ini dapat berfungsi sebagai alat penunjang diagnosis, dan juga dapat diterapkan terhadap klasifikasi sejumlah besar X-ray untuk percobaan penelitian klinis. Dalam Bagian II kami menjelaskan data yang digunakan untuk pelatihan dan menguji metode yang diusulkan, dalam Bagian III kami menyajikan deteksi sendi dalam X-ray, bagian IV kami menjelaskan klasifikasi otomatis dari lutut X-ray, dan dalam bagian V pembahasan hasil eksperimen.

II. DATA Data yang digunakan untuk percobaan adalah gambar X-ray lutut diambil dalam perjalanan dua tahun berturut-turut, sebagai bagian dari studi Aging Longitudinal Baltimore (BLSA), yang merupakan studi penuaan normatif longitudinal. Gambar X-ray diperoleh di semua peserta, terlepas dari gejala atau keterbatasan fungsional, sehingga memberikan representasi tanpa bias X-ray lutut dalam sampel penuaan. X-ray Lutut fleksi tetap diperoleh dengan sudut cahaya di 10 derajat, berfokus pada fossa poplitea menggunakan Siremobile Compact C-arm (Siemens Medical Solutions, Malvern, PA). Gambar asli adalah 8-bit 1000 945 grayscale gambar DICOM, dikonversi ke dalam format TIFF. Gambar lutut kiri dibalik secara horizontal untuk menghindari varians yang tidak perlu dalam data. Setiap gambar lutut diklasifikasikan menurut Kellgren-Lawrence (0-4) seperti yang dijelaskan dalam buku Atlas Radiografi Standar oleh dua pembaca yang berbeda, dengan nilai sumbang diputuskan oleh pembaca ketiga. Dalam 79,8% kasus dua pembaca menunjukkan kelas KL sama, dan gambar sisanya diputuskan oleh pembaca ketiga. Pembaca X-ray adalah ahli radiologi dengan setidaknya 25 tahun pengalaman membaca, dan membaca dari 50 hingga 100 muskuloskeletal X-ray per hari. Untuk memaksimalkan komparabilitas antara pembaca, semua pembaca menerima pelatihan menggunakan satu set "standar emas" X-ray. Setiap gambar lutut juga dinilai osteofit, penyempitan ruang sendi dan sclerosis dari

kompartemen medial dan lateral, dan penajaman spina tibialis. Jumlah gambar Xray lutut yang digunakan adalah 350, dibagi dalam empat tingkat KL seperti yang dijelaskan dalam Tabel I.

TABEL I DISTRIBUSI FOTO XRAY BERDASARKAN NILAI KL KL grade 0 1 2 3 KL description No osteophytes, normal joint space Doubtful narrowing, possible osteophytes Minimal but definite osteophytes, joint space Definite and moderate osteophytes joint space narrow, some subchondralsclerosis No. of images 154 102 39 55

Dalam klasifikasi yang diusulkan masing-masing nilai KL dianggap sebuah kelas, sehingga deteksi kelas KL lengkap otomatis adalah

pengklasifikasian empat arah. Nilai KL 4 (OA berat) dan 5 (lutut diganti) tetap berada di luar lingkup penelitian ini karena gejala nyeri berat yang menyertai nilai OA ini, membuat deteksi berbasis komputer kurang efektif pada KL kelas 4, dan tidak relevan di KL kelas 5. Gambar 1 menunjukkan empat X-ray lutut dari nilai KL 0 (normal), 1 (diragukan), 2 (minimal) dan 3 (sedang). Seperti dapat dilihat pada gambar, sebagian besar gambar X-ray adalah latar belakang atau bagian tidak relevan dari tulang, sementara hanya daerah sekitar sendi berisi informasi yang berguna untuk tujuan deteksi OA. X-ray juga mengandung beberapa meta-data dalam bentuk huruf R dan L. Huruf-huruf ini adalah efek pelat logam berbentuk huruf kecil yang ditempatkan di dekat lutut ketika X-ray akan diambil, mencegah kemungkinan kebingungan antara lutut kiri dan kanan. Sampel Gambar 1 menunjukkan bagaimana nilai KL yang berbeda mungkin terlihat cukup mirip dengan mata yang tak terlatih. Bahkan para ahli yang berpengalaman dan terlatih dapat menemukan kesulitan untuk menetapkan kelas KL dan menilai keparahan OA, dan analisis kedua (dan kadang-kadang

juga hingga tiga) analisis seringkali diperlukan untuk mendapatkan diagnosis yang handal dan akurat. Meskipun menyediakan pendekatan untuk menilai status lutut, klasifikasi KL manual tidak dapat dianggap sebagai standar emas untuk tingkat keparahan OA. Alasan untuk itu adalah bahwa klasifikasi KL didasarkan pada seperangkat elemen radiografi visual yang telah diamati berkorelasi dengan OA, namun tidak ada bukti bahwa serangkaian elemen ini lengkap. Oleh karena itu, seserorang bisa mendiagnosis OA, dengan lebih banyak unsur dan tanda-tanda yang jelas, atau tanda-tanda tersebut tidak terlihat jelas oleh mata telanjang. Ketidaklengkapan himpunan elemen KL dapat terlihat oleh korelasi parsial antara gejala nyeri dan klasifikasi KL. Bagian penting lainnya adalah kejadian OA terus berlanjut, sementara nilai KL masih belum jelas. Artinya, X-ray lutut yang diklasifikasikan sebagai KL kelas 1 dapat berada di suatu tempat antara kelas 0 dan 1, tapi karena nilai KL adalah kelas diskrit, kasus di-antara ini akan diklasifikasikan sebagai KL murni kelas 1. Transisi dari variabel kontinu ini ke variabel diskrit dapat dipengaruhi oleh banyak kasus.

III. DETEKSI SENDI Meskipun upaya untuk membuat X-ray sekonsisten mungkin, gerakan alamiah dari pasien manusia, terutama pada usia tua, membuatnya hampir mustahil untuk mengulangi prosedur dengan cara yang sama persis karena perbedaan dalam fleksibilitas dari pasien dan kemampuan mereka untuk menempatkan lutut mereka pada posisi yang tepat, serta kemampuan mereka untuk mempertahankan posisi tersebut hingga X-ray diambil. Akibatnya, posisi sendi dalam gambar X-ray dapat bervariasi secara signifikan. Karena dalam setiap gambar X-ray sendi dapat muncul pada koordinat gambar yang berbeda, algoritma deteksi sendi diperlukan untuk menemukan sendi dan memisahkannya dari keseluruhan gambar. Hal ini dilakukan dengan menggunakan seperangkat tetap 20 gambar dipilih sebelumnya, sehingga setiap gambar adalah 150 150 window dari pusat sendi. Sebagai contoh, Gambar 2

adalah pusat sendi dari X-ray dari panel pada Gambar 1. Gambar-gambar ini kemudian di downscaled dengan faktor gambar 10 ke 15 15.

Gambar. 2. Sebuah window dari pusat sendi digunakan untuk menemukan pusat sendi dalam Xray

Mencari sendi lutut yang diberikan dalam gambar X-ray dilakukan dengan terlebih dahulu downscaling gambar dengan faktor 10, dan kemudian pemindaian gambar dengan 15 15 shifted window. Untuk setiap posisi, jarak Euclidean antara 15 15 piksel dari window bergeser dan masing-masing 20 15 15 gambar sendi yang telah ditetapkan dihitung dengan menggunakan Persamaan 1,

Dimana W x,y adalah intensitas pixel x, y di window bergeser W, Ix, y adalah intensitas pixel x, y pada gambar sendi I, dan di, w adalah jarak Euclidean antara gambar sendi I dan 15 15 shifted window W. Sejak pelaksanaan diusulkan menggunakan 20 gambar sendi, 20 jarak yang berbeda dihitung untuk setiap posisi yang mungkin dari shifted window, tetapi hanya dari 20 jarak terpendek dicatat.

Setelah memindai seluruh (lebar/10-15) (tinggi/10-15) posisi yang mungkin, window yang mencatat jarak Euclidean terkecil ditentukan sebagai pusat sendi, dan 250 200 piksel sekitar pusat ini membentuk sebuah gambar yang digunakan untuk analisis otomatis. Gambar 3 menunjukkan contoh dari 250 200 area sendi. Karena setiap gambar berisi tepat satu sendi, dan karena varians rotasi lutut cukup minim, metode sederhana dan cepat mampu berhasil menemukan pusat bersama di semua gambar dalam dataset.

Gambar. 3. Daerah sendi dari Xray lutut

Dengan menggunakan gambar yang lebih kecil untuk klasifikasi otomatis membuat mereka bersih dari fitur berbagai latar belakang, dan membuat gambar invarian ke posisi sendi dalam X-ray asli. Tidak ada usaha yang dibuat untuk memperbaiki varians rotasi gambar, karena varians kecil ini diperkirakan tidak akan mempengaruhi analisis gambar dijelaskan dalam Bagian IV.

IV. KLASIFIKASI GAMBAR Instrumen radiografi modern banyak yang lebih sensitif daripada mata manusia untuk mengamati gambar yang dihasilkan. Oleh karena itu, dapat secara wajar diasumsikan bahwa OA dapat dideteksi oleh elemen-elemen lain, selain yang diusulkan oleh Kellgren-Lawrence, tetapi tidak digunakan untuk klasifikasi karena ketidakmampuan dari mata manusia untuk merasakan mereka. Sejak
10

komputer secara substansial lebih sensitif terhadap variasi intensitas kecil, penggunaan yang efektif dari kekuatan deteksi berbasis komputer akan didasarkan pada klasifikasi data-driven, bukan upaya untuk mengikuti masing-masing elemen dari klasifikasi manual yang digunakan oleh Kellgren & Lawrence. Metode ini bekerja dengan terlebih dahulu mengekstraksi satu set besar fitur gambar, kemudian dipilih fitur yang paling informative. Sejak transformasi gambar sering dapat memberikan informasi tambahan yang sulit untuk disimpulkan ketika menganalisis piksel baku, fitur gambar dihitung tidak hanya pada piksel baku, tetapi juga pada transformasi beberapa gambar, dan juga pada transformasi dari transformasi. Deskriptor konten gambar ini diambil dari transformasi dan transformasi senyawa telah ditemukan sangat efektif dalam pengukuran klasifikasi dan kesamaan dataset gambar biologis dan biometrik. Untuk ekstraksi fitur gambar kita menggunakan algoritma berikut, dijelaskan lebih lengkap di: 1.Fitur Zernike adalah nilai-nilai absolut dari koefisien aproksimasi polinomial Zernike dari gambar seperti yang dijelaskan, memberikan 72 konten gambar deskriptor. 2.Multi-skala Histogram dihitung menggunakan nomor dari berbagai tempat (3, 5, 7, dan 9), seperti yang diusulkan, memberikan 3 +5 +7 +9 = 24 deskriptor konten gambar. 3.Empat momen mean Pertama, standar deviasi, skewness, dan kurtosis dihitung pada "garis" gambar di empat arah yang berbeda (0, 45, 90, 135 derajat). Setiap set garis-garis ini kemudian sampel ke dalam histogram 3-bin, menyediakan 4 4 3 = 48 deskriptor gambar. 4.Fitur Tekstur Tamura kontras, direksiobalitas dan kekasaran, sehingga deskriptor kekasaran adalah jumlahnya dan 3-bin histogram,

memberikan 1 +1 +1 +3 = 6 fitur gambar. 5.Fitur Haralick dihitung pada matriks kejadian gambar seperti yang dijelaskan, dan menyumbangkan nilai-nilai gambar 28 deskriptor. 6.Chebyshev Statistik - Sebuah histogram 32-bin dari 1 400 vektor yang dihasilkan oleh Chebyshev transform gambar dengan urutan N = 20.

11

Pengubah gambar yang digunakan oleh metode yang diusulkan adalah Transformasi Wavelet yang umum digunakan (Symlet 5, tingkat 1), Transformasi Fourier dan Transformasi Chebyshev. Selain itu, tiga transformasi gabungan juga digunakan, yang diikuti olehtransformasi Chebyshev, transformasiFourier, transformasi wavelet diikuti dengan transformasi Fourier, dan transformasi Fourier diikuti olehtransformasi Chebyshev. Karena intuisi manusia dan analisis fitur gambar diambil dari transformasi dan transformasi gabungan terbatas, transformasi gabungan tersebut dipilih secara empiris dengan menguji semua permutasi 2-tingkat dari tiga transformasi dasar (Wavelet, Fourier dan Chebyshev), dan menilai kontribusi konten yang dihasilkan deskriptor untuk akurasi klasifikasi. Mengekstrak seperangkat deskriptor 210 konten gambar dari 7 transformasi gambar yang berbeda (termasuk piksel mentah) menghasilkan vektor fitur dari dimensi dari 1470. Namun, tidak semua fitur gambar sama-sama informatif, dan beberapa fitur tersebut diharapkan untuk mewakili kebisingan. Untuk memilih fitur gambar paling informatif dan menolak fitur bising, setiap deskriptor konten gambar ditugaskan dengan skor Fisher, dijelaskan oleh Persamaan 2, ( )

dimana Wf adalah Skor Fisher dari fitur f, N adalah jumlah total kelas, adalah rata-rata nilai dari fitur f antara gambar dialokasikan untuk pelatihan, dan dan adalah mean dan varians dari nilai-nilai dari fiturf antara semua gambar pelatihan kelas c. Skor Fisher dapat dikonseptualisasikan sebagai rasio varians dari mean kelas dikumpulkan untuk rata-rata varians dalam kelas. Semua varians digunakan dalam persamaan dihitung setelah nilai dari f fitur dinormalisasi terhadap interval. Nilai Skor Fisher memperingkatkan fitur gambar dengan keinformatifan mereka, dan ditugaskan ke semua fitur 1470 dihitung dengan mengekstraksi deskripsi gambar konten 210 dari 7 transformasi gambar yang berbeda (termasuk gambar asli). Setelah masing-masing dari 1470 fitur gambar ditugaskan dengan skor Fisher, 90% terlemah dari fitur (dengan skor Fisher terendah) ditolak, mengakibatkan ruang fitur dari 147 gambar deskriptor konten. Sebagaimana

12

dijelaskan dalam Bagian V, pengaturan ini memberikan kinerja terbaik dalam hal akurasi klasifikasi. Distribusi dari berbagai jenis fitur gambar dan transformasi citra dijelaskan dalam Tabel II. TABEL II DISTRIBUSI TIPE DARI FITUR DENGAN ALGORITME DAN TRANSFORMASI GAMBAR Transform Zernike Haralick Tamura polynomials textures textures 10 22 26 0 0 9 0 67 8 1 0 2 10 0 10 31 1 4 2 2 0 1 00 10 First MultiChebyshev Total four scale statistic moments histogram 0 0 6 25 3 1 2 5 0 4 15 0 2 0 7 0 1 10 0 4 0 0 4 0 14 30 35 6 22 14 15 147

Raw pixels Wavelet Chebyshev Fourier Fourier + Chebyshev Fourier + Wavelet Chebyshev + Fourier Total

Seperti tabel tunjukkan, deskriptor konten gambar paling informatif adalah polinomial Zernike, dan keduanya Haralick dan fitur tekstur Tamura. Sifat radial Zernike polinomial memungkinkan fitur ini untuk mencerminkan perbedaan dalam unit disk, sehingga fitur ini diharapkan peka terhadap ruang sendi di gambar Xray. Seperti yang diamati dan secara teliti dibahas oleh Boniatis dkk., pola variasi intensitas piksel secara matematis digambarkan oleh fitur tekstur berkorelasi dengan perubahan biokimia, biomekanik dan struktural kartilago artikular dan jaringan tulang subchondral. Proses ini telah dikaitkan dengan degenerasi kartilago pada OA, dan karena itu diharapkan mempengaruhi jaringan sendi dalam mode yang dapat dirasakan oleh tekstur radiografi. Karena tidak semua elemen radiografi OA telah diisolasi dan ditandai dengan baik, tidak semua fitur gambar diskriminatif diharapkan sesuai dengan elemen OA dikenal. Oleh karena itu, sebagian kecil dari nilai-nilai diskriminatif seperti distribusi statistik dari nilai-nilai pixel dari transformasi Fourier transform

13

diikuti dengan Chebyshev sulit untuk mengasosiasikan dengan elemen radiografi OA yang dikenal. Algoritma tambahan untuk fitur gambar ekstraksi telah diuji, tetapi ditemukan kurang informatif untuk klasifikasi nilai KL. Deskriptor konten gambar Ini termasuk fitur transformasi Radon, yang diharapkan berkorelasi dengan ruang sendi, tetapi diungguli oleh polinomial Zernike. Filter Gabor menangkap informasi tekstural yang juga dapat berguna untuk analisis, tetapi ditemukan kurang informatif daripada tekstur Haralick dan Tamura. Karena bidang yang diminati memiliki variasi intensitas relatif rendah, fitur kontras tinggi seperti tepi dan statistik objek seperti yang dijelaskan tidak memberikan informasi yang bermanfaat. Setelah menghitung nilai-nilai fitur semua gambar tes yang diberikan, vektor fitur yang dihasilkan diklasifikasikan menggunakan aturan Weighted Nearest Neighbor, yang merupakan salah satu rutinitas yang paling efektif untuk klasifikasi non-parametrik. Bobot, dalam hal ini, adalah skor Fisher dihitung dengan Persamaan 2. Hasil klasifikasi ini bisa menjadi kelas nilai KL ditentukan oleh sampel pelatihan dengan jarak terpendek untuk sampel uji yang diberikan, tetapi juga dapat menjadi nilai interpolasi berdasarkan dua sampel pelatihan terdekat yang tidak dimiliki oleh kelas yang sama, seperti dijelaskan oleh Persamaan 3, ( ) ( )

Di mana KL adalah nilai interpolasi KL yang dihasilkan, dan d1, d2 adalah jarak dari dua sampel terdekat yang merupakann milik nilai KL berbeda K1 dan K2, masing-masing. Keuntungan utama dari interpolasi ini adalah bahwa hal itu berpotensi dapat memberikan estimasi resolusi yang lebih tinggi dengan menentukan tingkat keparahan OA dalam kelas (misalnya, KL kelas 1,6 untuk kasus keparahan OA antara KL kelas 0 dan 1). Ini, bagaimanapun, adalah lebih sulit untuk mengevaluasi akurasi karena data yang digunakan sebagai kebenaran dasar hanya menentukan tingkat keparahan OA dalam resolusi nilai KL.

14

V. HASIL EKSPERIMENTAL Metode yang diusulkan diuji dengan menggunakan dataset yang dijelaskan dalam Bagian II, di mana kebenaran dasar adalah klasifikasi manual dari Xray. Dalam percobaan pertama, metode yang diusulkan diuji dengan secara otomatis mengelompokkan OA sedang (KL kelas 3) dan lutut normal (KL kelas 0). Percobaan dilakukan dengan menggunakan 55 gambar Xray dari setiap tingkatan, seperti bahwa 20 gambar dari setiap kelas digunakan untuk pelatihan dan 35 untuk pengujian. Tes ini diulang 20 kali, di mana masing-masing berjalan menggunakan split acak yang berbeda dari gambar pelatihan dan tes. Sejak dataset memiliki lebih gambar kelas 0 dari kelas 3, masing-masing berjalan menggunakan set gambar yang berbeda dari 55 kelas 0, yang dipilih secara acak dari dataset. Ketepatan klasifikasi adalah 91,5% (P <0,000001), seperti dapat dipelajari dari matriks kebingungan Tabel III. TABEL III

MATRIX CONFUSION OA SEDANG DAN NORMAL

Sebagaimana ditunjukkan matriks confusion, spesifisitas deteksi OA moderat adalah ~86.5%, dan sensitivitas adalah 95%. Hal ini dapat menjadi penting untuk penggunaan praktis potensial dari classifier yang dijelaskan, karena mungkin terlalu protektif dalam beberapa kasus, tetapi kurang mungkin untuk memberhentikan Xray positif seperti biasa. Perlu dicatat bahwa sementara pembaca manusia memiliki tingkat konsensus ~80%, ketidaksepakatan biasanya antara nilai KL tetangga, dan tidak ada kasus yang memiliki satu pembaca mengklasifikasikan lutut normal sementara yang lain mengklasifikasikan sebagai moderat. Oleh karena itu, pembaca yang berpengalaman dan berpengetahuan

15

harus dapat memberitahu OA lutut moderat dari normal dengan akurasi praktis 100%. Sebuah percobaan yang sama menguji akurasi klasifikasi kelas KL 2 (OA minimal). Sejak masalah klasifikasi ini lebih sulit, lima gambar pelatihan lebih banyak yang digunakan untuk masing-masing kelas sehingga training set terdiri dari 25 gambar dari kelas 0 dan 25 gambar dari kelas 2. Penggunaan set pelatihan yang lebih besar meningkatkan akurasi klasifikasi, sementara meningkatkan pelatihan diatur dalam deteksi kelas 3 tidak berkontribusi terhadap kinerja, sebagaimana akan dibahas nanti dalam bagian ini. Ketepatan klasifikasi adalah ~80.4% (P <0,0001), dan matriks confusion diberikan dalam Tabel IV. TABEL IV MATRIX CONFUSION OA MINIMAL DAN NORMAL

Seperti yang bisa dipelajari dari tabel, spesifisitas deteksi adalah ~79.3%, dengan sensitivitas ~81.4%. Angka-angka ini menunjukkan bahwa deteksi KL kelas 2 kurang efektif dibandingkan dengan deteksi otomatis KL kelas 3. Hal ini dapat dijelaskan oleh fakta bahwa kemajuan OA adalah terus menerus, sehingga KL kelas 2 diharapkan secara visual lebih mirip dengan nilai KL 0 daripada 3. Kami juga mencoba untuk mengklasifikasikan KL kelas 1 (OA ragu-ragu) dari 0, yang memberikan akurasi klasifikasi sebesar 54% bila menggunakan 25 gambar per kelas untuk pelatihan dan 14 gambar untuk pengujian. Meningkatkan ukuran set pelatihan untuk 70 sampel per kelas (dan 32 sampel untuk pengujian) sedikit membantu peningkatan kinerja sampai 57%. Hal ini dapat dijelaskan oleh fakta bahwa kedua nilai secara visual sangat mirip, dan bahkan pembaca manusia berpengalaman sering harus berjuang untuk membedakan antara keduanya. Juga, karena nilai KL adalah diskrit sementara kemajuan OA sebenarnya terus menerus, sangat banyak kasus antara dapat secara signifikan berkontribusi pada kebingungan.
16

Tabel V menunjukkan akurasi klasifikasi ketika mengklasifikasikan sepasang nilai KL. Dalam semua kasus, 25 gambar digunakan untuk pelatihan, 14 gambar untuk pengujian, dan keakuratan klasifikasi dihitung dengan rata-rata akurasi 20 split acak untuk set gambar pelatihan dan tes. Perbedaan maksimum dari rata-rata (di antara 20 giliran) juga ditentukan dalam tabel.

TABEL V AKURASI KLASIFIKASI 2-JALURDARI SELURUH PASANGAN NILAI KL

Seperti yang ditunjukkan tabel, klasifikasi antara dua nilai KL terdekat kurang akurat dibandingkan klasifikasi nilai yang tidak dekat. Kita juga dapat melihat bahwa dua nilai KL terdekat 2 dan 3 dapat dibedakan dengan akurasi 65%, sedangkan klasifikasi kelas 1, 2 dan nilai 0, 1 memberikan akurasi sebesar 60% dan 54% masing-masing. Ini mungkin menunjukkan bahwa nilai KL tetangga secara visual lebih mirip satu sama lain pada tahap awal OA. Hal ini juga terlihat bahwa akurasi klasifikasi meningkat sebagaimana perbedaan antara nilai KL akan lebih besar. Misalnya, akurasi klasifikasi nilai KL 3 dan 0 adalah lebih baik dari akurasi klasifikasi nilai KL 3 dan 1. Hasil ini sesuai dengan sifat kontinyu dari OA. Menguji akurasi klasifikasi ketika mengklasifikasikan semua 4 nilai KL dilakukan dengan secara acak memilih 25 gambar dari setiap kelas untuk pelatihan, dan kemudian memilih 14 gambar yang tersisa dari setiap kelas untuk pengujian. Percobaan ini diulang 20 kali, sehingga dalam menjalankan setiap set pelatihan dan uji ditentukan secara acak. Ketepatan klasifikasi keseluruhan dari classifier ini adalah 47%, seperti yang dijelaskan oleh matriks confusion dari Tabel VI.

17

Akurasi Klasifikasi 47% tidak dapat dianggap kuat, dan itu secara signifikan lebih rendah dari 79,8% dari kesepakatan antara dua ahli manusia. Namun, matriks confusion menunjukkan bahwa dari semua kasus KL kelas 3, hanya ~4% digolongkan sebagai non-OA (KL kelas 0), dan ~13% sebagai diragukan (KL kelas 1). Meneliti positif palsu, matriks confusion menunjukkan bahwa ~7% dari Xray secara manual diklasifikasikan sebagai kelas 0 KL yang salah diklasifikasikan oleh metode yang diusulkan sebagai KL kelas 3 (sedang), dan juga ~11% dari KL kelas 1 keliru diklasifikasikan sebagai KL kelas 3.
TABEL VI MATRIX CONFUSION PENGKLASIFIKASI 4-JALUR DARI SELURUH NILAI KL

Karena kemajuan OA sebenarnya adalah variabel kontinu, ada banyak di antara kasus yang dapat digolongkan ke salah satu dari dua kelas terdekat dari kasus yang diberikan. Misalnya, kemajuan OA antara KL kelas 1 dan kelas 2 dapat diklasifikasikan baik 1 dan 2. Seperti dijelaskan pada akhir Bagian IV, nilai yang dihasilkan dari klasifikasi gambar juga dapat menjadi interpolasi dari dua nilai KL terdekat, daripada kelas kelas KL tunggal. Efektivitas interpolasi ini dapat ditunjukkan dengan menghitung koefisien korelasi Pearson antara nilai KL diprediksi dan aktual (bila menggunakan semua 4 grade KL seperti yang dijelaskan pada Tabel VI). Bila menggunakan nilai interpolasi sebagai kelas yang diprediksi, Pearson korelasi adalah 0,73, dibandingkan dengan 0,49 ketika kelas KL yang diprediksi hanya kelas yang terdekat dengan sampel pelatihan. Lutut diklasifikasikan sebagai positif OA jika sudah diklasifikasikan sebagai KL grade 2 atau lebih tinggi. Dengan menggabungkan gambar dari nilai KL 2 dan 3, kami memperkenalkan sebuah kelas baru yang disebut OA positif yang berisi 78 gambar (39 dari masing-masing kelas). Percobaan dilakukan dengan membangun classifier 2-arah menggunakan kelas yang baru didefinisikan dan KL kelas 0, seperti bahwa 60 gambar dari setiap kelas digunakan untuk pelatihan dan
18

18 untuk pengujian. Tujuan penelitian ini adalah untuk mengklasifikasikan Xray positif OA dari negatif OA. Ketepatan klasifikasi classifier ini adalah ~86.1%, dengan sensitivitas dan spesifisitas ~88.7% dan ~83.5%, masing-masing. Hal ini juga penting untuk menyebutkan bahwa Xray diambil dari subyek manusia yang dipilih secara acak yang berpartisipasi dalam studi BLSA, dan tidak harus dari pasien yang melaporkan gejala rasa sakit atau didiagnosis sebagai positif OA di salah satu sendi lain mereka. Kebijakan ini memberikan representasi yang seragam dari populasi lanjut usia, dan karena itu dapat diasumsikan bahwa hasil yang disajikan di sini dapat digeneralisasi pada populasi lansia secara keseluruhan. Ketepatan klasifikasi dapat dipengaruhi oleh ukuran training set sedemikian rupa sehingga diharapkan meningkat sejalan dengan jumlah sampel pelatihan yang semakin tinggi. Gambar 4 menunjukkan akurasi klasifikasi dari klasifikasi nilai KL 2 dan 3 dari kelas KL 0 sebagai fungsi dari ukuran training set. Seperti dapat dipelajari dari grafik, untuk KL kelas 3akurasi klasifikasi meningkat sebagaimana ukuran dari set pelatihan semakin besar, tetapi stabil pada _14 gambar pelatihan per kelas. keakuratan Klasifikasi KL kelas 2 juga meningkat dengan jumlah gambar pelatihan, tetapi dataset kami tidak cukup besar untuk menentukan apakah mencapai puncak akurasi.

Gambar. 4. akurasi Klasifikasi (%) dari nilai KL 2 dan 3 sebagai fungsi dari ukuran training set

19

Seperti dijelaskan dalam Bagian IV, 10% dari fitur gambar dengan skor Fisher tertinggi digunakan untuk klasifikasi, sedangkan sisanya dari deskriptor konten gambar diabaikan. Gambar 5 menunjukkan bagaimana jumlah fitur yang digunakan untuk klasifikasi mempengaruhi akurasi klasifikasi KL kelas 3. Menurut grafik, kinerja terbaik dicapai bila menggunakan antara 7,5% sampai 12,5% dari jumlah total fitur gambar (1470).

Gambar. 5. Klasifikasi akurasi (%) dari nilai KL 2 dan 3 sebagai fungsi dari jumlah fitur gambar yang digunakan Dalam hal kompleksitas komputasi, mengklasifikasi satu gambar Xray membutuhkan 105 detik, dengan menggunakan sistem dengan 2GHz Intel prosesor dan 1MB RAM. Sementara waktu yang diperlukan untuk deteksi bersama yang dijelaskan dalam Bagian III diabaikan, hampir semua waktu CPU dikorbankan untuk mengubah gambar dan mengekstraksi fitur gambar. Faktor utama kompleksitas ini adalah fitur Zernike 2-dimensi, yang dikenal mahal. Kelemahan dari classifier ini membuatnya tidak cocok untuk aplikasi realtime atau tugas lain di mana kecepatan adalah perhatian utama, tetapi mungkin cukup cepat untuk klasifikasi tunggal gambar Xray, terutama mengingat kenyataan bahwa seluruh prosedur menggunakanXray dapat membutuhkan waktu lebih lama lagi.

20

Peningkatan waktu respon dari classifier dapat dicapai dengan paralelisasi dari algoritma ekstraksi fitur. Karena sebagian besar fitur gambar tidak tergantung pada satu sama lain, algoritma menjadi sepele untuk memparalelkan sehingga banyak fitur gambar dapat dihitung secara bersamaan oleh prosesor yang berbeda. Sebagai contoh, sementara satu prosesor dapat menghitung fitur Haralick pada Transformasi Chebyshev, prosesor lain dapat mengekstrak fitur Haralick dari Transformasi Fourier, atau fitur Zernike dari transformasi Chebyshev. Untuk mengambil keuntungan penuh dari paralelisasi, algoritma juga telah

diimplementasikan dengan menggunakan Open Microscopy Environment (OME) software suite (Ome), yang merupakan platform untuk penyimpanan dan pengolahan gambar mikroskop, dan dirancang untuk mengoptimalkan

pelaksanaan dan aliran data dari modul eksekusi ganda. Penjelasan rinci dari paralelisasi transformasi gambar dan gambar fitur ekstraksi di Ome dapat ditemukan.

VI. KESIMPULAN Dalam tulisan ini kita menjelaskan pendekatan otomatis untuk mendeteksi OA lutut dengan menggunakan X-ray. Dengan tidak adanya metode diagnosis OA yang akurat, kelas KL yang secara manual diklasifikasikan digunakan di sini sebagai "gold standar", walaupun diketahui bahwa metode ini kurang sempurna. Klasifikasi ini tidak dilakukan dengan cara yang mencoba untuk meniru klasifikasi manusia, tetapi didasarkan pada pendekatan diarahkan data menggunakan X-ray yang secara manual diklasifikasikan dari nilai KL yang berbeda, yang mewakili berbagai tahap keparahan OA. Hasil penelitian menunjukkan bahwa lebih dari 95% kasus OA moderat dibedakan secara akurat dari kasus normal, dengan tingkat positif palsu ~12.5%. Klasifikasi akurasi membedakan OA minimal dari kasus normal ~80%, dan deteksi kasus OA meragukan adalah jauh kurang meyakinkan. Upaya di kemudian hari meningkatkan akurasi deteksi OA diragukan akan mencakup integrasi informasi klinis yang relevan seperti riwayat cedera lutut, berat badan, dan sudut alignment lutut, dan juga akan menggunakan lebih banyak sampel X-ray yang telah tersedia. Namun, karena sifat subjektif dari "gold standar", adalah mungkin

21

bahwa korelasi 100% antara klasifikasi berbasis komputer dan manual tidak dapat dicapai. KL nilai 4 (OA berat) dan 5 (lutut diganti) tetap berada di luar lingkup penelitian ini karena gejala berat yang menyertai tahap ini, dan deteksi relatif mudah OA di tahap ini. Sedangkan akurasi klasifikasi nilai KL 1 dan 2 tidak dapat dianggap kuat, penting untuk dicatat bahwa pembaca radiograf sering ditantang dalam upaya untuk membedakan nilai nilai ini, dan oleh karena itu kebingungan dari deteksi otomatis antara kedua nilai tidak dapat dianggap mengejutkan. Kami mengakui bahwa peralatan yang digunakan untuk mendapatkan gambar lutut tidak memungkinkan untuk resolusi maksimal struktur sendi. Kami berspekulasi gambar radiografi konvensional diperkirakan akan memungkinkan untuk deliniasi yang lebih baik dari nilai OA, terutama pada kasus dengan penyakit kurang parah. Tentu radiografi konvensional mampu menggambarkan struktur sendi lebih mudah, tetapi mencapai hal ini dengan paparan radiasi lebih besar. Penerapan perangkat lunak pencitraan untuk interpretasi gambar X-ray terjadi tanpa bias yang melekat dalam interpretasi klinis. Akhirnya, studi ini dilakukan dalam konteks studi penuaan longitudinal yang akan memungkinkan perbandingan data pencitraan untuk fitur OA klinis sebagai rasa sakit, tetapi juga untuk langkah-langkah fisiologis relevan dengan penuaan sistem tubuh yang mungkin berkontribusi terhadap keparahan OA. Rencana masa depan termasuk pengujian teknik otomatis ini dalam evaluasi gambar lutut longitudinal diperoleh dari waktu ke waktu, untuk memeriksa apakah OA dapat dideteksi sebelum bukti radiografis terlihat oleh seorang pembaca. Kami juga berencana untuk mengembangkan teknik yang mirip untuk mengklasifikasikan X-ray tangan dengan memperhatikan sendi sinyal yang cenderung untuk pengembangan OA. Kode sumber lengkap yang digunakan untuk percobaan tersedia untuk download gratis di bawah lisensi GNU standar publik melalui CVS di www.openmicroscopy.org. Para ilmuwan dan insinyur didorong untuk mendownload, mengkompilasi dan menggunakan kode ini untuk kebutuhan mereka.

22

Anda mungkin juga menyukai