com
PENELITIAN ASLI
Anthony D. Yao, BS • Derrick L. Cheng, BA, BS • Ian Pan, MA • Felipe Kitamura, MD, MSc
Dari Warren Alpert Medical School of Brown University, Box G-9280, 222 Richmond St, Providence, RI (ADY, DLC, IP); dan Departemen Pencitraan Diagnostik,
Universidade Federal de São Paulo, São Paulo, Brasil (FK). Diterima 27 Februari 2019; revisi diminta 26 Maret; revisi diterima 6 November; diterima 22 November.
Alamat korespondensi keADI (email:anthony_yao@brown.edu).
Tujuan:Untuk meninjau dan mensintesis literatur saat ini secara sistematis dan untuk mengembangkan ringkasan karakteristik teknis dari aplikasi
pembelajaran mendalam yang ada di neuroradiologi.
Bahan dan metode:Item Pelaporan Pilihan untuk Tinjauan Sistematis dan Tinjauan Meta-Analisis dilakukan hingga 1 September 2019,
menggunakan database PubMed, Cochrane, dan Web of Science. Sebanyak 155 artikel yang membahas aplikasi pembelajaran mendalam
dalam neuroimaging diidentifikasi, dibagi dengan modalitas pencitraan, dan dicirikan oleh tugas pencitraan, sumber data, jenis algoritme,
dan metrik hasil.
Hasil:Sebanyak 155 studi diidentifikasi dan dibagi menjadi: MRI (n=115), MRI fungsional (n=19), CT (n=9), PET (n=18), dan AS (n=1). Tujuh adalah
multimodal. Aplikasi MRI dijelaskan dalam 74%, dan 76 (49%) ditugaskan dengan segmentasi gambar. Dari 155 artikel yang diidentifikasi dalam
penelitian ini, 65 (42%) diuji pada data institusional; hanya 16 yang divalidasi terhadap data yang tersedia untuk umum. Selain itu, 53 studi (34%)
menggunakan kumpulan data gabungan kurang dari 100, dan 124 (80%) menggunakan kumpulan data gabungan kurang dari 1000.
Kesimpulan:Meskipun pembelajaran mendalam telah menunjukkan potensi untuk masing-masing modalitas ini, tinjauan ini menyoroti beberapa kebutuhan di bidang
penelitian pembelajaran mendalam termasuk penggunaan kumpulan data internal tanpa validasi eksternal, tidak tersedianya metode implementasi, metrik penilaian
yang tidak konsisten, dan kurangnya validasi klinis. Namun, pertumbuhan yang cepat dari pembelajaran mendalam dalam neuroradiologi menjanjikan dan, karena
langkah-langkah dibuat untuk meningkatkan standardisasi, generalisasi, dan reproduktifitas, itu mungkin segera memainkan peran dalam diagnosis klinis dan
pengobatan gangguan neurologis.
©RSNA, 2020
kecerdasan buatan (AI) menggambarkan penggunaan DNN dimodelkan setelah koneksi sinaptik di otak manusia.
SEBUAH
komputer atau mesin untuk meniru kognisi manusia (1,2). DNN dapat digambarkan sebagai serangkaian lapisan neuron
Pembelajaran mesin (ML) adalah subbidang AI di mana model dengan koneksi berbobot; bobot ini mencerminkan kekuatan
dirancang untuk menghasilkan keluaran yang diinginkan dari koneksi dan dapat disesuaikan dengan membandingkan keluaran
kumpulan data yang ada tanpa instruksi eksplisit. ML dapat model dengan kebenaran dasar data yang diberi label. DL telah
dibagi lagi menjadi pembelajaran yang diawasi dan tidak melihat yang paling sukses dalam pengenalan gambar dengan
diawasi. Dalam pembelajaran yang diawasi, model pengembangan arsitektur jaringan saraf convolutional (CNN). CNN
memprediksi label atau hasil tertentu, misalnya, memprediksi adalah DNN yang dirancang khusus untuk mengakomodasi
apakah gambar menggambarkan kucing atau anjing atau struktur intrinsik gambar, meskipun penggunaannya juga
menentukan apakah radiografi dada normal atau tidak melampaui pengenalan gambar. Untuk keterangan lebih lanjut,
normal. Ini membutuhkan data input untuk secara eksplisit lihat artikel ulasan yang diterbitkan oleh Chartrand et al (2).
diberi label dengan output yang diinginkan. Dalam DL telah menunjukkan potensi substansial dalam
pembelajaran tanpa pengawasan, model menghasilkan neuroimaging karena volume tinggi data multimodal dan peran
representasi data berdasarkan distribusi yang mendasarinya, penting dalam diagnosis penyakit neurologis. DL dapat
yang tidak memerlukan pelabelan eksplisit. Gambaran diimplementasikan di beberapa titik dalam perawatan pasien dan
karakteristik pembelajaran terawasi dan tidak terawasi dapat telah menunjukkan kemanjuran dalam membuat triase gambar
dilihat pada Gambar 1. Pembelajaran mendalam (DL) dapat prioritas tinggi, merekomendasikan studi tindak lanjut yang tepat,
dianggap sebagai subbidang ML yang menggunakan jaringan dan mendeteksi lesi untuk manajemen jangka panjang (3-5). Selain
saraf dalam (DNN) sebagai model untuk berbagai tugas yang itu, aplikasi DL dalam neuroradiologi bertujuan untuk mengurangi
mencakup pembelajaran terawasi dan tidak terawasi. waktu diagnosis dan kesalahan dokter sambil memberikan
Representasi dari arsitektur ML yang berbeda ditunjukkan kemampuan kepada dokter dan peneliti untuk bekerja dengan
pada Gambar 2. kumpulan data yang sangat besar atau tidak praktis.
Salinan ini hanya untuk penggunaan pribadi. Untuk memesan salinan cetak, hubungi reprints@rsna.org
Pembelajaran Mendalam di Neuroradiologi
metrik penilaian sangat berbeda antara setiap proyek. Sumber ity dan Reproduksibilitas, dan database kelembagaan. Artikel
data penting termasuk Inisiatif Neuroimaging Penyakit dinilai menggunakan metrik yang berbeda. Metrik yang paling
Alzheimer (ADNI), Tantangan Segmentasi Tumor Otak, umum adalah akurasi (n=18), diikuti oleh sensitivitas (n=
Tantangan Segmentasi Lesi Stroke Iskemik, dan berbagai 8) dan spesifisitas (n=8). Temuan dapat dilihat pada Tabel E2
kumpulan data institusi swasta. Dari studi ini, 77 menggunakan (suplemen).
kumpulan data di mana:nlebih besar dari 100; hanya 18 set data
yang digunakan di mananlebih besar dari 1000. Sebagian besar Artikel CT
studi ini menggunakan CNN (n=94). Artikel dievaluasi Sembilan artikel diidentifikasi menggambarkan penggunaan DL
menggunakan berbagai metrik, termasuk area di bawah kurva dalam pencitraan CT. Dari jumlah tersebut, semuanya adalah
(AUC), Koefisien kesamaan dadu (DSC), akurasi, sensitivitas, CNN dua dimensi atau tiga dimensi. Tugas termasuk
spesifisitas, atau metrik lainnya. Daftar lengkap tujuan aplikasi, pembuatan gambar (n=2), deteksi (n=2), klasifikasi (n=3),
sumber data, tipe model, dan metrik penilaian dapat dilihat prediksi (n=1), dan segmentasi (n=1) dengan tujuan mulai dari
pada Tabel E1 (tambahan). rekonstruksi data CT hingga identifikasi perubahan otak setelah
perdarahan, penyakit Alzheimer, dan peristiwa traumatis.
Artikel MRI Fungsional Sumber data termasuk Icahn School of Medicine AI Consortium,
Sembilan belas artikel menjelaskan aplikasi DL dalam MRI CT Low-Dose Grand Challenge, dan berbagai database institusi
fungsional. Proyek-proyek ini terutama terdiri dari CNN (n = 10) swasta. Metrik bervariasi antara studi dan termasuk AUC,
dan dirancang untuk mengevaluasi aktivitas otak selama sensitivitas, spesifisitas, nilai prediksi positif, nilai prediksi
istirahat, tugas sensorimotor, dan gangguan kognitif ringan. negatif, waktu, dan kesalahan absolut rata-rata. Temuan
Sumber data antara lain ADNI, Consortium for Reliabil- disajikan pada Tabel E3 (suplemen).
Gambar 3:Pedoman PRISMA untuk Diagram Alir Tinjauan Sistematis. A = Rekaman yang disaring berdasarkan tinjauan singkat terhadap judul
atau abstrak publikasi; makalah yang dikecualikan termasuk yang tidak berbahasa Inggris, diterbitkan sebelum tahun 2000, dan tidak
menjelaskan penelitian pembelajaran mendalam. B = Hanya artikel peer-review yang mengevaluasi modalitas pembelajaran mendalam dalam
neuroradiologi yang disertakan. Publikasi yang dikecualikan meninjau bidang teknologi, memberikan penilaian kualitatif pembelajaran
mendalam, memberikan analisis kuantitatif berkualitas rendah per Kriteria Kelompok Kerja GRADE, atau tidak menerapkan pembelajaran
mendalam untuk menyelesaikan tugas pencitraan. Silakan merujuk ke Metode untuk penjelasan lebih rinci. C = Pencarian literatur sekunder
dilakukan hingga 1 September 2019, menggunakan kriteria dan metodologi pencarian yang identik dengan temuan yang diperbarui.
Artikel PET data tutorial (n=19838) dan dianalisis menggunakan DSC, precision,
Delapan belas artikel membahas penggunaan DL dalam pencitraan dan recall. Proyek ini dijelaskan pada Tabel E5 (suplemen).
PET. Banyak dilakukan analisis multimodal PET dan MRI. Model
bervariasi dan termasuk CNN, DL multitrait, autoencoder Diskusi
bertumpuk, jaringan saraf penduga rata-rata bersyarat, dan Peran AI dalam neuroradiologi telah menunjukkan pertumbuhan
jaringan permusuhan generatif. Tugas pencitraan bervariasi dan yang luar biasa dalam 2 dekade terakhir. Dalam penelitian ini, kami
termasuk klasifikasi (n=9), deteksi (n=2), generasi (n=4), rekonstruksi mengidentifikasi 155 artikel yang merinci aplikasi DL dalam
(n=1), dan prediksi (n=2) digunakan terutama untuk penyakit neuroimaging. Dari jumlah tersebut, mayoritas (74%)
Alzheimer dan klasifikasi beban amiloid. Data dari studi ini diperoleh menggambarkan aplikasi MRI dan 42 dari 115 (37%) algoritma MRI
dari ADNI, Seoul National University Hospital, Parkinson's ditugaskan untuk segmentasi gambar. Hal ini diharapkan karena
Progression Markers Initiative, dan database Korean Brain Aging MRI menggunakan volume besar data gambar tiga dimensi mentah
Study; sebagian besar divalidasi secara eksternal melalui ADNI (n= dan mudah diizinkan untuk studi awal tugas ML dasar, seperti
13). Penilaian algoritma bervariasi dan meliputi akurasi, sensitivitas, segmentasi. Namun, dalam artikel ini, kami menyoroti beberapa
spesifisitas, dan waktu. Hasil dapat dilihat pada Tabel E4 (suplemen). penelitian yang menjelaskan penggunaan DL dalam lima modalitas
pencitraan terpisah—MRI, MRI fungsional, CT, PET, dan AS—
digunakan dalam neuroradiologi dan diterapkan pada berbagai
Artikel AS penyakit neurologis yang sangat luas mulai dari penyakit Alzheimer.
Satu artikel diidentifikasi menggunakan CNN dua dimensi untuk mengelompokkan dan cedera vaskular pada perkembangan otak janin dan neoplasma
dan mengklasifikasikan USG janin transventrikular. Studi ini menggunakan institusi serebral.
seperti klasifikasi citra, pembangkitan, regresi, deteksi, dan peneliti, dokter, dan ilmuwan komputer akan segera memungkinkan DL untuk
rekonstruksi, antara lain. Teknik pencitraan baru ini dan diintegrasikan secara efektif dalam praktik klinis. Demikian pula, standarisasi
semakin banyak metrik penilaian yang tersedia yang lebih besar akan memungkinkan perbandingan dan meta-analisis di
menggarisbawahi ekspansi cepat dan potensi klinis DL masa depan untuk memberikan nilai klinis pada penelitian DL. Meskipun ada
dalam neuroradiologi. insentif yang melekat terhadap berbagi data karena persaingan antara
peneliti, informasi yang ditekan secara langsung menghambat reproduktifitas
Generalisasi, Reproduksibilitas, dan Nilai Klinis dan membatasi pengembangan bidang ini.
mencerminkan kualitas algoritme yang sebenarnya saat diuji terhadap sumber standarisasi pelaporan DL neuroradiologi, kemampuan generalisasi,
daya eksternal. Meskipun temuan ini mungkin menantang dalam keadaan reproduktifitas, dan validitas klinis. Kami menyarankan bahwa peneliti masa
ketika kumpulan data besar tertentu tidak tersedia untuk umum, sebagian depan mengusulkan kerangka kerja dengan kriteria pelaporan khusus untuk
besar penelitian DL saat ini menggunakan data MRI dan CT mentah yang studi DL masa depan. Peneliti dapat mengambil manfaat dari penggunaan
sudah tersedia melalui kumpulan data sumber terbuka seperti ADNI, struktur yang mirip dengan tabel yang disajikan dalam Lampiran E1
Tantangan Segmentasi Tumor Otak, dan Tantangan Segmentasi Lesi Stroke (tambahan) artikel ini; metrik standar yang umum digunakan dan berpotensi
Iskemik. Karena jumlah database pencitraan seperti itu—khusus dan lainnya— sesuai dapat mencakup AUC, DSC, sensitivitas, spesifisitas, dan akurasi.
dikumpulkan, peneliti DL akan terus merasa lebih mudah untuk memvalidasi Penelitian lebih lanjut yang memvalidasi algoritma saat ini terhadap database
algoritme mereka terhadap kumpulan data yang lebih besar dan lebih luas. eksternal yang lebih besar juga diperlukan untuk menunjukkan generalisasi
model—terutama jika dikembangkan dan diuji hanya menggunakan data
Reproduksibilitas juga sangat terbatas; hampir semua artikel yang internal pribadi. Akhirnya, kami merekomendasikan agar peneliti DL
diidentifikasi dalam penelitian ini gagal menggambarkan metode membagikan atau menyediakan kode sumber terbuka untuk algoritme
implementasi algoritma mereka. Sedangkan data medis berada di bawah mereka agar lembaga lain dapat memvalidasi data mereka lebih lanjut.
batasan privasi yang ketat, model dan bobot terkait tidak. Karena bidang ini Crosstalk ini memungkinkan peneliti untuk menarik inspirasi dari studi serupa
terus berkembang dan algoritme memerlukan validasi untuk penggunaan dan mendorong gelombang baru pengembangan DL. Dengan mengatasi
klinis, peneliti mungkin perlu merilis model dan kode mereka agar pembaca setiap tantangan ini dan menunjukkan utilitas klinis, bidang DL dapat segera
dapat mengevaluasi, mereproduksi, dan menguji data eksternal. diimplementasikan dalam perawatan pasien.
konten, semua penulis; persetujuan versi final dari naskah yang dikirimkan, semua penulis; setuju 3. Titano JJ, Badgeley M, Schefflein J, dkk. Pengawasan jaringan saraf dalam
untuk memastikan setiap pertanyaan yang terkait dengan pekerjaan diselesaikan dengan tepat, otomatis dari gambar tengkorak untuk peristiwa neurologis akut. Nat Med
semua penulis; penelitian literatur, semua penulis; studi eksperimental, ADY; analisis statistik, DLC; 2018;24(9):1337–1341.
dan penyuntingan naskah, semua penulis. 4. Feng R, Badgeley M, Mocco J, Oermann EK. Manajemen stroke yang
dipandu pembelajaran mendalam: tinjauan aplikasi klinis. J Neurointerv
Pengungkapan Benturan Kepentingan:ADYmengungkapkan tidak ada hubungan yang relevan.
Surg 2018;10(4):358–362.
DLCmengungkapkan tidak ada hubungan yang relevan.AKU PKegiatan yang terkait dengan artikel ini:
5. NielsenA, HansenMB, Tietze A,MouridsenK. Prediksi hasil jaringan dan penilaian
diungkapkan tidak ada hubungan yang relevan. Aktivitas yang tidak terkait dengan artikel ini:
efek pengobatan pada stroke iskemik akut menggunakan pembelajaran
konsultan untuk MD.ai (hubungan yang tidak terkait dengan pekerjaan saat ini dan tidak ada
mendalam. Pukulan 2018;49(6)::1394–1401.
pendanaan yang diterima dari entitas ini untuk penelitian ini. Hubungan lain: diungkapkan tidak ada
6. Zaharchuk G, Gong E, Wintermark M, Rubin D, Langlotz CP. Pembelajaran mendalam
hubungan yang relevan.FKKegiatan yang terkait dengan artikel ini: diungkapkan tidak ada hubungan
dalam neuroradiologi. AJNR Am J Neuroradiol 2018; 39 (10): 1776–1784.
7. Jiang F, Jiang Y, Zhi H, dkk. Kecerdasan buatan dalam perawatan kesehatan: masa lalu, sekarang
yang relevan. Aktivitas yang tidak terkait dengan artikel ini: dipekerjakan oleh DASA (perusahaan
dan masa depan. Stroke Vasc Neurol 2017;2(4):230–243.
utama penulis) dan Universidade Federal de São Paulo (perusahaan sekunder penulis). Hubungan lain:
diungkapkan tidak ada hubungan yang relevan.
8. Lee EJ, Kim YH, Kim N, Kang DW. Jauh ke dalam otak: kecerdasan buatan
dalam pencitraan stroke. J Stroke 2017;19(3):277–285.
9. Plis SM, HjelmDR, Salakhutdinov R, dkk. Pembelajaran mendalam untuk
Referensi neuroimaging: studi validasi. Front Neurosci 2014;8:229.
1. Moravec H. Kapan perangkat keras komputer cocok dengan otak manusia? J Evol 10. Akkus Z, Galimzianova A, Hoogi A, Rubin DL, Erickson BJ. Pembelajaran
Technol 1998; 1:1–12. https://jetpress.org/volume1/moravec.htm. mendalam untuk segmentasi MRI otak: keadaan seni dan arah masa depan. J
2. Chartrand G, Cheng PM, Vorontsov E, dkk. Pembelajaran mendalam: primer Digit Imaging 2017;30(4):449–459.
untuk ahli radiologi. RadioGraphics 2017;37(7):2113–2131.