com
GCAT
TACG
GCAT
gen
Artikel
Bernd Timo Hermann 1,* , Sebastian Pfeila 1, Nicole Groenke 1, Samuel Schaible 1,2, Robert Kunze 1, Fré
Déric Ris 3 , Monika Elisabeth Hagen 3 dan Johannes Bhakdi 1
1 Departemen Penelitian & Pengembangan, Quantgene Inc. 2940 Nebraska Ave, Santa Monica, CA 90404, AS;
sebastian@quantgene.com (SP); nicole@quantgene.com (NG); samuel@quantgene.com (SS);
robert@quantgene.com (RK); jb@quantgene.com (JB)
2 Departemen Bedah Umum, Visceral dan Kecelakaan, Rumah Sakit Universitas Heidelberg, Im Neuenheimer Feld
672, 69120 Heidelberg, Jerman
3 Departemen Bedah, Rumah Sakit Universitas Jenewa, 4 Rue Gabrielle-Perret-Gentil, 1211 Jenewa, Swiss;
frederic.ris@hcuge.ch (FR); monikahagen@aol.com (MEH)
* Korespondensi: bernd@quantgene.com
Abstrak: Deteksi varian genetik di daerah hot-spot genomik yang relevan secara klinis telah menjadi aplikasi
yang menjanjikan dari teknologi sekuensing generasi berikutnya dalam onkologi presisi. Diagnostik pribadi
yang efektif memerlukan deteksi varian dengan frekuensi yang seringkali sangat rendah. Ini dapat dicapai
dengan pengurutan bacaan pendek yang ditargetkan yang memberikan kedalaman pengurutan tinggi. Namun,
varian genetik langka dapat berisi informasi penting untuk deteksi dini kanker dan keberhasilan pengobatan
selanjutnya, tingkat kebisingan latar belakang yang tak terhindarkan biasanya membatasi keakuratan uji
panggilan varian frekuensi rendah. Untuk mengatasi tantangan ini, kami mengembangkan DEEPGENTM, sebuah
uji pemanggilan varian yang dimaksudkan untuk mendeteksi varian frekuensi rendah dalam sampel biopsi cair.
----
--- Kami memproses sampel referensi dengan mutasi tervalidasi dari frekuensi yang diketahui (0–0,5%) untuk
menentukan DEEPGENTMkinerja dan persyaratan input minimal. Temuan kami mengkonfirmasi DEEPGENTM
Kutipan: Herman, BT; Pfeil, S.;
keefektifan dalam membedakan antara sinyal dan noise hingga 0,09% varian frekuensi alel dan LOD(90)
Groenke, N.; Schaible, S.; Kunze, R.;
sebesar 0,18%. Sensitivitas superior juga dikonfirmasi dengan perbandingan ortogonal dengan uji berbasis
Ris, F.; Hagen, SAYA; Bhakdi, J.
DEEPGENTM—Tes Pemanggilan biopsi cair yang tersedia secara komersial untuk deteksi kanker.
Gambar 1. Ikhtisar DEEPGENTM alur kerja pengujian. Sampel darah dari biopsi cair atau bahan referensi digunakan untuk
mengisolasi DNA bebas sel (cfDNA). Pengidentifikasi molekul unik (UMI) diikat ke untaian cfDNA individu, diikuti oleh pengayaan
sekuens yang relevan dengan kanker menggunakan panel primer yang disesuaikan. Pustaka NGS yang diperkaya selanjutnya
diurutkan pada Illumina NovaSeq 6000 dan dianalisis dengan DEEPGENTM pipa bioinformatika. Outputnya adalah tabel mutasi
yang berisi frekuensi varian untuk semua lokasi yang ditargetkan.
Terutama ketika diterapkan pada pengaturan klinis, setiap uji pemanggilan varian harus
dapat diandalkan dan menunjukkan kinerja yang baik dalam hal sensitivitas dan spesifisitas [6]. Ini
dicontohkan di bidang onkologi presisi yang mengandalkan deteksi varian frekuensi rendah [7].
Namun, akurasi tinggi dapat dihambat oleh beberapa faktor yang perlu ditangani saat
menghasilkan jalur bioinformatika untuk pemrosesan data dan pemanggilan varian alel frekuensi
rendah. Selain itu, proses laboratorium (pengambilan sampel DNA, persiapan perpustakaan, dan
pengurutan) semuanya rentan terhadap kesalahan dan dapat menimbulkan gangguan sistematis
dan stokastik ke dalam data [8]. Lebih lanjut, efisiensi pendeteksian suatu varian juga dipengaruhi
oleh kualitas genom referensi yang digunakan, kompleksitas sisi genomik tempat varian tersebut
berada dan tentu saja oleh karakteristik varian itu sendiri. Oleh karena itu, strategi algoritmik yang
digunakan untuk langkah-langkah penting, seperti pemfilteran berbasis kualitas, definisi urutan
konsensus, atau pemanggilan varian itu sendiri, dapat sangat memengaruhi kinerja pengujian
secara keseluruhan [9–11]. Terakhir, desain dan optimalisasi saluran bioinformatika juga akan
dipengaruhi oleh metode pengurutan (seluruh genom, seluruh exome atau target) dan, dengan
demikian, cakupan rata-rata yang ditargetkan dari posisi genom.
Terlepas dari aplikasi yang ditunjuk, validasi fungsionalitas dan kinerja varian yang
memanggil kinerja pipa sangat penting [6,12]. Namun, evaluasi metrik penting, seperti sensitivitas
(rasio varian benar yang terdeteksi) atau spesifisitas (kemampuan untuk membedakan panggilan
varian positif palsu), sering dilakukan tanpa adanya kebenaran dasar yang divalidasi. Strategi
validasi umum mencoba menentukan presisi alat pemanggil varian dengan validasi ortogonal
terhadap kumpulan data yang dihasilkan oleh teknologi lain atau dengan membandingkan
beberapa ulangan, dengan asumsi bahwa deteksi berulang, atau tidak adanya sinyal dapat
dianggap benar. Namun, tidak ada pendekatan yang memungkinkan perhitungan akurasi [6].
Pendekatan lain adalah bahwa dataset sintetis dengan varian buatan dari frekuensi yang
ditentukan [13]. Meskipun metode ini dapat memberikan satu set varian positif sejati, set referensi
seperti itu kemungkinan tidak mencerminkan data kehidupan nyata dan juga tidak dapat
digunakan untuk menentukan spesifisitas.
Studi ini merupakan validasi teknis DEEPGENTM. Kami menggunakan sampel referensi yang diproduksi
dengan varian spike-in dari frekuensi alel yang diketahui [14]. Pendekatan kami untuk menggunakan beberapa
varian tervalidasi telah memungkinkan pengujian yang lebih komprehensif dan kuat
gen 2021, 12, 507 3 dari 11
dari DEEPGENTM pengujian, terutama karena penghilangan selektif referensi varian tertentu
memberikan referensi negatif yang benar dan, dengan itu, persyaratan untuk secara andal menentukan
keakuratan pengujian panggilan varian kami.
mampu mengkompensasi kesalahan pengurutan kecil dengan menggunakan algoritma pencarian fuzzy-
match. Metode ini mempertimbangkan jarak pengeditan (yaitu, jumlah minimum perubahan karakter
untuk didapatkan dari string A ke string B) dan memungkinkan identifikasi string bahkan ketika hingga
10% hurufnya diubah (termasuk nukleotida yang hilang atau disisipkan).
Urutan primer spesifik digunakan untuk menetapkan pembacaan ke lokasi yang ditentukan pada
genom sementara UMI memberikan informasi tentang fragmen DNA induk asli dari mana pembacaan
masing-masing berasal. Jika urutan primer atau UMI tidak dapat ditentukan secara memadai,
pembacaan masing-masing dihilangkan dari pemrosesan lebih lanjut. Urutan konsensus dari fragmen
asli yang ditangkap diidentifikasi dengan mengkonsolidasikan pembacaan berdasarkan informasi
primer dan UMI. Panggilan dasar yang berbeda yang disebabkan oleh kesalahan pengurutan
diselesaikan oleh sistem pemungutan suara mayoritas. Selanjutnya, urutan konsensus harus didukung
oleh setidaknya tiga salinan (UMI≥ 3). Urutan konsensus di bawah ambang batas ini difilter dan tidak
digunakan untuk panggilan varian.
Berdasarkan informasi yang diperoleh dari urutan primer, setiap fragmen DNA
konsensus yang unik disejajarkan dengan urutan referensi yang terkait. Urutan referensi
diturunkan dari GRCh37/hg19 [15]. Pemanggilan varian dilakukan dengan algoritma Smith-
Waterman yang dinamis. Algoritme ini menggunakan penyelarasan semi-global dan menguji
pendekatan penalti celah affine dan linier, serta skema penilaian yang berbeda saat
menentukan traceback. Penyelarasan dengan varian paling sedikit kemudian dipilih. Jika
lebih dari dua belas varian terdeteksi, penyelarasan dianggap "terlalu berbeda" dan fragmen
DNA disaring dan dihapus dari analisis.
Berdasarkan daftar putih dengan target yang ditentukan, varian nukleotida tunggal (SNV), varian
multi nukleotida (MNP), dan penyisipan/penghapusan pendek (INDELS) (hingga 10 pasangan basa)
dicatat. INDELS yang lebih panjang dan spesifik yang telah ditentukan sebelumnya dengan relevansi
klinis diidentifikasi dengan algoritme ke-2 yang memanfaatkan pengetahuan tentang posisi genomik
dan informasi urutan di sekitarnya. Indel panjang diidentifikasi menggunakan pencarian string hard-
coded, yang menyaring string yang terdiri dari penyisipan aktual dan pengapit lima bp seperti yang
dijelaskan dalam urutan referensi. Penghapusan panjang ditemukan dengan memotong urutan masing-
masing dari referensi dan menggabungkan lima bps yang mengapit ke dalam string pencarian.
Perubahan genomik yang identik dirangkum dan jumlah, cakupan, dan frekuensi yang dihasilkan
(jumlah/cakupan× 100) untuk setiap varian unik ditulis dalam tabel mutasi, di samping lokasi dan
informasi mutasinya.
atau salah (tidak ada). Berbagai frekuensi varian yang berbeda diuji. Ambang batas VAF yang optimal
ditemukan pada 0,09% dengan spesifisitas yang sangat tinggi (proporsi negatif yang sebenarnya/semua
negatif) sebesar 95% (Gambar 2A, Gambar S1). Ambang batas VAF 0,09% ditetapkan sebagai filter global di
DEEPGENTM dan dengan demikian diterapkan untuk semua data.
Efisiensi dan keandalan DEEPGENTM assay ditentukan dengan tiga percobaan validasi
numerik. Kami memanfaatkan standar referensi dengan varian spikedin, termasuk kontrol negatif
yang sebenarnya. Pertama, standar referensi untuk setiap VAF yang diuji diurutkan dan dianalisis
dalam tiga ulangan independen. Mutasi positif sejati didefinisikan karena diverifikasi melalui
DEEPGENTM dan dinyatakan oleh produsen sebagai hadiah, sedangkan hasil positif palsu mengacu
pada mutasi yang disebut oleh DEEPGENTM dalam bahan referensi pada 0% VAF. Negatif sejati
didefinisikan sebagai varian yang dilaporkan tidak ada oleh pabrikan dan DEEPGENTM. Tidak
adanya varian yang diharapkan dianggap sebagai negatif palsu. Hasilnya digunakan untuk
menghitung sensitivitas, spesifisitas, dan akurasi, serta nilai prediksi positif (PPV) dan negatif (NPV)
(Tabel 1). Interval kepercayaan Clopper–Pearson yang tepat untuk setiap metrik dihitung
menggunakan perangkat lunak MedCalc (https://www.medcalc.org/calc/diagnostic_test.php
(diakses pada 29 Maret 2021), Med-Calc Software, Ostend, Belgia). Hasil berdasarkan standar
referensi dengan masukan 20 ng digunakan untuk menentukan batas deteksi (LOD) di mana
DEEPGENTM assay masih dapat memanggil 90% dari semua varian (LOD90). Titik data dengan VAF
terdeteksi (1) atau tidak terdeteksi (0) dilengkapi dengan regresi logistik sederhana menggunakan
GraphPad Prism versi 8.3.1 untuk Windows (GraphPad Software, San Diego, CA, USA,
www.graphpad.com (diakses pada 29 Maret 2021)). Kekokohan frekuensi yang diamati mungkin
berbeda karena jumlah input cfDNA yang bervariasi. Selain itu, penurunan konsentrasi input
diperkirakan akan menghambat deteksi varian dengan frekuensi alel yang sangat rendah.
Dalam percobaan kedua, kami menguji DEEPGENTMsensitivitas dengan input yang dikurangi.
Untuk ini, empat ulangan independen standar referensi dengan VAF 0,125% diurutkan, hanya
menggunakan DNA input 5 ng, dan dianalisis. Berdasarkan perbedaan yang diduga antara 20 ng
standar dan input 5 ng yang dikurangi, kami selanjutnya mengekstrapolasi jumlah input yang
diduga, di mana setidaknya 50% target masih dapat dideteksi.
Dalam percobaan ketiga, kami mengevaluasi DEEPGENTMreproduktifitas intra-assay,
mengacu pada kemampuan assay untuk memberikan hasil yang kuat dengan bahan masukan
yang sama. Reproduksibilitas intra-assay diuji dengan enam ulangan independen dari SeraseqTM
ctDNA Mutation Mix v2 standar referensi dengan mutasi target yang divalidasi pada 0,5% VAF. Target
yang divalidasi dinyatakan terdeteksi ketika ditemukan dalam kisaran yang dapat diterima di sekitar
frekuensi yang diharapkan (0,5± 0,25%).
3. Hasil
3.1. DEEPGENTM Analisis Kinerja
Metrik kinerja DEEPGENTM pengujian (Gambar 1) dihitung berdasarkan standar
referensi dengan frekuensi alel tervalidasi 0%, 0,125%, 0,25% dan 0,5%. Ambang
frekuensi 0,09% ditentukan secara heuristik untuk memberikan yang terendah, kuat
gen 2021, 12, 507 6 dari 11
diskriminasi antara sinyal sebenarnya dan artefak pengurutan, menghasilkan spesifisitas 95% (Gambar 2
SEBUAH).
Gambar 2. DEEPGENTM kinerja pengujian menggunakan standar referensi SeraseqTM ctDNA Mutation Mix v2 dengan frekuensi alel
minor tervalidasi dari 0%, 0,125%, 0,25% atau 0,5% VAF sebagai input. (SEBUAH) Kekhususan DEEPGENTM uji ditampilkan untuk kisaran
0,01-0,5% VAF sebagai ambang batas. Garis putus-putus menunjukkan ambang batas kualitas yang ditargetkan sebesar 95%. (B)
Sensitivitas, akurasi, PPV, dan NPV untuk VAF terverifikasi sebesar 0,125%, 0,25%, dan 0,5%. (C) Plot kotak frekuensi yang diamati untuk
setiap VAF tervalidasi yang diuji. Kumis mewakili kisaran interval kepercayaan 90 persen. (D) Frekuensi varian yang terdeteksi per varian
target yang divalidasi versus frekuensi varian referensi yang diharapkan. Data mewakili mean± SD (n = 3).
Untuk standar referensi dengan target VAF 0,25% dan 0,5%, DEEPGENTM assay mengungkapkan
sensitivitas, akurasi, PPV dan NPV >95%. Pada 0,125% VAF, sedikit penurunan sensitivitas, NPV dan
akurasi keseluruhan dicatat (Gambar2B, Meja 1). Plot batang menunjukkan frekuensi varian yang
terdeteksi dari target yang divalidasi untuk VAF sebesar 0%, 0,125%, 0,25%, dan 0,5% (Gambar2C). Dalam
setiap VAF yang diuji, frekuensi yang dilambangkan mendekati nilai yang diharapkan. Temuan ini
dikonfirmasi ketika mempertimbangkan hasil untuk semua 20 varian target secara individual: 85% dari
VAF yang diukur berada dalam kisaran yang dapat diterima±50% dari nilai referensi yang diverifikasi
(Gambar 2D).
mereka dapat diukur secara konsisten dalam rentang frekuensi yang dapat diterima sebesar 0,5% ± 0,25%. Hanya satu
varian (PIK3CA_1) yang tidak terdeteksi secara konsisten atau dengan VAF yang lebih rendah dari yang diharapkan.
Tabel 1. Ringkasan metrik kinerja DEEPGENTM pengujian kadar logam. Sensitivitas, spesifisitas, PPV, NPV, dan akurasi
pemanggilan varian dihitung untuk VAF terverifikasi 0%, 0,125%, 0,25%, dan 0,5%. Hasil keseluruhan (di seluruh VAF yang
divalidasi) dan interval kepercayaan 95% (CI) ditampilkan.
( Spesifik = )
Kekhususan Negatif Sejati 0% 95% 95,0% 86,1%–99,0%
Negatif Sejati+Positif Palsu × 100
0,5% 95,2%
( PPV = )
PPV Positif Sejati 0,25% 95,2% 98,2% 94,8%–99,6%
Positif Sejati+Positif Palsu × 100
0,125% 93,9%
0,5% 98,3%
( NPV = )
NPV Negatif Sejati 0,25% 98,3% 78,1% 66,8%–86,9%
Negatif Sejati+Negatif Palsu × 100
0,125% 80,3%
Ketepatan =
0,5% 96,7%
Ketepatan ( ) 0,25% 96,7% 92,1% 87,9%–95,2%
Positif Sejati+Negatif Sejati
Total Target Diperiksa × 100 0,125% 85,8%
gen 2021, 12, 507 8 dari 11
Gambar 3. Batas deteksi dan bahan DNA masukan minimal yang dibutuhkan. (SEBUAH) Jumlah target yang terdeteksi (1) dan tidak ada
(0) untuk setiap VAF tervalidasi yang diuji di 3 ulangan ditampilkan. Ukuran lingkaran sesuai dengan jumlah varian yang disebut (maks =
60). Data dilengkapi dengan regresi logistik. LOD (90) ditentukan pada VAF 0,18%. (B + C) Perbandingan standar referensi VAF 0,125%
dengan 5 ng (n = 4) dan 20ng (n = 3) masukan DNA. (B) Persentase mutasi terverifikasi yang terdeteksi untuk kedua jumlah DNA yang
diuji. Tingkat deteksi 50% yang diprediksi dihitung untuk input DNA 2,5 ng. (C) Ditampilkan adalah frekuensi alel varian rata-rata yang
diukur dari target 0,125% yang terdeteksi divalidasi. Garis putus-putus menunjukkan VAF yang diharapkan sebesar 0,125%. Data
mewakili mean± SD (n = 3).
Gambar 4. Reproduksibilitas DEEPGENTM pengujian kadar logam. Hasil dari enam ulangan independen dari 0,5% SeraseqTM Standar
referensi ctDNA Mutation Mix v2 dibandingkan di 20 varian target yang divalidasi. Detail untuk setiap varian yang divalidasi tercantum
dalam Tabel S3. (SEBUAH) Representasi peta panas dari enam ulangan dengan frekuensi varian terukurnya. VAF di sekitar nilai yang
diharapkan ditampilkan dengan warna biru, nilai di luar kisaran yang dapat diterima (VAF yang diharapkan± 50%) berwarna putih. (B)
Tinjauan dari semua 20 target yang divalidasi (pada 0,5% VAF) dengan frekuensi terukurnya. Rentang yang diizinkan (0,25%–0,75%) dari
nilai terukur ditampilkan sebagai latar belakang abu-abu. Plot kotak menunjukkan rentang interkuartil (IQR) dengan kumis mewakili
rentang interval kepercayaan 5-95 persen.
Gambar 5. Perbandingan DEEPGENTM dan uji AVENIO menggunakan 13 target yang divalidasi dengan VAF yang diketahui. (
SEBUAH) Area berwarna mewakili fraksi target yang terdeteksi oleh DEEPGENTM (ungu) dan AVENIO (abu-abu muda) pada
0,125%, 0,25% dan 0,5% VAF. (B) Spesifisitas, sensitivitas, PPV, NPV, dan akurasi untuk DEEPGENTM dan uji AVENIO untuk setiap
VAF yang diuji. (C) Ikhtisar dari 13 target yang tumpang tindih (pada 0,125% VAF) dengan frekuensi varian terukurnya dari
AVENIO dan DEEPGENTM tes.
gen 2021, 12, 507 9 dari 11
4. Diskusi
Di sini, kami mendemonstrasikan DEEPGENTM kinerja tinggi assay untuk mendeteksi varian dengan
frekuensi alel rendah. Data yang disajikan menunjukkan akurasi panggilan varian tinggi dan selanjutnya
menunjukkan kemampuan pipeline untuk membedakan dengan kuat antara sinyal dan noise hingga VAF
0,09% (Gambar2SEBUAH). Secara khusus, DEEPGENTMSensitivitas tinggi digarisbawahi oleh validasi
ortogonal terhadap uji yang tersedia secara komersial untuk pemanggilan varian alel frekuensi rendah [
17]. Selanjutnya, DEEPGENTMKeandalan dalam rentang VAF rendah didukung oleh LOD(90) yang dihitung
sebesar 0,18% serta input rendah yang diproyeksikan yang diperlukan untuk mendeteksi 50% target
frekuensi rendah (0,125%). Dengan demikian, validasi ini menunjukkan bahwa DEEPGENTM mampu
menemukan varian genom dengan andal pada frekuensi alelik yang sangat rendah tanpa berdampak
negatif pada spesifisitasnya.
Khususnya dalam rentang frekuensi alel rendah, sinyal sebenarnya dan kebisingan latar
belakang menjadi semakin sulit untuk dibedakan, yang membuat perbandingan dengan baseline
yang andal menjadi lebih penting. Dalam hal ini, standar referensi yang digunakan tidak hanya
memberikan dasar yang andal, tetapi juga memberikan kepercayaan pada validitas umum
kapasitas kinerja DEEPGENTM, karena rangkaian varian target yang divalidasi mencakup beragam
lokus genom (20 lokasi genomik di 15 gen). Namun, mengingat sifat DEEPGEN . yang luasTMpanel
primer dan daftar putih, serta fakta bahwa kompleksitas urutan bervariasi di wilayah genom yang
berbeda, kami tidak dapat mengesampingkan kemungkinan bahwa kinerja mungkin lebih rendah
di situs tertentu lainnya.
Namun demikian, metrik kinerja penting secara konsisten kuat di semua VAF yang diuji.
Akurasi tinggi keseluruhan DEEPGENTM pengujian selanjutnya ditunjukkan dalam perbandingan
langsung dengan pengujian AVENIO. Keduanya DEEPGENTM dan AVENIO berhasil menekan
panggilan varian positif palsu, namun DEEPGENTMtingkat deteksi 's hingga empat kali lebih tinggi
pada rentang VAF yang lebih rendah, terutama pada 0,125% (Gambar 5). Selain itu, DEEPGENTM uji
mempertahankan sensitivitas yang dapat diterima bahkan ketika ditantang dengan jumlah DNA
yang berkurang (Gambar 3). Ketika empat kali lipat lebih sedikit input DNA digunakan (20 ng
hingga 5 ng), jumlah varian yang terdeteksi hanya berkurang ~ 15%, menunjukkan penerapan
pengujian untuk deteksi varian frekuensi alel rendah dari bahan input kecil.
Nilai ambang batas frekuensi cut-off global 0,09% juga menjelaskan sedikit penurunan sensitivitas
pada 0,125% VAF dan mencerminkan meningkatnya kesulitan untuk mendeteksi varian pada frekuensi
alel ultra rendah (Gambar 2B). Ambang batas ini telah ditentukan secara heuristik dan memberikan
pertukaran terbaik antara sensitivitas dan spesifisitas, sedangkan ambang ini sengaja ditetapkan untuk
lebih membatasi sehubungan dengan panggilan varian positif palsu (Gambar S1). Hal ini dilakukan
karena pendekatan berbasis NGS masih rentan terhadap pendeteksian artefak teknis yang dapat muncul
dari berbagai sumber dan secara teknis sulit dikendalikan [16,18]. Sebuah studi baru-baru ini
menunjukkan bahwa masalah ini masih lazim di berbagai pendekatan populer untuk panggilan varian [
14]. DEEPGENTM dikembangkan dan dioptimalkan untuk mendeteksi serangkaian sinyal yang relevan
dengan kanker, itulah sebabnya penting untuk memiliki keyakinan pada validitas setiap panggilan
varian.
Sementara negatif palsu juga harus dihindari, masalah hilangnya varian langka dengan frekuensi
ultra-rendah memiliki relevansi yang lebih tinggi untuk tujuan lain, seperti survei mutasi de novo [19].
Selain itu, bertentangan dengan metode pengurutan seluruh genom, DEEPGENTMpendekatan urutan
yang ditargetkan menghasilkan cakupan rata-rata yang tinggi per varian yang ditargetkan (~150.000×
kedalaman sekuensing mentah; kedalaman rata-rata setelah runtuh ~5000×). Dalam pendekatan NGS,
seperti sekuensing seluruh genom, kedalaman baca yang buruk dapat menjadi sumber utama varian
negatif palsu [4], itulah sebabnya strategi cakupan tinggi mengurangi kemungkinan umum terjadinya
mereka.
Meskipun hasil yang sangat baik, penelitian kami terbatas pada validasi analitis dari kinerja
pengujian. Untuk memvalidasi penggunaan pipa dalam pengaturan klinis, studi lebih lanjut
dengan pengujian tambahan pada sampel klinis harus dilakukan.
Singkatnya, DEEPGENTM menghasilkan metrik kinerja yang sangat baik untuk panggilan
varian menggunakan standar referensi yang divalidasi, dan mengungguli pengujian yang tersedia
secara komersial dalam perbandingan ortogonal. Selanjutnya, DEEPGENTMkinerjanya konsisten,
gen 2021, 12, 507 10 dari 11
seperti yang ditunjukkan oleh reproduktifitas intra-assay yang kuat. Dikombinasikan dengan
serangkaian gen dan varian tertarget yang relevan secara klinis, DEEPGENTM menjanjikan untuk menjadi
alat yang berharga dan tepat untuk kedokteran presisi dan onkologi. Ini mungkin benar khususnya
untuk diagnostik berbasis biopsi cair, yang biasanya dihadapkan pada konsentrasi ctDNA yang rendah
dalam plasma pasien dan bahkan konsentrasi molekul mutan yang lebih rendah.20]. Mengingat akurasi
tinggi untuk varian dengan frekuensi sangat rendah, DEEPGENTM dapat sangat berguna untuk
mendeteksi kanker pada tahap awal dan untuk memantau perkembangan pengobatan lanjutan
menggunakan sampel darah pasien.
5. Kesimpulan
Kesimpulannya, validasi teknis DEEPGEN . iniTM menunjukkan kinerja pengujian yang sangat
baik saat menggunakan sampel referensi standar industri yang mengandung varian dengan
frekuensi sangat rendah. Selanjutnya, perbandingan ortogonal dengan uji mapan menyoroti
DEEPGENTMsensitivitas superior untuk deteksi varian langka. Keakuratan pengujian yang baik
menyoroti penerapannya untuk metode pengambilan sampel yang menantang secara teknis,
seperti biopsi cair.
Kontribusi Penulis: Konseptualisasi, RK dan JB; Kurasi data, RK; Analisis formal, BTH, SP, NG dan
SS; Pemeriksaan, BTH dan SP; Metodologi, BTH, SP, RK dan JB; Administrasi proyek, JB; Sumber
Daya, JB; Perangkat Lunak, RK; Pengawasan, JB; Visualisasi, BTH, SP dan NG; Tulisan—draf asli,
BTH, SP dan NG; Penulisan—review dan penyuntingan, SS, FR dan MEH Semua penulis telah
membaca dan menyetujui versi naskah yang diterbitkan.
Pendanaan: Penelitian ini didanai oleh Quantgene Inc., (Santa Monica, CA, USA).
Pernyataan Ketersediaan Data: Pembatasan berlaku untuk ketersediaan data ini. Data diperoleh
dari Quantgene Inc. dan tersedia dari penulis dengan izin Quantgene Inc.
Ucapan terima kasih: Selanjutnya, penulis ingin mengucapkan terima kasih kepada Felix Huettenbach dan
Anders Bill untuk mengoreksi serta bantuan organisasi mereka. Kami berterima kasih kepada Carlo Anacta atas
keahlian dan dukungannya dalam desain grafis. Kami juga menghargai masukan dan umpan balik yang
membangun dari Christel Weiß (Departemen statistik medis, bioinformatika dan pemrosesan informasi;
Universitätsmedizin Mannheim) dan Christina Curtis (Departemen Kedokteran/Onkologi, Universitas Stanford).
Konflik kepentingan: Para penulis memiliki kepentingan sebagai berikut: MH melaporkan hibah dari Intuitive
Surgical Inc, biaya pribadi dan dukungan non-finansial dari Johnson & Johnson, biaya pribadi dan dukungan
non-finansial dari Verb Surgical Inc, biaya pribadi dari Verily Inc, di luar karya yang dikirimkan; dan MH
memegang saham Quantgene dan opsi saham. BTH, NG, SP, RK, SS, MH dan JB menerima biaya atau
kompensasi finansial lainnya dari Quantgene Inc. atau afiliasinya. FR tidak memiliki apa pun untuk diungkapkan.
Referensi
1. Goodwin, S.; McPherson, JD; McCombie, WR Kedewasaan: Sepuluh tahun teknologi pengurutan generasi berikutnya.Nat. Pdt.
2016, 17, 333–351. [CrossRef] [PubMed]
2. Dong, L.; Wang, W.; Li, A.; Kansal, R.; Chen, Y.; Chen, H.; Li, X. Urutan Generasi Berikutnya Klinis untuk Pengobatan Presisi dalam Kanker.
Curr. Genom.2015, 16, 253–263. [CrossRef] [PubMed]
3. Rabbani, B.; Nakaoka, H.; Akhondzadeh, S.; Tekin, M.; Mahdieh, N. Urutan generasi berikutnya: Implikasi dalam pengobatan dan
farmakogenomik yang dipersonalisasi.mol. BioSyst.2016, 12, 1818–1830. [CrossRef] [PubMed]
4. Goldfeder, RL; Pendeta, JR; Zook, JM; Hutan, AKU; Waggott, D.; Roda, MT; Salit, M.; Ashley, EA Implikasi medis dari akurasi teknis
dalam pengurutan genom.Obat Genom. 2016, 8, 1–12. [CrossRef] [PubMed]
gen 2021, 12, 507 11 dari 11
5. Stranneheim, H.; Wedell, A. Exome dan sekuensing genom: Sebuah revolusi untuk penemuan dan diagnosis gangguan monogenik.
J.Magang. Med.2016, 279, 3–15. [CrossRef] [PubMed]
6. Eberle, MA; Fritzilas, E.; Krusche, P.; Källberg, M.; Moore, BL; Bekritsky, MA; Iqbal, Z; Chuang, H.-Y.; Humphray, SJ; Halpern, AL; dkk.
Kumpulan data referensi dari 5,4 juta varian manusia bertahap yang divalidasi oleh pewarisan genetik dari pengurutan silsilah tiga
generasi dengan 17 anggota.Res. Genom 2017, 27, 157-164. [CrossRef] [PubMed]
7. Garraway, LA; Verweij, J.; Ballman, KV Precision Oncology: Sebuah Tinjauan.J.klin. Onkol.2013, 31, 1803–1805. [CrossRef]
8. Robasky, K.; Lewis, NE; Church, GM Peran replika untuk mitigasi kesalahan dalam pengurutan generasi berikutnya.Nat. Pdt. 2014,
15, 56–62. [CrossRef]
9. Ashley, EA Menuju kedokteran presisi. Nat. Pdt.2016, 17, 507–522. [CrossRef] [PubMed]
10. Kim, J.; Kim, D.; Lim, JS; Maeng, JH; Putra, H.; Kang, H.-C.; Nam, H.; Lee, JH; Kim, S. Penggunaan replikasi teknis untuk mendeteksi mutasi
somatik tingkat rendah dalam pengurutan generasi berikutnya.Nat. komuni.2019, 10, 1–11. [CrossRef] [PubMed]
11. Sandmann, S.; De Graaf, AO; Karimi, M.; Van Der Reijden, BA; Hellström-Lindberg, E.; Jansen, JH; Dugas, M. Mengevaluasi Alat Pemanggilan Varian
untuk Data Sekuensing Generasi Berikutnya yang Tidak Cocok.Sci. Reputasi.2017, 7, 1–12. [CrossRef] [PubMed]
12. SoRelle, JA; Wachsmann, M.; Cantarel, BL Merakit dan Memvalidasi Pipeline Bioinformatika untuk Uji Klinis Pengurutan Generasi Selanjutnya.
Lengkungan. Patol. Laboratorium. Med.2020, 144. [CrossRef] [PubMed]
13. Daber, R.; Sukhadia, S.; Morrissette, JJ Memahami keterbatasan informatika sekuensing generasi berikutnya, sebuah pendekatan untuk validasi
jalur klinis menggunakan kumpulan data buatan.Gen Kanker. 2013, 206, 441–448. [CrossRef] [PubMed]
14. Bian, X.; Zhu, B.; Wang, M.; Hu, Y.; Chen, Q.; Nguyen, C.; Hiks, B.; Meerzaman, D. Membandingkan kinerja pemanggil varian yang dipilih
menggunakan data sintetis dan segmentasi genom.Bioinform BMC. 2018, 19, 1–11. [CrossRef] [PubMed]
15. Pendarat, ES; Linton, LM; Birren, B.; Nusbaum, C.; Zodi, MC; Baldwin, J.; Devon, K.; Dewar, K.; Doyle, M.; FitzHugh, W.; dkk. Urutan
awal dan analisis genom manusia.Alam 2001, 409, 860–921. [CrossRef] [PubMed]
16. Ribeiro, A.; Golicz, A.; Hackett, CA; Milne, saya.; Stefanus, G.; Marshall, D.; Flavell, AJ; Bayer, M. Penyelidikan penyebab positif
palsu polimorfisme nukleotida tunggal menggunakan simulasi membaca dari genom eukariota kecil.Bioinform BMC. 2015, 16,
1–16. [CrossRef] [PubMed]
17. Choi, J.; Dannebaum, R.; Singh, A.; Foley, R.; Dinis, J.; Choi, C.; Min, B.; Li, J.; Feng, L.; Casey, F.; dkk. Abstrak 3648: Kinerja pengujian ctDNA
AVENIO di berbagai platform pengurutan generasi berikutnya dengan throughput tinggi.Kanker Res. 2018, 78, 3648. [CrossRef]
18. Li, H.; Gelatik, J. Menuju pemahaman yang lebih baik tentang artefak dalam panggilan varian dari sampel cakupan tinggi.Bioinformatika 2014, 30,
2843–2851. [CrossRef] [PubMed]
19. Bobo, D.; Lipatov, M.; Rodriguez-Flores, JL; Auton, A.; Henn, BM False Negatives Adalah Fitur Penting dari Callset Sequencing Generasi
Selanjutnya.bioRxiv 2016, 066043. [CrossRef]
20. Jung, A.; Kirchner, T. Biopsi cair dalam diagnosis genetik tumor.Dtsch. Arztebl. Int.2018, 115, 169-174. [CrossRef] [PubMed]