ConCLuster BMCMedGenomics Ganetal 2018.en - Id

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.
com
Gandkk. Genomik Medis BMC2018,11(Suppl 6):117

https://doi.org/10.1186/s12920-018-0433-z
RISET Akses terbuka
Identifikasi subtipe kanker dari data RNA-seq sel

tunggal menggunakan metode pengelompokan
konsensus
Yanglan Gan1, Ning Li1, Guobing Zou2, Yongchang Xin1dan Jihong Guan3*
DariKonferensi Internasional ke-29 tentang Informatika Genom

Yunnan, Tiongkok. 3-5 Desember 2018
Abstrak
Latar belakang:Kanker manusia adalah ekosistem kompleks yang terdiri dari sel-sel dengan tanda tangan molekuler yang berbeda.
Heterogenitas intratumoral seperti itu menimbulkan tantangan besar bagi diagnosis dan pengobatan kanker. Kemajuan terbaru dari teknik
sel tunggal seperti scRNA-seq telah membawa wawasan yang belum pernah terjadi sebelumnya ke dalam heterogenitas seluler.
Selanjutnya, masalah komputasi yang menantang adalah mengelompokkan kumpulan data bising dimensi tinggi dengan sel yang jauh
lebih sedikit daripada jumlah gen.
Metode:Dalam makalah ini, kami memperkenalkan conCluster kerangka kerja pengelompokan konsensus, untuk identifikasi subtipe kanker
dari data RNA-seq sel tunggal. Menggunakan strategi ensemble, conCluster menggabungkan beberapa partisi dasar ke cluster konsensus.
Hasil:Diterapkan pada set data scRNA-seq kanker nyata, conCluster dapat mendeteksi subtipe kanker secara lebih akurat daripada metode
pengelompokan scRNA-seq yang banyak digunakan. Selanjutnya, kami melakukan analisis jaringan ekspresi bersama untuk subtipe
melanoma yang teridentifikasi.
Kesimpulan:Analisis kami menunjukkan bahwa subtipe ini menunjukkan jaringan ko-ekspresi gen yang berbeda dan set gen
yang signifikan dengan pengayaan fungsional yang berbeda.
Kata kunci:Pengelompokan konsensus, heterogenitas intratumoral, Subtipe kanker, Pengurutan sel tunggal
Latar belakang Baru-baru ini, RNA-Seq sel tunggal (scRNA-seq)

Karakterisasi heterogenitas intratumoral sangat penting untuk mengkuantifikasi ekspresi populasi seluler yang beragam
terapi kanker presisi, karena populasi sel yang beragam biasanya dan memungkinkan peneliti untuk menganalisis
memungkinkan kekambuhan dan resistensi terhadap pengobatan. perbedaan antar sel [5-7]. Karakterisasi penuh dari lanskap
1]. Teknologi RNA-seq massal konvensional mengungkapkan transkripsi sel individu memiliki potensi besar untuk
ekspresi gen rata-rata dari kumpulan sel, dan selanjutnya banyak mendeteksi subpopulasi tumor yang penting secara klinis,
metode telah dikembangkan untuk menyimpulkan evolusi tumor pemahaman tentang heterogenitas tumor dan aplikasi
menggunakan data dari sekuensing massal sampel tumor [2,3]. klinis lebih lanjut.8,9]. Pengelompokan data ekspresi sel
Pendekatan ini memerlukan dekonvolusi sinyal campuran dari tunggal menyediakan cara intuitif untuk identifikasi tipe
subpopulasi tumor yang mendasarinya, yang seringkali ambigu.4]. sel dari massa sel heterogen, yang dapat digunakan dalam
analisis ekspresi hilir yang beragam [10-12].
Karena noise, dimensi tinggi, dan heterogenitas data, data
scRNA-seq yang baru diproduksi menimbulkan tantangan besar
* Korespondensi:jhguan@tongji.edu.cn bagi algoritma pengelompokan tradisional, seperti K-means,
3Departemen Ilmu dan Teknologi Komputer, Universitas Tongji,
pengelompokan hierarkis, dan pengelompokan spektral.13]. Salah
Shanghai, Cina
Daftar lengkap informasi penulis tersedia di akhir artikel satu strategi yang layak adalah pertama-tama mengurangi
© Penulis. 2018Akses terbukaArtikel ini didistribusikan di bawah ketentuan Lisensi Internasional Creative Commons Attribution 4.0 (
http://creativecommons.org/licenses/by/4.0/), yang mengizinkan penggunaan, distribusi, dan reproduksi tanpa batas dalam media apa
pun, asalkan Anda memberikan kredit yang sesuai kepada penulis asli dan sumbernya, memberikan tautan ke lisensi Creative Commons,
dan menunjukkan jika ada perubahan. Pengabaian Dedikasi Domain Publik Creative Commons
(http://creativecommons.org/publicdomain/zero/1.0/) berlaku untuk data yang disediakan dalam artikel ini, kecuali dinyatakan lain.
Gandkk. Genomik Medis BMC2018,11(Suppl 6): 117 Halaman 66 dari 112
data dimensi ke dalam subruang dimensi yang lebih rendah sel tunggal ini, dengan mengontrol hubungan antara
dan menerapkan pengelompokan tradisional ke data ekspresi rata-rata dan variabilitas.
pengurangan dimensi. Metode pengurangan dimensi yang
Langkah 2 Kurangi dimensi menggunakan t-SNE
banyak digunakan termasuk analisis komponen utama (PCA) [
14] atau algoritma Embedding Stochastic Neighbor Untuk lebih mengurangi dimensi, kami mengadopsi t-SNE yang banyak
Terdistribusi (t-SNE) [15]. Sementara itu, sejumlah metode digunakan untuk mengurangi data berdimensi tinggi menjadi
yang dirancang khusus untuk analisis scRNA-seq telah subruang dimensi yang lebih rendah. Secara rinci, kebingungan
diperkenalkan, termasuk Seurat [16], Rp [17], SNN-klik [18], merupakan parameter penting dari t-SNE, yang digunakan sebagai
SINCERA [19] dan SC3 [20]. Metode canggih ini telah sangat ukuran halus dari jumlah tetangga yang efektif. Studi sebelumnya
meningkatkan kemampuan analisis data scRNA-seq. Namun, menunjukkan bahwa kinerja t-SNE cukup kuat dengan perubahan
karena metode pengelompokan sebagian besar sensitif kebingungan antara 5 dan 50. Di sini, kami menetapkan kebingungan
terhadap kebisingan dan parameter awal, bagaimana sebagai 30 dan menggunakan t-SNE untuk mengurangi data ekspresi
mengelompokkan data scRNA-seq secara akurat di lingkungan scRNA yang difilter menjadi dua dimensi.
yang berbeda dan mengungkapkan wawasan biologis masih

Step3 Partisi sel dalam berbagai cara
merupakan tantangan besar [21].
Berdasarkan matriks data dua dimensi yang ditransformasi, kami
Di sini, kami mengusulkan model pengelompokan konsensus, con-
melakukan pengelompokan K-means dengan parameter awal
Cluster, untuk identifikasi subtipe kanker dari data RNA-seq sel
yang berbedaTkali untuk mendapatkan partisi dasar yang berbeda
tunggal. Secara khusus, conCluster pertama-tama memperoleh satu
untuk sel-sel tunggal. Pada langkah ini, kita juga dapat
set partisi dasar menggunakan pengelompokan tSNE+K-means dengan
menggunakan metode pengelompokan dasar lainnya. Untuk
parameter awal yang berbeda, dan kemudian menggabungkan partisi
setiap hasil pengelompokan individu, kami menurunkan matriks
yang berbeda ini ke dalam cluster konsensus. Metode conCluster kami
binerBN∗Kto,yang dibangun berdasarkan label cluster yang sesuai
juga dapat dengan mudah diperluas untuk menggabungkan hasil
dariNsel, dimanaKto(t=1, 2,· · · ,T) adalah nomor klaster dalamt
pengelompokan dari metode pengelompokan yang berbeda. Kami
partisi dasar. Untuk setiap baris dariBN∗Kto,hanya satu elemen
menerapkan conCluster ke set data scRNA-seq kanker nyata, dan
adalah 1, yang lain adalah 0.
selanjutnya membangun jaringan ko-ekspresi untuk subtipe kanker
yang diidentifikasi untuk menganalisis perbedaannya. Hasil Langkah4 Pengelompokan konsensus
eksperimen menunjukkan efektivitas dan kekokohan conCluster Setelah mendapatkanTpartisi yang berbeda, kami menggabungkan
dibandingkan dengan lima metode clustering yang banyak digunakan. semua matriks biner itu menjadi matriks biner yang lebih besar B= {BN∗
Kto|t=1, 2,· · · ,T}.Selanjutnya, kami melakukan pengelompokan K-
means berdasarkan matriks biner gabungan. Di sini, Indeks Calinski-
Metode Harabaz [22] digunakan untuk menentukan jumlah cluster. Kemudian
Ikhtisar model conCluster kami menggabungkan hasil dari masing-masing hasil pengelompokan
Untuk mengidentifikasi subtipe dari kumpulan sel kanker, kami individu menjadi satu konsensus [23].
mengembangkan conCluster untuk menggabungkan beberapa
hasil pengelompokan. MembiarkanEN∗Gmenunjukkan matriks Metrik Evaluasi
ekspresi gen sel tunggal, di mana baris sesuai dengan sel yang Ketika label sel tersedia dalam kumpulan data, kami
berbeda dan kolom sesuai dengan gen. Setiap elemen dariEaku j mengadopsi indeks rand yang disesuaikan (ARI) untuk
sesuai dengan ekspresi genjdalamsayasel ke. Con-Cluster kami mengukur akurasi pengelompokan [24]. Untuk satu setNsel
mengambil matriks ekspresiEsebagai input, melalui empat dan dua partisi yang berbeda dari sel-sel ini, tumpang tindih
langkah, akhirnya mempartisiNsel menjadiKcluster, antara dua partisi dapat diringkas dalam tabel kontingensi, di
direpresentasikan sebagaiC= {Ck|k=1, 2,· · · ,K}.Angka1 mana setiap entri menunjukkan jumlah objek yang sama
menunjukkan gambaran umum model conCluster yang diusulkan. antara dua partisi. ARI kemudian dihitung sebagai:
Berikut ini, kami akan menguraikan setiap langkah secara rinci.
[ ]
() −
(sebuah)( )()
/n 2
naku j
saya bsaya
Langkah1 Filter gen 2 2 2

saya j
ARI= [ ] [ ]
aku j
Untuk fokus pada tanda tangan transkriptomik intrinsik dari sel-sel tumor
(sebuahsaya
) () (sebuah)( )()
ini, kami menyaring gen langka dan ada di mana-mana dan mengidentifikasi bsaya
2 + 2 /2 2
saya bsaya
2 /2 n
gen yang paling bervariasi di seluruh dataset sel tunggal. Pertama, karena saya j saya j
gen langka dan ada di mana-mana biasanya tidak berguna untuk
(1)
pengelompokan, kami menyaring gen yang diekspresikan dalam waktu
kurang darir% sel (gen langka) atau diekspresikan dalam setidaknya (100-r)% di mana (.) menunjukkan koefisien binomial,naku jadalah elemen
sel (gen di mana-mana). Seperti pada penelitian sebelumnya [22],rditetapkan dari tabel kontingensi,sebuahsayaadalah jumlah darisayabaris ke-
sebagai 6. Selanjutnya, kami mengidentifikasi set gen yang paling banyakv% tiga dari tabel kontingensi,bjadalah jumlah darijkolom th dari tabel
variabel di seluruh kontingensi.
Gambar 1Alur kerja skematis dari conCluster
Kumpulan data pengelompokan menggunakan model teori-grafik; CIDR

Data ekspresi sel tunggal dari dua studi scRNA-seq menggunakan pendekatan imputasi untuk mengurangi dampak
baru-baru ini dipilih dari repositori data NCBI Gene putus sekolah dalam data scRNA-seq dengan cara yang berprinsip;
Expression Omnibus (GSE72056 [25], GSE73727 [26]). dan SC3 mengubah matriks jarak sel-ke-sel dari pengelompokan
Karena berisi jenis sel dalam publikasi asli, dapat digunakan K-means individu untuk mendapatkan partisi konsensus. Untuk
untuk lebih memvalidasi hasil pengelompokan metode yang menjalankan metode SC3 utama, parameter ks harus disetel.
berbeda. Dalam studi ini, tipe sel ditentukan melalui proses Untuk CIDR, ada dua parameter (nPC dan nCluster). SNN-cliq
multi-tahap yang melibatkan informasi tambahan seperti mengandalkan empat parameter (k, jarak r dan m). Kami mencoba
tanda tangan molekuler tipe sel. Dataset pertama berisi nilai yang berbeda dari parameter ini dan memilih nilai-nilai yang
kumpulan sel dari tumor melanoma manusia, terdiri dari 4645 memperoleh ARI tertinggi. Di sini, kami memilih dua set data RNA-
sel tunggal yang diisolasi dari 19 pasien; dan dataset kedua seq sel tunggal [GSE72056 dan GSE73727], karena berisi struktur
berasal dari pulau pankreas manusia, berisi 6 jenis sel pulau cluster yang sudah ada sebelumnya yang dapat digunakan untuk
manusia yang diketahui. Untuk memastikan kualitas data validasi.
yang baik, sampel dengan ukuran perpustakaan kurang dari Angka2menunjukkan kinerja pengelompokan dari algoritma
10.000 dikeluarkan. Kumpulan data yang diubah oleh logTPM yang berbeda yang diukur dengan indeks rand yang
digunakan sebagai input dari metode yang berbeda. disesuaikan (ARI). Untuk dataset GSE73727 dengan 6 cluster,
metode ini mencapai kinerja yang lebih baik ketika jumlah
cluster mendekati 6. Untuk dataset GSE72056 dengan 2 cluster
Hasil (tumor ganas dan jinak), kinerjanya paling baik ketika k sama
Evaluasi kinerja pada data RNA-seq sel tunggal dengan 2. Secara keseluruhan, conCluster yang diusulkan
Untuk mengevaluasi kinerja sepenuhnya, kami membandingkan con- mengidentifikasi subtipe sel tunggal ini dengan lebih tepat,
Cluster dengan lima metode pengelompokan data scRNA-seq yang sebagaimana tercermin oleh indeks rand yang disesuaikan
banyak digunakan, termasuk pengelompokan spektral, tSNE+K-means, mendekati 0,9, yang lebih tinggi daripada lima metode yang
SNN-Cliq, CIDR, dan SC3. Secara khusus, pengelompokan spektral dibandingkan untuk kedua kumpulan data. Beberapa metode
adalah metode pengelompokan tradisional yang efisien; tSNE+Kmeans seperti SNN-cliq dan SC3 bisa mendapatkan kinerja yang
adalah K-means clustering yang dikombinasikan dengan teknik reduksi sebanding dengan conCluster. Namun, kinerjanya tidak stabil
dimensi nonlinier tSNE; SNN-Cliq mengadopsi pendekatan tetangga untuk kumpulan data dan klaster yang berbeda. ARI metode
terdekat bersama untuk menghitung kesamaan antara sel dan clustering tradisional seperti spectral clustering relatif lebih
melakukan sel tunggal rendah dibandingkan metode lainnya.
Gambar 2.Evaluasi kinerja conCluster dan lima metode pengelompokan data scRNA yang banyak digunakan. Adjusted Rand Index (ARI) digunakan untuk
mengukur kesamaan antara label cluster yang disimpulkan dan benar
sangat baik dan K-means menunjukkan stokastik dalam struktur Identifikasi subtipe kanker
pengelompokan karena inisialisasi acak, konCluster kami berdasarkan Selanjutnya, kami menerapkan conCluster dan lima
beberapa tSNE+K-means memperoleh solusi yang lebih baik daripada algoritma yang dibandingkan pada sel tumor melanoma
metode lain. Kinerjanya menunjukkan bahwa ensemble dari beberapa ganas di GSE72056. Dalam dataset ini, terdapat 1257 sel
partisi data membantu untuk menggabungkan cluster bersama-sama ganas setelah mengecualikan sel tumor jinak. Menentukan
dengan cara yang masuk akal. jumlah cluster diketahui sulit dalam clustering.
Gambar 3Identifikasi subtipe dari kumpulan data scRNA-seq melanoma manusia. Warna yang berbeda menunjukkan keluaran cluster oleh masing-masing algoritma
(Nomor cluster k = 6)
Karena tidak ada kebenaran dasar dari cluster untuk sel-sel ganas pola ekspresi terkoordinasi dalam subtipe tertentu. Jaringan ko-
ini, kami menggunakan Indeks Calinski-Harabaz [22] untuk ekspresi ini dapat direpresentasikan sebagai matriks kesamaan gen-
menentukan jumlah cluster. conCluster berhasil mengidentifikasi Cgen. Di sini, kami mengidentifikasi gen yang memiliki perbedaan
enam cluster dalam dataset. Seperti yang ditunjukkan pada ekspresi yang signifikan di antara sel dengan menerapkan FDR 5%.
Gambar.3, conCluster menampilkan lima cluster yang lebih jelas Gen-gen ini digunakan untuk merekonstruksi jaringan koekspresi
dikenali daripada metode yang dibandingkan. SNN-cliq, spesifik subtipe dan mengidentifikasi sejumlah modul gen koekspresi
tSNE+Kmeans dan SC3 juga mendapatkan cluster yang relatif jelas, tinggi. kami menggunakan WGCNA untuk membuat modul ekspresi
sedangkan spectral clustering dan CIDR kurang baik dalam bersama, yang merupakan alat yang banyak digunakan untuk analisis
membedakan cluster tersebut. ekspresi bersama. Angka4menunjukkan jaringan co-ekspresi untuk
Selanjutnya, untuk mengidentifikasi gen pengatur dari setiap subtipe melanoma. Kami memperhatikan bahwa subtipe yang
setiap subtipe melanoma ganas, kami melakukan analisis berbeda mencakup subset gen koekspresi yang berbeda. Gen-gen ini
jaringan ekspresi bersama gen. Jaringan ekspresi bersama dengan tingkat konektivitas tertinggi biasanya adalah
mengidentifikasi gen mana yang cenderung ditampilkan
Gambar 4Jaringan ko-ekspresi divisualisasikan untuk enam subtipe yang berbeda dari tumor melanoma maligna manusia. Node mewakili gen, Edge
weight menunjukkan signifikansi statistik dari hubungan ko-ekspresi
diharapkan menjadi driver yang diperlukan untuk Misalnya, dalam subtipe 1, gen yang paling terhubung
jalur sinyal fungsi penting. terlibat dalam inisiasi translasi (RPL12, RPL38, RPS24,
Kami menghitung tingkat jaringan untuk setiap gen dalam RPS3); dalam subtipe 2, set gen yang paling terhubung
jaringan ekspresi bersama dari subtipe melanoma yang berbeda, erat termasuk gen yang terlibat dalam respons seluler
dan mengidentifikasi gen dengan koneksi paling banyak. Untuk terhadap respons stimulus (FOS, DUSP1, JUN, FOSB);
memeriksa fungsi potensial dari gen-gen tersebut, kami dalam subtipe 3, set gen termasuk B2M, HLA-A, HLA-B,
melakukan analisis pengayaan ontologi gen sistematis terkait dengan pemrosesan dan penyajian antigen.
menggunakan alat DAVID dan merangkum proses dan jalur
biologis utama [27]. Gen yang paling terhubung di setiap jaringan Kesimpulan
dan analisis pengayaan ontologi gen yang sesuai tercantum dalam Kanker biasanya menunjukkan heterogenitas tumor yang substansial
Tabel1. Secara keseluruhan, modul-modul ini diperkaya secara di hampir semua fitur fenotipik yang dapat dibedakan, seperti
signifikan untuk proses biologis penting yang relevan dengan morfologi seluler, ekspresi gen, dan metabolisme. Untuk menganalisis
melanoma, termasuk respons terhadap stimulus cahaya, heterogenitas tumor, penting untuk mengelompokkan populasi sel
pemrosesan antigen, dan regulasi kematian sel. dengan benar ke dalam kelompok yang berbeda
Tabel 1Gen signifikan dan analisis GO dari jaringan ekspresi bersama dari subtipe melanoma yang berbeda
Daftar gen Jenis istilah & nama P-nilai

Subtipe 1 RPS24 SNHG5 RPS3 RPL38 BP: penargetan protein kotranslasi 6.34E-8
RPL12 CTSB PAICS HLA-C BP: inisiasi translasi 2.89E-7
RPS12 MTRNR2L2 MTRNR2L6 BP: regulasi proses apoptosis KEGG: 9.71E-2
GAS5 MTRNR2L10 ARPC1B Pemrosesan dan presentasi antigen CC: 8.47E-2
adhesi fokal 1.42E-3
Subtipe 2 FOSB JUNB JUN IER2 BP: respons seluler 2.28E-6
DNAJB1 TOB1 PPP1R15A BP: regulasi transkripsi negatif BP: 7.67E-3
LOC284454 MCL1 BRD2 regulasi kematian sel 3.025E-3
DUSP1 SLC2A3 ZFP36 MF: aktivitas faktor transkripsi 1.65E-4
KEGG: Diferensiasi osteoklas BP: 4.96 E-4
Subtipe 3 HLA-C CTSB HLA-B GSG1 jalur pensinyalan interferon 2.09E-12
IL12RB1 HLA-A CTSD BP: regulasi positif sitotoksisitas yang dimediasi sel T BP: 2.96E-9
LOC90834 B2M HLA-F HLA-H pemrosesan antigen 1.38E-6
Ahnak HLA-E SHOX BP: respon imun 5.22E-11
KEGG: Pemrosesan dan penyajian antigen BP: 8.11E-8
Subtipe 4 MTRNR2L6 MTRNR2L10 respons seluler terhadap stimulus hormon 1.33E-2
MTRNR2L1 MTRNR2L3 BP: respons terhadap stimulus mekanis 1.50E-2
MTRNR2L2 MTRNR2L8 KEGG: Diferensiasi osteoklas 1.89E-2
FOSB IER2 MTRNR2L4 MF: pengikatan DNA 8.34E-3
MTRNR2L7 ARGLU1 MF: aktivitas faktor transkripsi 6.79E-3
JUN RBM39 SET
Subtipe 5 SHISA9 ABCC9 ORC4 KEGG: Siklus sel 5.28E-2
UGDH-AS1 LOC643406 ASTN2 CC: komponen integral membran CC: 7.95E-2
MDM2 UGT8 LOC286437 sinapsis 8.59E-2
TMEM212 XKR9 GLIPR1L2
SPC25 ARHGEF26-AS1
Subtipe 6 C17orf76-AS1 RPS4X BP: inisiasi translasi BP: 1.21E-18
RPS6 GAS5 RPL29 pemrosesan rRNA 7.40E-17
RPS3 RPS24 RPS27 BP:biogenesis subunit kecil ribosom 8.07E-5
EEF1G RPS19 RPLP0 MF:konstituen struktural ribosom 1.76E-15
RPL18A RPL26 RPL13AP5 KEGG:Ribosom 2.44E-10

subtipe berdasarkan data ekspresi sel tunggal. Karena variasi Catatan Penerbit
Springer Nature tetap netral sehubungan dengan klaim yurisdiksi dalam peta
biologis dan teknis yang tidak dapat dihindari, set data scRNA-
yang diterbitkan dan afiliasi institusional.
seq ini berisik dan berdimensi tinggi, yang menimbulkan
tantangan besar bagi metode komputasi. Dalam makalah ini, Detail penulis
1Sekolah Ilmu dan Teknologi Komputer, Universitas Donghua, Shanghai,
kami mengusulkan, conCluster, metode pengelompokan
Cina.2Sekolah Teknik Komputer dan Sains, Universitas Shanghai, Shanghai,
konsensus tanpa pengawasan untuk mengatasi keterbatasan Cina.3Departemen Ilmu dan Teknologi Komputer, Universitas Tongji,
ini dan menyediakan pengelompokan yang kuat. Secara Shanghai, Cina.
khusus, conCluster kami menggabungkan banyak partisi
Diterbitkan: 31 Desember 2018
dasar menjadi satu konsensus, prosedur ini dapat
mengurangi dampak bahwa kinerja metode pengelompokan Referensi
individu cenderung dipengaruhi oleh noise dan parameter 1. Meacham CE, Morrison SJ. Heterogenitas tumor dan plastisitas sel
kanker. Alam. 2013;501(7467):328.
awal yang berbeda. Selain itu, langkah-langkah pra- 2. Oesper L, Mahmoody A, Raphael BJ. Theta: menyimpulkan heterogenitas intra-
pemrosesan data seperti pengurangan dimensi penting dalam tumor dari data sekuensing DNA throughput tinggi. Biola genom.
analisis data scRNA-seq. Hasil eksperimen menunjukkan 2013;14(7):R80.
3. Roth A, Khattra J, Yap D, Wan A, Laks E, Biele J, Ha G, Aparicio S,
bahwa con-Cluster yang diusulkan dapat lebih akurat
Bouchard-Cté A, Shah SP. Pyclone: inferensi statistik struktur
mendeteksi subtipe kanker daripada metode clustering populasi klonal pada kanker. Metode Nat. 2014;11(4):396.
scRNA-seq yang banyak digunakan dibandingkan. 4. Navin N, Kendall J, Troge J, Andrews P, Rodgers L, McIndoo J, Cook K, Stepansky
A, Levy D, Esposito D, dkk. Evolusi tumor disimpulkan oleh sekuensing sel
Peningkatan kinerja conCluster akan menarik bagi para
tunggal. Alam. 2011;472(7341):90.
peneliti di bidang analisis data scRNA-seq. 5. Patel AP, Tirosh I, Trombetta JJ, Shalek AK, Gillespie SM, Wakimoto H, Cahill DP,
Nahed BV, Curry WT, Martuza RL, dkk. rna-seq sel tunggal menyoroti
Singkatan heterogenitas intratumoral pada glioblastoma primer Sains.
CIDR: Pengelompokan melalui imputasi dan pengurangan dimensi; DAVID: Basis 2014;344(6190):1396–401.
data untuk anotasi, visualisasi, dan penemuan integrasi; PCA: Analisis komponen 6. Pollen AA, Nowakowski TJ, Chen J, Retallack H, Sandoval-Espinosa C, Nicholas
utama; SC3: Pengelompokan konsensus sel tunggal; scRNA-seq: Pengurutan RNA CR, Shuga J, Liu SJ, Oldham MC, Diaz A, dkk. Identitas molekuler glia radial
sel tunggal; SINCERA: Analisis pembuatan profil RNA-seq SEL TUNGGAL; SNN-Cliq: luar manusia selama perkembangan kortikal. Sel. 2015;163(1):55–67.
Berbagi tetangga terdekat-Cliq; t-SNE: algoritma embedding tetangga stokastik
terdistribusi-t; WGCNA: Analisis jaringan ko-ekspresi gen tertimbang 7. Zeisel A, Muñoz-Manchado AB, Codeluppi S, Lönnerberg P, La Manno G, Juréus
A, Marques S, Munguba H, He L, Betsholtz C, dkk. Jenis sel di korteks tikus dan
hippocampus diungkapkan oleh sel tunggal rna-seq.
Ucapan Terima Kasih

Sains. 2015;347(6226):1138–42.
Kami berterima kasih kepada pengulas anonim atas komentar mereka yang bermanfaat pada naskah.
8. Chung W, Eum HH, Lee HO, Lee KM, Lee HB, Kim KT, Ryu HS, Kim S, Lee JE, Park
YH, dkk. rna-seq sel tunggal memungkinkan profil tumor dan sel imun yang
komprehensif pada kanker payudara primer. Komunitas Nat. 2017;8: 15081.
Pendanaan
Pekerjaan ini dan biaya publikasi sebagian disponsori oleh Dana Penelitian
9. Haque A, Engel J, Teichmann SA, Lönnberg T. Panduan praktis untuk
Fundamental untuk Universitas Pusat (2232016A3-05), Yayasan Ilmu Pengetahuan
pengurutan rna sel tunggal untuk penelitian biomedis dan aplikasi
Alam Nasional Tiongkok (61772128, 61772367), Program Penelitian dan
klinis. Obat Genom. 2017;9(1):75.
Pengembangan Kunci Nasional Tiongkok (2016YFC0901704) dan Yayasan Ilmu
Pengetahuan Alam Shanghai (17ZR1400200,18ZR1414400). 10. Kharchenko PV, Silberstein L, Scadden DT. Pendekatan Bayesian untuk
analisis ekspresi diferensial sel tunggal. Metode Nat. 2014;11(7):740.
11. Ji Z, Ji H. Tscan: Rekonstruksi dan evaluasi pseudo-waktu dalam analisis rna-seq
Ketersediaan data dan bahan
sel tunggal. Asam Nukleat Res. 2016;44(13):e117.
Dataset GSE72056 dan GSE73727 dapat diunduh di URL berikut: https://
12. Fiers MW, Minnoye L, Aibar S, Bravo González-Blas C, Kalender Atak Z, Aerts
www.ncbi.nlm.nih.gov/geo/query/acc.cgi.
S. Memetakan jaringan pengatur gen dari data omics sel tunggal. Genomik
Fungsi Singkat. 2018;17(4):246–54.
Tentang suplemen ini
13. Stegle O, Teichmann SA, Marioni JC. Tantangan komputasi dan analitik dalam
Artikel ini telah diterbitkan sebagai bagian dariBMC Medical Genomics
transkriptomik sel tunggal. Nat Rev Genet. 2015;16(3):133.
Volume 11 Tambahan 6, 2018: Prosiding Konferensi Internasional ke-29
14. Yau C, dkk. pcareduce: pengelompokan hierarkis profil transkripsi sel tunggal.
tentang Informatika Genom (GIW 2018): genomik medis. Isi lengkap
Bioinforma BMC. 2016;17(1):140.
suplemen tersedia online dihttps://bmcmedgenomics.biomedcentral.com/
15. Maaten Lvd, Hinton G. Visualisasi data menggunakan t-sne. J Mach Pelajari Res.
articles/ supplement/volume-11-supplement-6.
2008;9(Nov):2579–605.
Kontribusi penulis 16. Macosko EZ, Basu A, Satija R, Nemesh J, Shekhar K, Goldman M, Tirosh I, Bialas
YLG dan NL bertanggung jawab atas gagasan utama, serta penyelesaian naskah AR, Kamitaki N, Martersteck EM, dkk. Profil ekspresi genom-lebar yang sangat
dan eksperimen. GBZ, YCX dan JHG telah mengoordinasikan pra-pemrosesan data paralel dari sel-sel individual menggunakan tetesan nanoliter Sel.
dan mengawasi upaya tersebut. Semua penulis telah membaca dan menyetujui 2015;161(5):1202–14.
naskah akhir. 17. Lin P, Rombongan M, Ho JW. Cidr: Pengelompokan yang sangat cepat dan akurat
melalui imputasi untuk data rna-seq sel tunggal. Biola genom. 2017;18(1):59.
Persetujuan etika dan persetujuan untuk berpartisipasi Tak 18. Xu C, Su Z. Identifikasi tipe sel dari transkriptom sel tunggal menggunakan
dapat diterapkan. metode pengelompokan baru. Bioinformatika. 2015;31(12):1974–80.
19. Guo M, Wang H, Potter SS, Whitsett JA, Xu Y. Sincera: saluran untuk
Persetujuan untuk publikasi Tak analisis profil rna-seq sel tunggal. PLoS Comput Biol. 2015;11(11):
dapat diterapkan. 004575.
20. Kiselev VY, Kirschner K, Schaub MT, Andrews T, Yiu A, Chandra T, Natarajan KN,
Kepentingan bersaing Reik W, Barahona M, Green AR, dkk. Sc3: pengelompokan konsensus data
Para penulis menyatakan bahwa mereka tidak memiliki kepentingan yang bersaing. rna-seq sel tunggal. Metode Nat. 2017;14(5):483.
21. Butler A, Hoffman P, Smibert P, Papalexi E, Satija R. Mengintegrasikan data

transkriptomik sel tunggal di berbagai kondisi, teknologi, dan spesies. Nat
Bioteknologi. 2018;36(5):411.
22. Caliński T, Harabasz J. Metode dendrit untuk analisis cluster. Metode Teori-
Status Komunitas. 1974;3(1):1–27.
23. Pan Y, Wang Z, Zhan W, Deng L. Komputasi identifikasi hot spot energi
mengikat di kompleks protein-rna menggunakan pendekatan ensemble.
Bioinformatika. 2018;34(9):1473–80.
24. Hubert L, Arabie P. Membandingkan partisi. J Classif. 1985;2(1):193–218.
25. Tirosh I, Izar B, Prakadan SM, Wadsworth MH, Treacy D, Trombetta JJ,
Rotem A, Rodman C, Lian C, Murphy G, dkk. Membedah ekosistem
multiseluler melanoma metastatik oleh sel tunggal rna-seq. Sains.
2016;352(6282)::189–96.
26. Li J, Klughammer J, Farlik M, Penz T, Spittler A, Barbieux C, Berishvili E,
Bock C, Kubicek S. Transkriptom sel tunggal mengungkapkan ciri khas
tipe sel pulau pankreas manusia. EMBO Rep. 2016;17(2):178–87.
27. Huang DW, Sherman BT, Lempicki RA. Analisis sistematis dan integratif dari
daftar gen besar menggunakan sumber daya bioinformatika david. Protokol
Nat. 2008;4(1):44.

ConCLuster BMCMedGenomics Ganetal 2018.en - Id

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

ConCLuster BMCMedGenomics Ganetal 2018.en - Id

Diunggah oleh

Hak Cipta:

Format Tersedia

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

Gandkk. Genomik Medis BMC2018,11(Suppl 6):117

RISET Akses terbuka

Identifikasi subtipe kanker dari data RNA-seq sel

DariKonferensi Internasional ke-29 tentang Informatika Genom

Latar belakang Baru-baru ini, RNA-Seq sel tunggal (scRNA-seq)

yang berbeda dan mengungkapkan wawasan biologis masih

Langkah1 Filter gen 2 2 2

Gambar 1Alur kerja skematis dari conCluster

Kumpulan data pengelompokan menggunakan model teori-grafik; CIDR

Daftar gen Jenis istilah & nama P-nilai

RPL12 CTSB PAICS HLA-C BP: inisiasi translasi 2.89E-7

RPS12 MTRNR2L2 MTRNR2L6 BP: regulasi proses apoptosis KEGG: 9.71E-2

GAS5 MTRNR2L10 ARPC1B Pemrosesan dan presentasi antigen CC: 8.47E-2

adhesi fokal 1.42E-3

Subtipe 2 FOSB JUNB JUN IER2 BP: respons seluler 2.28E-6

DNAJB1 TOB1 PPP1R15A BP: regulasi transkripsi negatif BP: 7.67E-3

LOC284454 MCL1 BRD2 regulasi kematian sel 3.025E-3

DUSP1 SLC2A3 ZFP36 MF: aktivitas faktor transkripsi 1.65E-4

KEGG: Diferensiasi osteoklas BP: 4.96 E-4

Subtipe 3 HLA-C CTSB HLA-B GSG1 jalur pensinyalan interferon 2.09E-12

LOC90834 B2M HLA-F HLA-H pemrosesan antigen 1.38E-6

Ahnak HLA-E SHOX BP: respon imun 5.22E-11

KEGG: Pemrosesan dan penyajian antigen BP: 8.11E-8

Subtipe 4 MTRNR2L6 MTRNR2L10 respons seluler terhadap stimulus hormon 1.33E-2

MTRNR2L1 MTRNR2L3 BP: respons terhadap stimulus mekanis 1.50E-2

MTRNR2L2 MTRNR2L8 KEGG: Diferensiasi osteoklas 1.89E-2

FOSB IER2 MTRNR2L4 MF: pengikatan DNA 8.34E-3

MTRNR2L7 ARGLU1 MF: aktivitas faktor transkripsi 6.79E-3

JUN RBM39 SET

Subtipe 5 SHISA9 ABCC9 ORC4 KEGG: Siklus sel 5.28E-2

UGDH-AS1 LOC643406 ASTN2 CC: komponen integral membran CC: 7.95E-2

MDM2 UGT8 LOC286437 sinapsis 8.59E-2

TMEM212 XKR9 GLIPR1L2

Subtipe 6 C17orf76-AS1 RPS4X BP: inisiasi translasi BP: 1.21E-18

RPS6 GAS5 RPL29 pemrosesan rRNA 7.40E-17

RPS3 RPS24 RPS27 BP:biogenesis subunit kecil ribosom 8.07E-5

EEF1G RPS19 RPLP0 MF:konstituen struktural ribosom 1.76E-15

RPL18A RPL26 RPL13AP5 KEGG:Ribosom 2.44E-10

Ucapan Terima Kasih

21. Butler A, Hoffman P, Smibert P, Papalexi E, Satija R. Mengintegrasikan data

Anda mungkin juga menyukai