Anda di halaman 1dari 8

Bioinformatika Pendekatan untuk Identifikasi dan Anotasi RNA Editing Situs

Modifikasi pasca-transkripsi urutan nukleotida transkrip dengan mengedit RNA merupakan mekanisme molekuler penting dalam pengaturan fungsi protein dan berhubungan dengan berbagai fenotipe penyakit manusia. Identifikasi mengedit RNA situs adalah langkah dasar untuk mempelajari mengedit RNA. Sumber daya Database dan bioinformatika digunakan untuk membubuhi keterangan dan mengevaluasi sebagai serta mengidentifikasi situs editing RNA. Tidak ada metode yang bebas dari keterbatasan. Benar mendirikan sebuah pipa analitik dan strategis penerapan kedua metode eksperimental dan bioinformatika merupakan langkah pertama dalam menyelidiki mengedit RNA. ulasan ini merangkum pendekatan bioinformatika modern dan sumber daya terkait untuk penelitian mengedit RNA. jurnal Genetika Kedokteran penghapusan editing ( penyisipan atau penghapusan nukleotida ) . Artikel Baru pengembangan -throughput sequencing Tinggi, Generasi berikutnya Teknologi , semakin BANYAK SITUS mengedit RNA Yang CEPAT Yang ditemukan . Artikel Baru demikian , BANYAK Alat -alat bioinformatika Dan Algoritma untuk mengidentifikasi SITUS baru Negara RNA mengedit Dan semantik anno tasi Bahasa Dari INFORMASI Yang diketahui semakin sering diperkenalkan . Setiap menggunakan metoda , bagaimanapun , tidak prabayar bebas Bahasa Dari keterbatasan . Sebagai Contoh , BANYAK positif Palsu ditemukan di SITUS Yang baru Negara ditemukan . 2-4 ) Hal inisial sebagian KARENA SAAT keterbatasan Suami TERSEDIA Tinggi, Teknologi throughput sequencing Dan sebagian KARENA DAFTAR ISI CONTENTS DELTA pleteness menggunakan metoda Analisis bioinformatika . Ulasan inisial merangkum pendekatan bioinformatika Yang moderen SITUS bahwa surat keterangan RNA editing temukan Dan. menggunakan metoda Analytic BEKERJA SENDIRI tidak semata - mata FUNDS urutan data RNA . Ulasan Suami JUGA meliputi langkah - langkah Strategis Yang digunakan Dalam, Analisis mengedit RNA , Sumber Daya terkait bioinformatika Yang berguna Dalam, Analisis mengedit RNA Dan menggunakan metoda untuk membandingkan Analisis untuk lebih meningkatkan HASIL Analisis . Bioinformatika Pendekatan untuk Identifikasi Dan Anotasi RNA situs editing Soo Youn Lee Dan Kim Ju Han * Seoul National University Biomedis Informatika ( SNUBI ) Dan Telkomnika Informatika

Pusat Penelitian Biomedis ulasan Tax J Med Genet 2013 , 10 ( 1 ) : 27 - 32 http://dx.doi.org/10.5734/JGM.2013.10.1.27 ISSN 1226-1769 (Print ) 2233-9108 (Online ) Modifikasi pasca - transkripsi Urutan nukleotida transkrip Artikel Baru mengedit RNA merupakan MEKANISME molekuler Penting Dalam, pengaturan fungsi protein Dan berhubungan Artikel Baru berbagai fenotipe penyakit manusia . Identifikasi mengedit RNA SITUS adalah langkah Ditempatkan untuk mempelajari mengedit RNA . Sumber Daya database Dan bioinformatika digunakan untuk membubuhi surat keterangan Dan mengevaluasi sebagai Serta mengidentifikasi SITUS mengedit RNA . Tidak ADA Yang menggunakan metoda prabayar bebas Bahasa Dari keterbatasan . BENAR mendirikan sebuah pipa analitik Dan Strategis penerapan kedua menggunakan metoda eksperimental Dan bioinformatika merupakan langkah PERTAMA Dalam, menyelidiki mengedit RNA . ulasan Suami merangkum pendekatan bioinformatika yang modern Dan Sumber Daya terkait untuk penelitian mengedit RNA . Kata kunci : RNA editing , RNA - seq , Bioinformatika pengantar Mengedit RNA adalah proses penelaahan di mana molekul Urutan nukleotida perubahan terjadi Dalam, molekul RNA Penghasilan kena pajak ITU telah ditranskrip Oleh RNA polimerase . 1) Mengedit RNA adalah molekul Peristiwa BACAKAN JARANG Dan bentuk UMUM Before pengolahan RNA termasuk splicing , 5 ' capping Dan Acara 3 ' - polyadenylation biasanya tidak dianggap sebagai Mengedit RNA . SEMENTARA mengedit RNA Luas ( atau pan - editing ) dapat terjadi beberapa FUNDS biota , BACAKAN JARANG Dan biasanya terdiri Bahasa Dari sejumlah Kecil perubahan FUNDS Urutan molekul Yang terkena dampak Dalam, vertebrata . SEMENTARA mengedit RNA telah diamati Dalam, berbagai bentuk RNA termasuk tRNA , rRNA , mRNA Dan Mirna FUNDS eukariota Dan mereka virus , belum terlihat di prokariota . Mengedit RNA terjadi FUNDS beberapa organel seluler seperti mitokondria Dan plastida Serta Dalam, inti Dan sitoplasma . Mengedit RNA terutama diklasifikasikan Ke Dalam, doa Kategori ; substitusi editing ( perubahan KIMIA nukleotida individu ) Dan penyisipan / genetika Kedokteran penghapusan editing (penyisipan atau penghapusan nukleotida). dengan pengembangan tinggi-throughput sequencing generasi berikutnya teknologi, semakin banyak situs editing RNA yang cepat yang ditemukan. Dengan demikian, banyak alat-alat bioinformatika dan

algoritma untuk mengidentifikasi situs baru RNA mengedit dan semantik anno tasi dari informasi yang diketahui semakin sering diperkenalkan. Setiap metode, bagaimanapun, tidak bebas dari keterbatasan. Sebagai contoh, banyak positif palsu ditemukan di situs yang baru ditemukan. 2-4) Hal ini sebagian karena keterbatasan saat ini tersedia tinggi teknologi sequencing throughput dan sebagian karena laporan laba pleteness metode analisis bioinformatika. Ulasan ini merangkum pendekatan bioinformatika yang modern bahwa situs keterangan RNA editing discover dan. metode Analytic tidak bekerja sendiri semata-mata pada data sequencing RNA. Ulasan ini juga meliputi langkah-langkah strategis yang digunakan dalam analisis mengedit RNA, sumber daya terkait bioinformatika yang berguna dalam analisis editing RNA dan metode untuk membandingkan analisis untuk lebih meningkatkan hasil analisis mengedit RNA RNA Fenomena modifikasi uridin ( U ) penyisipan / penghapusan RNA editing ditemukan di mitokondria mencoba protista panosomatid pada tahun 1986 . 5) Mengedit RNA dapat dikelompokkan menjadi dua editing classes-insertion/deletion dasar dan mengedit substitusi . Sementara mengedit RNA luas ( pan - editing ) mungkin terjadi pada beberapa organisme , mengedit dalam vertebrata yang langka dan biasanya terdiri dari sejumlah kecil perubahan pada urutan molekul yang terkena dampak . A - to- I editing adalah bentuk paling umum dari RNA editing di mam mals . 5,6) Adar ( DeAminases Adenosin bekerja pada RNA ) adalah RNA mengedit enzim yang terlibat dalam deaminasi hidrolitik dari Ade tidak sinus untuk inosin ( A -to -I editing ) 7-9 ) pada eukariota lebih tinggi . 10 ) Cto- U editing , editing lain dengan deaminasi , melibatkan cytidine deaminase yang deaminates basis cytidine menjadi basis Uridine . Apolipoprotein B pada manusia adalah contoh dari C -to - U editing dengan bentuk Apo B100 memiliki urutan CAA yang diedit untuk UAA , kodon stop , untuk membuat Apo B48 . Apo B100 , yang diedit

bentuk , dinyatakan dalam hati dan Apo B48 , diedit oleh APOBEC enzim , diekspresikan dalam usus . 11 ) Editing C -to - U jauh jarang dari A -to -I editing . Situs editing RNA terletak di dalam intron , 5'UTRs , 3'UTRs , urutan RNA non - coding 6) dan coding daerah . 12 ) terutama , ribuan situs editing RNA telah ditemukan di Alu di mRNA manusia. 13 , 14 ) Mengedit RNA dapat menyebabkan non - identik protein coding substitusi , 15 ) splicing alternatif , perubahan daerah benih Mirna , dan ekspresi gen . 6) Banyak situs editing RNA telah dilaporkan untuk hadir dalam berbagai penyakit manusia seperti epilepsi , iskemia otak , depresi dan tumor otak . 12 , 16-18 ) Secara khusus , beragam RNA terkait kanker situs editing telah diidentifikasi di berbagai onkogen seperti glioma terkait onkogen 1 ( GLI1 ). 19 ) Beberapa situs editing RNA memiliki berdampak pada penemuan obat . 20 ) Produk gen seperti isoform adalah dibuat oleh RNA editing kegiatan narkoba mempengaruhi . 19 ) Perkembangan terbaru dari DNA tinggi - throughput dan RNA sequ teknologi encing telah memberi kontribusi pada identifikasi baru RNA mengedit situs dan mengedit jenis seperti T ke C , T ke A , C ke A , C ke T , G ke T , C ke G dan G to C. 21 ) Hasil dari ini teknis baru pertanyaan menunjukkan bahwa editing RNA sangat terhubung ke manusia fenotipe termasuk beberapa penyakit . 22 ) Saat ini , salah satu tantangan besar lenge di RNA editing penelitian adalah identifikasi yang tepat dari RNA

mengedit situs dari bising Data RNA - Seq oleh RNA benar diskriminatif situs editing dari Polimorfisme Nukleotida Tunggal ( SNP ) dan artefak teknis yang disebabkan oleh sequencing dan analisis kesalahan . 23 ) Untuk alasan ini, bioinformatika pendekatan untuk data RNA - Seq situs analisis dan mengidentifikasi RNA editing menjadi lebih penting . Dengan demikian , bagian berikut membahas data yang RNA - Seq pipa analisis untuk mengidentifikasi situs editing RNA dan memperkenalkan alat bioinformatika dan database
DNA dan RNA-Seq-Seq Data preprocessing untuk RNA editing penelitian Gambar. 1 menunjukkan langkah-langkah untuk mengidentifikasi situs editing RNA dari RNA-Seq dan urutan DNA (dari exome sequencing atau seluruh sekuensing genom ) data. Ini

menunjukkan pipa analisis untuk penemuan situs baru RNA editing dan satu lagi untuk sistematis annotating Data RNA - Seq dengan situs editing dikenal . Berbagai sumber daya bioinformatika , database , metode dan algoritma yang tercantum dalam Tabel 1 yang secara luas digunakan dalam pipa analisis hari ini . Identifikasi situs baru RNA editing terdiri dari dua langkah , baca pemetaan dan panggilan varian . kedua Bowtie 24 ) dan TopHat 25 ) adalah Urutan populer membaca alat pemetaan . Bowtie adalah yang cepat , memori efisien aligner dibaca pendek , menyelaraskan DNA pendek membaca ke manusia genom pada tingkat lebih dari 25 juta 35 - bp membaca per jam . bowtie indeks genom dengan indeks Burrows - Wheeler untuk memori efisiensi. TopHat adalah sambatan cepat persimpangan mapper untuk RNA - Seq membaca . Ini sejalan RNA - Seq dibaca untuk genom mamalia berukuran menggunakan cepat pendek aligner Bowtie membaca , dan kemudian menganalisa Hasil pemetaan untuk mengidentifikasi sambatan persimpangan antara ekson . Sementara TopHat digunakan lebih sering secara langsung membandingkan RNA Data seq dengan referensi genom saja , 26 ) SOAP2 27 ) dan Burrows Wheeler Aligner ( BWA ) 23 ) digunakan untuk mengidentifikasi situs editing RNA dengan membandingkan DNA dan RNA urutan pasang dari sampel yang sama . BWA sendiri tidak membaca peta lebih intron . Pemetaan RNA - seq

membaca tanpa metode untuk pemetaan lebih junc tions akan menghasilkan ekson 'pulau' dan tidak akan memetakan setiap membaca yang span intron . untuk langkah kedua varian menelepon , SAMtools 28 ) dan GATK 29 ) sangat digunakan . File SAM dan BAM file berisi informasi yang sama , tetapi dalam format yang berbeda . Format SAM adalah format teks untuk menyimpan data sekuens dalam serangkaian tab delimited kolom ASCII . Format BAM menyimpan data yang sama dalam terkompresi , diindeks , bentuk biner . Saat ini, sebagian format data SAM adalah output dari aligners yang membaca file FASTQ dan menetapkan urutan ke posisi sehubungan dengan genom referensi diketahui . SAMtools menerima SAM atau BAM format file dan jenis file BAM . Tabrakan beruntun atau mpileup Perintah ini digunakan untuk mengkonversi diurutkan BAM file ke VCF ( Varian Hubungi Format ) Format . kemudian VCFtools 30 ) melakukan kualitas VCF memeriksa dan penyaringan . Dalam mengidentifikasi situs editing RNA , penyaringan langkah-langkah yang sangat penting . Di sebagian besar percobaan , peneliti memeriksa sumber daya database Karena perkembangan DNA throughput tinggi dan RNA se quencing metode, sejumlah besar situs editing baru memiliki telah ditemukan. Sebagian besar sumber daya database (Tabel 1) memberikan dikenal RNA editing informasi situs dikuratori dari literatur. dbRES 31) adalah web database berorientasi untuk dijelaskan mengedit RNA situs yang dikumpulkan secara manual dari literatur dengan percobaan terkait hasil dan database bank gen. 32) Terkutuk (Database RNA Mengedit pada manusia) 33, 34) adalah database terbesar RNA manusia mengedit situs dengan sekitar 500.000 situs editing RNA manusia memberikan akses terpusat untuk data yang dipublikasikan. mengedit RNA lokasi dipetakan pada genom manusia referensi dengan Informasi penjelasan termasuk, gen, sumber referensi daerah dan referensi PubMed id. Terkutuk juga mengandung 8.500 RNA peristiwa di Drosophila melanogaster dan Mus musculus editing. 33)

Ini menghasilkan Wikipedia subbagian pada RNA editing untuk entri 16 gen dan Alu mengulangi. REDIdb 35) dan peneliti ikan 36) mengandung RNA mengedit situs dalam mitokondria dan kloroplas urutan-encoded. mir-EdiTar 37) mengandung diprediksi A-ke-aku RNA situs pengeditan Mirna daerah yang mengikat Discovery of novel RNA editing sites
Novel RNA editing sites were discovered from a variety of human samples including B cells from 27 individuals
22)

and the Han Chinese population


27)

as well as from cell lines.


1)

One of the popular methods is to compare RNA and DNA sequences obtained from the same sample, returning RNA-DNA differences (RDDs). After detecting the RDDs, a variety of biological resources like the 1000 genome,
38)

HapMap
39)

and dbSNP
40)

are used to filter known SNPs from the RDDs. DARNED


33, 34)

is also used to filter known RNA editing sites. Two methods for identifying RNA editing sites have recently been proposed based on RNA-Seq data from multiple samples of a single species.
23)

The first method performs RNA variant calling for each RNA-Seq data after mapping sequence reads to a genomic reference sequence and filtering known SNPs. The second method performs sequence alignments using pooled reads from different RNA-Seq samples to select a higher read coverage. After alignment, it performs RNA variant calling and filters known SNPs. Given the fact that the DNA-RNA paired dataset is very rare, these methods have merits. RddChecker (http://genomics.jhu.edu/ software/rddChecker/) is a representative tool for identifying RDDs and novel RNA editing sites using DNA and RNA sequencing data (Table 1). A large number of false positives are the major problem with these methods. Li et al., for example, reported that they found 28,848 RDDs with 12 different RNA-editing types including A to G (I)
22)

but many studies have claimed false positives from the same dataset.
2-4)

Annotation of RNA-Seq data with known editing sites

RDDs obtained from the comparison a RNA-Seq with a reference genome sequence are annotated with known RNA editing sites queried from RNA editing databases like DARNED
33, 34)

to determine true RDDs. In 2011, Picardi et al. presented Expedit,


26)

a web appli cation that maps data and, given individual sequence reads as input, executes a comparative analysis against DARNED editing sites. It provides a user-friendly web interface for uploading raw RNA-Seq data like FASTQ, BAM and SAM format files and explores RNA editing sites. It annotates each RNA editing site with 10 types of information including location, gene information, source, etc, but with some limitations. It deals with the hg18 reference only. Uploading raw RNA-Seq data cannot be completed within a practical time. For example, it takes about two hours for a 700 Mb BAM file. RCARE (RNA-Seq comparison and annotation for RNA editing; http://www.snubi.org/software/rcare/) is a useful tool for identifying RNA editing sites from a variety of RNA-seq data, providing 22 types of biological information including synonymous/ non-synonymous changes, splicing junctions, non-coding RNAs and gene information. It also provides seven summary plots including the rate of RNA editing type, distribution in each chro mosome and origin of the samples.

kesimpulan RNA Editing adalah mekanisme pasca-transkripsi yang penting, mengubah urutan transkrip RNA primer dengan menghapus, memasukkan atau memodifikasi residu. Banyak studi melakukan eksperimen untuk menemukan situs editing RNA. Setiap metode untuk mengidentifikasi situs editing RNA, bagaimanapun, memiliki keterbatasan. novel RNA editing metode pendeteksian situs menderita positif palsu.
Dikenal RNA editing metode penjelasan situs tidak cukup dalam menemukan situs baru RNA editing. Peneliti harus hati-hati mempertimbangkan kondisi eksperimental dan metode analisis. disebabkan oleh keterbatasan keadaan saat ini alat-alat seni yang digunakan dalam inve stigating situs editing RNA, satu harus benchmark dan test drive metode yang berbeda dan basis pengetahuan untuk mencapai hasil terbaik. Lebih baik bioinformatika alat akan muncul. Kami berharap ulasan ini sug gests pedoman yang wajar untuk identifikasi mengedit RNA situs menggunakan DNA dan / atau data sequencing RNA.