mencari oligonukleotida yang menunjukkan daerah non-coding di
genom ragi dan cacing (102, 103)
Setelah mendeteksi peraturan situs mengikat, ada masalah mendefinisikan gen yang sebenarnya diatur, biasanya disebut regulon. Umumnya, situs mengikat diasumsikan terletak langsung di hulu regulon; namun ada masalah yang berbeda terkait dengan ini tergantung pada organisme. Untuk prokariota, ini dipersulit oleh adanya operon; itu sulit untuk menemukan gen yang diatur dalam suatu operon karena dapat berada beberapa gen hilir regulasi urutan. Seringkali sulit diprediksi organisasi operon (104),terutama untuk menentukan gen itu ditemukan di kepala, dan sering ada kurangnya konservasi jangka panjang di antara organisme terkait (105). Masalah pada eukariota bahkan lebih parah; situs regulasi sering bertindak di kedua arah, situs yang mengikat biasanya jauh dari regulator karena daerah intergenik besar, dan peraturan transkripsi biasanya hasil tindakan gabungan oleh banyak faktor transkripsi dalam cara kombinatorial. Terlepas dari masalah ini, penelitian ini telah berhasil mengkonfirmasi jalur regulasi transkripsi dari sistem yang ditandai dengan baik seperti sistem respon kejut (99). Selain itu, layak untuk verifikasi prediksi mental apa pun, terutama menggunakan data ekspresi gen. Studi ekspresi gen Banyak penelitian ekspresi sejauh ini berfokus pada merancang metode untuk gen cluster dengan kesamaan dalam profil ekspresi. Ini untuk menentukan protein yang diekspresikan bersama di bawah berbeda kondisi seluler yang berbeda. Secara singkat, metode yang paling umum bersifat hierarkis clustering, peta pengorganisasian, dan K-means clustering. Metode hirarki berasal dari algoritma untuk membangun pohon filogenetik, dan gen kelompok di “bottom-up”; gen dengan yang paling mirip profil ekspresi dikelompokkan terlebih dahulu,dan mereka dengan profil yang acak dimasukkan secara iteratif (106-108). Sebaliknya, peta mengorganisir diri (109,110) dan metode K-means (111) menggunakan pendekatan "top-down" di mana pengguna menentukan terlebih dahulu jumlah cluster untuk data set. Cluster awalnya ditugaskan secara acak, dangen dikelompokkan lagi secara iteratif hingga mereka terkelompok secara optimal. Mengingat metode ini, itu menarik untuk menghubungkan data ekspresi ke atribut lain seperti struktur, fungsi dan lokalisasi subseluler setiap produk gen. Pemetakan sifat ini memberikan wawasan tentang karakteristik protein yang diekspresikan bersama, dan juga menyarankan beberapa kesimpulan menarik tentang keseluruhan biokimia sel. Pada ragi, protein lebih pendek cenderung lebih banyak diekspresikan daripada protein, mungkin karena relatif mudah dengan mereka diproduksi (112). Melihat kandungan asam amino,gen yang diekspresikan secara umum diperkaya dengan alanin dan glisin, dan habis dalam asparagin; ini dianggap mencerminkan persyaratan penggunaan asam amino dalam organisme, di mana sintesis alanin dan glisin penuh semangat lebih murah dari asparagine. Beralih ke struktur protein, tingkat ekspresi dari laras TIM dan NTP lipatan hidrolase yang tertinggi, sedangkan untuk leusin ritsleting, jari seng dan trans membrane lipatan yang mengandung helix adalah yang terendah. Hal ini berkaitan dengan fungsi yang terkait dengan lipatan tersebut; yang umumnya terlibat dalam jalur metabolisme dan yang terakhir dalam signaling atau proses transportasi (113). Hal Ini juga tercermin dalam hubungan dengan subseluler lokalisasi protein, di mana ekspresi protein sitoplasma adalah tinggi, tetapi nuklir dan membrane protein cenderung rendah (114, 115). Hubungan yang lebih kompleks juga telah dinilai. Kebijaksanaan konvensional bahwa produk gen yang berinteraksi satu sama lain lebih mungkin memiliki profil ekspresi yang mirip daripada jika tidak (116, 117). Namun, Studi terbaru menunjukkan bahwa ini hubungan tidak begitu sederhana (118). Sementara profil ekspresi serupa untuk produk gen yang secara permanen terkait, misalnya dalam ukuran subunit ribosom besar, profil berbeda secara signifikan untuk produk yang hanya terkait secara sementara, termasuk yang milik metabolisme yang sama jalan Seperti dijelaskan di bawah ini, salah satu yang utama kekuatan pendorong di belakang ekspresi Analisis telah dilakukan untuk menganalisis kanker garis sel (119). Secara umum, sudah di perlihatkan garis sel yang berbeda (missel epitel dan ovarium) dapat dibedakan atas dasar mereka profil ekspresi, dan iniprofil dipertahankan ketika sel ditransfer dari in vivo ke dalam lingkungan vitro (120). Dasar untuk perbedaan fisiologis mereka terlihat dalam ekspresi spesifikgen; misalnya, level ekspresi produk gen yang diperlukan untuk perkembangan melalui siklus sel,terutama gen ribosom, berkorelasi baik dengan variasi dalam proliferasi sel menilai. Analisis komparatif dapat dilakukan meluas ke sel tumor, di mana penyebab kanker yang mendasarinya terungkap dengan menunjukkan area variasi biologis dibandingkan dengan sel normal. Misalnya di payudara kanker, gen yang terkait dengan selproliferasi dan IFN-diatur jalur transduksi sinyal adalah ditemukan diregulasi (52, 121). Satu dari kesulitan dalam perawatan kanker telah menargetkan terapi khusus untuk jenis tumor yang berbeda secara patogenetik, untuk memaksimalkan kemanjuran dan meminimalkan toksisitas. Karena itu,perbaikan dalam klasifikasi kanker telah menjadi pusat kemajuan dipengobatan kanker. Walaupun perbedaan antara berbagai bentuk kanker - misalnya subclass dari leukemia akut - sudah baik didirikan, masih belum memungkinkan untuk menetapkan diagnosis klinis pada dasar dari satu tes. Dalam studi terbaru, leukemia myeloid akut dan akutleukemia limfoblastik adalah berhasil dibedakan berdasarkan profil ekspresi sel-sel ini (53). Karena pendekatannya tidak memerlukan sebelumnya pengetahuan biologis tentang penyakit, itu dapat memberikan strategi generik untuk mengklasifikasikan semua jenis kanker Jelas, aspek penting dari memahami data ekspresi terletak pada memahami dasar transkripsi peraturan. Namun, analisis di bidang ini masih terbatas pada analisis awal tingkat ekspresi dalam mutan ragi kurang komponen kunci dari transkripsi kompleks inisiasi (10, 122). “... banyak PRAKTISAPLIKASI ... " Di sini, kami menjelaskan beberapa mata pelajaran utama penggunaan bio informatika Menemukan Homolog Seperti dijelaskan sebelumnya, salah satunya kekuatan pendorong di belakang bio informatika adalah mencari kesamaan antara berbagai biomolekul. Selain memungkinkan organisasi yang sistematis data, identifikasi proteinhomolog memiliki beberapa praktik langsung menggunakan. Yang paling jelas adalah mentransfer informasi antara protein terkait. Misalnya, diberi karakter yang buruk-ised protein, adalah mungkin untuk mencari homolog yang lebih dipahami dan dengan hati-hati, terapkan beberapa pengetahuan tentang yang terakhir ke yang pertama. Khusus dengan data struktural, model teoritis protein adalah biasanya didasarkan pada dipecahkan secara eksperi mental struktur homolog dekat (123).Teknik serupa digunakan dalam lipatan pengakuan di mana struktur tersier prediksi tergantung pada struktur temuan homolog jarak jauh dan pengecekan apakah prediksi itu penuh semangat layak (124). Dimana biokimia atau data struktural kurang, studi bisa dibuat di organisme tingkat rendah seperti ragi dan hasilnya diterapkan homolog dalam organisme tingkat tinggi seperti manusia, tempat eksperimen lebih banyak menuntut. Pendekatan yang setara juga dipekerjakan dalam genomik. Homolog-Temuan digunakan secara luas untuk konfirmasi daerah pengkodean di urutan baru genom dan data fungsional sering ditransfer ke anotasigen individu. Pada skala yang lebih besar, itu juga menyederhanakan masalah memahami genom kompleks oleh menganalisis organisme sederhana terlebih dahulu dan kemudian menerapkan prinsip yang sama yang lebih rumit - ini adalah satu alasan mengapa genomik struktural awal proyek yang berfokus pada Mycoplasmagenitalium (91). Ironisnya, ide yang sama dapat terjadi diterapkan secara terbalik. Obat potensial target dengan cepat ditemukan oleh memeriksa apakah homolog dari protein mikroba esensial tidak ada pada manusia. Pada skala yang lebih kecil, structural perbedaan antara protein yang samadapat dimanfaatkan untuk merancang obatmolekul yang secara spesifik mengikat satu struktur tetapi tidak yang lain. Desain Obat Rasional Salah satu medis paling awal aplikasi bio informatika telah dalam membantu desain obat rasional. Gambar 2 menguraikan pendekatan yang sering dikutip, mengambil produk gen MLH1 sebagai contoh target obat. MLH1 adalah manusia gen yang mengkode perbaikan ketidakcocokan protein (mmr) terletak pada shortlengan kromosom 3 (125). Melalui analisis keterkaitan dan kesamaannya dengan mmr gen pada tikus, memiliki gen telah terlibat dalam nonpolyposis kanker kolorektal (126). Mengingat urutan nukleotida, kemungkinan urutan asam amino yang dikodekan protein dapat ditentukan dengan menggunakan perangkat lunak terjemahan. Urutan teknik pencarian kemudian dapat digunakan untuk menemukan homolog dalam modelorganisme, dan berdasarkan urutan kesamaan, adalah mungkin untuk memodelkan struktur protein manusia pada struktur dicirikan secara eksperimental mendatang. Akhirnya, algoritma dockingbisa merancang molekul yang bisa mengikat struktur model, memimpin cara untuk tes biokimia untuk menguji aktivitas biologis mereka pada actual protein. Melalui skala besar inisensus, seseorang dapat mengatasi suatu nomorevolusi, biokimia dan pertanyaan biofisik. Sebagai contoh, terkait lipatan protein spesifik dengan kelompok filogenetik tertentu? Seberapa umum lipatan berbeda dalam organisme tertentu? Dan untuk berapa derajat lipatan yang dibagikan antar organisme terkait? Apakah sejauh ini berbagi parallel ukuran keterkaitan berasal dari pohon evolusi tradisional? Awal studi menunjukkan bahwa frekuensi lipatan sangat berbeda antara