Anda di halaman 1dari 10

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Genomik 114 (2022) 110431

Daftar isi tersedia diScienceDirect

Genomik

halaman utama jurnal:www.elsevier.com/locate/ygeno

Analisis evolusi gen di Echinodermata menawarkan wawasan tentang


asal usul filum metazoa
Saoirse FoleyA,B,*, Anna VlasovaC,D, Marina Marcet-HoubenC,D, Toni GabaldonC,D,e, Veronica
F.HinmanA,B
ADepartemen Ilmu Biologi, Universitas Carnegie Mellon, 5000 Forbes Ave, Pittsburgh, PA 15213, AS
BEchinobase #6-46, Mellon Institute, 4400 Fifth Ave, Pittsburgh, PA 15213, AS
CPusat Komputer Super Barcelona (BSC-CNS), Jordi Girona, 29, 08034 Barcelona, Spanyol
DInstitut Penelitian Biomedis (IRB Barcelona), Institut Sains dan Teknologi Barcelona, Baldiri Reixac, 10, 08028 Barcelona, Spanyol
eCatalan Institution for Research and Advanced Studies (ICREA), Barcelona, Spanyol

INFO ARTIKEL ABSTRAK

Kata kunci: Meskipun studi baru-baru ini membahas dampak evolusioner dari duplikasi dan hilangnya gen di antara metazoa, dasar
Filogenetik genomik untuk evolusi filum tetap membingungkan. Di sini, kami menggunakan pendekatan filogenomik untuk mencari gen
Filogenomik ortologis tanpa fungsi yang diketahui di antara echinodermata, dan selanjutnya menggunakannya untuk memandu
Filoma
identifikasi homolog mereka di seluruh metazoa lain. Kumpulan 14 gen terakhir kami diperoleh melalui serangkaian alat
Ortologi
prediksi homologi, data ekspresi gen, ontologi gen, dan menghasilkanStrongylocentrotus purpuratus filum. Kumpulan gen
Echinodermata
Metazoa menjadi sasaran analisis tekanan seleksi, yang menunjukkan bahwa mereka sangat terkonservasi dan di bawah seleksi
negatif. Kehadiran mereka di kedalaman taksonomi yang luas menunjukkan bahwa gen yang dibutuhkan untuk membentuk
filum adalah nenek moyang filum tersebut. Oleh karena itu, daripada genesis gen de novo, kami mengandaikan bahwa
kekuatan evolusioner seperti seleksi pada elemen genom yang ada dalam rentang waktu yang besar dapat mendorong
divergensi dan berkontribusi pada munculnya filum.

1. Perkenalan signifikansi peristiwa kehilangan gen dalam evolusi genom metazoan,


yang khususnya terlihat di antara deuterostomia. Namun, efek dari
Filum Echinodermata mengandung beberapa kelas organisme laut yang repertoar gen yang dilestarikan secara taksonomi, terutama yang
berbeda secara morfologis, termasuk bulu babi (Echinoidea), teripang fungsinya belum dijelaskan, sejauh ini belum diselidiki oleh studi
(Holothuroidea), lili laut (Crinoidea), dan bintang laut (Asteroidea). Sebagai filogenomik. Gen semacam itu terbukti penting dalam pemahaman kita
deuterostoma dengan embrio bilateral transparan, sistem echinodermata tentang kemunculan filum dan evolusi fungsi.
telah digunakan sebagai model untuk menginterogasi pertanyaan
perkembangan dari evolusi jaringan pengatur gen (misalnya proses Dalam penelitian ini, kami mencari keberadaan gen homolog yang dilestarikan
skeletogenik di [52]; evolusi tipe sel [64], pengikatan faktor transkripsi T-box secara taksonomi dari (saat ini) fungsi yang tidak diketahui di seluruh metazoa. Kami
di [10]) untuk regenerasi seluruh tubuh [11,38]. Tidak seperti vertebrata [12], mulai dengan menurunkan satu set gen tersebut di Echinodermata untuk menguji
tidak ada duplikasi genom utama yang diketahui terjadi di dalam apakah synapomorphies gen baru berkontribusi pada munculnya filum, menggunakan
Echinodermata. Dengan perkiraan usia lebih dari 500 juta tahun [13], filum seperangkat alat prediksi homologi, data ekspresi gen, dan ontologi gen. Kami kemudian
kuno dan beragam ini telah mendapatkan dukungan sumber daya genomik menghasilkan dan melaporkan filum bulu babi ungu (Strongylocentrotus purpuratus),
tingkat tinggi melalui Echinobase [6], menjadikan Echinodermata kandidat yang kami gunakan bersama dengan analisis yang disebutkan di atas untuk
yang sangat baik untuk mengeksplorasi asal-usul genom filum metazoa. menginformasikan serangkaian gen yang dilestarikan secara taksonomi dengan fungsi
yang tidak diketahui di seluruh metazoa. Kumpulan gen ini kemudian dikenai analisis
Penelitian terbaru telah membahas peristiwa kehilangan gen sebagai sumber tekanan seleksi. Kami mengakhiri dengan mengomentari implikasi evolusioner dari hasil
keragaman genetik, dan dengan demikian evolusi adaptif (misalnya [1,50]). Secara kami, dan menyarankan beberapa pertimbangan terkait untuk diingat saat
khusus, studi filogenomik oleh Fernández dan Gabaldón [18] menyoroti menggunakan homologi

* Penulis korespondensi di: Departemen Ilmu Biologi, Universitas Carnegie Mellon, 5000 Forbes Ave, Pittsburgh, PA 15213, AS. Alamat email:
schioedtei@gmail.com (S.Foley).

https://doi.org/10.1016/j.ygeno.2022.110431
Diterima 3 Oktober 2021; Diterima dalam bentuk revisi 10 Mei 2022; Diterima 6 Juli 2022
Tersedia online 12 Juli 2022
0888-7543/© 2022 Para Penulis. Diterbitkan oleh Elsevier Inc. Ini adalah artikel akses terbuka di bawah lisensi CC BY (http://creativecommons.org/licenses/by/4.0/).
S. Foley et al. Genomik 114 (2022) 110431

alat prediksi untuk menilai clades kuno. Hubungan ortologi dan paralogi disimpulkan menggunakan algoritma
spesies tumpang tindih seperti yang diterapkan di ETE v3 ([31], lihat juga
2. Metode jalur pipa dan perintah yang dijelaskan dihttp://etetoolkit.org/docs/latest/
tutorial/tuto rial_phylogeny.html#species-overlap-so-algorithm). Algoritme
2.1. Rekonstruksi pohon filum dan spesies melintasi pohon dan memanggil kejadian spesiasi atau duplikasi di node
internal berdasarkan keberadaan spesies umum di kedua partisi anak yang
ItuS.purpuratusphylome dibangun menggunakan pipa PhylomeDB [30]. ditentukan oleh node. Ini memberikan dasar untuk mengevaluasi
Untuk setiap gen yang terkandung dalamS.purpuratusgenom, sebuah keuntungan dan kerugian gen. Berdasarkan prediksi ortologi, keuntungan
BLAST [5] pencarian dilakukan terhadap database yang berisi proteom dari muncul pada leluhur bersama dari setiap keluarga ortologis dan kerugian
pengambilan sampel spesies pan-Metazoan (Tabel 1) untuk mengambil satu muncul pada simpul di mana ortolog hilang. Rasio duplikasi per node
set protein dengan kemiripan yang signifikan (nilai-e<1e-05, terus-menerus dihitung dengan membagi jumlah duplikasi yang diamati di setiap node
tumpang tindih lebih dari 50% urutan kueri). Jumlah hit dibatasi hingga 150 dengan jumlah total pohon gen yang mengandung node tersebut: nilai yang
hit terdekat per gen. Sebuah multiple sequence alignment (MSA) kemudian dihasilkan akan menunjukkan tidak ada duplikasi (nilai = 0), rata-rata satu
dibangun, di mana set urutan protein homolog diselaraskan melalui tiga duplikasi per gen di genom (nilai = 1), atau beberapa duplikasi per gen dan
program yang berbeda: MUSCLE v3.8.1551 [16] (otot -dalam simpul (nilai>1).
File_with_sequences -out Name_outfile), MAFFT v7.407 (mafft –otomatis Spesies pohon direkonstruksi menggunakan dua pendekatan. Pohon
File_with_sequences>Name_outfile), dan KALIGN v2.04 [34] (kalign -f fasta -i pertama dibangun menggunakan DupTree [60] (duptree -i list_trees -o
File_with_sequences -out Name_- outfile). Baik penjajaran maju dan mundur results_duptree.txt 1>duptree.log 2>duptree.error), dan didasarkan pada
dibangun di setiap kasus, dan enam penjajaran yang dihasilkan semua gen yang direkonstruksi dalam filum. DupTree merekonstruksi
digabungkan menggunakan M-Coffee v12.0 [58] (tcoffee topologi yang meminimalkan jumlah duplikasi saat direkonsiliasi dengan
File_with_sequences -n_core 1 -output fasta -quiet kumpulan pohon gen. Pohon spesies kedua dibangun dari seleksi 224 gen
- aln List_alignment_files -outfile Name_outfile). Penjajaran yang dihasilkan yang memiliki ortolog satu-ke-satu pada 14 dari 15 spesies; di mana
dipangkas menggunakan trimAl v1.4.rev15 [9] (trimal -compareset keberpihakan yang dipangkas digabungkan untuk menghasilkan 122.503
paths_to_alignments -forceselect m_coffee_alignment -out posisi asam amino. Penjajaran ini digunakan untuk rekonstruksi pohon
intermediate_output -phylip -ct 0.16666 -cons 30; trimal -in kemungkinan maksimum menggunakan IQ-Tree [41]. IQ-Tree dijalankan
intermediate_output -gt 0.1 -cons 30 -out clean_alignment) menggunakan menggunakan perintah yang sama sesuai rekonstruksi filum, dan pemilihan
batas konsistensi 0,1667 dan batas skor kesenjangan 0,1 . Penjajaran yang model dilakukan menggunakan ModelFinder IQTREE, dan model LG + F + R7
dihasilkan digunakan untuk merekonstruksi pohon filogenetik dipilih sesuai kriteria BIC.
menggunakan IQ-Tree v1.6.9 [41] (iqtree -nt 4 -quiet -mem 4G -cmin 4 -cmax
10 -s clean_alignment -bb 1000 -mset DCmut, JTTDCMut, LG, WAG, VT). 2.2. Penambangan untuk gen yang dilestarikan secara taksonomi
Pohon kemungkinan maksimum akhir (ML) direkonstruksi menggunakan
model terbaik yang dipilih berdasarkan kriteria informasi Bayesian (BIC, [49 Dataset yang dihasilkan oleh Foley et al. [19] diunduh melalui
]). Dukungan dihitung menggunakan bootstrap cepat (1000 pengulangan). Echinobase. Kumpulan data ini berisi prediksi ortologi satu-ke-satu
Pohon dan perataan yang dihasilkan disimpan di PhylomeDB 5.0 ([20],http:// antaraS.purpuratusdan manusia yang disebut dengan enam alat
phylomedb.org), di bawah phylomeID 349. Total ada 25.130 pohon, mewakili berbeda: InParanoid v4.1 [44,47] (perl inparanoid.pl proteome1.fasta
91,6% proteom. proteome2.fasta), ProteinOrtho v6 [35] (perl proteinortho6.pl -project-
=ProjectName -e=1e-40 proteome1.fasta proteome2.fasta), SwiftOrtho [
27] (python ./bin/find_hit.py -p blastp -i CatOf2Proteomes.faa -d
Tabel 1 CatOf2Proteomes.faa -oCatOf2Proteomes.fsa.sc-e 1e-40 -s 111111;
Daftar spesies yang digunakan untuk rekonstruksi filum, masing-masing menunjukkan i) diikuti oleh python ./bin/find_orth.py -iCatOf2Proteomes.fsa.sc-c 0,5
ID mnemonik spesies, ii) ID taksonomi NCBI, iii) nama spesies, dan iv) sumber untuk - y 0>CatOf2Proteomes.fsa.sc.ort), FastOrtho (http://enews.patricbrc. org/) (./
setiap proteom. FastOrtho –option_file ../AnalysisDirectory/Analysis_optionfile), OMA ([3],
Singkatan NCBI Jenis Sumber jalankan sesuai standar DIOPT), dan OrthoFinder v2.4 [17] (./OrthoFinder/
Id pajak orthofinder -f ./DirectoryContainingTwoProteomes). Kami kemudian
STRPU 7668 Strongylocentrotus Echinobase (https://www. memperluas pencarian InParanoid, OMA, dan OrthoFinder untuk
purpuratus echinobase.org/entry/) mendeteksi ortolog di berbagai taksa model lainnya (Arabidopsis thaliana,
ACAPL 133434 Rencana Acanthaster Genomik Kelautan OIST
Caenorhabditis elegans,Danio rerio, Drosophila melanogaster,Otot otot,
https://marinegenomics.
Rattus norvegicus,Saccharomyces cerevisiae, Schizosaccharomyces pombe,
oist.jp/gallery
1.529.436 1529436 Anneissia japonica NCBI, PRJNA615663 DanXenopus tropicalis), dan semua alat dijalankan seperti di atas.The Foley
CIOIN 7719 Ciona intestinalis Quest For Orthologs 2008 et al. [19] dataset juga berisi prediksi ortologi one-to-one antara
NEMVE 45351 Nematostella vectensis Quest For Orthologs 2020 S.purpuratusdan anggota dari dua kelas echinodermata lainnya (Asteroidea
BRAFL 7739 Branchiostoma OIST Marine genomics
dan Crinoidea) seperti yang disebut oleh lima dari enam alat (semua kecuali
florida https://marinegenomics.
oist.jp/gallery
OMA), yang memfasilitasi aksesi prediksi ortolog berikutnya untuk keduanya
AMPQE 400682 Amfibi Ensemble Metazoa Rencana Acanthasterv1.0 (bintang laut mahkota duri; Asteroidea) dan
queenslandica Anneissia japonicav1.0 (bintang bulu; Crinoidea). Set ortologi ini
CRAVI 6565 Crassostrea virginica NCBI, PRJNA376014 dibandingkan dan diproses melalui skrip shell khusus untuk mengembalikan
283.909 283909 Capitella teleta NCBI, PRJNA175705
model protein yang i) tidak dipulihkan sebagai homolog oleh alat apa pun di
CAEL 6239 Caenorhabditis Pencarian Untuk Ortolog, 2020
elegan salah satu spesies non-echinodermata, dan ii) dipulihkan sebagai ortologis
XENTR 8364 Xenopus tropicalis Xenbase (http://www.xe di ketiga spesies echinodermata; yaitu ID untuk masing-masing ortolog 1: 1
nbase.org) di seluruh dataset echinodermata kami dicari dalam keluaran non-
9031 Gallus gallus Quest For Orthologs, 2020
echinodermata menggunakan perintah "grep", dan yang homolognya
ANAK AYAM

DROME 7227 Drosophila Quest For Orthologs, 2020


melanogaster
terdeteksi dengan cara ini dikeluarkan dari rangkaian gen kami ke depan .
SACKO 10224 Saccoglossus Genomik Kelautan OIST Model protein khusus echinodermata yang tersisa dimasukkan ke server
kowalevsky https://marinegenomics. web PFAM v33.1 [39] untuk pencarian domain protein menggunakan
oist.jp/gallery hmmscan dalam kondisi default [46]. Gen disaring berdasarkan tidak adanya
MANUSIA 9606 Homo sapiens Pencarian Untuk Ortolog, 2020
istilah ontologi gen PFAM,

2
S. Foley et al. Genomik 114 (2022) 110431

berikut ini hanya model yang tidak dikarakterisasi yang dipertahankan. Hanya aplikasi [59]. Ini memungkinkan proporsi situs yang dipilih secara
isoform terpanjang dari setiap gen yang dipertahankan. positif dan negatif di setiap gen untuk diperkirakan dengan
Per Foley dkk. [19], data ekspresi jalur waktu perkembangan untuk probabilitas posterior 0,95.
masing-masing gen dalam subset yang tersisa ini (yaitu gen yang cocok
dengan kriteria homologi, tidak memiliki domain PFAM, merupakan isoform 3. Hasil
terpanjang, dan tidak dikarakterisasi) diunduh dari Echinobase. Data
ekspresi diperoleh pada jam-jam berikut setelah pembuahan: 0, 10, 18, 24, Suite alat prediksi homologi memulihkan satu set 145 model protein
40, 40, 48, 56, 64, dan 72. Kami melanjutkan untuk menginterogasi lebih echinodermata sebagai ortologis di tiga spesies echinodermata, yang tidak
lanjut aktivitas gen yang diinginkan padaS.purpuratusdengan mengunduh ditemukan sebagai homolog oleh alat apa pun di spesies non-echinodermata
data transkriptom dari arsip SRA yang sesuai dengan enam jaringan dewasa mana pun. Setelah menghapus isoform yang lebih pendek, dan gen dengan
berbeda yang sesuai dengan proyek PRJNA81157 [56]; usus (SRX173274), anotasi ontologi gen, tersisa 31 gen. Penyaringan untuk gen yang nilai TPM-nya
ovarium (SRX173277), testis (SRX173283), kelenjar aksial (SRX173268), saraf memuncak pada 50 atau lebih melalui perjalanan waktu perkembangan
radial (SRX173280), dan coelomocyte (SRX173270). Transkriptom dirakit menghasilkan daftar akhir dari 14 gen yang menarik yang ortologis di antara
dengan Trinity v2.11.0 [24] (Trinity –seqType fq –kiri ../Tissue_1.fastq – echinodermata, sejauh ini tidak dikarakterisasi, dan diekspresikan selama
kanan ../data_2.fastq –CPU 20 –max_memory 20G). Daerah pengkodean perkembangan dan dalam jaringan dewasa (daftar lengkap dalam file tambahan
protein kemudian diprediksi oleh Transdecoder [25] "GenesAndExpressionData.xlsx"). Hit terbaik timbal balik antara
(TransDecoder.LongOrfs -t Tissue.trinity.fasta). Setiap transkriptom S.purpuratusdan satu set tiga organisme laut lainnya (Nematostella
kemudian dicari gen yang kami minati melalui BLASTP (1e-7, [8]) (ledakan vectensis,Branchiostoma floridae,Ciona intestinalis) ditemukan dan
- kueri GenesOfInterest.fasta -db Tissue.t.fasta.pep -nilai 1e-7 -outfmt 6 diekstraksi untuk 7/14 gen ini (Meja 2).
>TissueExpression.blast).
Profil ekspresi gen untuk kursus waktu perkembangan menginformasikan 3.1. Rekonstruksi filum
langkah penyaringan terakhir kami. Kami berharap bahwa gen perkembangan
kemungkinan akan menunjukkan spesifisitas dalam filum (yaitu taksa / klad Kami merekonstruksi sejarah evolusi semua gen (filum) yang dikodekan
turunan). Jadi, kami hanya mempertahankan gen dengan profil ekspresi yang dalam genom bulu babi ungu (S.purpuratus) menggunakan pipa PhylomeDB
memiliki nilai ekspresi transkrip per juta (TPM) puncak>50, yang merupakan 10% [30]. Selain bulu babi ungu, kami memilih satu set perwakilan pan-filetik dari
teratas dari kumpulan data kami. Meskipun ada masalah dalam spesies echinodermata, bersama dengan spesies lain yang digunakan
menginterpretasikan nilai ekspresi dari satu set data [48], kami memilih nilai batas sebagai kelompok luar untuk rekonstruksi pohon filogenetik. Daftar lengkap
ini dalam upaya untuk menghilangkan gen apa pun yang sinyal ekspresinya spesies yang digunakan dalam rekonstruksi filum dapat ditemukan diTabel 1
berpotensi terdiri dari derau tingkat rendah. Kami kemudian melakukan pencarian . Pohon keluarga gen dianalisis untuk memprediksi hubungan ortologi dan
gen yang tersisa untuk pencarian BLASTP timbal balik yang kurang ketat (1e-7, [8]) paralogi [21], untuk mendeteksi dan memberi tanggal kejadian duplikasi [29
untuk menguji apakah mereka sinapomorfik untuk echinodermata. BLAST ], dan untuk mentransfer anotasi fungsional dari ortolog satu-ke-satu (lihat
pertama menanyakan model protein ini terhadap serangkaian proteom referensi Metode). Semua pohon dan perataan tersedia melalui PhylomeDB dengan
(seperti yang dikurasi oleh proyek Quest for Orthologs) dari tiga organisme laut PhylomeID 349 ([20],http://phylomedb.org), yang merupakan sumber
lainnya;Nematostella vectensisv1.0 (starlet sea anemone, Cnidaria), dan dua berharga bagi para peneliti yang tertarik pada fungsi dan evolusi gen
chordata awal yang menyimpang:Branchiostoma floridaev1.0 (lancelet, echinodermata. Pohon juga ditautkan melalui halaman gen Echinobase, dan
Cephalochordata) danCiona intestinalisVersi HT (menyemprotkan laut, Tunicata). dapat diakses dengan cara ini.
BLAST kedua mempertanyakan keseluruhannyaStrongylocentrotus purpuratus Kami merekonstruksi pohon spesies yang mewakili hubungan evolusioner di
proteome terhadap set proteome organisme laut. Perintah sesuai dengan BLAST antara spesies yang dipertimbangkan dengan menggabungkan keberpihakan 224
sebelumnya. gen salinan tunggal yang ada dalam setidaknya 14 dari 15 spesies yang dianalisis (
Gambar 1). Filogeni yang dihasilkan sepenuhnya konsisten dengan pengetahuan
2.3. Pengayaan istilah ontologi gen saat ini tentang posisi evolusi spesies terpilih [18]. Kami menggunakan pohon
spesies ini untuk menghitung kepadatan duplikasi per cabang di setiap node yang
Selain pencarian PFAM selama pemfilteran, semuanyaS.purpuratus gen mengarah keS.purpuratus(Gambar 1) dan melakukan analisis pengayaan
dianotasi menggunakan InterProScan v.5.47–82.0 [32] (java -XX:+ fungsional untuk gen yang digandakan pada periode evolusi yang berbeda (File
UseParallelGC -XX:ParallelGCThreads=4 -Xms128M -Xmx2048M -jar tambahan "PhylomeAnalyses.xlsx", digambarkan dalam tab
interproscan-5.jar -cpu 4 -d folderName -goterms -pathways -i sequencefile) "duplication_by_age.GO_enrichment"). Puncak duplikasi gen terbesar sesuai
menggunakan semua database InterPro yang tersedia dan aplikasi dengan cabang terminal yang secara khusus mengarah ke bulu babi setelah
pemindaian. Gen yang terkait dengan anotasi "elemen transposable" (TEs) divergensi dari Asteroidea (diwakili olehAcanthastergaris keturunan), dan gen-gen
berdasarkan keberadaan domain PFAM spesifik telah dihapus dari analisis itu diperkaya dalam aktivitas reseptor berpasangan G-protein, transduksi sinyal,
duplikasi gen hilir. Analisis pengayaan istilah GO antara daftar gen yang aktivitas saluran kalium, dan proses reduksi-oksidasi (Gambar 2).
diminati dijalankan menggunakan adaptasi Python internal dari FatiGO [2],
dan divisualisasikan menggunakan REVIGlO [53] pelayan. Sebanyak 2758 gen dari proteom bulu babi tidak memiliki homolog di antara
spesies terpilih (file tambahan "PhylomeAnalyses.xlsx", di bawah tab "yatim
2.4. Penilaian tekanan seleksi piatu"). Hanya sebagian kecil darinya (381) yang tidak memiliki tanda tangan
InterPro, termasuk 11 dari 14 gen yang kami minati, yang menunjukkan bahwa
Gen-gen terpilih yang memiliki entri PhylomeDB yang sesuai mereka mungkin merupakan gen yatim piatu. Sisanya diperkaya dalam istilah
diakses menggunakan PhylomeDB. Untuk memastikan sumber yang ontologi yang berkaitan dengan aktivitas reseptor pensinyalan, respons imun, dan
konsisten untuk tipe data selanjutnya, urutan asam amino dan DNA pengikatan (Gambar 3). Antara lain, protein ini diperkaya dengan istilah domain
yang sesuai dengan gen ini diunduh dari Genbank. Penjajaran asam jari seng dan mengandung banyak daerah yang tidak teratur, yang merupakan
amino dihasilkan menggunakan MAFFT v7.481 [33] (mafft otomatis karakteristik dari faktor transkripsi. Pohon gen untuk 8 dari 14 gen minat kami
– –inputorder "input.faa">"inputAln.faa"). Paket PAL2NAL v14 [54] (pal2nal.pl yang dihasilkan oleh analisis PhylomeDB diberikan dalam Gambar tambahan. S1-
masukanAln.faa masukanDNA.fas -nogap -keluaran paml>gen. pal2nal) digunakan S8. Tidak ada pohon gen yang ditemukan untuk enam gen yang tersisa, karena
untuk menyelaraskan sekuens DNA kodon-demi-kodon menggunakan data asam kurang dari 2 homolog ditemukan dalam setiap kasus.
amino. Pohon Newick untuk masing-masing gen diakses melaluiS.purpuratus
phylome, dan dimasukkan dalam file fasta DNA yang disejajarkan sebagai Kami mengecualikan elemen transposable potensial (TE) berdasarkan
panduan untuk analisis seleksi di FUBAR [40] melalui web Datamonkey keberadaan domain PFAM tertentu. Secara total, kami mencatat 18.159

3
S. Foley et al. Genomik 114 (2022) 110431

Meja 2
Kumpulan gen kita. Ontologi dilaporkan oleh InterProScan. Kasus di mana ID phylomeDB diikuti oleh tanda bintang (*) menunjukkan bahwa gen tersebut tidak memiliki pohon
phylomeDB yang sesuai (misalnya ini dapat terjadi ketika kurang dari dua homolog ditemukan). LOC578009 adalah satu-satunya gen synapomorphic baru yang ditemukan untuk
echinodermata, tetapi merupakan pengecualian; gen ini sebagian besar ditemukan di seluruh metazoa.

Gen RBBH ID FilomeDB Ontologi

LOC100890987 T/A Phy00E9VCL_STRPU T/A


LOC100891212 T/A Phy00E9NDK_STRPU T/A
LOC577463 T/A Phy000VU63_STRPU* PERGI: 0005515
LOC577943 T/A Phy00E9SJD_STRPU T/A
LOC578009 T/A Phy000VM39_STRPU* T/A
LOC578017 T/A Phy00E9SMM_STRPU T/A
LOC582352 T/A Phy00E9ZEJ_STRPU T/A
LOC762881 C3YW32_BRAFL Phy000VNKZ_STRPU* T/A
LOC100893267_iso_X1 C3YI62_BRAFL Phy00E9SFI_STRPU PERGI:0031262, PERGI:0051315
LOC100888903 A7S6U8_NEMVE Phy00EA5U1_STRPU T/A
LOC100891350 A7SDT1_NEMVE Phy00EA8QT_STRPU* PERGI: 0005509
LOC580808 A7S7R1_NEMVE STRPU Phy0037CV2* T/A
LOC577313 F6REZ6_CIOIN Phy00EAAOU_STRPU T/A
LOC578221 C3ZA97_BRAFL Phy000VYP2_STRPU* T/A

Gambar 1.Pohon spesies direkonstruksi menggunakan 224 gen salinan tunggal yang terdapat pada 14 spesies dari 15 dengan perangkat lunak IQ-Tree. Angka merah di
bawah node internal mewakili usia node. Angka biru di atas mewakili tingkat duplikasi tanpa ekspansi besar. Pohon itu ditambahkan dengan setiap gen yang menarik
yang entri PhylomeDB dipulihkan, dan keberadaan homolog untuk gen itu dilambangkan dengan lingkaran hijau. Sebagian besar gen ini mewakili homolog satu salinan,
dengan pengecualian LOC577313, yang tampaknya telah diduplikasi dalam tiram (Crassostrea virginica). Persentase situs di bawah seleksi negatif, seperti yang diturunkan
menggunakan FUBAR, dilaporkan di bawah setiap kolom LOC, dan menunjukkan bahwa sebagian besar gen berada di bawah seleksi negatif yang kuat di sebagian besar
situsnya. Menariknya, homolog untuk gen-gen ini tampaknya hanya ditemukan di seluruh organisme laut. (Untuk interpretasi referensi warna dalam legenda gambar ini,
pembaca dirujuk ke versi web artikel ini.)

protein sebagai protein potensial terkait TE (~4,2%). Namun demikian, kami hits untuk gen ini, meskipun InterPro memprediksi domain untuk satu gen
secara teratur melihat pengayaan istilah integrasi DNA dalam analisis khusus echinodermata (XM_777691.5 mengenai GO:0005515 [pengikatan
pengayaan. glikoprotein / pengikat asam amino protein]), dan dua gen organisme laut
(XM_030995292.1 mengenai GO:0031262 [ Kompleks Nuf2-Ndc80]) dan
GO:0051315 (pelekatan mikrotubulus spindel mitosis ke kinetokor; dan
3.2. Ekspresi spatiotemporal
XM_030999108.1 mengenai GO:0005509 [pengikatan ion kalsium]).

Berdasarkan data perjalanan waktu perkembangan (file tambahan


Nilai ekspresi gen untuk 14 gen yang diminati pada jaringan embrionik dan
"GenesAndExpressionData.xlsx"), ada 14 gen yang tampaknya diekspresikan dan
dewasa ditunjukkan padaGambar 4, dengan nilai ekspresi mentah dilaporkan
dipertahankan selama perkembangan; 7 yang hanya ditemukan di
dalam file tambahan "GenesAndExpressionData.xlsx". Gen-gen ini diekspresikan
echinodermata, dan 7 di mana pencarian BLAST mencocokkan hit dengan
dalam embrio selama perkembangan, dengan sebagian besar
organisme laut lainnya (Gambar 4). PFAM tidak memprediksi domain apa pun

4
S. Foley et al. Genomik 114 (2022) 110431

Gambar 2.Analisis pengayaan istilah GO dari gen yang digandakan diS.purpuratuslevel (usia #1) untuk duplikasi tanpa ekspansi besar, diringkas dengan server REVIGO.
Panel A mencakup proses biologis, dan panel B mencakup kategori fungsi molekuler.

Nilai TPM memuncak antara 18 dan 24 jam pasca pembuahan. Ekspresi gen 3.3. Analisis seleksi
ini juga terdeteksi di semua jaringan dewasa, dengan testis dan selomosit
(yang merupakan sel imun echinodermata, [51]) menunjukkan nilai ekspresi Dari delapan gen dengan entri PhylomeDB, masing-masing terbukti memiliki
yang lebih besar relatif terhadap jaringan lain. sebagian besar situs di bawah seleksi negatif yang kuat di kedua taksa echinodermata
dan non-echinodermata (Gambar 1). Output FUBAR mentah adalah

5
S. Foley et al. Genomik 114 (2022) 110431

Gambar 3.Analisis pengayaan istilah GO dariS.purpuratusgen anak yatim (yaitu, berpotensi spesifik garis keturunan), dirangkum dengan server REVIGO. Panel A
mencakup proses biologis, dan panel B mencakup kategori fungsi molekuler.

6
S. Foley et al. Genomik 114 (2022) 110431

Gambar 4.Ekspresi gen pada jaringan embrionik dan dewasa direpresentasikan sebagai peta panas. Dalam setiap kasus, gen di tanda kurung hijau yang sesuai dengan
bulu babi ungu hanya ditemukan di echinodermata, dan gen di tanda kurung hijau yang sesuai dengan logo InterPro biru adalah satu-satunya yang merekam domain
InterPro. Panel A menunjukkan nilai mentah TPM untuk setiap titik waktu perkembangan utama, mulai dari 0 hingga 72 jam pasca pembuahan. Panel B menampilkan
ekspresi log dari nilai TPM tersebut. Ekspresi gen yang kita minati dipertahankan selama perkembangan, umumnya memuncak pada 18-24 jam. Panel C menunjukkan
nilai TPM di enam jaringan dewasa yang berbeda. Panel D menunjukkan log dari nilai-nilai tersebut. Ekspresi juga dipertahankan pada jaringan dewasa, khususnya pada
selomosit dan testis. (Untuk interpretasi referensi warna dalam legenda gambar ini,

dilaporkan dalam Tabel S1 tambahan, dan laporkan bahwa hanya satu situs set kami (LOC578009) tidak memiliki hit BLAST timbal balik terbaik, hit
dalam satu gen (LOC577313) yang berada di bawah seleksi positif. Masing- ontologi gen, atau pohon PhylomeDB yang sesuai (yaitu gen khusus garis
masing gen ini tampaknya homolog salinan tunggal, dengan pengecualian keturunan yang tidak dikarakterisasi dalamS.purpuratus,Meja 2). Gen ini
LOC577313, yang digandakan dalam tiram.Crassostrea virginica (Gambar layak disebutkan, karena mungkin menjadi kandidat untuk sinapomorfi gen
tambahan. S7). baru di Echinodermata, tetapi ini akan menjadi pengecualian dari aturan
tersebut. Hasil kami menunjukkan kurangnya novel, gen synapomorphic
4. Diskusi untuk Echinodermata. Memang, ini konsisten dengan semakin banyak
penelitian yang menunjukkan bahwa gen baru mungkin bukan pendorong
Dengan menggunakan data genomik dari Echinodermata sebagai titik awal, kami utama fitur baru [61].
mengidentifikasi satu set 14 gen homolog samar yang sangat dilestarikan pada tingkat Meskipun kumpulan gen kami terutama terdiri dari gen yang tidak
taksonomi berbeda di seluruh metazoa, yang 11/14 tidak memiliki fungsi yang diketahui dikarakterisasi dengan fungsi yang tidak diketahui, tekanan seleksi negatif yang
sebagaimana disimpulkan melalui analisis pengayaan ontologi InterProScan dan PFAM. kuat yang diamati di berbagai metazoa dalam analisis filum dapat menunjukkan
Mengingat bahwa echinodermata kuno, pertama kali muncul lebih dari 500 juta tahun bahwa gen ini melakukan fungsi penting di tingkat kerajaan; yaitu mungkin
yang lalu [13], dan bahwa gen-gen yang dilaporkan di sini juga ditemukan pada taksa mereka berada di bawah seleksi yang stabil untuk memastikan bahwa mereka
non-echinodermata, gen-gen ini kuno, dan asal-usulnya mungkin mendahului dipertahankan dan tidak melakukan diversifikasi secara besar-besaran. Ekspresi
kemunculan Echinodermata—temuan yang konsisten dengan Tweedt dan Erwin [57], gen-gen ini pada orang dewasa dan embrionik
yang mencatat bahwa sebagian besar perangkat pengembangan metazoa hadir dalam S.purpuratusjaringan lebih lanjut mendukung pentingnya mereka. Hasil kami juga
metazoa yang menyimpang awal sebelum dikooptasi untuk fungsi perkembangan memberikan dukungan untuk studi sebelumnya [18], yang menunjukkan
tertentu. Ini menyiratkan bahwa gen yang diperlukan untuk membentuk filum ada di kelangkaan umum peristiwa perolehan gen di sebagian besar clade metazoan dan
tingkat kerajaan, dan dengan demikian merupakan nenek moyang filum tersebut. Hanya mengusulkan bahwa kehilangan gen, daripada perolehan gen, mungkin menjadi
satu gen yang masuk pendorong utama divergensi clade - tren yang sangat kuat untuk deuterostomia.

7
S. Foley et al. Genomik 114 (2022) 110431

Demikian pula, menarik juga untuk dicatat bahwa, perGambar 1, homolog untuk S.purpuratusphylome, kami memulihkan satu set gen tingkat filum homolog dari
gen yang kita minati tampaknya hanya ditemukan dalam organisme laut, yang fungsi yang tidak diketahui di seluruh metazoa, yang mungkin mendahului
mungkin memerlukan penilaian peristiwa kehilangan gen dalam studi munculnya filum masing-masing. Synapomorphies gen baru tampaknya tidak
terestrialisasi di masa mendatang. Oleh karena itu kami menyarankan bahwa berperan dalam munculnya Echinodermata. Saat menyelidiki homologi jauh, data
dasar genomik untuk kemunculan echinodermata dan filum metazoa lainnya kami menunjukkan bahwa pendekatan yang lebih santai lebih cocok untuk
dapat ditemukan tidak hanya dalam asal-usul gen de novo, tetapi dalam efek memulihkan homologi tersebut. Kami mengidentifikasi seleksi negatif yang kuat
tekanan seleksi yang diberikan pada gen dan arsitektur genomik yang ada. di seluruh rangkaian gen kami, yang mungkin mengarah pada upaya untuk
Sementara mempersempit daftar gen yang sangat terkonservasi dari fungsi melestarikannya melalui seleksi stabilisasi. Kami kemudian mengandaikan bahwa,
yang tidak diketahui, kami mengamati bahwa PhylomeDB dan pekerjaan BLAST daripada asal-usul gen de novo, kekuatan evolusioner pada gen yang ada (seperti
terbaik timbal balik longgar (1e-7) dapat memulihkan homolog di mana metrik seleksi yang dilakukan dalam skala waktu yang besar dan mendorong divergensi)
dan alat prediksi ortologi konvensional berjalan dalam kondisi yang ketat tidak. mungkin telah berkontribusi pada munculnya echinodermata dan filum lainnya.
Dalam kasus PhylomeDB, ini dapat dikaitkan dengan komposisi kumpulan takson.
Perbedaan urutan yang tinggi di antara kumpulan gen kita juga bisa menjadi
faktor, yang mungkin dikaitkan dengan kombinasi seleksi positif yang kuat dan Pernyataan kontribusi kepengarangan CRedit
skala waktu yang besar untuk terjadinya diversifikasi. Ini berimplikasi pada
bagaimana kita menggunakan alat prediksi homologi ketika berhadapan dengan Saoirse Foley:Konseptualisasi, Metodologi, Analisis formal,
kelompok purba, karena beberapa paket bergantung pada kesamaan urutan dan Investigasi, Sumber Daya, Visualisasi, Akuisisi pendanaan, Penulisan –
pengelompokan untuk menginformasikan prediksi mereka [23]. DIOP [28] draf asli, Penulisan – review & pengeditan.Anna Vlasova:Metodologi,
mengurangi hal ini dengan memasukkan beberapa alat yang menggunakan Analisis formal, Investigasi, Visualisasi, Penulisan – draf asli, Penulisan –
kombinasi algoritme pengelompokan dan filogenetik untuk memanggil homologi, ulasan & penyuntingan.Marina Marcet-Houben:Metodologi, Analisis
tetapi gen yang benar-benar homolog dapat dibuat tidak terdeteksi ketika formal, Investigasi, Visualisasi, Penulisan – draf asli, Penulisan – ulasan
sensitivitas analisis konservatif diperparah oleh usia clade yang dikombinasikan & penyuntingan.Toni Gabaldon:Sumber Daya, Pengawasan, Akuisisi
dengan tekanan seleksi. Kinerja alat prediksi ortologi yang berbeda dalam pendanaan, Penulisan – draf asli, Penulisan – ulasan & pengeditan.
mendeskripsikan kandungan gen nenek moyang eukariotik terakhir sebelumnya Veronica F.Hinman:Pengawasan, Akuisisi pendanaan, Penulisan – draf
telah diteliti [14], dan studi terkait mencatat bahwa (dengan desain) alat semacam asli, Penulisan – ulasan & pengeditan.
itu tidak mengembalikan orthogroup yang konsisten saat memanggil homologi
yang jauh. Yang mengatakan, metode yang muncul yang mampu Terima kasih
mempertimbangkan struktur protein dan interaksi saat memanggil homologi
protein jarak jauh tampak menjanjikan [7,37,62,63], dan terbukti cocok untuk Kami berterima kasih kepada Greg Cary dan Cheryl Telmer atas
memprediksi hubungan homolog yang jauh. wawasan mereka selama proses penulisan naskah. Pekerjaan
berkelanjutan di Echinobase didukung oleh Institut Nasional Kesehatan
Demikian pula, penting untuk dicatat bahwa gen baru yang telah berevolusi melalui Anak dan Perkembangan Manusia (P41 HD095831) yang diberikan
pengocokan domain sering terlewatkan oleh alat prediksi ortologi yang menelusuri kepada VFH. Karya ini menggunakan Extreme Science and Engineering
seluruh protein [22]. Kami mungkin mengecualikan gen tersebut dengan Discovery Environment (XSEDE),[55] yang didukung oleh National
memprioritaskan gen yang tidak dikarakterisasi dari fungsi yang tidak diketahui (yaitu Science Foundation dengan nomor hibah ACI-1548562. Secara khusus,
pemfilteran berdasarkan hit PFAM atau istilah ontologi). Sementara alat ada untuk ini menggunakan sistem Bridges dan Bridges2, yang didukung oleh
memeriksa ortologi di tingkat domain (misalnya [45]), ada kesulitan dalam NSF award number ACI-1445606, di Pittsburgh Supercomputing Center
membandingkannya secara adil [4]. Dengan demikian, menilai apakah pengocokan (PSC) [42] melalui permintaan alokasi MCB200030 dan BIO210137 yang
domain secara signifikan berdampak pada munculnya filum dapat terbukti bermanfaat, diberikan kepada SF. Grup TG mengakui dukungan dari Kementerian
dan gen yang muncul melalui pengocokan domain dapat terbukti menjadi kandidat Sains dan Inovasi Spanyol untuk hibah PGC2018-099921-B-I00, yang
untuk gen sinapomorfik baru di antara echinodermata. Meskipun demikian, tampaknya didirikan bersama oleh Dana Pembangunan Regional Eropa (ERDF);
masuk akal bahwa efek seleksi positif yang bertahan selama jutaan tahun dapat dari Badan Riset Catalan (AGAUR) SGR423; dari program penelitian dan
meruntuhkan penandaan pengacakan domain melalui divergensi berikutnya. inovasi Horizon 2020 Uni Eropa (ERC-2016-724173); dari Yayasan
Gordon dan Betty Moore (Hibah GBMF9742) dan dari Instituto de Salud
Duplikasi gen transposon diamati (Gambar 2) mungkin terkait dengan Carlos III (Hibah INB PT17/0009/0023 - ISCIII-SGEFI/ERDF).
regenerasi pada echinodermata [15], dan kami mendorong basis molekuler
potensial untuk regenerasi ini untuk dipertimbangkan dalam studi lebih Lampiran A. Data tambahan
lanjut. Mengingat bahwa keluarga transposon cukup beragam, dan istilah
integrasi DNA diperkaya, ini mungkin menunjukkan bahwa anotasi TE Data tambahan untuk artikel ini dapat ditemukan online dihttps://doi.
diremehkan dan oleh karena itu kurang dipelajari. Selain itu, telah org/10.1016/j.ygeno.2022.110431.
ditunjukkan bahwa gen yang terlibat dalam reproduksi dan kekebalan
(antara lain) cenderung berkembang pesat pada echinodermata [43]. Per Referensi
analisis ekspresi gen kami di seluruh jaringan dewasa, gen yang kami minati
relatif lebih tinggi diekspresikan dalam testis dan coelomocytes, meskipun [1] R. Albalat, C. Cañestro, Evolusi karena kehilangan gen, Nat. Pendeta Genet. 17 (2016)
379–391,https://doi.org/10.1038/nrg.2016.39.
penting untuk dicatat bahwa nilai-nilai ini berasal dari dataset tunggal.
[2] F. Al-Shahrour, R. Díaz-Uriarte, J. Dopazo, FatiGO: alat web untuk menemukan
Ekspresi tinggi di testis konsisten dengan penelitian sebelumnya [26], dan hubungan yang signifikan antara istilah ontologi gen dengan kelompok gen,
melibatkan gen-gen ini dalam proses pengenalan gamet yang dapat Bioinformatika 20 (2004) 578–580,https://doi.org/10.1093/bioinformatics/ btg455.

mendorong isolasi reproduktif [36]. Diambil bersama dengan ekspresi tinggi


[3] AM Altenhoff, NM Glover, C.-M. Kereta Api, K. Kaleb, A. Warwick Vesztrocy,
yang diamati pada selomosit, yang mungkin menyiratkan peran dalam D. Dylus, TM de Farias, K. Zile, C. Stevenson, J. Long, H. Redestig, GH Gonnet,
proses pengenalan non-inang, gen yang kami identifikasi di sini harus C. Dessimoz, Database ortologi OMA pada tahun 2018: mengambil hubungan evolusi di
antara semua domain kehidupan melalui web yang lebih kaya dan antarmuka
menarik untuk penelitian selanjutnya yang berupaya memahami pendorong
terprogram, Nucleic Acids Res. 46 (2018) D477–D485,https://doi.org/10.1093/ nar/
spesiasi genomik. gkx1019.
[4] AM Altenhoff, J. Garrayo-Ventas, S. Cosentino, D. Emms, NM Glover,
5. Kesimpulan A. Hernández-Plaza, Y. Nevers, V. Sundesha, D. Szklarczyk, JM Fernández,
L. Codó, Untuk Konsorsium Ortolog, TQ, JL Gelpi, J. Huerta-Cepas, W. Iwasaki,
S. Kelly, O. Lecompte, M. Muffato, MJ Martin, S. Capella-Gutierrez, PD Thomas,
Dengan menggunakan echinodermata sebagai titik awal dan menghasilkan E. Sonnhammer, C. Dessimoz, Pencarian layanan benchmark Orthologs dan

8
S. Foley et al. Genomik 114 (2022) 110431

panggilan konsensus pada tahun 2020, Nucleic Acids Res. 48 (2020) W538–W545,https://doi. org/ studi fungsional, BMC Bioinforma. 12 (2011) 357,https://doi.org/10.1186/
10.1093/nar/gkaa308. 1471-2105-12-357.
[5] SF Altschul, W. Gish, W. Miller, EW Myers, DJ Lipman, Alat pencarian penyelarasan [29] J. Huerta-Cepas, T. Gabaldón, Menugaskan peristiwa duplikasi ke skala temporal
lokal dasar, J. Mol. Biol. 215 (1990) 403–410,https://doi.org/10.1016/S0022- relatif dalam studi luas genom, Bioinformatika 27 (2011) 38–45,https://doi.org/
2836(05)80360-2. 10.1093/bioinformatics/btq609.
[6] BI Arshinoff, GA Cary, K. Karimi, S. Foley, S. Agalakov, F. Delgado, VS Lotay, C. [30] J. Huerta-Cepas, S. Capella-Gutierrez, LP Pryszcz, I. Denisov, D. Kormes,
J.Ku, TJ Pells, TR Beatman, E.Kim, RA Cameron, PD Vize, CA Telmer, J. M. Marcet-Houben, T. Gabaldón, PhylomeDB v3.0: gudang yang berkembang dari
C. Croce, CA Ettensohn, VF Hinman, Echinobase: memanfaatkan database model organisme yang kumpulan pohon genome-wide, penjajaran dan prediksi ortologi dan paralogi
masih ada untuk membangun basis pengetahuan yang mendukung penelitian tentang genomik berbasis filogeni, Nucleic Acids Res. 39 (2011) D556–D560,https://doi.org/ 10.1093/
dan biologi echinodermata, Nucleic Acids Res. 50 (2022) D970–D979,https://doi. org/10.1093/nar/ nar/gkq1109.
gkab1005. [31] J. Huerta-Cepas, F. Serra, P. Bork, ETE 3: rekonstruksi, analisis, dan visualisasi data
[7] S. Bhattacharya, R. Roche, MH Shuvo, D. Bhattacharya, Kemajuan terbaru dalam filogenomik, Mol. Biol. Evol. 33 (2016) 1635–1638,https://doi.org/10.1093/molbev/
deteksi homologi protein didorong oleh threading peta interaksi antar-residu, msw046.
Depan. Mol. Biosci. 8 (2021), 643752,https://doi.org/10.3389/ fmolb.2021.643752. [32] P. Jones, D. Binns, H.-Y. Chang, M. Fraser, W. Li, C. McAnulla, H. McWilliam,
J. Maslen, A. Mitchell, G. Nuka, S. Pesseat, AF Quinn, A. Sangrador-Vegas,
[8] C. Camacho, G. Coulouris, V. Avagyan, N. Ma, J. Papadopoulos, K. Bealer, T. M. Scheremetjew, S.-Y. Yong, R. Lopez, S. Hunter, InterProScan 5: klasifikasi fungsi
L. Madden, BLAST+: arsitektur dan aplikasi, BMC Bioinforma. 10 (2009) protein skala genom, Bioinformatika 30 (2014) 1236–1240,https://doi. org/
421,https://doi.org/10.1186/1471-2105-10-421. 10.1093/bioinformatika/btu031.
[9] S. Capella-Gutiérrez, JM Silla-Martínez, T. Gabaldón, TrimAl: alat untuk pemangkasan [33] K. Katoh, DM Standley, MAFFT perangkat lunak keselarasan urutan ganda versi 7:
penyelarasan otomatis dalam analisis filogenetik skala besar, Bioinformatika 25 (2009) peningkatan kinerja dan kegunaan, Mol. Biol. Evol. 30 (2013) 772–780, https://
1972–1973,https://doi.org/10.1093/bioinformatics/ btp348. doi.org/10.1093/molbev/mst010.
[34] T. Lassmann, ELL Sonnhammer, Kalign–algoritma penyelarasan urutan berganda
[10] GA Cary, AM Cheatle Jarvela, RD Francolini, VF Hinman, Penggunaan luas Genome dari situs yang akurat dan cepat, BMC Bioinforma. 6 (2005) 298,https://doi.org/10.1186/
pengikatan faktor transkripsi Tbrain afinitas tinggi dan rendah selama pengembangan 1471-2105-6-298.
echinodermata, Proc. Natl. Acad. Sains. AS 114 (2017) 5854–5861,https://doi. org/10.1073/ [35] M. Lechner, S. Findeiss, L. Steiner, M. Marz, PF Stadler, SJ Prohaska, Proteinortho:
pnas.1610611114. deteksi (co-)ortolog dalam analisis skala besar, BMC Bioinforma. 12 (2011) 124,
[11] GA Cary, A. Wolff, O. Zueva, J. Pattinato, VF Hinman, Analisis regenerasi larva bintang laut https://doi.org/10.1186/1471-2105-12-124.
mengungkapkan proses yang dilestarikan dari regenerasi seluruh tubuh di seluruh [36] HA Lessios, Gen spesiasi pada invertebrata laut yang bertelur bebas, Integr.
metazoa, BMC Biol. 17 (2019) 16,https://doi.org/10.1186/s12915-019-0633-9. Komp. Biol. 51 (2011) 456–465,https://doi.org/10.1093/icb/icr039.
[12] P. Dehal, JL Boore, Dua putaran duplikasi seluruh genom pada vertebrata leluhur, [37] S. Li, J. Chen, B. Liu, Protein deteksi homologi jarak jauh berdasarkan memori
PLoS Biol. 3 (2005), e314,https://doi.org/10.1371/journal. pbio.0030314. jangka pendek dua arah, BMC Bioinforma. 18 (2017) 443,https://doi.org/ 10.1186/
s12859-017-1842-2.
[13] B. Deline, JR Thompson, NS Smith, S. Zamora, IA Rahman, SL Sheffield, W. [38] A. Meyer, V. Hinman, Lengan bintang laut: aplikasi Patiria miniata yang luas sebagai
I. Ausich, TW Kammer, CD Sumrall, Evolusi dan perkembangan di awal filum, Curr. sistem model dalam biologi evolusioner, perkembangan, dan regeneratif, Curr.
Biol. 30 (2020) 1672–1679, e3,https://doi.org/10.1016/j.cub.20 20.02.054. Atas. Dev. Biol. 147 (2022) 523–543,https://doi.org/ 10.1016/bs.ctdb.2022.01.006.

[14] ES Deutekom, B. Snel, TJP van Dam, Tolok ukur metode ortologi menggunakan pola [39] J. Mistry, S. Chuguransky, L. Williams, M. Qureshi, GA Salazar, EL
filogenetik yang didefinisikan di dasar eukariota, Singkat. Informasi bio. 22 (2021), L. Sonnhammer, SCE Tosatto, L. Paladin, S. Raj, LJ Richardson, RD Finn,
https://doi.org/10.1093/bib/bbaa206. A. Bateman, Pfam: database keluarga protein tahun 2021, Nucleic Acids Res. 49
[15] IY Dolmatov, SV Afanasyev, AV Boyko, Mekanisme molekuler pembelahan pada (2021) D412–D419,https://doi.org/10.1093/nar/gkaa913.
echinodermata: analisis transkriptom, PLoS One 13 (2018), e0195836,https://doi. [40] B. Murrell, S. Moola, A. Mabona, T. Weighill, D. Sheward, SL Kosakovsky Pond,
org/10.1371/journal.pone.0195836. K. Scheffler, FUBAR: pendekatan bayesian yang cepat dan tidak dibatasi untuk seleksi
[16] RC Edgar, MUSCLE: multiple sequence alignment dengan akurasi tinggi dan inferensi, Mol. Biol. Evol. 30 (2013) 1196–1205,https://doi.org/10.1093/molbev/mst030.
throughput tinggi, Nucleic Acids Res. 32 (2004) 1792–1797,https://doi.org/
10.1093/nar/gkh340. [41] L.-T. Nguyen, HA Schmidt, A. von Haeseler, BQ Minh, IQ-TREE: algoritma stokastik
[17] DM Emms, S. Kelly, OrthoFinder: inferensi ortologi filogenetik untuk genomik yang cepat dan efektif untuk memperkirakan filogeni kemungkinan maksimum,
komparatif, Genome Biol. 20 (2019) 238,https://doi.org/10.1186/ Mol. Biol. Evol. 32 (2015) 268–274,https://doi.org/10.1093/molbev/msu300.
s13059-019-1832-y. [42] NA Nystrom, MJ Levine, RZ Roskies, JR Scott, Bridges: sumber daya HPC fleksibel yang unik
[18] R. Fernández, T. Gabaldón, Keuntungan dan kerugian gen melintasi pohon kehidupan untuk komunitas baru dan analitik data, dalam: Prosiding Konferensi XSEDE 2015 tentang
metazoa, Nat. Ekol. Evol. 4 (2020) 524–533,https://doi.org/10.1038/s41559-019-1069-x. Kemajuan Ilmiah yang Diaktifkan oleh Infrastruktur Siber yang Disempurnakan – XSEDE
[19] S. Foley, C. Ku, B. Arshinoff, V. Lotay, K. Karimi, PD Vize, V. Hinman, Integrasi peta 15, ACM Press , New York, New York, AS, 2015, hlm. 1–8,https://doi.org/
ortologi 1:1 dan dataset yang diperbarui ke dalam Echinobase, di: Database 10.1145/2792745.2792775. Dipresentasikan pada Konferensi XSEDE 2015.
(Oxford), 2021,https://doi.org/10.1093/database/baab030, 2021.
[20] D. Fuentes, M. Molina, U. Chorostecki, S. Capella-Gutiérrez, M.Marcet-Houben, [43] TA Oliver, DA Garfield, MK Manier, R. Haygood, GA Wray, SR Palumbi, Seleksi positif
T. Gabaldón, PhylomeDB V5: repositori yang diperluas untuk katalog seluruh seluruh genom dan evolusi berbasis habitat di landak laut dangkal dan dalam,
genom dari filogeni gen beranotasi, Nucleic Acids Res. 50 (2022) D1062–D1068, Genome Biol. Evol. 2 (2010) 800–814,https://doi.org/10.1093/gbe/evq063.
https://doi.org/10.1093/nar/gkab966.
[21] T. Gabaldón, Penetapan ortologi berskala besar: kembali ke filogenetik? Genom Biol. [44] G. Östlund, T. Schmitt, K. Forslund, T. Köstler, DN Messina, S. Roopra, O. Frings,
9 (2008) 235,https://doi.org/10.1186/gb-2008-9-10-235. ELL Sonnhammer, InParanoid 7: algoritme dan alat baru untuk analisis ortologi
[22] T. Gabaldón, EV Koonin, Fungsional dan implikasi evolusi dari ortologi gen, Nat. eukariotik, Nucleic Acids Res. 38 (2010) D196–D203,https://doi.org/ 10.1093/
Pendeta Genet. 14 (2013) 360–366,https://doi.org/10.1038/nrg3456. nar/gkp931.
[23] N. Glover, C. Dessimoz, I. Ebersberger, SK Forslund, T. Gabaldón, J. Huerta-Cepas, [45] E. Persson, M. Kaduk, SK Forslund, ELL Sonnhammer, Domainoid: inferensi
M.-J. Martin, M. Muffato, M. Patricio, C. Pereira, AS da Silva, Y. Wang, ortologi berorientasi domain, BMC Bioinforma. 20 (2019) 523,https://doi.org/
E. Sonnhammer, PD Thomas, Kemajuan dan aplikasi dalam pencarian 10.1186/s12859-019-3137-2.
ortolog, Mol. Biol. Evol. 36 (2019) 2157–2164,https://doi.org/10.1093/molbev/ [46] SC Potter, A. Luciani, SR Eddy, Y. Park, R. Lopez, RD Finn, server web HMMER:
msz150. pembaruan 2018, Nucleic Acids Res. 46 (2018) W200–W204,https://doi.org/
[24] MG Grabherr, BJ Haas, M. Yassour, JZ Levin, DA Thompson, I. Amit, 10.1093/nar/gky448.
X. Adiconis, L. Fan, R. Raychowdhury, Q. Zeng, Z. Chen, E. Mauceli, N. Hacohen, [47] M. Remm, CE Storm, EL Sonnhammer, Pengelompokan otomatis ortolog dan
A. Gnirke, N. Rhind, F. di Palma, BW Birren, C. Nusbaum, K. Lindblad-Toh, inparalog dari perbandingan spesies berpasangan, J. Mol. Biol. 314 (2001) 1041–
N. Friedman, A. Regev, Rakitan transkriptom lengkap dari data RNA-Seq tanpa 1052, https://doi.org/10.1006/jmbi.2000.5197.
genom referensi, Nat. Bioteknologi. 29 (2011) 644–652,https://doi.org/ 10.1038/ [48] NJ Schurch, P. Schofield, M. Gierliński, C. Cole, A. Sherstnev, V. Singh, N. Wrobel,
nbt.1883. K. Gharbi, GG Simpson, T. Owen-Hughes, M. Blaxter, GJ Barton, Berapa banyak ulangan
[25] BJ Haas, A. Papanicolaou, M. Yassour, M. Grabherr, PD Blood, J. Bowden, M. biologis yang diperlukan dalam percobaan RNA-seq dan alat ekspresi diferensial apa yang
B. Couger, D. Eccles, B. Li, M. Lieber, MD MacManes, M. Ott, J. Orvis, N. Pochet, harus Anda gunakan? RNA 22 (2016) 839–851,https://doi.org/ 10.1261/rna.053959.115.
F. Strozzi, N. Weeks, R. Westerman, T. William, CN Dewey, R. Henschel, R.
D. LeDuc, N. Friedman, A. Regev, Rekonstruksi urutan transkrip De novo dari RNA-seq [49] G. Schwarz, Memperkirakan dimensi model, Ann. Stat. 6 (1978) 461–464, https://
menggunakan platform trinitas untuk pembuatan dan analisis referensi, Nat. Protokol. 8 doi.org/10.1214/aos/1176344136.
(2013) 1494–1512,https://doi.org/10.1038/nprot.2013.084. [50] V. Sharma, N. Hecker, JG Roscito, L. Foerster, BE Langer, M. Hiller, Pendekatan genomik
[26] MW Hart, A. Foster, Gen yang sangat diekspresikan dalam gonad bintang kelelawar mengungkapkan wawasan tentang pentingnya kehilangan gen untuk adaptasi mamalia,
Patiria miniata: ontologi gen, perbedaan ekspresi, dan lokus pengenalan gamet, Nat. Komunal. 9 (2018) 1215,https://doi.org/10.1038/s41467-018- 03667-1.
Invertebr. Biol. 132 (2013) 241–250,https://doi.org/10.1111/ivb.12029.
[27] X. Hu, I. Friedberg, SwiftOrtho: pengklasifikasi ortologi genom multipel yang cepat, hemat [51] LC Smith, V. Arizza, MA Barela Hudgell, G. Barone, AG Bodnar, KM Buckley,
memori, Gigascience 8 (2019),https://doi.org/10.1093/gigascience/ giz118. V. Cunsolo, NM Dheilly, N. Franchi, SD Fugmann, R. Furukawa, J. Garcia-Arraras, JH
Henson, T. Hibino, ZH Irons, C. Li, CM Lun, AJ Majeske, M. Oren, P. Pagliara, A.
[28] Y. Hu, I. Flockhart, A. Vinayagam, C. Bergwitz, B. Berger, N. Perrimon, SE Mohr, Pinsino, DA Raftos, JP Rast, B. Samasa, D. Schillaci, C.
Pendekatan integratif untuk prediksi ortolog untuk fokus penyakit dan lainnya S. Schrankel, L. Stabili, K. Stensväg, E. Sutton, Echinodermata: kompleks

9
S. Foley et al. Genomik 114 (2022) 110431

sistem kekebalan pada echinodermata, dalam: EL Cooper (Ed.), Kemajuan dalam [58] IM Wallace, O. O'Sullivan, DG Higgins, C. Notredame, M-coffee: menggabungkan beberapa
Imunologi Komparatif, Penerbitan Internasional Springer, Cham, 2018, hlm. 409–501, metode penyelarasan urutan dengan T-coffee, Nucleic Acids Res. 34 (2006) 1692–1699,
https://doi.org/10.1007/978-3-319-76768-0_13. https://doi.org/10.1093/nar/gkl091.
[52] Z. Sun, CA Ettensohn, regulasi yang bergantung pada sinyal dari jaringan regulasi [59] S. Weaver, SD Shank, SJ Spielman, M. Li, SV Muse, SL Kosakovsky Pond, Datamonkey
gen skeletogenik landak laut, Gene Expr. Pola 16 (2014) 93–103,https://doi.org/ 2.0: aplikasi web modern untuk mengkarakterisasi proses evolusi selektif dan
10.1016/j.gep.2014.10.002. lainnya, Mol. Biol. Evol. 35 (2018) 773–777,https://doi.org/ 10.1093/molbev/msx335
[53] F. Supek, M. Bošnjak, N. Škunca, T. Šmuc, REVIGO merangkum dan memvisualisasikan daftar .
panjang istilah ontologi gen, PLoS One 6 (2011), e21800,https://doi.org/10.1371/ [60] A. Wehe, MS Bansal, JG Burleigh, O. Eulenstein, DupTree: program untuk analisis
journal.pone.0021800. filogenetik skala besar menggunakan kekikiran pohon gen, Bioinformatika 24
[54] M. Suyama, D. Torrents, P. Bork, PAL2NAL: konversi yang kuat dari susunan urutan (2008) 1540–1541,https://doi.org/10.1093/bioinformatics/btn230.
protein menjadi susunan kodon yang sesuai, Nucleic Acids Res. 34 (2006) W609– [61] CM Weisman, Asal-usul dan fungsi gen de novo: melawan segala rintangan?
W612,https://doi.org/10.1093/nar/gkl315. J.Mol. Evol. (2022)https://doi.org/10.1007/s00239-022-10055-3.
[55] J. Towns, T. Cockerill, M. Dahan, I. Foster, K. Gaither, A. Grimshaw, V. Hazlewood, [62] GW Wilburn, SR Eddy, Pencarian homologi jarak jauh dengan model Potts tersembunyi,
S. Lathrop, D. Lifka, GD Peterson, XSEDE: percepatan penemuan ilmiah, PLoS Comput. Biol. 16 (2020), e1008085,https://doi.org/10.1371/journal. pcbi.1008085.
Comput. Sains. Eng. 16 (5) (2014) 62–74, sep 2014. URL,https://doi.org/10.
1109/mcse. [63] W. Zheng, Q. Wuyun, Y. Li, SM Mortuza, C. Zhang, R. Pearce, J. Ruan, Y. Zhang, Mendeteksi
[56] Q. Tu, RA Cameron, KC Worley, RA Gibbs, EH Davidson, Struktur gen bulu babi struktur protein homologi jauh dengan menyelaraskan peta kontak berbasis jaringan
Strongylocentrotus purpuratus berdasarkan analisis transkriptom, syaraf dalam, Komputasi PLoS. Biol. 15 (2019), e1007411,https://doi.org/ 10.1371/
Genom Res. 22 (2012) 2079–2087,https://doi.org/10.1101/gr.139170.112. journal.pcbi.1007411.
[57] SM Tweedt, DH Erwin, Origin of metazoan developmental toolkits and their [64] A. Meyer, C. Ku, W. Hatleberg, CA Telmer, V. Hinman, Hipotesis baru tentang
expression in the fossil record, in: I. Ruiz-Trillo, AM Nedelcu (Eds.), Evolutionary keanekaragaman jenis sel dan kebaruan dari transkriptomik sel tunggal dan inti
Transitions to Multicellular Life, Springer Netherlands, Dordrecht, 2015, komparatif dalam echinodermata, bioRxiv. (2022).https://www.biorxiv.org/content/
hlm. 47–77,https://doi.org/10.1007/978-94-017-9642-2_3. Kemajuan dalam 10.1101/20 22.05.06.490935v1.abstrak.
Genomik Laut.

10

Anda mungkin juga menyukai