Anda di halaman 1dari 14

Machine Translated by Google

Engqvist BMC Mikrobiologi (2018) 18:177


https://doi.org/10.1186/s12866-018-1320-7

ARTIKEL PENELITIAN Akses terbuka

Menghubungkan anotasi enzim dengan


sejumlah besar suhu pertumbuhan mikroba
mengungkapkan adaptasi metabolik terhadap
pertumbuhan pada suhu yang beragam
Martin KM Engqvist

Abstrak
Latar Belakang: Suhu lingkungan dari semua habitat adalah sifat fisik utama yang membentuk biologi mikroba yang
menghuninya. Oleh karena itu, suhu pertumbuhan optimal (OGT) mikroba merupakan bagian penting dari data yang
diperlukan untuk memahami adaptasi evolusioner yang dimanifestasikan dalam urutan genom mereka. Sayangnya tidak
ada database suhu pertumbuhan atau dataset yang mudah diunduh yang mencakup sebagian besar mikroorganisme yang
dikultur. Dengan demikian kami terbatas dalam menafsirkan data genom untuk mengidentifikasi adaptasi suhu pada mikroba.
Hasil: Dalam karya ini saya berkontribusi secara signifikan untuk menutup celah ini dengan menambang data dari pusat
pengumpulan kultur utama untuk mendapatkan data suhu pertumbuhan untuk kumpulan 21.498 mikroba yang tidak berlebihan.
Kumpulan data (https://doi.org/10.5281/zenodo.1175608 ) mengandung terutama bakteri dan archaea dan mencakup
psychrophiles, mesophiles, thermophiles dan hyperthermophiles. Dengan menggunakan data ini, 43% penuh dari semua entri
protein dalam basis data UniProt dapat dianotasi dengan suhu pertumbuhan spesies dari mana mereka berasal. Saya
memvalidasi dataset dengan menunjukkan korelasi Pearson hingga 0,89 antara suhu pertumbuhan dan rata-rata enzim optima,
sifat fisiologis yang secara langsung dipengaruhi oleh suhu pertumbuhan. Menggunakan dataset suhu saya mengkorelasikan
kejadian genom anotasi fungsional enzim dengan suhu pertumbuhan. Saya mengidentifikasi 319 fungsi enzim yang meningkat
atau menurun seiring dengan suhu. Delapan jalur metabolisme secara statistik diperkaya untuk fungsi enzim ini. Selanjutnya,
saya membangun korelasi antara 33 domain fungsi yang tidak diketahui (DUFs) dengan suhu pertumbuhan mikroba, empat di
antaranya (DUF438, DUF1524, DUF1957 dan DUF3458_C) signifikan pada archaea dan bakteri.

Kesimpulan: Dataset suhu pertumbuhan memungkinkan analisis korelasi skala besar dengan fungsi enzim dan anotasi
tingkat domain. Perubahan yang bergantung pada suhu pertumbuhan dalam kemunculannya menyoroti potensi adaptasi
evolusioner. Beberapa perubahan yang diidentifikasi sebelumnya diketahui, seperti preferensi untuk biosintesis menaquinone
melalui jalur futalosin pada bakteri yang tumbuh pada suhu tinggi. Lainnya mewakili titik awal yang penting untuk studi masa
depan, seperti DUF di mana kemunculannya berubah dengan suhu. Dataset suhu pertumbuhan harus menjadi sumber daya
komunitas yang berharga dan akan menemukan kegunaan tambahan, penting, dalam menghubungkan sifat genomik,
transkriptomik, proteomik, metabolomik, fenotipik atau taksonomi dengan suhu dalam penelitian mendatang.

Kata kunci: Suhu pertumbuhan optimal, Fungsi enzim, Adaptasi suhu metabolisme, Metabolisme Archaeal dan bakteri,
Domain protein yang belum diketahui fungsinya

Korespondensi: martin.engqvist@chalmers.se
Departemen Biologi dan Teknik Biologi, Universitas Teknologi
Chalmers, Gothenburg, Swedia

© Penulis. Akses Terbuka 2018 Artikel ini didistribusikan di bawah ketentuan Lisensi Internasional Creative Commons
Attribution 4.0 (http://creativecommons.org/licenses/by/4.0/), yang mengizinkan penggunaan, distribusi, dan reproduksi
tanpa batas dalam media apa pun, asalkan Anda memberikan kredit yang sesuai kepada penulis asli dan sumbernya,
memberikan tautan ke lisensi Creative Commons, dan menunjukkan jika ada perubahan. Pengabaian Dedikasi Domain Publik
Creative Commons (http://creativecommons.org/publicdomain/zero/1.0/) berlaku untuk data yang disediakan dalam artikel ini, kecuali dinyatakan lain.
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 2 dari 14

Latar belakang [17], dianggap dipindahkan dari archaea ke bac teria [18, 19].
Fisiologi dan adaptasi evolusioner makhluk hidup
organisme dibentuk oleh faktor lingkungan yang Metabolisme sangat bervariasi di antara termofil dan
menentukan habitat di mana mereka tinggal, tetapi ketersediaan kecenderungan umum sulit untuk dibedakan karena sangat sulit
metadata yang menggambarkan lingkungan setiap habitat adalah untuk membedakan antara efek spesiasi versus penyesuaian
terbatas. Ini berlaku untuk sifat-sifat seperti pertumbuhan terhadap lingkungan ekstrem. Sebagai contoh,
suhu, pH, salinitas dan banyak lagi. Beberapa proyek yang Tiga jalur glikolitik utama digunakan oleh bakteri dalam
menangani aspek keterbatasan ini telah dipublikasikan dalam umum: glikolisis Embden-Meyerhof (EM) tradisional, jalur Entner-
beberapa tahun terakhir. Yang paling komprehensif dari ini Doudoroff, dan pentosa
adalah BacDive [1, 2] yang dibuat dengan mendigitalkan dan jalur fosfat; ketiganya juga dapat ditemukan pada bakteri termofilik
menambang catatan analog yang berisi metadata mikroba yang berbeda [20-23]. Di archaea, bagaimanapun,
[3]. Sumber daya lainnya termasuk MediaDB, yang menawarkan hanya varian modifikasi dari degradasi gula klasik
database yang dikuratori dengan tangan untuk kondisi pertumbuhan mikroba jalur diidentifikasi [23, 24]. Misalnya, Pyrococ cus furiosus
[4] dan KOMODO yang memasok komposisi media mengandung variasi nontradisional EM
untuk ribuan organisme [5]. Catatan tentang glikolisis, di mana kinase yang bergantung pada ADP terlibat
toleransi fenotipik dan lingkungan selama lebih dari 5.000 dan gliseraldehida-3-fosfat diubah langsung menjadi
spesies juga telah tersedia [6]. Satu pendekatan baru-baru ini 3-fosfogliserat, tanpa zat antara 1,3-bifo sfogliserat termolabil
memanfaatkan penambangan teks untuk menyimpulkan sejumlah besarseperti pada kolisis gli tradisional [25, 26]. Bahkan dalam taksonomi
ciri-ciri fenotipik dari literatur ilmiah dan yang sama
World Wide Web [7]. domain, set jalur yang digunakan dapat bervariasi. Analisis fluks dari
Di antara faktor lingkungan, suhu adalah unik tiga bakteri yang sangat termofilik menunjukkan bahwa
dalam hal itu melintasi hambatan fisik. Akibatnya, organisme metabolisme termofil yang dipelajari sangat tinggi
tidak dapat secara efisien melindungi diri dari suhu di berbeda, dengan perbedaan dalam jalur seperti asam amino
cara mereka melindungi diri dari pH atau salinitas eksternal yang atau metabolisme NADPH [27]. Namun, komunalitas adalah
ekstrem dengan mempertahankan konsentrasi yang curam bahwa ketiga strain sangat bergantung pada glikolisis dan
gradien di atas membran biologis. Sebaliknya, setiap molekul bio siklus TCA. Studi tentang Thermus thermophilus, mungkin
di dalam mikroorganisme harus disesuaikan dengan thermophile yang paling banyak dipelajari, mengungkapkan alternatif
suhu di mana mereka tumbuh. Hal ini membuat protein jalur sintesis asam amino, dengan lisin disintesis oleh jalur alfa-
dan metabolit dari mikroba yang tumbuh pada suhu panas sangat aminoadipat bukannya jalur dia minopimelat [28] dan homosistein
menarik untuk aplikasi bioteknologi dan industri [8]. Organisme diproduksi
dapat secara umum dari prekursor alternatif, O-asetil-L-homoserin
dikategorikan berdasarkan kisaran suhu pertumbuhan optimal [29]. T. thermophilus juga dikenal menghasilkan berbagai
mereka. Tidak ada konsensus yang dicapai mengenai poliamina, yang paling umum, spermidine dan
kisaran suhu yang tepat dari setiap kategori, di sini saya spermine, disintesis menggunakan jalur yang berbeda dari
gunakan yang berikut ini: psikrofil (<15 °C), L-arginin melalui aminopropil agmatine [30]. Analisis dari
mesofil (15–50 °C), termofil (50–80 °C) dan genom termofilik lengkap adalah metode yang banyak digunakan
hipertermofil (>80 °C). menemukan kedua jalur metabolisme baru, serta enzim potensi
Berbagai adaptasi spesifik terhadap suhu tinggi penggunaan bioteknologi [31-33]. Jalur alternatif sintesis
diketahui, dengan banyak penelitian yang berfokus pada karakteristik menaquinone (MK) adalah
genom termofilik atau molekul seperti protein ditemukan ketika tidak ada gen dari jalur klasik
dan lipid [9, 10]. Stabilitas protein termofilik dikaitkan dengan inti ditemukan dalam genom beberapa organisme mikro penghasil MK
hidrofobiknya, peningkatan jumlah [34]. Gen yang terlibat dalam sintesis MK baru
residu bermuatan dan ikatan disulfida [9, 11, 12]. jalur hadir dalam berbagai mikroorganisme termofilik, yang mungkin
Membran sel pada thermophiles dicirikan oleh: memainkan peran dalam adaptasi terhadap pertumbuhan
penghalang permeabilitas tinggi dan kapasitas untuk pada suhu tinggi, sebagai salah satu zat antara dalam
mempertahankan fase kristal cair, karena adanya lemak jenuh jalur klasik, isochorismate, dikenal termo labil [35].
asam pada bakteri, dan lipid eter di archaea [13]. Adaptasi pada
tingkat DNA juga diketahui. Sebagai contoh, Beberapa penelitian menghindari keterbatasan yang terkait dengan
genom thermophiles umumnya lebih kecil dari membandingkan sejumlah kecil spesies termofilik versus mesofilik,
orang-orang dari mesophiles, dengan pengurangan jumlah sehingga mengidentifikasi tren yang lebih umum,
beberapa anggota keluarga protein [14-16]. Transfer gen horizontal adalah
dengan melakukan analisis metagenomik lingkungan
dianggap sebagai kekuatan pendorong penting untuk termofilik sampel dari habitat ekstrim [36, 37]. Sebuah studi yang
adaptasi. Misalnya, girase terbalik, yang membandingkan metagenom yang diperoleh dari gurun yang dingin dan panas
terbukti memiliki aktivitas pendamping DNA pelindung panas menemukan thermophiles yang memiliki jumlah gen yang lebih tinggi
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 3 dari 14

terlibat dalam metabolisme dan transportasi karbohidrat Hasil


dan metabolit sekunder [38]. Hasil serupa adalah Situs web pusat pengumpulan budaya adalah sumber yang kaya untuk
ditemukan dalam penelitian lain tentang metagenom dari sumber air panas data suhu pertumbuhan
di India, di mana banyak jalur KEGG [39, 40] Hipotesis yang mendasari proyek ini adalah bahwa, mengingat
diselidiki [41, 42]. set data yang cukup besar dengan suhu pertumbuhan organisme,
Dalam karya ini saya menyelidiki tren metabolisme dalam beradaptasi korelasi yang berarti antara suhu pertumbuhan dan adaptasi biologis
untuk termofilisitas dengan membandingkan keberadaan enzim dapat dibuat. saya beralasan
metabolisme selama ribuan organisme, tumbuh pada berbagai suhu. bahwa protokol budidaya yang tersedia untuk umum dari
Saya mengidentifikasi 319 individu mikroorganisme di pusat pengumpulan stok utama dapat membentuk
reaksi enzimatik yang lebih disukai hadir pada suhu rendah atau sumber daya yang dapat ditambang untuk pertumbuhan tersebut
tinggi, yang menunjukkan adaptasi metabolik. Saya mengidentifikasi suhu. Perangkat lunak khusus dengan Python (http://
delapan jalur yaitu www.python.org) dirancang untuk secara sistematis mengunduh
berlebihan dalam perubahan metabolisme. Ini mungkin merupakan semua halaman web publik yang berisi organisme dalam formasi
bagian dari metabolisme yang sangat penting untuk adaptasi dari empat pusat pengumpulan stok: ATCC
terhadap pertumbuhan di tempat yang berbeda (http://www.lgcstandards-atcc.org), DSMZ (http://
suhu. Akhirnya, saya menunjukkan bahwa 33 domain protein dari www.dsmz.de), NCTC (http://www.phe-culturecollec tions.org.uk)
fungsi yang tidak diketahui (DUF) juga berkorelasi dengan pertumbuhan dan NIES (http://www.shigen.nig.ac.jp).
suhu, hasil yang dapat memberikan petunjuk penting Masing-masing halaman ini kemudian ditambang untuk organisme
untuk fungsi mereka. Mengaktifkan pendekatan ini adalah hal yang unik nama dan suhu pertumbuhan (Gbr. 1a). Stok kelima
kumpulan data 21.498 organisme dengan suhu pertumbuhannya, pusat, koleksi saham Institut Pasteur (http://
yang saya peroleh melalui penambangan data publik www.research.pasteur.fr/en/team/biological-resources--
protokol kultur organisme yang tersedia dari pusat pengumpulan tengah/) menyediakan tabel excel dengan nama organisme
kultur utama. Saya membuat data ini tersedia untuk memungkinkan dan suhu pertumbuhan berdasarkan permintaan. Akhirnya, organisme
peneliti mendapatkan wawasan tambahan tentang suhu pertumbuhan dari database BacDive [1, 2]
adaptasi evolusioner yang bergantung pada suhu. dikumpulkan menggunakan skrip yang berinteraksi dengan publik

sebuah b

Gbr. 1 Pusat pengumpulan kultur mewakili sumber yang kaya untuk data suhu pertumbuhan. a Skema ikhtisar yang menunjukkan bagaimana pertumbuhan
dataset suhu diperoleh. b Perbandingan basis data yang menunjukkan jumlah organisme unik terbesar yang tidak ada di
yang lain. Total sumber daya menunjukkan jumlah total organisme di setiap basis data, unik untuk sumber daya menunjukkan berapa banyak organisme di dalamnya
database yang unik. c Sebuah plot biola yang menunjukkan distribusi pertumbuhan suhu pertumbuhan dalam dataset untuk masing-masing dari tiga domain
kehidupan. Titik putih mewakili median. Bilah hitam lebar mewakili kuartil atas dan bawah, yang berisi 50% titik data.
Garis hitam tipis mewakili nilai yang berdekatan atas dan bawah. Bentuk plot luar adalah plot kepadatan kernel yang memvisualisasikan probabilitas
distribusi data
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 4 dari 14

API. Prosedur ini menghasilkan lebih dari 160.000 catatan, suhu enzim yang ditentukan secara eksperimental
banyak di antaranya adalah deposisi terpisah untuk hal yang sama diekstraksi dari database enzim BRENDA [43]
jenis. Penting untuk dicatat bahwa catatan ini berlaku (https://www.brenda-enzymes.org). Data yang dihasilkan
suhu yang dilaporkan oleh sejumlah besar peneliti individu untuk mengandung suhu yang ditentukan secara eksperimental sebesar
kultur organisme dalam berbagai aktivitas enzimatik maksimal ("Suhu"
kondisi pertumbuhan. Dalam beberapa kasus mereka akan mewakili benar kategori data optimum” dalam BRENDA) untuk 31.826 enzim,
suhu pertumbuhan yang optimal, di lain mereka mungkin hanya bersumber dari 3.421 organisme. Dataset ini disebut sebagai
mewakili suhu di mana organisme berada dataset suhu enzim. Secara keseluruhan
ditumbuhkan oleh peneliti itu, tanpa optimal yang sebenarnya distribusi suhu pertumbuhan (Gbr. 2a) berbeda dibandingkan
telah ditentukan. dengan distribusi suhu enzim secara keseluruhan
Nama-nama organisme diciutkan ke tingkat spesies optima (Gbr. 2b). Mayoritas (88%) suhu pertumbuhan berada
(mengabaikan penunjukan regangan) dan suhu pertumbuhan pada kisaran antara 20 °C dan 40 °C, dengan
dalam setiap spesies dirata-ratakan. Prosedur ini adalah penurunan mendadak dalam jumlah organisme yang tumbuh
dilakukan untuk memfasilitasi pemetaan taksonomi hilir pada suhu di atas 40 °C. Sebagai perbandingan, sebagian besar
dan perbandingan lintas-basis data (lihat di bawah). Pendekatan optimal suhu enzim juga berada dalam kisaran antara
ini dibenarkan karena suhu pertumbuhan 99,7% dari 20 °C dan 40 °C (64%), tetapi distribusinya menurun
semua strain dalam dataset kurang dari 10 °C dari jauh lebih drastis di atas kisaran suhu ini.
rata-rata spesies yang dihitung dan 96,4% kurang dari 5 °C Untuk dapat mengkorelasikan suhu pertumbuhan dengan en
(Berkas tambahan 1: Gambar S1). Jumlah organisme zyme optima, organisme yang ada di kedua set data adalah
di masing-masing database dibandingkan (Gbr. 1b). Jumlah diidentifikasi (Gbr. 2c). Dari 21.498 organisme dengan pertumbuhan
dari 21.498 nama organisme unik yang digabungkan dengan suhu dan 3.421 organisme dengan enzim
suhu pertumbuhan diperoleh. ATCC dan BacDive suhu optimal hanya 1.811 yang hadir di keduanya
memiliki jumlah organisme unik terbesar yang kumpulan data. Dari ini ditentukan secara eksperimental
tidak ada di database lain, dengan 6.852 dan 2.211 suhu optimal untuk 18.135 enzim yang tersedia.
masing-masing. Secara berurutan, DSMZ, NCTC, NIES dan Pasteur Skor jarak sederhana dihitung dengan mengurangkan
memiliki 854, 44, 749 dan 415 organisme yang unik suhu pertumbuhan masing-masing organisme dari masing-masing
ada di masing-masing database. individu enzim suhu optimum (Gbr. 2d). Enzim
Setiap nama organisme dalam dataset dipetakan ke a dengan optima tepat pada suhu pertumbuhan memiliki
pengenal taksonomi menggunakan sumber daya taksonomi NBCI skor jarak 0 °C. Mereka yang memiliki optimal
(https://www.ncbi.nlm.nih.gov/taxonomy). Data lebih tinggi dari suhu pertumbuhan memiliki skor jarak positif,
dari semua database digabungkan menjadi satu dengan besaran yang sama dengan suhu
kumpulan data non-redundan, yang disebut sebagai perbedaan. Enzim dengan nilai optimum lebih rendah dari
kumpulan data suhu pertumbuhan. Sebagian besar organisme suhu pertumbuhan memiliki skor jarak negatif. Enzim dengan
dalam dataset (62%) terdiri dari bakteri (Gbr. 1c). optima antara 20 dan 100 °C bisa jadi
Sebagian besar adalah psikrofil dan mesofil. Hanya ditemukan di seluruh kisaran suhu pertumbuhan,
sejumlah kecil adalah termofil. Archaea membentuk 36% menunjukkan bahwa tidak semua enzim cocok dengan organisme
dari semua organisme dalam kumpulan data, dengan distribusi suhu pertumbuhan (Gbr. 2d). Meskipun penyimpangan ini
yang lebih merata antara mesofil, termofil, dan dari yang diharapkan, setengah (51%) dari pengukuran enzim
hipertermofil. Eukariota, terutama terdiri dari jamur sebenarnya berada dalam ±10 °C dari pertumbuhan
dan protista, hanya 2% dari kumpulan data dan mencakup psikrofil suhu dan 67% berada dalam ± 15 ° C dari pertumbuhan
dan mesofil. Secara umum suhu, menunjukkan bahwa suhu pertumbuhan mungkin
kumpulan data berisi lebih banyak psikrofil dan meso fil daripada indikator yang baik untuk sebagian besar enzim optima.
termofil dan hipertermofil (Gbr. 1). Korelasi ini diselidiki lebih lanjut dengan membandingkan
1c). Dataset suhu pertumbuhan tersedia suhu pertumbuhan masing-masing organisme dengan rata-rata
untuk digunakan kembali oleh peneliti lain sebagai file tab-delimited sebagai en zyme optima dihitung dengan peningkatan jumlah
serta dalam format xml di Zenodo (https://zenodo.org/ enzim rata-rata dari organisme itu, mulai dari 1
; doi: https://doi.org/10.5281/zenodo.1175609). sampai 100 (Gbr. 2e). Ada kecenderungan yang jelas untuk hubungan
korelasi yang lebih kuat antara pertumbuhan dan suhu enzim ketika
Suhu pertumbuhan berkorelasi kuat dengan mean meningkatkan jumlah enzim rata-rata. Hasil ini
enzim optimal menunjukkan bahwa satu enzim yang dipilih secara acak (n = 1) adalah
Dataset suhu pertumbuhan divalidasi dengan menyelidiki korelasi prediktor yang tidak tepat dari suhu pertumbuhan dengan
antara suhu pertumbuhan Korelasi Pearson sebesar 0,48. (Gbr. 2e, lingkaran paling bawah).
setiap organisme dan suhu optimum enzim dari organisme Namun, rata-rata optimum dari setidaknya lima enzim
tersebut. Untuk validasi ini semua tidak menampilkan koefisien korelasi Pearson lebih besar
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 5 dari 14

sebuah c

e f

Gbr. 2 Suhu pertumbuhan berkorelasi kuat dengan rata-rata enzim optima. a Distribusi suhu pertumbuhan untuk semua organisme dalam dataset
suhu pertumbuhan. b Distribusi optima yang ditentukan secara eksperimental untuk 31.826 enzim yang diperoleh dari database BRENDA. c Diagram
Venn yang menunjukkan jumlah organisme yang ada di setiap set data suhu pertumbuhan, dataset suhu enzim, serta jumlah organisme yang ada
di keduanya. d Jarak skor suhu optimum enzim individu dengan suhu pertumbuhan. Garis abu-abu horizontal menunjukkan kesepakatan yang
sempurna antara dua nilai. Dua garis putus-putus diagonal menunjukkan optimum suhu enzim mutlak 0 °C dan 100 °C. Warna menunjukkan
kerapatan titik dengan warna yang lebih cerah dan lebih hijau menunjukkan kerapatan yang lebih tinggi. e Sebuah plot sensitivitas menunjukkan
koefisien korelasi Pearson antara suhu optimum enzim dan suhu pertumbuhan. Setiap titik data mewakili koefisien korelasi yang diperoleh antara
suhu optimum rata-rata dari n sampel enzim dalam rentang 1 < = n < = 100 dan suhu pertumbuhan. Rata-rata lima enzim atau lebih mencapai koefisien
korelasi di atas 0,75. f Sebuah scatterplot yang membandingkan suhu pertumbuhan organisme dengan lebih dari lima suhu optimal enzim yang
dilaporkan dengan suhu optimum rata-rata semua enzim yang dilaporkan untuk organisme itu. Garis abu-abu diagonal menunjukkan korelasi positif
sempurna. Garis hitam tebal mewakili regresi polinomial berbobot lokal. Koefisien korelasi Pearson diberikan
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 6 dari 14

dari 0,75. Diharapkan katalitik yang optimal Dalam dataset suhu pertumbuhan terdapat lebih banyak bakteri
suhu enzim mengikuti suhu pertumbuhan, secara proporsional pada suhu pertumbuhan rendah dan
korelasi tinggi yang terlihat antara kedua variabel ini adalah secara proporsional lebih archaea pada suhu pertumbuhan tinggi
oleh karena itu validasi dataset suhu pertumbuhan. (File tambahan 2: Gambar S2). Menghubungkan angka EC dan
suhu pertumbuhan untuk seluruh kumpulan data mungkin
Banyak fungsi enzim berkorelasi dengan suhu karena itu soroti yang berbeda di antara keduanya
Berbagai pertanyaan biologis mungkin diselidiki oleh: domain kehidupan, bukan yang mewakili sinyal yang benar untuk
mengkorelasikan sifat biologis dengan suhu pertumbuhan yang adaptasi suhu. Bakteri dan archaea
dikumpulkan atau organisme. Ini bisa termasuk transkriptomik gen, karena itu dianalisis secara terpisah. Koefisien korelasi Spearman
sifat proteomik, metabolomik, antara suhu pertumbuhan dan
omik, fenotipik atau taksonomi. Untuk menguji ide ini, saya rasio kejadian enzim dihitung untuk setiap EC
fungsi enzim yang berkorelasi, diklasifikasikan berdasarkan nomor nomor dan koreksi nilai-p yang diperoleh (Tambahan
misi Enzyme Com (nomor EC), dengan suhu pertumbuhan dalam file 3: Gambar S3). Kekhawatiran dalam analisis ini adalah bahwa
upaya untuk mengidentifikasi ketergantungan suhu dapat menghasilkan positif palsu yang mewakili fungsi enzim yang
adaptasi metabolik. Keterbatasan dalam pendekatan ini adalah hanya ada pada organisme yang terkait erat dengan a
bahwa itu hanya berfokus pada fungsi enzim yang diketahui dan distribusi suhu pertumbuhan terbatas. Untuk menghapus
yang baru tidak dapat diidentifikasi secara langsung. Anotasi yang positif palsu seperti itu - dan pertahankan hanya yang mungkin
hilang serta anotasi yang salah juga menimbulkan gangguan di mewakili strategi umum adaptasi suhu - a
analisis ini. Selain itu, penting untuk mempertimbangkan tahap penyaringan berdasarkan jarak filogenetik yang dilakukan.
bahwa keberadaan urutan pengkodean enzim dalam a Fungsi enzim dengan korelasi yang signifikan
kumpulan data tidak berarti itu diekspresikan dan berfungsi dalam a (nilai p yang dikoreksi di bawah 0,01) dengan demikian disaring untuk
organisme yang diberikan. mempertahankan hanya mereka yang memiliki distribusi filogenetik
Untuk mendapatkan satu set fungsi enzim untuk analisis semua 88. yang luas, yang ditunjukkan oleh skor jarak filogenetik setidaknya enam
6 juta catatan protein dari database UniProt [44] (lihat Metode untuk detailnya).
(https://www.uniprot.org/) telah diunduh. Ini, Dari 3.551 nomor EC yang dipetakan total 319
43% (38,3 juta) dapat dijelaskan dengan pertumbuhan nomor EC unik yang tersisa setelah penyaringan (total 340
suhu organisme dari mana mereka berasal - contoh ketika menghitung nomor EC berulang),
menggunakan dataset suhu pertumbuhan. nomor EC, sembilan menunjukkan korelasi positif yang signifikan secara statistik dalam
kemudian diperoleh untuk setiap kabel yang cocok, jika ada, archaea dan 55 pada bakteri (Gbr. 3c dan d, panel atas;
menggunakan alat pemetaan ID UniProt File tambahan 5: significant_ec.tsv). Sebaliknya, 86 enzim dari
(https://www.uniprot.org/uploadlists/). Hal ini mengakibatkan archaea menunjukkan korelasi negatif dengan
pemetaan 3.551 nomor EC unik, yang kira-kira setengah dari yang suhu dan 190 pada bakteri (Gbr. 3c dan d, bawah
saat ini terdaftar di panel; File tambahan 5: significant_ec.tsv). 14 nomor EC berulang
database BRENDA. Untuk analisis selanjutnya, ote Eukary baik dalam dataset archaeal dan bakteri dengan
dikeluarkan karena rentang pertumbuhannya yang terbatas korelasi yang sama dan 7 angka EC menunjukkan kebalikannya
suhu dalam kumpulan data. korelasi di archaea dibandingkan dengan bakteri. Bersama,
Dataset suhu pertumbuhan sangat miring 319 angka EC ini dapat menjelaskan penyesuaian adaptasi
terhadap organisme yang tumbuh antara 20 °C dan 40 °C metabolik yang penting untuk pertumbuhan di berbagai
(Gbr. 1c). Kemiringan data ini akan mengganggu suhu.
dengan analisis korelasi. Oleh karena itu, untuk setiap nomor EC
individu, rasio organisme yang memiliki Jalur metabolisme tertentu diperkaya untuk
setidaknya satu protein yang membawa anotasi itu - versus fungsi enzim yang berkorelasi
organisme yang tidak - dihitung untuk mendapatkan nilai tunggal Untuk mengambil analisis satu langkah lebih jauh, saya menyelidiki
pada setiap suhu pertumbuhan. Ini apakah ada bagian metabolisme yang diperkaya untuk fungsi
menghasilkan distribusi rasio di atas yang dianalisis enzim yang diidentifikasi pada langkah sebelumnya. Pengayaan
suhu untuk setiap nomor EC individu. Pemotongan ditetapkan, tersebut akan melibatkan jalur metabolisme tertentu,
termasuk dalam perhitungan hanya organisme dengan setidaknya atau serangkaian jalur terkait, dalam proses beradaptasi dengan
1.000 catatan protein, sebagai suhu pertumbuhan yang berbeda. Fungsi enzim
ditentukan oleh plot sensitivitas (Gbr. 3a). Potongan ini dipetakan ke KEGG (http://www.genome.jp/kegg)
digunakan untuk menghilangkan kebisingan yang disebabkan oleh organisme dengan jalur dan tes hipergeometrik diterapkan untuk menguji
sangat sedikit entri di UniProt. Proporsi protein yang dianotasi untuk pengayaan. Delapan dari 155 jalur KEGG adalah
sebagai enzim tetap kira-kira secara statistik diperkaya untuk fungsi enzim. Ini
konstan di seluruh suhu pertumbuhan di kedua archaea adalah: siklus TCA (KEGG jalur map00020), ubiquin satu dan
dan bakteri (Gbr. 3b). biosintesis terpenoid-kuinon lainnya (KEGG
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 7 dari 14

sebuah b

Gambar 3 Banyak fungsi enzim yang berhubungan dengan suhu. a Plot sensitivitas yang menunjukkan jumlah nomor EC yang signifikan (nilai p terkoreksi
< 0,01) diperoleh pada batas yang berbeda untuk jumlah minimum entri UniProt per organisme. Garis putus-putus abu-abu menunjukkan batas yang dipilih. b
Anotasi enzim sebagai bagian dari proteom. Setiap titik mewakili rata-rata untuk semua organisme yang tumbuh pada suhu tertentu. Itu
berarti untuk archaea dan bakteri dihitung secara terpisah. c Peta panas menunjukkan bagaimana terjadinya perubahan angka EC yang signifikan dengan
suhu pertumbuhan di archaea. Setiap baris mewakili nomor EC yang berbeda dan setiap kolom suhu pertumbuhan yang berbeda. Semua termasuk EC
angka-angka tersebut secara statistik berkorelasi (nilai p terkoreksi < 0,01) baik secara positif (merah) atau negatif (biru) dengan suhu pertumbuhan dan minimum
skor jarak filogenetik enam (lihat Metode untuk detailnya). Untuk setiap suhu pertumbuhan yang dilaporkan, rasio organisme yang mengandung masing-masing
anotasi EC spesifik ditunjukkan oleh intensitas warna. Abu-abu menunjukkan suhu di mana tidak ada suhu pertumbuhan yang tersedia di
Himpunan data. d Analisis dan skala warna seperti pada c, tetapi dilakukan dengan data dari bakteri. r menunjukkan koefisien korelasi Spearman

jalur map00130), metabolisme purin (jalur KEGG yang menunjukkan korelasi negatif dengan suhu pertumbuhan
map00230), metabolisme sistein dan metionin (KEGG (Gbr. 4b). Dua jalur metabolisme yang berbeda menyebabkan
Pathway map00270), metabolisme piruvat (KEGG path way sintesis menaquinone dari chorismate. Yang pertama, disebut
map00620), satu kumpulan karbon oleh folat (KEGG path jalur futalosin, mengandung tiga enzim yang menunjukkan
way map00670), metabolisme metana (Jalur KEGG korelasi positif dengan suhu (Gbr. 4c). Kedua
map00680), dan jalur fiksasi karbon pada prokariota Jalur biosintesis menaquinone mengandung lima enzim yang
(peta jalur KEGG00720). menunjukkan korelasi negatif dengan pertumbuhan
Untuk menyoroti salah satu jalur ini sebagian dari suhu dan tidak hadir pada suhu tinggi
“ubiquinone dan biosintesis terpenoid-quinone lainnya (Gbr. 4d). Data ini menunjukkan bahwa adaptasi evolusioner
jalur” disajikan pada Gambar. 4a dengan data dari bakteri. terhadap pertumbuhan pada suhu tinggi di banyak bakteri adalah untuk
Jalur sintesis ubiquinone mengandung tiga enzim: biosintesis menaquinone melalui jalur futalosin.
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 8 dari 14

sebuah

b c

Gbr. 4 Jalur metabolisme tertentu diperkaya untuk fungsi enzim yang berkorelasi. a Diagram jalur yang menunjukkan bagian dari jalur KEGG
"ubiquinon dan jalur biosintesis terpenoid-kuinon lainnya" (map00130). Enzim yang kemunculannya secara signifikan berkorelasi dengan pertumbuhan
suhu (nilai p terkoreksi < 0,01) ditunjukkan dengan warna merah (korelasi positif) atau biru (korelasi negatif). b. Adanya enzim
berpartisipasi dalam biosintesis perubahan Ubiquinone dengan suhu. Setiap titik menunjukkan terjadinya nomor EC sebagai rasio nya
kehadiran di semua organisme yang tumbuh pada suhu tertentu. Garis mewakili regresi polinomial berbobot lokal dengan kepercayaan 95%
pita untuk garis regresi yang ditunjukkan dalam warna abu-abu. r menunjukkan koefisien korelasi Spearman. c Kehadiran enzim yang berpartisipasi dalam
biosintesis menaquinone melalui jalur futalosin berubah dengan suhu. d Kehadiran enzim yang berpartisipasi dalam biosintesis
menaquinone melalui jalur klasik berubah dengan suhu

Domain fungsi yang tidak diketahui berkorelasi dengan suhu dapat diidentifikasi dari data urutan saja dan salah satunya adalah
Analisis korelasi EC terbatas karena hanya dapat karena itu tidak terbatas pada apa yang diketahui melalui
memanfaatkan fungsi enzim yang telah dikarakterisasi. eksperimen. Dari 3.918 total DUF, 98 di antaranya berkorelasi
Aktivitas yang tidak diketahui "tersembunyi" dan tidak dapat signifikan dengan suhu (File tambahan 4:
dikorelasikan. Untuk mengatasi keterbatasan ini saya melakukan Gambar S4), 33 di antaranya juga memiliki distribusi filogenetik
yang luas (Gbr. 5, File tambahan 6: significant_duf.tsv).
analisis akhir di mana domain fungsi yang tidak diketahui (DUFs) adalah
berkorelasi dengan suhu dengan cara yang sama seperti Empat dari 33 berkorelasi positif di archaea, dan
nomor EC. DUF adalah domain yang menunjukkan yang dilestarikan delapan berkorelasi negatif (Gbr. 5a). Tujuh belas adalah
pola dalam urutan primer protein, tetapi untuk yang berkorelasi positif pada bakteri dan delapan berkorelasi negatif
fungsi protein di mana mereka terjadi tidak diketahui. (Gbr. 5b). Dua di antaranya, DUF438
Ini menguntungkan untuk analisis sejauh mereka (PF04282) dan DUF1957 (PF09210), secara positif
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 9 dari 14

sebuah

Gbr. 5 Domain fungsi yang tidak diketahui berkorelasi dengan suhu. a Heat-maps menunjukkan bagaimana terjadinya DUF yang signifikan berubah dengan
suhu pertumbuhan di archaea. Setiap baris mewakili DUF yang berbeda dan setiap kolom memiliki suhu pertumbuhan yang berbeda. Semua DUF yang disertakan adalah
berkorelasi secara statistik (nilai p terkoreksi < 0,01) baik positif (merah) atau negatif (biru) dengan suhu pertumbuhan dan filogenetik minimum
skor distribusi enam (lihat Metode untuk rincian). Untuk setiap suhu pertumbuhan yang dilaporkan, rasio organisme yang mengandung masing-masing DUF . spesifik
anotasi ditunjukkan oleh intensitas warna. Abu-abu menunjukkan suhu di mana tidak ada suhu pertumbuhan yang tersedia dalam dataset. b
Analisis dan skala warna seperti pada, tetapi dilakukan dengan data dari bakteri

berkorelasi di kedua archaea dan bakteri. Juga untuk korelasi enzim dari termofilik dan hipertermofilik
negatif dua domain, DUF3458_C (PF17432) organisme mungkin menjelaskan perataan di atas 40 °C
dan DUF1524 (PF07510), muncul di archaea dan histogram suhu enzim (Gbr. 2b), dibandingkan dengan histogram
bakteri. suhu pertumbuhan (Gbr. 2a).
Kecenderungan protein mesofilik menjadi katalitik aktif pada
Diskusi suhu yang lebih tinggi dari yang diharapkan sesuai dengan
Dataset yang dikumpulkan dalam karya ini, terdiri dari 21.498 pengamatan yang dibuat oleh Dehouck dan rekan [45]. Yang lemah
nama organisme dan suhu pertumbuhan, dianggap lebih besar korelasi antara optima enzim individu dan pertumbuhan
daripada yang tersedia melalui BacDive [1, 2], suhu ditunjukkan dalam penelitian itu, meskipun dengan suhu yang lebih kecil
MediaDB [4] dan IJSEM [6]. Kelengkapan dari kumpulan data [45]. Wawasan baru yang diperoleh dalam pekerjaan saat ini adalah
dataset ditunjukkan oleh fakta bahwa 43% dari semua bahwa rata-rata optimal katalitik dari setidaknya lima enzim
entri di UniProt dapat dijelaskan dengan pertumbuhan berkorelasi kuat (korelasi Pearson > 0,75) dengan
suhu organisme dari mana mereka berasal. suhu pertumbuhan di seluruh organisme yang dianalisis
Ini sangat mengesankan mengingat kumpulan data berfokus (Gbr. 2e dan f). Ini memberikan validasi penting dari
pada mikroba dan banyak organisme dalam basis data Uni Prot akurasi dataset suhu pertumbuhan.
tidak termasuk dalam kategori ini – misalnya Mengejutkan bahwa banyak enzim individu dalam mofil dan
urutan mamalia atau tumbuhan. Dalam dataset ada hipertermofil memiliki optimalisasi katalitik
proporsi organisme mesofilik yang sangat tinggi dibandingkan jauh lebih rendah dari suhu pertumbuhan (Gbr. 2d). Faktanya,
untuk termofilik (Gbr. 1c). Penurunan tajam dalam pertumbuhan bahkan stabilitas rata-rata semua enzim yang dicirikan dari
suhu di atas 40 °C sangat cocok dengan yang dilihat oleh organisme ini berada pada urutan 10 hingga 20 °C
Barberan dan rekan [6]. Sejauh mana ini mencerminkan lebih rendah dari suhu pertumbuhan (Gbr. 2f). Telah
distribusi suhu pertumbuhan yang sebenarnya secara alami diusulkan sebelumnya bahwa adaptasi suhu pada mofil dan
organisme yang terjadi, dan sejauh mana bias ini disebabkan hipertermofil dapat dihasilkan dari faktor ekstrinsik untuk
oleh apa yang telah dipilih peneliti untuk dipelajari menstabilkan proteom - selain
tidak jelas. adaptasi dalam urutan dan lipatan protein. Ini mungkin termasuk
Ketika membandingkan enzim optima (suhu zat terlarut yang kompatibel [46] seperti digliserol fosfat [47], di-
dengan aktivitas katalitik maksimal seperti yang dilaporkan dalam myo-inositol-fosfat [48], peningkatan
Basis data BRENDA) dengan suhu pertumbuhan ada tindakan oleh pendamping, tingkat pergantian protein yang lebih
dua aspek penting: Pertama, protein dari mesofil tinggi, kepadatan molekuler, atau mekanisme lain yang belum
cenderung lebih stabil dari yang diharapkan berdasarkan ditemukan. Perbedaan suhu pertumbuhan dan
suhu pertumbuhan. Kedua, protein dari thermophiles dan enzim optima dalam termofil yang disajikan di sini mendukung
hyperthermiphiles cenderung kurang stabil daripada gagasan bahwa faktor ekstrinsik seperti itu penting.
diharapkan (Gbr. 2d dan f). Bersama-sama, yang tak terduga Kebutuhan untuk mengembangkan adaptasi untuk menstabilkan secara global
stabilitas tinggi dari banyak enzim yang berasal dari mesophilic proteom kemungkinan muncul dari fakta bahwa mutasi acak
organisme, dan stabilitas rendah yang tak terduga dari banyak dalam protein termostabil lebih cenderung mengarah ke
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 10 dari 14

penurunan stabilitas dibandingkan dengan mutasi acak pada a dan menyoroti bagian-bagian metabolisme di bawah tekanan evolusi
protein yang cukup stabil [49]. Efek ini menjadi lebih yang lebih tinggi untuk berubah dengan suhu.
diucapkan dengan meningkatnya suhu pertumbuhan dan Salah satu jalur yang diperkaya yang diidentifikasi di sini berisi
membuatnya semakin sulit untuk mengembangkan protein yang lebih enzim metabolisme kuinon. Sebagian kecil bakteri
stabil. Ini juga membuat thermophiles lebih sensitif terhadap mensintesis ubiquinon [52, 53]. Hasil yang didapat dalam
mutasi acak dari mesophiles dan pada dasarnya menempatkan penelitian ini menunjukkan bahwa di antara ini yang melakukan sintesis, the
sebuah "batas kecepatan evolusi" [49]. Saya berspekulasi bahwa terjadinya penurunan gen biosintesis ubiquinone
adaptasi yang berkembang (faktor ekstrinsik) yang menstabilkan keseluruhandengan suhu (Gbr. 4a dan b). Sintesis menakuinon
proteome memberikan solusi untuk kedua kesulitan terjadi melalui dua jalur, klasik dan futalosin, dan
mengembangkan protein yang sangat stabil serta cara untuk gen yang terlibat dalam jalur futalosin hadir dalam a
mengurangi beberapa risiko yang ditimbulkan oleh mutasi acak, berbagai mikroorganisme termofilik [34]. Di sini, saya memberikan
memungkinkan organisme untuk mentolerir tingkat mutasi yang lebih tinggi.bukti bahwa jalur futalosin tidak hanya
Alam memberikan banyak contoh evolusi lainnya hadir dalam organisme termofilik, tetapi sebenarnya yang berlaku
adaptasi yang memodifikasi fisiokimia intraseluler pada suhu pertumbuhan tinggi pada bakteri. Saya
lingkungan untuk memastikan fungsi protein yang berspekulasi bahwa ini mungkin adaptasi evolusioner
berfungsi buruk dalam kondisi lingkungan. Misalnya, mengembangkan mencerminkan fakta bahwa jalur klasik mengandung
heterokista untuk memastikan lingkungan mikrooksik isokorimat menengah termolabil [35].
untuk fiksasi N2 oleh nitrogenase di filamen cyanobacter teria [50], Untuk memperluas analisis saya ke fungsi protein yang memiliki
dan anatomi Krantz untuk berkonsentrasi CO2 untuk belum ditentukan saya mengkorelasikan terjadinya do mains of
fiksasi karbon oleh Rubisco pada tanaman C4 [51]. unknown function (DUFs) dengan suhu.
Untuk archaea dan bakteri ada beberapa kali 33 domain signifikan yang diidentifikasi (Gbr. 5, Tambahan
lebih banyak enzim yang kemunculannya berkorelasi negatif dengan file 6: signifikan_duf.tsv) dapat mewakili fungsi penting untuk adaptasi
suhu (lebih ada pada pertumbuhan rendah) terhadap pertumbuhan pada suhu yang beragam.
suhu) daripada yang berkorelasi positif Menggunakan pendekatan komputasi untuk mendapatkan wawasan
(Gbr. 3c dan d; File tambahan 5: significant_ec.tsv). Secara khusus, tentang fungsi DUF telah dilakukan sebelumnya. Untuk
terdapat 64 fungsi enzim yang berkorelasi positif dengan suhu dan contoh, daftar 238 DUF esensial (eDUFS), adalah
276 fungsi yang berkorelasi positif dengan suhu diidentifikasi berdasarkan keberadaan mereka dalam protein esensial
berkorelasi negatif. Saya berspekulasi bahwa perbedaan ini adalah pada bakteri [54]. Pendekatan lain memanfaatkan remote
hasil langsung dari mesophiles yang telah dipelajari untuk a deteksi kesamaan untuk membangun hubungan struktur-fungsi untuk
derajat yang lebih tinggi dari thermophiles dan hyperthermophiles, 614 keluarga DUF, sehingga memberikan petunjuk untuk
menghasilkan lebih banyak fungsi enzim yang diketahui penting untuk fungsinya [55]. Pendekatan eksperimental, terutama
pertumbuhan pada suhu mesofilik. bahwa genomik struktural, juga telah digunakan untuk
Dalam perpanjangan logis dari argumen ini saya mengusulkan bahwa a mendapatkan informasi tambahan tentang DUF [56]. Sepengetahuan
sejumlah besar fungsi enzim kemungkinan tetap saya, pendekatan yang diuraikan di sini adalah yang pertama diberikan
ditemukan pada organisme termofilik. Masing-masing dari 319 bukti yang menghubungkan DUF dengan suhu diduga
enzim di sini terbukti hadir secara berbeda pada berbagai suhu adaptasi pada bakteri dan archaea. Dengan demikian, 33 . ini
pertumbuhan menyoroti target penting untuk domain memberikan titik awal yang penting untuk masa depan
generasi hipotesis masa depan dan penyelidikan eksperimental. studi.
Secara khusus, studi lebih lanjut diperlukan untuk menentukan
apakah korelasi tersebut mencerminkan kausalitas yang sebenarnya. Kesimpulan
Dari delapan jalur KEGG - dengan signifikan Dalam penelitian ini saya menambang dan menyediakan suhu
representasi berlebihan dari enzim yang berubah dengan suhu pertumbuhan untuk 21.498 organisme. Kumpulan data ini komprehensif
- empat sebelumnya diidentifikasi sebagai terlalu terwakili dalam dan memungkinkan anotasi suhu pertumbuhan 43% dari
studi metagenomik habitat suhu tinggi [41, 42]: semua urutan di UniProt. Anotasi ini dapat digunakan untuk
jalur fiksasi karbon pada prokariota, metabolisme piruvat, metabolisme menghubungkan fungsi enzim dan tingkat domain
metana dan metabolisme purin. Itu anotasi untuk menyoroti tergantung pada suhu pertumbuhan
Siklus TCA, jalur KEGG lain yang diperkaya, diketahui perubahan dalam kejadiannya. Dalam beberapa kasus, analisis ini
secara luas digunakan dalam tiga bakteri termofilik [27]. mengkonfirmasi apa yang diketahui, seperti preferensi untuk
Dalam pendekatan saya, dengan mengidentifikasi jalur dengan enzim biosintesis menaquinone melalui jalur futalosin
yang kemunculannya sangat berkorelasi dengan suhu pertumbuhan, pada bakteri yang tumbuh pada suhu tinggi. Dalam kasus lain
saya memperkuat argumen bahwa jalur ini adalah hasilnya mewakili titik awal yang penting untuk masa depan
di bawah tekanan evolusioner dalam adaptasi suhu. Dia studi, misalnya dalam menyoroti DUF yang terjadi karena perubahan
oleh karena itu mewakili kemajuan yang jelas dibandingkan membandingkan suhu. Saya percaya bahwa kumpulan data
sejumlah kecil organisme mesofilik dan termofilik akan menjadi sumber daya komunitas yang berharga dan akan menemukan
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 11 dari 14

tambahan, penting, penggunaan dalam mengkorelasikan sifat Untuk Gambar. 2d skor jarak sederhana dihitung dengan
genomik, trans scriptomik, proteomik, metabolomik, fenotipik atau mengurangkan setiap suhu pertumbuhan organisme dari
taksonomi dengan suhu dalam penelitian mendatang. suhu optimum masing-masing enzim. Ini
dilakukan agar lebih mudah memvisualisasikan besarnya
dari perbedaan kedua variabel tersebut. Skor jarak positif merupakan
Metode
Mendapatkan dataset suhu pertumbuhan enzim yang memiliki op tima katalitik lebih tinggi dari suhu pertumbuhan.
Negatif
Data kondisi pertumbuhan organisme diunduh dari
empat pusat pengumpulan budaya ATCC, DSMZ, NCTC skor mewakili enzim yang memiliki optima lebih rendah dari
suhu pertumbuhan organisme. Prosedur ini adalah
dan NIES dalam bentuk file html. Untuk setiap catatan organisme,
digunakan sebagai pengganti z-normalisasi sebagai tujuan plot ini
nama ilmiah dan suhu pertumbuhan diekstraksi menggunakan skrip
adalah untuk memvisualisasikan yang sebenarnya, relevan secara biologis,
khusus dalam Python versi 2.7, yang
perbedaan suhu antara dua variabel dan
tersedia secara bebas untuk digunakan kembali (https://doi.org/10.5281/
bukan hanya perbedaan besaran yang dinormalisasi.
zenodo.1458278). Data yang berkaitan dengan nama organisme dan
Untuk Gambar. 2e , tujuannya adalah untuk mengevaluasi seberapa
suhu pertumbuhan dari lembaga Pasteur diperoleh sebagai file Excel
baik rata-rata aritmatika dari suhu enzim yang diukur secara optimal
(komunikasi pribadi). Data
untuk organisme tertentu berkorelasi dengan organisme
dari database BacDive diperoleh menggunakan custom
suhu pertumbuhan. Secara khusus, analisis berfokus pada
skrip dengan Python dengan berinteraksi dengan aplikasi publik
menunjukkan bagaimana kekuatan korelasi itu berubah
antarmuka pemrograman (API). Catatan dari ATCC,
dengan jumlah enzim optima individu yang digunakan untuk
DSMZ dan BacDive mencerminkan yang tersedia pada Juli 2017.
Catatan dari Pasteur, NCTC dan NIES mencerminkan yang tersedia menghitung rata-rata. Langkah-langkah berikut dilakukan:
Untuk masing-masing dari 1.811 organisme yang ada di kedua
di bulan-bulan pertama tahun 2015. Nama subspesies atau
suhu pertumbuhan dan set data suhu enzim n
penunjukan strain telah dihapus dari semua organisme dan
titik data untuk enzim optima (di mana n mewakili masing-masing
suhu pertumbuhan yang dilaporkan untuk catatan dengan
bilangan bulat dalam kisaran 1 hingga 100) diambil sampelnya secara acak
nama spesies yang sama dirata-ratakan dan dibulatkan ke
tanpa penggantian dan suhu rata-rata dihitung. Dalam setiap iterasi
bilangan bulat terdekat. Nama organisme selanjutnya dicocokkan dengan
hanya organisme yang memiliki persamaan dengan
pengidentifikasi taksonomi (TaxId) menggunakan taksonomi NCBI
atau lebih dari n enzim optima yang dilaporkan dimasukkan
basis data dari Juli 2017; organisme yang tidak ada yang bisa
dalam perhitungan. Korelasi Pearson antara
diperoleh telah dihapus dari dataset. Garis keturunan taksonomi untuk
ini rata-rata suhu enzim optima dan suhu pertumbuhan organisme
setiap organisme kemudian diperoleh dengan menanyakan database
kemudian dihitung.
NCBI dengan TaxIds dan
Perhitungan diulang 1.000 kali untuk setiap n dan
menggunakan sumber daya eutils (https://www.ncbi.nlm.nih.gov/).
rata-rata dari perhitungan ini dilaporkan.
Semua suhu pertumbuhan divalidasi untuk memastikan bahwa
Suhu enzim rata-rata optima yang digunakan pada Gambar. 2f
mereka jatuh dalam kisaran 5 sampai 130 °C.
dihitung melalui rata-rata sederhana dari semua yang dilaporkan
enzim optima dari setiap organisme. Berdasarkan hasil yang diamati
Mendapatkan dataset suhu enzim
pada Gambar. 2e, organisme yang kurang dari
Semua enzim yang ditentukan secara eksperimental yang tersedia
lima enzim optima dilaporkan dikeluarkan. Regresi polinomial berbobot
temperature optima diekstraksi dari rilis basis data en zyme BRENDA
lokal (LOESS) dihitung menggunakan fungsi loess() (ditulis oleh BD
2017.2 (Juli 2017) dengan Python
skrip menggunakan paket SOAP Zolera (https://pypi.pytho n.org/pypi/
Ripley, berdasarkan paket terdekat Cleveland, Grosse
ZSI/) berinteraksi dengan API BRENDA publik.
dan Shyu.) [57] dari paket dasar “statistik” dalam versi R 3.4.3.
Untuk menghilangkan duplikasi data yang berasal dari enzim yang sama,
suhu optimal dari enzim dengan nomor EC yang sama dirata-ratakan
dalam setiap organisme dan dibulatkan menjadi Mendapatkan dan memfilter data UniProt
bilangan bulat terdekat. TaxId diperoleh untuk setiap organisme
Urutan protein SwissProt dan TrEMBL diunduh sebagai file fasta dari
menggunakan sumber daya NCBI eutils. Organisme yang tidak rilis UniProt 2017_07. SEBUAH
TaxId dapat ditemukan telah dihapus dari dataset.
serangkaian langkah pencocokan dan penyaringan data dilakukan,
seperti diuraikan di bawah ini, untuk mendapatkan satu set nomor EC
Membandingkan suhu pertumbuhan dan enzim dan domain Pfam untuk dianalisis. File fasta dari
kumpulan data kedua sumber diurai untuk mengekstrak nama spesies
Untuk setiap organisme, suhu pertumbuhan yang dikumpulkan milik setiap pengidentifikasi urutan UniProt. Di mana
dibandingkan dengan suhu optimum enzim. Itu mungkin, masing-masing spesies ini diberi pertumbuhan
organisme yang ada di kedua set data diidentifikasi suhu melalui pencocokan nama dengan pertumbuhan
melalui pencocokan nama spesies. kumpulan data suhu. Pengidentifikasi UniProt milik
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 12 dari 14

organisme tanpa suhu pertumbuhan yang ditetapkan telah dijelaskan di sini, matriks MatLab yang berisi skor jarak diunduh
dihapus dari analisis lebih lanjut. Selain itu, pengidentifikasi dari repositori GitHub (https://github.com/SysBioChalmers/
milik organisme dengan kurang dari 1.000 urutan dalam sumber GECKO/tree/mas ter/databases/PhylDist.mat) dan diekspor ke
daya dibuang (Gbr. 3a). Pengidentifikasi UniProt yang tersisa file teks.
setelah pemfilteran awal ini, anotasi EC dan domain Pfam, jika Jarak adalah nol untuk dua organisme yang memiliki tingkat
tersedia, diperoleh menggunakan alat pemetaan ID UniProt taksonomi yang sama tetapi hanya berbeda pada tingkat nama
(https://www.uniprot.org/uploadlists/ ). Untuk membuat dataset organisme. Skor maksimum dalam skema ini adalah delapan,
EC, pengidentifikasi UniProt yang tidak dianotasi dengan nomor menunjukkan dua organisme dari domain kehidupan yang berbeda.
EC dan yang memiliki nomor EC tidak lengkap (misalnya Nomor EC yang kemunculannya secara signifikan berkorelasi
1.14.-.-) dibuang. Untuk membuat dataset domain Pfam, dengan suhu disaring untuk mempertahankan yang ada di
pengidentifikasi UniProt yang tidak dianotasi dengan domain setidaknya dua organisme dengan jarak enam atau lebih.
Pfam dibuang. Pengidentifikasi UniProt yang tersisa, semuanya
dijelaskan dengan nama spesies, suhu pertumbuhan, dan
Analisis korelasi domain
nomor EC atau domain Pfam masing-masing dikenai analisis Kumpulan data domain UniProt Pfam yang difilter yang
korelasi dengan suhu pertumbuhan.
dijelaskan di atas difilter untuk mempertahankan hanya yang
terkait dengan DUF. Rasio antara jumlah organisme yang
membawa protein dengan anotasi domain tertentu versus
Analisis korelasi EC
Kumpulan data UniProt EC yang difilter yang dijelaskan di atas jumlah organisme yang tidak dihitung seperti dijelaskan di atas.
Perhitungan korelasi rasio ini dengan suhu, koreksi nilai p, dan
miring, secara tidak proporsional berisi pengenal yang dijelaskan
penyaringan untuk keragaman filogenetik juga dilakukan seperti
dengan suhu pertumbuhan dalam kisaran 20 hingga 40 °C.
yang dijelaskan di atas.
Untuk menghilangkan penyimpangan ini, rasio antara jumlah
organisme yang membawa protein dengan penjelasan EC
spesifik versus jumlah organisme yang tidak dihitung - secara
terpisah pada setiap suhu pertumbuhan. Langkah pemrosesan Mengidentifikasi jalur metabolisme dengan fungsi enzim
ini menghasilkan kumpulan data di mana kemunculan setiap berkorelasi suhu yang diwakili secara signifikan Untuk
nomor EC diwakili oleh rasio tunggal, antara 0,0 dan 1,0, pada mengidentifikasi jalur metabolisme, atau kumpulan cara jalur
setiap suhu pertumbuhan. Korelasi Spearman antara rasio ini tersebut, dengan representasi berlebihan yang signifikan secara
dan suhu pertumbuhan selanjutnya dihitung untuk setiap nomor statistik dari nomor EC berkorelasi suhu, langkah-langkah
EC. Dalam perhitungan ini, pengidentifikasi dari bakteri dan berikut dilakukan: Semua data jalur KEGG yang tersedia
archaea diperlakukan secara terpisah. Pemisahan ini dilakukan diunduh sebagai xml menggunakan API transfer status
karena distribusi suhu pertumbuhan ar chaea dan bakteri representasional (REST) KEGG (http://www.kegg.jp/kegg/rest/
berbeda, dengan semakin banyak archaea yang tumbuh pada keggapi.html). Nomor EC yang tercantum di masing-masing
suhu tinggi dan semakin banyak bakteri yang tumbuh pada jalur ini diekstraksi menggunakan skrip Python. Terjadinya
suhu rendah. Menganalisis pengidentifikasi dari ini melakukan angka EC pada masing-masing jalur tersebut dicocokkan
induk bersama-sama sehingga dapat menghasilkan kesalahan dengan angka EC yang berkorelasi signifikan dengan suhu
identifikasi nomor EC yang berbeda antara bakteri dan archaea. untuk menemukan overlap. Akhirnya, tes hipergeometrik Fischer
Nilai p yang dihasilkan dikoreksi untuk beberapa pengujian [59] dilakukan, menggunakan fungsi phyper() dari paket dasar
dengan fungsi p.adjust() dari paket dasar "stats" di R versi "stats" di R versi 3.4.3, untuk menguji pengayaan nomor EC
3.4.3, menggunakan tingkat deteksi palsu (FDR) menurut yang berkorelasi suhu di jalur ini. Nilai-p yang dihasilkan
Benjamini dan Hochberg [58]. Analisis ini akhirnya menghasilkan disesuaikan untuk beberapa pengujian menggunakan FDR,
satu set nomor EC baik secara signifikan positif atau negatif sebagaimana diuraikan di atas, dan jalur-jalur dengan nilai-p
berkorelasi dengan suhu. lebih kecil dari 0,05 dilaporkan.

File tambahan
Pada langkah terakhir analisis, nomor EC dengan distribusi
filogenetik baris sempit dihilangkan. Keterkaitan organisme Berkas tambahan 1: Gambar S1. Pengaruh suhu pertumbuhan
dihitung dari taksonomi KEGG (http://www.genome.jp/kegg/ rata-rata dari strain yang berbeda dari spesies yang sama kecil. Masing-
masing dari lebih dari 160.000 catatan individu yang diperoleh dari pusat
genome.html). Organisme diperlakukan sebagai daun di pohon
pengumpulan budaya dianalisis untuk melihat sejauh mana perbedaan suhu
berakar. Skor jarak filogenetik digunakan yang mewakili jumlah pertumbuhan galur yang dilaporkan dari rata-rata yang dihitung dari semua
node yang dipisahkan oleh dua daun (organisme). Perhitungan galur suatu spesies. (PDF 9kb)
yang tepat akan diterbitkan dalam makalah yang akan datang Berkas tambahan 2: Gambar S2. Kelimpahan spesies archaeal
yang menjelaskan kotak peralatan GECKO. Untuk pekerjaan dibandingkan dengan spesies bakteri berubah dengan suhu. Setiap
titik menunjukkan rasio spesies bakteri dan archaeal sebagai proporsi dari
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 13 dari 14

Persetujuan etika dan persetujuan untuk berpartisipasi


jumlah total spesies untuk setiap suhu pertumbuhan dalam dataset. (PDF 39kb)
Tidak berlaku.

File tambahan 3: Gambar S3. Angka EC yang berkorelasi negatif dan


Persetujuan untuk publikasi
positif dengan suhu pertumbuhan dapat diidentifikasi. a Korelasi antara
Tidak berlaku.
kemunculan anotasi nomor EC unik pada spesies dan suhu
pertumbuhannya ditunjukkan di archaea. Setiap titik menunjukkan
koefisien korelasi Spearman dan nilai-p terkoreksi (disesuaikan dengan Kepentingan bersaing
tingkat penemuan palsu) untuk satu nomor EC. Angka EC signifikan Penulis menyatakan bahwa ia tidak memiliki kepentingan bersaing.
(nilai p terkoreksi < 0,01) dengan korelasi positif berwarna merah, yang
berkorelasi negatif berwarna biru. b Korelasi antara kemunculan anotasi
Catatan Penerbit Springer
nomor EC unik pada spesies dan suhu pertumbuhannya ditunjukkan
pada bakteri. Analisis dan skala warna seperti pada A. Nature tetap netral sehubungan dengan klaim yurisdiksi di peta yang diterbitkan
(PDF 832kb) dan afiliasi institusional.

File tambahan 4: Gambar S4. Domain fungsi yang tidak diketahui (DUFs) baik
Diterima: 6 Juni 2018 Diterima: 16 Oktober 2018
berkorelasi negatif dan positif dengan suhu pertumbuhan dapat diidentifikasi. a
Korelasi antara kemunculan DUF unik pada spesies dan suhu pertumbuhannya
ditunjukkan pada archaea. Setiap titik menunjukkan koefisien korelasi Spearman dan
Referensi 1.
nilai-p terkoreksi (disesuaikan dengan tingkat penemuan palsu) untuk satu DUF.
Söhngen C, Bunk B, Podstawka A, Gleim D, Overmann J. BacDive--Metadatabase
DUF yang signifikan (nilai p terkoreksi < 0,01) dengan korelasi positif berwarna
Keanekaragaman Bakteri. Asam Nukleat Res. 2014;42:D592–9.
merah, yang berkorelasi negatif berwarna biru. b Korelasi antara terjadinya DUF unik
2. Söhngen C, Podstawka A, Ranjang B, Gleim D, Vetcinova A, Reimer LC, dkk.
pada spesies dan suhu pertumbuhannya ditunjukkan pada bakteri. Analisis dan skala
BacDive – Metadatabase Keanekaragaman Bakteri di 2016. Asam Nukleat Res.
warna seperti pada A. (PDF 166 kb)
2015;44:D581–5.
3. Reimer LC, Söhngen C, Vetcininova A, Overmann J. Mobilisasi dan integrasi data
fenotipik bakteri Mengaktifkan analisis keanekaragaman hayati generasi
File tambahan 5: signifikan_ec.tsv. File data tab-delimited yang berisi total berikutnya melalui basis metadata BacDive. J. Bioteknologi. 2017; 261:187–93.
319 nomor EC unik yang secara signifikan berkorelasi dengan suhu di
archaea atau bakteri. Masing-masing, header data "domain" dan "ec" menunjukkan 4. Richards MA, Cassen V, Heavner BD, Ajami NE, Herrmann A, Simeonidis E, dkk. MediaDB:
domain kehidupan dan nomor EC. Tabel menunjukkan koefisien korelasi Spearman
database kondisi pertumbuhan mikroba di media yang ditentukan.
(“spearmah_rho”) dan nilai p yang dikoreksi (disesuaikan dengan tingkat penemuan PLoS Satu. 2014;9:e103548.
palsu, “pval_norm”). Hanya nomor EC dengan nilai p kurang dari atau sama dengan 5. Oberhardt MA, Zarecki R, Gronow S, Lang E, Klenk HP, Gophna U, dkk.
0,01 yang disertakan. (TSV 11 kb) Memanfaatkan lanskap media kultur mikroba untuk memprediksi pasangan
organisme-media baru. Nat Comun [Internet]. 2015;6. Tersedia dari: https://
File tambahan 6: signifikan_duf.tsv. File data tab-delimited yang berisi total doi.org/10.1038/ncomms9493
33 DUF unik yang secara signifikan berkorelasi dengan suhu di archaea atau bakteri. 6. Barberán A, Caceres Velazquez H, Jones S, Fierer N. Bersembunyi di Pandangan Biasa:
Masing-masing, header data "domain", "pfam_id" dan "duf_id" menunjukkan domain Menambang Catatan Spesies Bakteri untuk Informasi Sifat Fenotipik. mSphere [Internet].
kehidupan, pengidentifikasi Pfam, dan pengidentifikasi DUF. Tabel menunjukkan 2017;2. Tersedia dari: https://doi.org/10.1128/mSphere.00237-17 Brbiÿ M, Piškorec M,
koefisien korelasi Spearman (“spearmah_rho”) dan nilai p yang dikoreksi (disesuaikan 7. Vidulin V, Kriško A, muc T, Supek F. Lanskap sifat fenotipik mikroba dan gen terkait. Asam
dengan tingkat penemuan palsu, “pval_norm”). Hanya DUF dengan nilai p kurang dari Nukleat Res. 2016; 44:10074–90.
atau sama dengan 0,01 yang disertakan. (TSV 1 kb)
8. Mehta R, Singhal P, Singh H, Damle D, Sharma AK. Wawasan termofilik dan aplikasi spektrum
luasnya. 3. Biotek. 2016;6:81.
9. Wang Q, Cen Z, Zhao J. Mekanisme kelangsungan hidup thermophiles pada suhu tinggi:
Singkatan
sudut omics. Fisiologi. 2015;30:97–106.
API: Antarmuka pemrograman aplikasi; DUF: Domain fungsi yang tidak diketahui; 10. Stetter KO. prokariota hipertermofilik. FEMS Microbiol Rev. Blackwell Publishing Ltd.
EC: Komisi enzim; FDR: Tingkat Deteksi Palsu; LOESS: Regresi polinomial berbobot 1996;18:149–58.
lokal; MK: Menaquinon; REST: Negara Perwakilan 11. Boutz DR, Cascio D, Whitelegge J, Perry LJ, Yeates TO. Penemuan
Transfer
kompleks protein termofilik yang distabilkan oleh rantai yang saling terkait secara topologi.
J Mol Biol. 2007;368:1332–44.
Ucapan Terima Kasih 12. Bezsudnova EY, Boyko KM, Polyakov KM, Dorovatovskiy PV, Stekhanova TN,
Saya ingin mengucapkan terima kasih kepada Elzbieta Rembeza atas umpan baliknya yang luas Gumerov VM, dkk. Wawasan struktural ke dalam dasar molekuler poliektremofilisitas
selama persiapan naskah, Kersten Rabe dan Aleksej Zelezniak atas diskusi dan umpan balik dehidrogenase alkohol rantai pendek dari archaeon hipertermofilik Thermococcus
yang membangun selama proyek ini. Saya ingin berterima kasih kepada Jens Nielsen karena sibiricus. Biochimie. 2012;94:2628–38.
telah mendukung proyek ini dengan saran, waktu, dan sumber daya. Akhirnya, saya berterima 13. Koga Y. Adaptasi termal dari membran lipid archaeal dan bakteri.
kasih kepada Ivan Domenzain karena telah membagikan matriks jarak organisme KEGG yang Archaea. 2012;2012:789652.
digunakan dalam karya ini.
14. van Noort V, Bradatsch B, Arumugam M, Amlacher S, Bange G, Creevey C, dkk. Jalur mutasi
yang konsisten memprediksi termostabilitas eukariotik BMC Evol Biol. 2013;13:7.
Pendanaan
Karya ini telah menerima dana dari Chalmers University of Technology Life Science Area 15. Burra PV, Kalmar L, Tompa P. Pengurangan gangguan struktural dan fungsional
of Advance. Badan pendanaan tidak memiliki peran dalam desain studi, pengumpulan kompleksitas dalam adaptasi termal prokariota. PLoS Satu. 2010;5:e12069.
data, analisis, interpretasi data atau penulisan naskah. 16. Sabath N, Ferrada E, Barve A, Wagner A. Suhu pertumbuhan dan ukuran genom pada
bakteri berkorelasi negatif, menunjukkan perampingan genom selama adaptasi termal.
Ketersediaan data dan bahan Dataset Genom Biol Evol. 2013;5:966–77.
suhu pertumbuhan yang dihasilkan selama penelitian saat ini tersedia di repositori 17. Kampmann M, Stock D. Reverse gyrase memiliki aktivitas pendamping DNA pelindung
Zenodo (https://zenodo.org/), https://doi.org/10.5281/zenodo.1175608 . panas yang independen dari supercoiling. Asam Nukleat Res. 2004;32:3537–45.
18. Forterre P, Bouthier De La Tour C, Philippe H, Duguet M. Reverse gyrase
dari hipertermofil: kemungkinan transfer sifat termoadaptasi dari archaea ke bakteri. Tren
Kontribusi penulis Gen. 2000; 16:152–4.
MKME bertanggung jawab penuh untuk membuat konsep dan melaksanakan proyek 19. Aravind L, Tatusov RL, Serigala YI, Walker DR, Koonin EV. Bukti untuk pertukaran gen
serta menulis naskah. Penulis membaca dan menyetujui naskah akhir. besar-besaran antara archaeal dan hipertermofil bakteri. Tren Gen. 1998;14:442–4.
Machine Translated by Google

Ahli Mikrobiologi BMC (2018) 18:177 Halaman 14 dari 14

20. Hitungan JA, Zeldes BM, Lee LL, Straub CT, Adams MWW, Kelly RM. Penurunan Termofil dan Jalur Penting untuk Bertahan Hidup di Lingkungan Ekstrim.
Fitur fisiologis, metabolisme, dan bioteknologi dari mikroorganisme yang sangat Mikrobiol Depan. 2016;7:2123.
termofilik. Wiley Interdiscip Rev Syst Biol Med [Internet]. 43. Schomburg I, Jeske L, Ulbrich M, Placzek S, Chang A, Schomburg D.
2017;9. Tersedia dari: https://doi.org/10.1002/wsbm.1377 21. Sistem informasi enzim BRENDA-Dari database ke sistem pakar.
Swarup A, Lu J, DeWoody KC, Antoniewicz MR. Jaringan metabolisme J. Bioteknologi. 2017;261:194–206.
rekonstruksi, karakterisasi pertumbuhan dan analisis fluks metabolisme 13C dari 44. Konsorsium UniProt. UniProt: pusat informasi protein. Asam nukleat
Thermus thermophilus HB8 yang ekstrim. Metab Eng. 2014;24:173–80. Res. 2015;43:H204–12.
22. Brumm PJ, Monsma S, Keough B, Jasinovica S, Ferguson E, Schoenfeld T, dkk. Urutan 45. Dehouck Y, Folch B, Rooman M. Meninjau kembali korelasi antara termoresistensi protein
Genom Lengkap Thermus aquaticus Y51MC23. PLoS Satu. 2015;10:e0138674. dan termofilisitas organisme. Protein Eng Des Sel. 2008; 21:275–8.

23. Selig M, Xavier KB, Santos H, Schönheit P. Analisis komparatif jalur glikolitik Embden 46. da Costa MS, Santos H, Galinski EA. Tinjauan tentang peran dan keragaman zat terlarut
Meyerhof dan Entner-Doudoroff di archaea hipertermofilik dan bakteri Thermotoga. yang kompatibel dalam Bakteri dan Archaea. Adv Biochem Eng Biotechnol. 1998;61:117–
Mikrobiol Lengkung. 1997;167:217–32. 53.
24. Brasen C, Esser D, Rauch B, Siebers B. Metabolisme Karbohidrat di Archaea: Wawasan 47. Lamosa P, Burke A, Peist R, Huber R, Liu MY, Silva G, dkk.
Saat Ini tentang Enzim dan Jalur yang Tidak Biasa dan Regulasinya. Termostabilisasi protein oleh digliserol fosfat, zat terlarut baru yang kompatibel dari
Microbiol Mol Biol Rev. 2014;78:89–175. Archaeoglobus fulgidus yang hipertermofil. Mikrobiol Lingkungan Appl. 2000;66:1974–9.
25. Kengen SW, de Bok FA, van Loo ND, Dijkema C, Stams AJ, de Vos WM.
Bukti untuk pengoperasian jalur Embden-Meyerhof baru yang melibatkan kinase 48. Martins LO, Carreto LS, Da Costa MS, Santos H. Zat terlarut baru yang kompatibel
yang bergantung pada ADP selama fermentasi gula oleh Pyrococcus furiosus. J Biol terkait dengan Di-myo-inositol-fosfat dalam anggota ordo Thermotogales.
Chem. 1994;269:17537–41. J Bakteri. 1996;178:5644–51.
26. Ettema TJG, Ahmed H, Geerling ACM, van der Oost J, Siebers B. Non-fosforilasi 49. Zeldovich KB, Chen P, Shakhnovich EI. Stabilitas protein memberikan batasan pada
gliseraldehida-3-fosfat dehidrogenase (GAPN) dari Sulfolobus solfataricus: kunci- kompleksitas organisme dan kecepatan evolusi molekuler. Proc Natl Acad Sci US A.
enzim cabang semi-fosforilasi dari Entner-Doudoroff jalan. Ekstrofil. 2008;12:75–88. 2007;104:16152–7.
50. Thiel T, Pratte B. Efek pada diferensiasi heterocyst dari fiksasi nitrogen dalam sel
27. Cordova LT, Cipolla RM, Swarup A, Long CP, Antoniewicz MR. 13C vegetatif dari cyanobacterium Anabaena variabilis ATCC 29413. J Bacteriol.
analisis fluks metabolik dari tiga bakteri termofilik yang sangat berbeda: Geobacillus 2001;183:280–6.

sp. LC300, Thermus thermophilus HB8, dan Rhodothermus marinus DSM 4252. Metab 51. Lundgren MR, Osborne CP, Christin PA. Mendekonstruksi anatomi Kranz untuk
Eng. 2017;44:182–90. memahami evolusi C4. J Exp Bot. 2014;65:3357–69.

28. Kosuge T, Hoshino T. Lisin disintesis melalui jalur alpha-aminoadipate di Thermus 52. Collins MD, Jones D. Distribusi tipe struktural kuinon isoprenoid pada bakteri dan implikasi

thermophilus. Mikrobiol FEMS Lett. 1998;169:361–7. taksonominya. Microbiol Rev. 1981;45:316–54.

29. Lee NR, Lakshmanan M, Aggarwal S, Song JW, Karimi IA, Lee DY, dkk. 53. Hiraishi A. Kuinon isoprenoid sebagai biomarker populasi mikroba di

Rekonstruksi jaringan metabolisme skala genom dan analisis fluks in silico dari bakteri lingkungan. J Biosci Bioeng. 1999;88:449–60.
54. Goodacre NF, Gerloff DL, Uetz P. Protein Domain Fungsi Tidak Diketahui Penting
termofilik Thermus thermophilus HB27. Fakta Sel Mikrob. 2014;13:61.
dalam Bakteri. MB. 2013;5:e00744–13 – e00744–13.

30. Oshima T. Poliamina unik yang diproduksi oleh termofil ekstrem, Thermus 55. Mudgal R, Sandhya S, Chandra N, Srinivasan N. De-DUFing DUF:

thermophilus. Asam amino. 2007;33:367–72. Menguraikan hubungan evolusioner jauh dari Domain Fungsi Tidak Diketahui
menggunakan metode deteksi homologi sensitif. Biol Langsung. 2015;10:38.
31. Henne A, Brüggemann H, Raasch C, Wiezer A, Hartsch T, Liesegang H, dkk.
56. Jaroszewski L, Li Z, Krishna SS, Bakolitsa C, Wooley J, Diakon AM, dkk.
Urutan genom termofil ekstrim Thermus thermophilus.
Eksplorasi wilayah yang belum dipetakan dari alam semesta protein. PLoS Biol. 2009;7:
Nat Bioteknologi. Grup Penerbit Alam;. 2004;22:547.
e1000205.
32. Schäfers C, Blank S, Wiebusch S, Elleuche S, Antranikian G. Lengkap
57. Cleveland WS, Grosse E, Shyu WM. Bab 8, Model Regresi Lokal. Dalam: Chambers
urutan genom Thermus brockianus GE-1 mengungkapkan enzim kunci metabolisme
JM, Hastie TJ, editor. Model Statistik di S. Wadsworth & Brooks/Cole; 1992.
xilan/xylose. Berdiri Genomic Sci. 2017;12:22.
33. Wu D, Raymond J, Wu M, Chatterji S, Ren Q, Graham JE, dkk. Urutan genom lengkap
58. Benjamini Y, Hochberg Y. Mengontrol tingkat penemuan palsu - pendekatan praktis dan
termofil pengoksidasi CO aerobik Thermomicrobium roseum. PLoS Satu.
kuat untuk beberapa pengujian. JR Stat Soc Seri B Stat Methodol. 1995;57:1.
2009;4:e4207.
34. Hiratsuka T, Furihata K, Ishikawa J, Yamashita H, Itoh N, Seto H, dkk. Jalur biosintetik
59. Johnson NL, Kotz S, Kemp AW. Distribusi Diskrit Univariat, Kedua
menaquinone alternatif yang beroperasi pada mikroorganisme. Sains. 2008;321:1670–
Edisi. New York: Wiley. p. 237–282.
3.
35. Fang M, Langman BM, Palmer DRJ. Analog isokhorismat yang stabil untuk studi MenD
dan enzim yang memanfaatkan isokhorismet lainnya. Bioorg Med Chem Lett.
2010;20:5019–22.
36. DeCastro ME, Rodríguez-Belmonte E, González-Siso MI. Metagenomics of Thermophiles
dengan Fokus pada Penemuan Thermozymes Novel. Mikrobiol Depan. 2016;7:1521.

37. Cowan DA, Ramond JB, Makhalanyane TP, De Maayer P. Metagenomics lingkungan
ekstrim. Mikrobiol Curr Opin. 2015;25:97-102.
38. Le PT, Makhalanyane TP, Guerrero LD, Vikram S, Van de Peer Y, Cowan DA.
Analisis Metagenomik Perbandingan Mengungkapkan Mekanisme Respon
Stres di Hypoliths dari Gurun Hyperarid Ekstrim. Genom Biol Evol. 2016;8:2737–47.

39. Ogata H, Goto S, Sato K, Fujibuchi W, Bono H, Kanehisa M. KEGG: Ensiklopedia


Kyoto Gen dan Genom. Asam Nukleat Res. 1999;27:29–34.
40. Kanehisa M, Furumichi M, Tanabe M, Sato Y, Morishima K. KEGG: baru
perspektif tentang genom, jalur, penyakit dan obat-obatan. Asam Nukleat Res.
2017;45:H353–61.
41. Badhai J, Ghosh TS, Das SK. Karakteristik taksonomi dan fungsional komunitas
mikroba dan korelasinya dengan sifat fisikokimia dari empat mata air panas bumi di
Odisha. India. Mikrobiol Depan. 2015;6:1166.

42. Saxena R, Dhakan DB, Mittal P, Waiker P, Chowdhury A, Ghatak A, dkk.


Analisis Metagenomik Mata Air Panas di India Tengah Mengungkapkan Hidrokarbon

Anda mungkin juga menyukai