Proses Sampling
Memproses sampel adalah tahapan pertama yang paling penting dalam semua
proyek metagenomik. DNA yang sudah diekstraksi harus mewakili semua sel yang ada pada
sampel serta asam nukleat berkualitas tinggi dalam jumlah yang cukup harus didapatkan
untuk produksi pustaka selanjutnya dan sekuensing. Pemrosesan membutuhkan protokol
spesifik untuk setiap tipe sampel dan tersedia berbagai metode yang kuat untuk ekstraksi
DNA. Jika komunitas target diasosiasikan dengan suatu host, maka metode untuk
mendapatkan DNA host minimal yang mungkin lebih cocok digunakan adalah fraksinasi atau
selective lysis. Beberapa tipe sampel (misalnya biopsies atau air tanah) sering
menghasilkan DNA dalam jumlah kecil. Produksi pustaka untuk teknologi sekuensing pada
umumnya membutuhkan jumlah nanogram atau mikrogram DNA yang tinggi, sehingga
amplifikasi dari material starting mungkin dibutuhkan. Multiple Displacement Amplification
(MDA) menggunakan hexamers dan phage phi29 polymerase acak merupakan salah satu
pilihan untuk meningkatkan DNA yang dihasilkan. Metode ini dapat mengamplifikasi
femtograms dari DNA untuk memproduksi mikrogram dari produk sehingga telah digunakan
secara luas pada genomik single-cell dan pada metagenomik tingkat tertentu.
Teknologi Sekuensing
Selama lebih dari 10 tahun teknologi sekuensing Sanger telah berubah secara
perlahan menjadi next-generation sequencing (NGS). Salah satu kelemahan dari
sekuensing Sanger adalah proses kloning yang labor-intensive dalam bias asosiasinya
terhadap gen beracun untuk host kloning. Beberapa teknologi NGS yang telah digunakan
secara luas pada sampel genomik adalah 454/Roche dan sistem Illumina/Solex. Beberapa
teknologi sekuensing tambahan yang tersedia adalah Applied Biosystem SOLiD sequencer,
Roche, Ion Torrent, dan Pacific Biosciences (PacBio).
Assembly
Terdapat dua strategi yang dpat digunakan untuk sampel metagenomik, yaitu
reference-based assembly (co-assembly) dan de novo assembly. Reference-based
assembly berkerja baik untuk dataset metagenomik yang berisikan sekuens dengan
referensi genom yang berkerabatan dekat. Program yang dapat melakukan reference-based
assembly adalah Newbler, AMOS, atau MIRA. De novo assembly pada umumnya
membutuhkan sumber komputasional yang besar, sehingga seluruh kelas alat assembly
berbasis pada grafik de Bruijn dibuat secara spesifik untuk menangani jumlah data yang
sangat besar. Program yang dapat melakukan de novo assembly adalah MetaVelvet dan
Meta-IDBA.
Binning
Anotasi
Terdapat dua pathway awal untuk anotasi metagenom. Pertama, jika rekonstruksi
genom adala tujuan dari penelitian dan assembly menghasilkan contigs besar maka lebih
baik untuk menggunakan pipelines yang sudah ada untuk anotasi genome; seperi RAST
atau IMG. Kedua, anotasi dapat dilakukan pada seluruh komunitas dan bergantung pada
pembacaan unassembled atau contigs pendek. Anotasi pada data sekuens metagenomik
terdiri atas dua tahap, yaitu identifikasi gen (feature prediction) dan anotasi fungsional.
Anotasi dapat dilakulan dengan program seperti BLASTX, KEGG, eggNOG, COG/KOG,
PFAM, dan TIGRFAM.
Metagenomik adalah ilmu yang mempelajari gen secara keseluruhan. Salah satu
contohnya adalah dari satu lingkungan terdapat beberapa mikroba yang tidak dapat dikultur,
sehingga dengan adanya analisis metagenomik mikroba-mikroba yang tidak dapat dikultur
tersebut dapat diketahui gennya. Selanjutnya, setelah mengetahui gen dari mikroba
tersebut, dapat diketahui aktivitas apa saha yang dihasilkan dari konsorsium mikroba yang
ada di ekosistem tersebut; dimana yang paling sering ditemukan merupakan fungsi-fungsi
sebagai penghasil enzim seperti selulase, xylanase, amilase, dan sebagainya. Selain itu,
dalam bidang farmasi dapat diketahui jika ada aktivitas antibakteri pada ekosistem tersebut,
dan dapat diketahui juga aktivitas biosurfaktan bakteri yang diisolasi dari isolasi cemaran
tumpahan minyak dalam bidang lingkungan.