Anda di halaman 1dari 15

Peran diabaikan kerusakan DNA dan usia

ibu dalam menghasilkan mutasi germline


manusia
Ziyue Gao​a, b,​1,Priya Moorjani​c,​d,Thomas A. Sasani​e,​Brent S. Pedersen​e,​Aaron R. Quinlan​e,​f,Lynn B. Jorde​e​,
Guy Amster​g, 2​, dan Molly Przeworski​g, h, 1,2
a​
Institut Medis Howard Hughes, Universitas Stanford, Stanford, CA 94305; ​b​Departemen Genetika, Universitas Stanford, Stanford, CA 94305;

c​Departemen Biologi Molekuler dan Sel, University of California, Berkeley, CA 94720; ​d​Pusat Biologi Komputasi, Universitas California, ​Berkeley, CA
94720; ​ Departemen Genetika Manusia, Fakultas Kedokteran Universitas Utah, Salt Lake City, UT 84112; f​​ Departemen Informatika Biomedis, Fakultas
e​

Kedokteran Universitas Utah, Salt Lake City, UT 84108; g​​ Departemen Ilmu Biologi, Universitas Columbia, New York, NY 10027; dan h​​ Departemen
Biologi Sistem, Universitas Columbia, New York, NY 10027
Diedit oleh James A. Birchler, Universitas Missouri, Columbia, MO, dan disetujui 2 April 2019 (diterima untuk ditinjau 23 Januari 2019)
Buku teks melihat bahwa sebagian besar mutasi germline pada mamalia muncul dari kesalahan replikasi secara tidak
langsung didukung oleh fakta bahwa ada lebih banyak mutasi dan lebih banyak pembelahan sel pada jantan daripada
germline betina. Ketika menganalisis set data mutasi de novo besar pada manusia, kami menemukan banyak baris bukti
yang membuat pandangan itu dipertanyakan. Khususnya, meskipun peningkatan drastis dalam rasio pembelahan sel
germinal jantan dan betina setelah timbulnya spermatogenesis, bahkan ayah muda berkontribusi tiga kali lebih banyak
mutasi daripada ibu muda, dan rasio ini hampir tidak meningkat dengan usia orangtua. Temuan mengejutkan ini
menunjukkan kontribusi besar mutasi yang disebabkan oleh kerusakan. Memang, C-to-G transisi dan transisi CpG, yang
bersama-sama merupakan lebih dari seperempat dari semua mutasi substitusi dasar, menunjukkan distribusi genomik dan
dependensi usia spesifik jenis kelamin yang mengindikasikan masing-masing perbaikan kerusakan rantai ganda dan
kerusakan terkait metilasi, masing-masing. Selain itu, kami menemukan bukti bahwa usia ibu saat pembuahan
mempengaruhi tingkat mutasi baik karena akumulasi kerusakan pada oosit dan berpotensi melalui pengaruh pada jumlah
mutasi postzygotic pada embrio. Temuan ini mengungkapkan peran kerusakan DNA dan usia ibu yang kurang dihargai
dalam asal mula mutasi germline manusia.
mutasi kerusakan DNA germline​ | ​dan memperbaiki laki-laki



| mutasi efek bias usia ibu

| ​Replikasi DNA​|

D​ espite ​
sumber ​
fundamental ​
daridiwariskan ​
pentingnya ​ ​
penyakitdan ​ pengemudi ​
germline ​
evolusi, ​
mutasi ​ sebagai

genesis masih kurang dipahami (1, 2). Mutasi sub-substitusi de novo dapat timbul dari kesalahan yang dibuat saat menyalin
templat DNA yang utuh (yaitu, ​“​digerakkan oleh replikasi​”​), atau dari kerusakan templat atau nukleotida bebas yang terjadi
sebelum replikasi DNA ( ​“​diinduksi kerusakan​”)​), atau interaksi keduanya (3). Kepentingan relatif dari sumber-sumber mutasi ini
masih belum jelas tetapi memiliki kepentingan yang melekat dan membawa banyak implikasi, termasuk untuk memahami
perilaku tak menentu dari jam molekuler yang digunakan untuk menentukan waktu peristiwa evolusi (4​-​6), karena sifat tekanan
seleksi pada replikasi DNA dan memperbaiki mesin (7, 8), dan pada manusia, untuk memprediksi risiko kekambuhan penyakit

Mendel dan beban penyakit (9, 10). ​Karena mutagenesis germline pada mamalia sangat sulit untuk ​ dipelajari secara langsung,
pemahaman kita tentang proses ini didasarkan pada mutasi yang diidentifikasi pada keturunan dan hubungannya dengan usia
orang tua mereka atau pada perbandingan filogenetik spesies dengan sejarah kehidupan yang berbeda. Khususnya, buku teks
berpandangan bahwa kesalahan replikasi adalah sumber utama mutasi germline manusia (11​- ​14) sering memicu peningkatan
jumlah mutasi germline dengan usia ayah (11, 13). Namun peningkatan ini dapat timbul tidak hanya dari replikasi DNA dalam
sel-sel induk spermatogonial, tetapi juga dari aktivitas metabolisme lain yang terkait dengan pembelahan sel atau dari kerusakan
yang tidak diperbaiki yang terjadi seiring berjalannya waktu (15). Komplikasi lebih lanjut adalah bahwa tingkat di mana lesi DNA
yang tidak diperbaiki diubah menjadi mutasi dipengaruhi oleh replikasi DNA dan dengan demikian dapat tergantung pada tingkat
pembelahan sel (16, 17).
Wawasan ke dalam genesis mutasi germline juga dapat diperoleh dengan membandingkan pola mutasi pria dan wanita, yang
mencerminkan lintasan perkembangan yang berbeda dan dinamika epigenetik. Pada mamalia, ayah berkontribusi lebih banyak
mutasi de novo (DNMs, yaitu, perubahan urutan DNA individu relatif terhadap orang tua mereka) ke keturunan mereka daripada
ibu, sebuah fenomena yang kadang-kadang disebut ​"​bias mutasi pria.​” ​Sel-sel benih jantan juga mengalami lebih banyak
pembelahan sel di setiap generasi daripada sel-sel betina, karena sel-sel induk spermatogonial terus diperbarui setelah pubertas
pada pria sedangkan oosit primer terbentuk pada tahap janin pada wanita. Mengingat semakin banyaknya pembelahan sel yang
dialami oleh sel germinal jantan, bias mutasi jantan telah secara luas ditafsirkan sebagai bukti bahwa kesalahan replikasi adalah
sumber utama mutasi titik (selain transisi di situs CpG) (11, 12, 18​-​20) . Namun, sudah Muller (15) mencatat bahwa penjelasan
lain adalah mungkin, karena ada banyak perbedaan jenis kelamin dalam pengembangan sel germinal dan gametogenesis selain
jumlah divisi sel. Untuk mengevaluasi bukti bahwa bias mutasi pria didorong oleh kesalahan replikasi yang terjadi selama
spermatogenesis, kami menganalisis kembali data DNM dari penelitian terbaru terhadap lebih dari 1.500induk​- ​trioketurunan (21)
dan membandingkan sifat-sifat mutasi ayah dan ibu. Kami menguji hipotesis bahwa mutasi germline terutama replikasi-didorong
asal dengan bertanya: Bagaimana
Signifikansi
Lebih dari tiga perempat dari mutasi germline manusia ayah asal dan jumlah mereka meningkat dengan​ayah​usia pada saat
pembuahan. Pengamatan ini dianggap mendukung pandangan buku teks bahwa mutasi titik germline sebagian besar
berasal dari kesalahan replikasi DNA. Menganalisis set data mutasi germline besar untuk manusia, kami menemukan
bahwa pemahaman ini tidak dapat menjelaskan pola mutasi baru yang diamati. Sebagai gantinya, kami menunjukkan
bahwa bias mutasi pria tidak didorong oleh spermatogenesis. Kami selanjutnya menemukan bukti bahwa sebagian besar
mutasi tidak replikatif asal dan mengungkap efek potensial dari​ibu​usia pada jumlah mutasi yang terjadi di awal
perkembangan embrio.
Kontribusi penulis: penelitian yang dirancang oleh ZG, PM, GA, dan MP; ZG, PM, TAS, BSP, ARQ, LBJ, GA, dan MP melakukan penelitian; ZG, PM, TAS, BSP, GA, dan MP
menganalisis data; ARQ dan LBJ merevisi makalah tersebut; dan ZG, PM, GA, dan MP menulis makalahnya.
Penulis menyatakan tidak ada konflik kepentingan.
Artikel ini adalah Pengajuan Langsung PNAS.
Artikel akses terbuka ini didistribusikan di bawah ​Lisensi Creative Commons Attribution-NonCommercial- NoDerivatives 4.0 (CC BY-NC-ND)​.

1​
Kepada siapa korespondensi dapat ditangani. Email: ziyuegao@stanford.edu atau mp3284 @
columbia.edu.

2​
GA dan MP berkontribusi sama untuk pekerjaan ini.
Artikel ini berisi informasi pendukung online di ​www.pnas.org/lookup/suppl/doi:10. 1073 / pnas.1901259116 / - / DCSupplemental​.
Diterbitkan online 24 April 2019.
www.pnas.org/cgi/doi/10.1073/pnas.1901259116 PNAS ​| ​7 Mei 2019 ​| ​vol. 116 ​| ​tidak. 19 ​| ​9491​-​9500
apakah mutasi pria dan wanita melacak jumlah divisi sel kuman? Apakah
akan meningkat secara substansial ​dengan usia orangtua pada saat
dependensi dari tingkat mutasi padaorang ​tua​'s​seks dan usia berbeda
pembuahan anak, meskipun sekali lagi tidak selalu
​ secepat rasio
dengan jenis mutasi dan, jika demikian, mengapa? Apakah ​ kontribusi pria
mbelahan sel (16, 23, 24). ​Untuk menguji prediksi ini, kami menganalisis
yang lebih tinggi untuk DNM dijelaskan oleh kesalahan replikasi dalam
membagi sel germinal pria? trio Islandia (21) (selanjutnya, ​"​dataset
data DNM autosomal dari 1.548

Hasil ​Rasio Mutasi dari Ayah ke Ibu Sudah Tinggi untuk Orang Tua deCODE​"​), ​
awalnya berfokus pada mutasi bertahap, yaitu, subset dari
Muda dan Stabil dengan Usia Orangtua. ​Jika mutasi ​didorong oleh kombinasi yang asal orangtua DNM tersebut. telah ditentukan oleh
transmisi ke individu generasi ketiga atau keterkaitan dengan varian
replikasi, rasio mutasi germline jantan dan betina (juga
​ dikenal sebagai
rdekat dalam pembacaan. Mengingat bahwa tingkat pentahapan ​berbeda
kekuatan bias mutasi jantan, ​α​) harus mencerminkan rasio jumlah divisi sel
fraksimutasi ayah dalam
germinal dalam ​dua jenis kelamin; dua rasio tidak harus proporsional,ntar trios​(SILampiran,​Gambar.​S1),kita dianggap ​
meskipun, jika tingkat mutasi divisi per sel bervariasi di seluruh tahap semua DNMs bertahap dan dibandingkan ​
fraksi ini terhadap​ayah​usia
perkembangan atau antara dua jenis kelamin (16). Sementarajantan
Bahan​dan​Metode).Kami menemukan
​ ​usia, ​dengan kasus ​G​paternal untuk
germlinedan betina diperkirakan mengalami jumlah pembelahan
​ sel mitosis
M​yang,, 719 untuk trio usia paternal keluarga (yaitu, dengan kontribusi
yang sama pada permulaan pubertas (​∼​30 hingga 35 divisi), kemudian rasio
mempertimbangkan dataset yang sama; paternal 0,9 ke Fig. Mutasi ​< ​G1
pembelahan sel jantan dan betina meningkat ​dengan cepat seiring an usia, / G​M SI ​ ​ ​< a​ dalah ​Lampiran,​ ​P​1.1, mencolok, dan ibu stabil yang
G
merupakan ​Tabel S1​). Mutasi ayah terdiri dari sekitar 75 hingga 80% dari
bertambahnya usia, karena seringnya mitosis divisi sel
​ induk
DNM ​(yaitu, ​α = ​3 hingga 4 di seluruh usia ayah); Selain itu,
spermatogonial (diperkirakan 23 divisi per tahun) ​dan tidak adanya mitosis
meskipunbesar jumlahtrio,
​ tidak ada efek signifikan dari usia ayah yang
sel benih wanita selamasama periode
​ yang(11, 22). Dengan demikian, jika
kesalahan replikasi adalah sumber utama mutasi germline, ​α ​diperkirakan erdeteksi oleh ​regresi di bawah berbagai model linear umum (​P ​> ​0,28;
ungsi "prediksi" dalam R).
lihat Bahan
​ dan Metode u​ ntuk rincian). Stabil ​α ​tetap setelah

mengecualikanC ​> ​mutasiG, yang sebelumnya dilaporkan meningkat


​ Selain model linier, kami mempertimbangkan efek usia eksponensial dari
secara tidak proporsional dengan usia ibu (21) (​Lampiran SI,​ Gambar S2​). salah satu atau kedua jenis kelamin. Kami mengamati peningkatan
Selain itu, hasil yang sama terlihat dalam dataset DNM in-dependen yang signifikan yang sesuai dengan efek usia ibu eksponensial lebih dari yang

mengandung 816 trio (25, 26), yang ​juga sebagian besar keturunan Eropa linear [​Δ​AIC (kriteria informasi Akaike) ​= -​29,9], ​konsisten dengan

​ Appendix,​ Gambar. S3​).


(selanjutnya disebut ​"​Inova dataset​"​; SI analisis sebelumnya dari dataset Inova yang menunjukkan peningkatan

yang lebih cepat dalam tingkat mutasi ibu pada usia yang lebih tua (25).
Penemuanrelatif stabil (meskipun ​tidak sepenuhnya konstan) ​α yang ​dari 3
Untuk memverifikasi temuan kami, kami membagi 1.548 trio menjadi dua
mempertanyakan keyakinan luas bahwa kelompok dengan usia ibu saat pembuahan di atas atau di bawah usia
hingga 4 dengan usia orang tua ​
spermatogenesis mendorong bias pria dalam mutasi germline (9, 18, 23). rata-rata 27 tahun dan menyesuaikan model linier dengan dua kelompok
ecara terpisah. Seperti yang diharapkan dari peningkatan yang cepat dalam
Sebuahyang stabil ​α ​lebih lanjut menunjukkan bahwa jumlah ibu
umlah mutasi ibu dengan usia, efek usia ibu diperkirakan lebih besar ​untuk
mutasimeningkat dengan​ibu​usia s hampir padarel- yang sama ​tingkatative
ibu yang lebih tua daripada ibu yang lebih muda (0,56 vs 0,24, 95% CI:

seperti melakukan mutasi ayah dengan ayah​'usia​s. Untuk mendapatkan [0,45,0,66] vs [0,12,0,38] ]), sedangkan perkiraan efek usia ayah serupa
perkiraan yang lebih tepat dari efek usia orang tua, kami memodelkan efekuntuk kedua kelompok (1,41 vs 1,40, 95% CI: [1,31, 1,51] vs [1,29, 1,53];
Lampiran SI,​ Tabel S5​). Kami lebih lanjut menemukan bahwa efek usia ibu
usia ibu dan ibu secara bersama-sama, memanfaatkan informasi ​dari mutasi
eksponensial tidak lagi memberikan kecocokan yang lebih baik secara

bertahap dan tidak bertahap dalamdeCODE dataset.


​ Secara singkat, kami signifikan ketika mengecualikan 72 trio denganibu ​usialebih dari 40
memodelkan jumlah mutasi yang diharapkan pada orang tua sebagai fungsi
Lampiran SI,​ Tabel S6​), menunjukkan bahwalinier modeladalah
​ perkiraan
linear dari usianya pada saat pembuahan ​anak dan mengasumsikan bahwa
yang wajar untuk keluarga dengan usia ibu di bawah 40 tahun. y. Sebagai

jumlah yang diamati dariibu mutasi(ayah)


​ mengikuti distribusi Poisson. pemeriksaan kewarasan pada perkiraan kami, kami memperkirakan fraksi
mutasi ayah untuk individu dengan ayah dan ibu yang berbeda memberikan
Kami selanjutnya ​memodelkan jumlah mutasi maternal (paternal) yang
usia yang cocok (Gthe P​​ / G​diamati ​M ​= ​0,9, pola
​ ​1,2, atau 1,4); untuk
​ ​kami
berhasil secara bertahap sebagai sampel binomial dari DNM (​Bahan dan
Metode)​ . Kami kemudian memperkirakan peningkatan tahunan berdasarkan subset ​prediksi dari ​mutasi bertahap (​SI Lampiran​, Gambar. S4​).

jenis kelamin ​dengan usia orang tua dengan kemungkinan maksimum Selanjutnya, kami menggunakan model linear yang cocok untuk trio
dengan usia ibu di bawah 40 tahun pada saat pembuahan (​Lampiran SI,​
(​Lampiran SI​, Tabel
​ S2​). Ketidakpastian dalam estimasi dievaluasi oleh Tabel S6​) untuk menguji rasio mutasi pria dan wanita. Kami menemukan
resampling trio boot-strap. Analisis ini ulanganmenemukan-sebelumnya
bahwa ​α ​ ​sudah ​~​3 (95% CI: [2.8, 3.5]) pada usia rata-rata onset
ingsbahwa jumlah mutasi pada ayah dan set ibu ​ kromosom meningkat pubertas[diasumsikan 13 y usia untuk kedua jenis kelamin (27); Gbr. 2 ​B
dan ​C​], konsisten dengan pengamatan kami terhadap fraksi stabil mutasi
dengan​ayah​dan​ibu,​usiaulang ​spectively (21, 25, 26) (Gambar. 2A).
paternal dengan usia paternal (Gbr. 1), dan menunjukkan bahwa germline
Gambar. 1. ​Fraksi mutasi ayah di antara mutasi bertahap, sebagai fungsi usia ayah
jantan telah mengakumulasi jumlah DNM yang jauh lebih besar daripada
pada saat pembuahan. Setiap titik mewakili data untuk satu anak (proband) dengan
usia orang tua yang sama (rasio usia ibu-ke-ibu antara 0,9 dan 1,1; total trio dengan
germline betina pada masa pubertas. Hal yang ​sama terlihat dalam analisis
minimum 6 dan rata-rata 23,5 mutasi bertahap per trio). Posisi ​x​-axis, tetapi bukan
posisi ​y​-axis, sedikit gugup untuk menunjukkan poin yang tumpang tindih. Garis biru
adalah fraksi yang diprediksi dari mutasi ayah dengan regresi binomial dengan tautan ulang kami terhadap dataset Inova yang lebih kecil
logit, dengan area yang diarsir mewakili interval kepercayaan 95% (dihitung dengan

9492 ​| ​www.pnas.org/cgi/doi/10.1073/pnas.1901259116 Gao et al.


Gambar. 2. ​Ketergantungan jenis kelamin dan usia mutasi germline (berdasarkan model linier yang diterapkan pada trio dengan usia ibu tidak lebih dari 40 tahun). Di
semua panel, area dan bar yang diarsir mewakili 95% CI dari jumlah yang sesuai yang diperoleh dari bootstrap. (​AAngka)​ mutasi khusus jenis kelamin disimpulkan sebagai
fungsi dari usia orang tua. Usia orangtua diukur sejak lahir, yaitu, kelahiran sesuai dengan usia 0 (di seluruh makalah). Intercept yang diekstrapolasi pada usia 0 adalah
kecil tetapi secara positif positif untuk kedua jenis kelamin, menyiratkan efek lemah tetapi signifikan dari usia reproduksi pada tingkat mutasi tahunan (16). (​B​) Diprediksi
rasio mutasi pria-wanita (α) sebagai fungsi dari rasio usia ayah ke ibu. Untuk referensi, rasio usia orang tua berpusat di sekitar 1,10 dalam dataset DNC ​deCODE (SD =
0,20). (​C)​ Kontras antara rasio mutasi pria-wanita (ungu) dan rasio pembelahan sel pria terhadap wanita (hijau), dengan asumsi usia ayah dan ibu yang sama. Perkiraan
angka pembelahan sel untuk dua jenis kelamin pada manusia berasal dari Drost dan Lee (11).
amin disebabkan oleh kerusakan: Dalam skenario ini, baik peningkatan
pada masa pubertas danstabil ​α yang ​setelah pubertas secara kasar
(​Lampiran SI​, Gambar. S5​). Temuan ini sangat tidak terduga: Sel-sel benih
laskan oleh tingkat kerusakan yang kira-kira konstan per unit waktu
pria dan wanita diperkirakan mengalami jumlah divisi yang sebanding pada
a kedua jenis kelamin dan lebih tinggi pada pria (23).
masa pubertas (masing-masing diperkirakan 35 vs 31) dan sekitar setengah
dari divisi ini mendahului penangguhan jenis kelamin (11, 22), jadi pria mber-Sumber Spesifik dari Mutasi yang Dipicu Kerusakan DNA.
dan wanita harus memiliki jumlah mutasi replikasi yang sama sebelum uk mengeksplorasi mekanisme mutasi yang mungkin, mengikuti
pubertas. Selain itu, perbedaan dalam spektrum mutasi antara laki-laki dan elitian sebelumnya (28, 31​-​33), kami mengklasifikasikan DNMs
perempuan adalah halus (21, 28, 29), menunjukkan bahwa sumber-sumber stitusi dasar menjadi enam kelas mutasi yang terpisah dan saling
engkapi berdasarkan alel induk dan turunan: T ​> ​A, T ​> ​C, T ​> ​G, C ​>
sebagian besar pembagian dibagi antara dua jenis kelamin. ​Lalu bagaimana
C ​> ​G, dan C ​> ​T
masing-masing jenis juga termasuk varian yang sesuai pada untai
menjelaskan bahwa ​α ​sudah tinggi saat pubertas dan bertahan
​ pada nilai
yang kira-kira sama selama masa dewasa? Sebuah resolusi yang mungkin mplemen terbalik). Mengingat ity baik ditandai hypermutabil- situs CpG
adalah bahwa jumlah pembelahan sel kuman pria dari penentuan jenis kohol pada primata​(34-36),​kita lebih di- vided ​C> ​T transisi menjadi
kelamin hingga pubertas telah jauh di bawah perkiraan. Memang, sebuah btipe non CpG-dan CpG konteks (tidak termasuk pulau-pulau CpG yang
penelitian baru-baru ini melaporkan bahwa mutasi pada mikrosatelit asanya hypomethy- lated; ​Bahan dan Metode)​ . Mengkonfirmasi analisis
li
berulang, yang kemungkinan besar hasil dari replikasi slippage, sudah lebih dari data ini (21), kami mendeteksi efek usia ayah dan ibu yang
banyak pada remaja yang dibandingkan dengan ibu remaja (30). Penjelasan gnifikan untuk semua tujuh jenis mutasi, dengan berbagai besaran
kedua, non-saling eksklusif adalah bahwa setelah penentuan jenis kelamin,ampiran SI​
, Gambar S6 dan Tabel S2​). Sementara bias jantan stabil
pembelahan sel germinal jauh lebih mutagenik pada pria daripada pada ngan usia orangtua untuk sebagian besar tipe mutasi (​Lampiran SI​,
wanita. Pada prinsipnya, dua kemungkinan pertama ini bisa menjelaskan ambar S6​ ),C ​
> ​
G danC ​
> ​
t ransisitransisiT pada situs CpG menonjol dari
tingginya ​α ​saat pubertas. Namun, mereka hanya akan mengarah kestabil ​αla umum (Gbr. 3). Secara khusus,C ​
> ​
m utasiG menunjukkan penurunan
yang ​sepanjang masa dewasa di bawah kondisi yang tidak masuk akal: seiring bertambahnya usia danCpG ​
> ​
m utasiTpG meningkat ​α​, terbukti
Secara khusus, jumlah pembelahan sel dan tingkat mutasi per pembelahan lam analisis mutasi bertahap dan dalam pemodelan kami semua mutasi
sel pada tahap perkembangan pada kedua jenis kelamin perlu memenuhi br. 3 ​
A ​ d an ​
B ​ ). Kami lebih lanjut menemukan bahwa sedangkan model
kondisi spesifik, seperti laki-laki-perempuan rasio kesalahan replikasi ear cocok untuk enam jenis mutasi lainnya secara individual, untukC ​>
sebelum pubertas secara kebetulan mirip dengan rasio peningkatan mutasi utasiG model dengan efek usia ayah linier dan efek usia ibu eksponensial
tahunan pada dua jenis kelamin setelah pubertas (​Lampiran SI​). Asumsi emberikan kesesuaian yang jauh lebih baik (​Δ​AIC ​= -​18.3; ​Lampiran SI​,
lain yang perlu dipertimbangkan kembali adalah perkiraan laju pembelahan bel S4​). Menariknya, efek usia ibu eksponensial juga memberikan
sel punca spermatogonial. Jika lebih lambat dari yang diperkirakan (24), cocokan yang lebih baik secara signifikan untuk enamnon-C ​> ​mutasi
rasio divisi sel germinal jantan dan betina mungkin lebih rendah daripada kG (​ Δ ​
A IC ​<-​9; ​Lampiran SI​, Tabel S6​), dan sekali lagi efeknya tidak
yang ditunjukkan pada Gambar. 2​C d​ an lebih sesuai dengan bias mutasi gnifikan ketika 72 trio dengan maternal usia di atas 40 tahun dikeluarkan,
yang diamati. Meski begitu, bagaimanapun,tinggi ​α ​saat pubertas atau enunjukkan bahwa tipe mutasi selain C ​> ​G juga meningkat pada tingkat
stabilitas relatifnya setelah itu tetap tidak dapat dijelaskan. Alih-alih, kami
ng lebih tinggi pada ibu usia lebih tua. ​Berdasarkan distribusi spasial
berhipotesis bahwa sebagian besar mutasi germline pada kedua jenis
ripada pada autosom dan sisa kromosom X (29). Kami juga menemukan
mereka dalam genom dan peningkatannya
​ dengan usia ibu,Cibu ​>
hwa konversi C ​> ​G secara signifikan lebih mungkin daripada jenis
mutasiGdihipotesiskan terkait dengan jeda ganda pada oosit yang menua: utasi lain terjadi pada kromo yang sama seperti penghapusan de novo (​≥​5
Jenis mutasi ini sering muncul dalam kelompok dengan konkordansi untai ) pada individu yang sama, dan tergantung pada kookurensi, bahwa jarak
yang kuat dan salinan de de novo dekat breakpoint varian varian; selain itu
penghapusan terdekat cenderung lebih pendek (​Lampiran SI,​ Gambar.
diperkaya di daerah genom dengan tingkat konversi gen noncrossover yang ). Hubungan yang sama tidak terlihat untuk penghapusan atau penyisipan
meningkat, suatu pengayaan yang meningkat dengan cepat seiring dengan ndek (​<​5 bp), namun (​Lampiran SI,​ Tabel S7​), yang lebih mungkin
usia ibu (21, 37). C ​> ​G mutasi juga lebih sering terjadi pada daerahuncul dari slip replikasi (38, 39). Bersama-sama, pengamatan ini
pseudoautosomal 1 manusia, yang mengalami crossover obligat pada pria,

Gao et al. PNAS ​| ​7 Mei 2019 ​| ​vol. 116 ​| ​tidak. 19 ​| ​9493

Gambar. 3. ​Ketergantungan jenis kelamin dan usia untuk C> G dan CpG> TpG DNMs. Area yang diarsir di semua panel mewakili 95% CI. Lihat ​Lampiran SI,​ Gbr. S6 ​untuk
plot serupa untuk tipe mutasi lainnya. Rasio mutasi pria-wanita pada usia 17 secara signifikan lebih rendah untuk CpG> TpG daripada jenis mutasi lainnya (dibahas dalam
teks utama). (​A)​ Fraksi dari mutasi ayah dalam DNM bertahap (mirip dengan Gambar. 1). (​B​) Diprediksi rasio mutasi pria-wanita (α). (​C​) Diperkirakan efek usia orang tua.
enunjukkan bahwa mekanisme mutasi independen metilasi juga berperan,

mendukung perbaikan tidak sempurna dari double-strand break sebagai tidaknya dalam spesies ini (44 ). ​Karena dinamika metilasijantan dan
sumber penting dari konversi C ​> ​G pada kedua jenis kelamin (21, 29, 37).
Pada gilirannya, tingginya tingkatC ​> ​transisiT di situs CpG tina mamalia germlinememiliki
​ karakteristik yang relatif baik, kita dapat

diperkirakan disebabkan oleh deaminasi spontan dari methylcytosine (40, embuat prediksi apriori tentang kapan perbedaan jenis kelamin dalamC ​>
41) yang tetap tidak diperbaiki oleh siklus replikasi berikutnya, meskipunnsisiT harus muncul dalam pengembangan untuk memeriksa apakah
studi terbaru dari tumor menunjukkan bahwa mereka mungkin juga hasil nesis mereka dikaitkan dengan metilasi. Secara khusus, selama
mbriogenesis,
dari interaksi antara metilasi dan proses replikasi DNA (3, 42). Pada spesies beberapa putaran demetilasi dan remetilasi DNA global
ragi yang diyakini kekurangan metilasi DNA, bagaimanapun, tingkat jadi untuk memungkinkan penghapusan dan pembentukan kembali
mutasi pada situs CpG juga cukup tinggi (43​-​45), yang mungkin emori epigenetik dari orang tua (46, 47). Karena perubahan metilasi ini
dibagi oleh embrio pria dan wanita hingga penentuan jenis kelamin embrio,
kedua jenis kelamin harus berbagi sebagian besar mutasi terkait metilasi nggi pada ayah ​ dibandingkan pada ibu, kira-kira dua kali lipat dari yang

selama perkembangan awal. Konsisten dengan prediksi ini, kami erlihat untuk jenis mutasi lainnya, menghasilkan peningkatan yang
memperkirakanlebih rendah ​α yang ​untuk transisi CpG daripada jenis itandai dalam ​α ​dengan usia orang tua di CpG ​> ​TpG ( Gbr. 3​C)​ . Untuk
mutasi yang bergantung pada replikasi lainnya pada usia reproduksi awal mendukung peran kunci metilasi dalam mutagenesis transisi CpG,
(misalnya, pada usia 17 tahun, ​α = ​2,6 [2,2, 3,0] vs 3,4 [3,2] , istribusi genom DNMs dalam 1.548 trio Islandia sangat terkait dengan
ngkat
3,7] untuk mutasi selain CpG ​> ​TpG) (Gbr. 3​B​). Setelah penentuan jenis metilasi dalam testis, dan lebih lemah dengan yang di ovarium (48,
kelamin (sekitar 7 minggu setelah pemupukan pada manusia), profil 9) (​ Lampiran SI)​
, Gbr. S8​A)​ . Selain itu, distribusi mutasi ayah di
metilasi sel kuman pria dan wanita berbeda: Remethylation terjadi pada epanjang genom menunjukkan korelasi yang lebih dekat dengan profil
metilasi
awal laki-laki, sebelum diferensiasi spermatogonia, tetapi sangat terlambat testis daripada ovarium, dan sebaliknya untuk mutasi ibu (​SI
pada wanita, hanya sesaat sebelum ovulasi (46, 47). Oleh karena itu, ampiran ​
, Gambar. S8 ​
B ​
d an ​
C ​ ). Singkatnya, ketergantungan jenis kelamin
germline jantan lebih termetilasi dibandingkan dengan germline betina an usia dari transisi CpG sesuai dengan profil metilasi temporal dan
untuk jangka waktu yang lama dari penentuan jenis kelamin orang tua enomik jenis kelamin spesifik dari sel benih mamalia, memberikan bukti
hingga sesaat sebelum konsepsi anak. Dengan demikian, setelah pubertas,ebih lanjut bahwa proses mutagenik terkait metilasi adalah sumber utama
ransisi CpG, dan memvalidasi kesimpulan kami untuk satu kasus di mana
perkiraan ​peningkatanCpG ​> ​mutasiTpG setiap tahun adalah 6,5 kali lebih
ami memiliki informasi independen tentang apa yang harus

9494 ​| ​www.pnas.org/cgi/doi/10.1073/pnas.1901259116 Gao et al.


jumlah yang diharapkan. Bersama denganC ​> ​mutasiG, transisi CpG mewakili
mutasi bertahap dan selanjutnya mengurangi kekuatan. Meskipun sekitar seperempat mutasi titik germinal secara akumulatif,

simulasi ini mengabaikan kesalahan dalam memanggil DNM, ketika dihubungkan ​dengan orang tua berusia 30 tahun pada saat

pembuahan; keduanya menunjukkan tanda-tanda tingkat kesalahan ality tidak nol​-​terutama ketika generasi ketiga adalah
mekanisme mutasi yang diinduksi kerusakan DNA.
tidak tersedia untuk memverifikasi transmisi​-​sehingga perkiraan daya untuk desain trio standar cenderung terlalu tinggi.
Konsisten dengan hal ini .​ Jumlah Mutasi de Novo Meningkat Secara substansial dengan ​pertimbangan, kami menemukan

bahwa dalam dataset deCODE, DNM dari ​Maternal Age. ​Pada mamalia, oosit primer terbentuk dan ​trio dengan dan tanpa

individu generasi ketiga berbeda dalam beberapa ditangkap


​ dalam profilase meiosis I, sebelum kelahiran sifat masa depan,

termasuk ketergantungan jumlah mutasi pada ​ibu, tanpa replikasi DNA lebih lanjut terjadi sampaisubur
usiadan usia orang tua (​Lampiran SI)​ . Oleh karena itu, kami mengharapkan suatu tion. Atas dasar ini, efek usia ibu yang terdeteksi
olehDNM baru-baru ini
efek usia ibupada mutasi postzygotic, jika ada, hanya studi (21, 25, 26) dan dikonfirmasi di sini (Gambar 2​A​) telah dapat dideteksi

menggunakan data. dari jumlah yang cukup besar yang mencerminkan akumulasi lesi DNA atau kerusakan ​dengan lebih dari dua

generasi. Sepengetahuan kami, satu-satunya mutasi yang diinduksi dalam (primer) oosit selamapanjang meiosis yang
datasettersedia untuk umum yang saat ini memenuhi kriteria ini adalah fase penangkapan (16, 21, 23, 50), dicontohkan oleh
peningkatan cepat dataset deCODE, yang meliputi 225 keluarga tiga generasi (21).Cibu ​> m
​ utasiG. Namun, penjelasan lain untuk

a ​Untuk mengurangi kebisingan karena pentahapan yang tidak lengkap dan pemanggilan DNM efek usia ibu dimungkinkan (25).

Sebagai contoh,efek seperti itu


kesalahan, kami fokus pada subset dari 199 probe deCODE yang juga dapat muncul jika oosit yang diovulasi di kemudian hari
telah mengalami hampir semua DNM secara bertahap (​>​95% bertahap) melalui transmisi ke lebih banyak mitosis (51, 52 ).

Dalam skenario ini, peningkatan substansial pada ​individu generasi ketiga. Menariknya, regresi Poisson dari DNM
​ ibu dari usia

17 tahun ke usia 40 tahun (Gambar 2​A)​ akan membutuhkan jumlah mutasi ayah pada kedua usia orangtua mengungkapkan ​oosit

yang diovulasi kemudian dalam kehidupan untuk melewati hampir dua kali lipat
efek marginal signifikan ibu. usia (​P ​= ​0,035) dan sejumlah kecil pembelahan sel dibandingkan dengan mereka yang mengalami
ovulasi awal (lebih banyak, tetapi peningkatan yang tidak signifikan pada kecocokan dibandingkan dengan model jika tingkat

mutasi pembelahan per sel lebih tinggi pada pembelahan sel awal, ​dengan usia ayah saja (​Δ​AIC ​= -​2.4; ​Lampiran SI​, Tabel S8​).
Kita bahas di bawah). Selain itu, skenario ini tidak memberikan
verifikasi bahwa sinyal seperti itu tidak akan muncul secara artifaktual dari perencanaan untuk stabilitas rasio pria-wanita
denganorangtua
korelasiantara usia ibu dan ayah dan usia tugas. Dengan demikian, sementara fenomena ini secara hipotetis dapat berkontribusi
dari usia orang tua ke sampah 1-y (​P ​= ​0,007; lihat ​Bahan dan Metode u​ ntuk efek usia ibu, dalam praktiknya, itu cenderung

menjadikecil ​detail). Kami selanjutnya mencatat bahwa efek usia ibu menjadi efek (lihat ​Lampiran SI u​ ntuk diskusi lebih rinci).
lebih signifikan ketika kita membatasi regresi Poisson hingga 130. Penjelasan yang kurang dihargai untuk efek usia ibu pada bayi

​ ​0,0037 dalam reaksi Poisson ​adalah efek pada mutasi postzygotic (25). Meskipun DNMs
dengan ​>​98% DNM bertahap (​P =

adalah depresi)
​ dan tetap signifikan dalam regresi binomial negatif yang biasanya ditafsirkan sebagai mutasi yang terjadi pada sel

germinal dari par- ​yang memungkinkanjumlah mutasi (​P =


​ ​0,0075; ​SI penyebaran
​ berlebih dalam, bahkan apa yang diidentifikasi
sebagai DNM dalam studi trio adalahge
Lampiran,​ Tabel S8​). Untuk memvisualisasikan efeknya, kami melakukan perbedaan nomik lebih lanjut antara keturunan dan

orang tua dalam analisis DNM di 199 probe dengan membandingkan semua pasangan dengan ​jaringan somatik yang diambil

sampelnya (di sini, darah). Perbedaan-perbedaan ini dapat muncul pada usia
​ ayah yang sama tetapi usia ibu berbeda. Di antara

619 orang tua seperti itu tetapi juga selama perkembangan awal anak (Gbr. 4​A​). ​pasangan, anak yang lahir dari ibu yang lebih tua

membawa lebih banyak ayah. Terutama,


​ beberapa divisi sel embriogenesis telah ditemukan mutasi daripada anak dengan ibu yang

lebih muda dalam 319 kasus, ​menjadi relatif mutagenik, yang mengarah ke mosaik somatik dan germline
lebih sedikit di 280 kasus, dan jumlah yang sama dalam 20 kasus, dan mutasi yang lebih besar pada sapi (53), tikus (54), dan pada
tingkat yang lebih rendah pada perbedaan manusia dalam jumlah mutasi ayah terkait dengan (28, 55​-​58), serta mutasi yang

sumbang antara ​perbedaan yang lebih besar di usia ibu (Kendall​'s​rank tes ​τ = ​0,09, kembar
​ monozigot (21, 59) Peningkatan

​ ​0,022 dengan tes lihat ​Bahan dan Metode ​untuk ​beberapa pembelahan sel pertama mungkin
jumlah mutasi titik dipermutasi;. ​P =

diharapkan, sebagai duautama


detail; Gbr. 4​C)​ . Sebaliknya, tidak ada pengaruh yang signifikan dari komponen ayah perbaikan dasar eksisi hilang dalam
spermatozoa, usia pada jumlah mutasi ibu ketika cocok untuk lesi terkemuka terakumulasi dalam langkah-langkah terakhir dari

spermatogenesis menjadi ​ibu​usia​ (​ P> ​0,31 ; Gambar. 4​D ​dan ​SI Lampiran​, Tabel S8​), hanya diperbaiki dalam zygote (60). More

generally, mammalian zygotes


though we caution that the power to detect such an effect is lower are almost entirely reliant on the protein and transcript
reservoirs of because of the smaller numbers of maternal mutations. the oocyte until the four-cell stage (61​–​63). Thus, if the
replication or

The estimated effect of maternal age on maternal mutations is repair


​ machinery of the oocytes deteriorates with the mother​'​s age

​ ​(64, 65), one consequence could be more mutations in the first


0.34 mutations per year (SE ​= ​0.04) by Poisson regression (​P =

few
3.4e-13). The estimated maternal age effect on paternal mutations cell divisions of the embryo (Fig. 4​B​). This scenario predicts
that the is similar but highly uncertain (0.30, SE ​= ​0.14). Naively, one mother​'​s age influences not only the number of mutations

on the ​might expect the maternal age effect on maternal mutations to be chromosomes inherited from the mother but also from the

father
stronger, as it includes both prezygotic effects (eg, damage in the (which would be assigned to ​“p​ aternal mutations​”​) (Fig. 4​B)​ .
oocyte) and postzygotic effects, whereas the effect on paternal Any maternal age effect on postzygotic mutations is challenging

mutations can only be postzygotic. This expectation is implicitly ​to detect, given the small fraction of postzygotic mutations
estimated based on the assumption of the same postzygotic effects of ma- in
​ humans (66), especially in comparison with the
stochasticity in
ternal age on maternal and paternal genomes, but they need not mutation counts across individuals and the noise induced by in-
be similar. Indeed, before fertilization, sperm and oocytes may complete phasing of mutations. Further reducing the ability to de-

harbor different levels of DNA damage (eg, oxidative stress may ​tect either a pre- or postzygotic effect of maternal age is the high

be higher in male germ cells) (67, 68) and after fertilization but correlation
​ between maternal and paternal ages (which is likely
why
before the first cleavage the two parental genomes experience a maternal age effect was not detected in earlier, smaller studies)

distinct epigenetic remodeling and are replicated separately in ​(33, 36). As an illustration, if we assume a large increase of 0.3
their own pronuclei (69, 70). Thus, the relative contributions of paternal mutations with each year of maternal age and complete

prezygotic and postzygotic effects of maternal age on the maternal phasing


​ of DNMs, we estimate the power to detect this
maternal age
genome are not distinguishable without additional data. Regard- effect in 200 trios to be only 45 to 56% (​SI Appendix,​ Fig. S9​).

less, the positive association between maternal age and the ​Moreover, using trio data alone, DNMs can only be phased based
number of DNMs on paternal chromosomes supports the hy- on informative heterozygous variants in the same reads, so only a

pothesis that a mother​'​s age at conception affects the postzygotic small


​ fraction (typically 25 to 30%) are phased (21, 25, 26) (​SI

mutation rate in the developing embryo. ​Appendix,​ Fig. S1​). If we assume no DNM calling errors and a

In cattle and humans, the high-frequency mosaic mutations uniform


​ phasing rate of 30% across all trios, the power is reduced to
that are likely to have arisen in early embryonic development are 15 to 20% with 200 trios and is 66 to 73% even with 1,000 trios
(​SI
enriched for C ​> ​A transversions (53, 55, 57), potentially reflecting ​Appendix​, Fig. S9​). Moreover, the phasing rate is likely to

vary the accumulation of the oxidative DNA damage 8-hydroxyguanine ​somewhat across families, introducing additional

variation in the in oocytes and the last stages of spermatogenesis (67, 68, 71) that
Gao et al. PNAS ​| ​May 7, 2019 ​| ​vol. 116 ​| ​tidak. 19 ​| ​9495
Fig. 4. ​Maternal age effect on mutations that occur on paternally inherited chromosomes. (​A​) An illustration of mutations occurring during development and gametogenesis.
Adapted from ref. 82. Filled stars represent mutations that arise in the parents and hollow stars mutations in the child. The standard trio approach requires allelic balance in
the child and no or few reads carrying the alternative allele in the parent, leading to inclusion of some early postzygotic mutations in the child (brown open) and exclusion of
a fraction of early mutations in the parents (brown filled). (​B​) An illustration of a potential maternal age effect on the number of postzygotic mutations. The shade of the
oocyte represents its cellular quality, with a darker color indicating a worse condition of the replication or repair machinery. (​C​) Pairwise comparison conditional on the same
paternal age. Each point represents a pair of trios, with the ​x ​axis showing the difference in maternal ages and the ​y ​axis the difference in paternal mutation counts (​Left​;
older mother – younger mother) or maternal mutation counts (​Right;​ older mother – younger mother); point position is slightly jittered to show overlapping points. ​P v​ alues
are evaluated by 10,000 permutations, using Kendall's rank correlation test statistic (​Materials and Methods​). (​D)​ Pairwise comparison conditional on the same maternal
age, similar to ​C.​ The ranges of ​y ​axis differ for the plots on the left and right for visualization purposes.
e effect may be particularly pronounced for these mutations, we focused
C ​> ​A mutations in the 199 probands
remains uncorrected in spermatozoa (60). Hypothesizing that a maternal
with ​>​95% phasing rates. Although this subset represents only ​∼​8%
mutations
of ​ ​0.02 by Poisson regression), and the point
(​P =
mutations, there is a significant effect of maternal age on paternal

9496 ​| ​www.pnas.org/cgi/doi/10.1073/pnas.1901259116 Gao et al.


lower estimate of the maternal age effect on paternal genome (0.095,
substitution rate [interpreted as a lower mutation rate per year SE ​= ​0.041) is even stronger than that of paternal age (0.057, SE ​=

(23, 77​–​79)]. These phylogenetic observations have been widely ​0.033), as well as stronger than the maternal age effect on the

taken to support a replicative origin of most non-CpG mutations (6, maternal


​ genome (0.024, SE ​= ​0.0094; see ​Materials and

Methods ​12, 19, 20, 23, 78, 79). Casting doubt on this interpretation, our for
​ details). Such results are not often obtained in a
random subset analyses of human DNMs show generally weak effects of re- of mutations of the same size (​P ​= ​0.045; ​Materials

and Methods​), ​productive age on the male-to-female mutation ratios as well as on suggesting paternal C ​> ​A mutations are indeed

more strongly yearly


​ mutation rates (​SI Appendix,​ Fig. S6 ​B ​and ​C)​ , an important affected by maternal age than are other DNMs.

After excluding ​role for nonreplicative mutations beyond CpG transitions, and a C
​ ​> ​A mutations, the maternal age effect on
paternal point mu- ​potential maternal age effect on the number of mutations on both tations is no longer significant in the 199

probands with ​>​95% maternal


​ ​ ​0.13) but remains
and paternal genomes. An alternative explanation for the DNMs phased (​P =

significant for the subset of ​phylogenetic patterns is that interspecific differences in the male ​130 probands with phasing rates

higher than 98% (​P ​= ​0.02). ​Thus, a mutation type associated with damage in sperm and

mutation bias and in yearly substitution rates reflect the evolution of ​the ratio of paternal to maternal ages at reproduction (76)

(Fig. 2​B)​ known


​ to be enriched in early embryogenesis shows a heightened signal of a maternal age effect on paternal mutations,

without or of rates of DNA damage (eg, metabolic rates) that covary with ​life history traits (6, 80). entirely accounting for the

signal.
Materials and Methods Discussion
Processing of de Novo Mutation Data. ​For each DNM we obtained parental ​These findings call into question the textbook view that
germline
ages at conception of the child (proband) and the position, allele, and parent- ​mutations arise predominantly from replication errors in germ

cells. First, multiple lines of evidence, reported in previous studies and


​ extended here, suggest that CpG transitions and C ​> ​G

mutation often arise from methylation-associated damage and ​double-strand break repair, respectively (21, 28, 37). Second, and

unexpectedly, even excluding both of these mutation types, roughly threefold more paternal mutations than maternal muta- ​tions

have occurred in young parents, despite similar numbers of estimated


​ germ cell divisions by that age in both parents (Fig. 2 ​B ​and

C​). Moreover, the male-to-female mutation ratio remains ​surprisingly stable with parental age, even as the ratio of male-to-
female cell divisions increases rapidly (Fig. 2 ​B ​and ​C)​ . The high ​α ​of ​∼​3 in young parents could be explained by a vast underesti-
of-origin information from the appendix of the publication for one dataset (21) and by personal communication with the authors for the replication dataset
(25, 26). We considered a mutation as “phased” if the parental haplotype on which it arose was determined by either informative flanking variant in the
read or from transmission to a third generation. See ​SI Ap- pendix​, Table S3 ​for a comparison of summary statistics of these datasets.
For both datasets, we removed indels and mutations on X chromosome (no Y-linked DNMs were reported), which resulted in 98,858 and 35,793 point
mu- tations (or single nucleotide substitutions) for Jónsson et al. (21) and Goldmann et al. (26), respectively. Each of these mutations was then
assigned into one of six mutation types (T > A, T > C, T > G, C > A, C > G, and C > T) based on the original allele present in homozygous state in both
parents and the derived allele that is carried by the child in heterozygous state. Complementary com- binations (such as C > T and G > A) were
combined such that the original allele is ​mation of the number of germ cell divisions in males between ​always a pyrimidine (C or T).

Moreover, each DNM was annotated to be in CpG ​


birth and puberty (30) or a much higher per-cell division mutation
or non-CpG context based on its two immediate flanking bases extracted from ​rate during development of spermatogonia in males, but its
sta-
human reference genome. For analyses of C > T mutations at CpG sites, we ​bility with parental ages cannot. Finally, despite highly variable

excluded those present in CpG islands (annotations downloaded from UCSC ​


cell division rates over development, germline mutations

​ accumulate in rough proportion to absolute time in both sexes (Fig. 2​A a​ nd ​SI Appendix,​ Fig. S6​). Together, these
appear to
findings point ​to a substantial role of DNA damage-induced mutations, raising
browser: CpG Islands track), because these sites are thought to be hypo- methylated and thus behave differently in terms of mutation rate compared
with CpG sites outside CpG islands (CGI) (79). C > T mutations at CpG sites in CGIs were included in analysis of “all point mutations.” ​questions

about the relative importance of endogenous versus exogenous mutagens, as well as about why male and female germ ​cells differ

in the balance of DNA damage and repair. In


​ addition, we identified a tentative signal of a maternal age effect on the number of
mutations on the paternal genome, which ​supports the hypothesis that the age of the mother at conception influences
​ mutagenesis
in early embryonic development of her child. Because violations of the assumptions of the regression model may lead to inflated

significance and the various tests that ​we performed were based on the same dataset, our findings need to
​ be replicated in other
large, independent datasets. A maternal
Test for an Effect of Parental Age on the Male Mutation Bias. ​We modeled the numbers of paternal and maternal DNMs (denoted by ​XP​ i​ and

​X​M​i​,

where the index


​ ​i ​indicates the proband ID) of each trio by two independent Poisson dis- tributions with unknown expected values (denoted as λ​Pi​ ​and
i​
λ​Mi​ ​). Under the assumption
​ that in the same individual the phasing probability (denoted by ​p​ ) of each mutation is identical and independent, the

numbers of phased paternal and maternal DNMs (denoted by ​Y​P​i ​and ​YM
​ i​ ​) also follow independent Poisson distributions
​ with expectations of ​p​i​λ​Pi​ and

​ Poisson process. Moreover, it can be shown that conditional on ​Y​Pi​ +​


pi​ ​λ​M​i,​ based on the thinning property of ​
Y​Mi​ ​, ​YP​ ​i f​ ollows a binomial distribution with a
success parameter of ​r​i ​= λ​P​i​/​(λ​Pi​ +
​ ​ which is exactly the expected contribution of paternal mutations in all DNMs ​age effect on the postzygotic
λ​M​i), ​

mutation rate is plausible, however, ​that we are interested in. Therefore, the test for a paternal age effect on the ​given what is known about

early mammalian embryogenesis, as


male mutation bias becomes a test for an effect of paternal age on the “success ​well as accumulating evidence for a nonnegligible number of
early
rate” ​r​i ​in a series of binomial samples (​YP​ i​ ​, YM ​ embryonic
​ i​ ​) ∼ binom(​YP​ i​ ​+​Y​Mi​ ​, ​ri​ ). ​ mutations among DNMs (28, 53, 54, 66, 72). Given its ​We

performed binomial regression with phased DNM data of 719 trios ​


potential implications, it will be important to investigate further.
with similar parental ages in R using the glm function with option “fam- ​Finally, our findings shed light on the divergent conclusions about

ily=binomial()” and did not detect a significant effect of paternal age with ​
sex-specific mutation rates reached from phylogenetic analyses ver-
sus analyses of DNMs. Pedigree studies in humans and chimpanzees suggest that by typical reproductive ages there is a similar

degree of male bias for de novo CpG transitions and other mutation types (21, ​73), when in phylogenetic analyses CpG transitions

are estimated to have


​ a much weaker male bias (19). Here, we show that the male bias of de novo CpG ​> ​TpG mutations is

significantly lower than that ​of other mutations at young reproductive age but higher at older age (Fig.
​ 3). Thus, results from
pedigree and phylogenetic studies could
​ 0.29 and 0.31, respectively). To take into account the greater dispersion in mutation counts than assumed
either a logit or an identity link function (​P =
under Poisson distribution, we tested quasi-binomial models by specifying “family=quasibinomial()” in glm and again found no significant effect with
​ 0.33 and 0.34, respectively). We also tested the effect of the average age of the father and the mother in these 719
either a logit or an identity link (​P =
trios with the same regression methods and found no significant results. We calculated the predicted fraction of paternal mutations and its 95%
confidence interval (shown in Figs. 1 and 3) with the R function “predict.”

be reconciled if humans and chimpanzees long had shorter genera- ​tion times than at present. In addition, across mammalian

species, a longer
​ generation time is associated with a decreased ratio of X to autosome divergence [interpreted as a greater male
bias in mutation ​Estimation of Sex-Specific Mutation Parameters with a Model-Based Approach. ​Similar to Jónsson et al. (21), we modeled the
expected number of mutations from a parent as a linear function of her (or his) age at conception of the child, and assumed that the observed maternal
(paternal) mutation count follows a ​
(6, 18, 74, 75), but see ref. 76 for complications of this method] and a
Poisson distribution with this expectation. One difference from the Jónsson et al.
​ ay 7, 2019 ​| v​ ol. 116 ​| t​ idak. 19 ​| 9
Gao et al. PNAS ​| M ​ 497
The log joint likelihood of all observed data under a set of mutation parameter values can be expressed as
​ N​
LL​= ​log ∏
L​ = X​N ​
​ 1​ i​
i= ​ 1
i=

log​(​Li​ )​
X​N​
​ ​
= ​C + i​=1 ​(21) model is in how we account for the incomplete parental origin information for the unphased DNMs. As described above, we explicitly
modeled the phasing process as a binomial sampling of DNMs, assuming identical and independent phasing probabilities of all mutations in the same
individual. Therefore, the parental age effects on DNM rates are modeled as the following:

λ​Mi​ =

β​0,​M ​+β​MG ​ i​ ,​
​ M

h​yM ​
​ i​ log​ ​β​0,​M +β​
​ ​ ​i
M​GM

+​yP​ i​ log

​ ​β​0,​P +β​
​ P​G​P​i​ λ​P​i ​= β​0,​P +β​
​ P​G​P​i​,

where index ​i i​ ndicates the proband; λ​Mi​ and


​ ​
λ​P​i are the expected numbers of
​ i​ log
+​yU ​
​ ​0,​M +β​
β ​ M​G​M​i ​+β​0,​P + ​ ​Pi​ −
​ β​PG ​

​ ​i ​and ​G​P​i ​are ages of the mother and the ​father at conception, respectively; and β​0,M​, β​M,​ β​0,P​, and β​P ​are the
maternal and paternal mutations; ​GM

mutation parameters
​ that characterize the sex-specific parental age effects and are shared across all probands (note that β​0,M a
​ nd β​0,P ​are the

extrapolated intercepts at age


​ zero, which are not biologically meaningful quantities and in particular are not necessarily nonnegative). We assumed
linear effects for both sexes in the initial model, but we relaxed this assumption by testing for exponential effects for either or both sexes later (discussed
below and ​SI Appendix​, Table S4​).
Á​
We then modeled the realized numbers of mutations, ​X​Mi​ and

​ ​M​i ​∼ Poisson​À​λ​M​i​ ,
​X​P​i,​ as X
Á​
X​P​i ​∼ Poisson​À​λ​P​i​ .

​ i​ and
The observed phased and unphased mutation counts ​YM ​
​YP​ ​i ​are modeled
​ as

Y​M​i ​∼ Binomial​ ​X​Mi​ ,​ ​pi​ ​ ,

​ Y​P​i ​∼ BinomialX​Pi​ ,​​ pi​ ,​

Y​U​i ​=

​ i​ +
X​M​i ​− ​YM ​

i​
​ β​0,​M +​ β​M​G​M​i ​+ β​0,​P + ​ ​Pi​ ,​
​ β​PG
where ​C i​ s a constant that is independent of the mutation parameters of interest.
We implemented this log likelihood function in R and found the MLEs of the mutation parameters by using function mle2 in the package bbmle with the

optimization method BFGS. To avoid being trapped in local maxima, we tested a grid of initial values for the slopes (β​P a ​ nd β​M)​ . We performed the
estimation for all point mutations altogether as well as for each mutation type separately. We note that the greater overdispersion of the mutation counts
than expected under a Poisson distribution is expected to have minimal influence on the MLEs, as application of Poisson regression and negative
binomial regression to the same dataset produces nearly identical point estimates of the coefficients, despite differences in estimated SEs.
Confidence Intervals of Male-To-Female Mutation Ratio at Given Parental Ages. ​To account for uncertainties in the DNM parameter estimates, we
used a bootstrap approach, randomly resampling the probands with replacement 500 times, keeping the same total number of probands in each run.
For each replicate, we obtained the MLEs of the DNM parameters as described above, predicted the numbers of paternal and maternal mutations at
given ages, and calculated the male-to-female mutation ratio. Thus, each bootstrap replicate provides one point estimate for each of the quantities of
interest, and the approximate distribution for each quantity can be obtained by aggregating results from the 500 replicates. The confidence intervals
shown in Figs. 2 and 3 represent the ranges between 2.5 and 97.5% quantiles of the empirical distributions, and given that they are estimated by
bootstrap, they should be robust to overdispersion of the mutation counts.
Test for Alternative Models for Parental Age Effects. ​In addition to the linear model described in the above, we also considered models with
exponential parental age effects postpuberty for either or both sexes. Specifically, we modeled the exponential parental age effect as follows:

X​M​i ​∼ Poisson​ ​aM


​ + ​ ​ ​GM
​ Exp​h​bM ​
​ i​ −​ P
​ ​
+c​Mi​ ​; ​X​P​i ​∼ Poisson​ ​a​P ​+ Exp​h​bP​ ​ ​ X​P​i ​−​Y​P​i​, where ​pi​ is the phasing rate in proband ​i ​and ​Y​Mi​ ​, ​YP​ ​i,​ and ​Y​Ui​ ​represent the ​numbers of phased maternal,

phased paternal, and unphased mutations, respectively. ​Y​Mi​ ​, Y


​ ​P​i,​ and ​YU​ ​i ​are defined as random variables, and we denote ​the observed values of these
​ ​i​, ​yP​ ​i,​ and ​y​Ui​ ​.
with lowercase notations ​yM
With the parameterization above, the likelihood of the observed data for proband ​i c​ an be written as
​ ​ ​ ​
Li​ = ​P​ ​G​Pi​ −​

P​ YM​ i​ =​

y​M​i​, ​YP​ i​ =

​ i​ ​ ​ β​0,​M,​ β​0,​P​, β​M​, β​P,​ ​G​Mi​ ,​​ G​P ​i​,​pi​ ​ = ​P
​yP​ i​ ,​​ Y​U​i ​=​yU
i +c​P,​
​ 13 is the age of onset of puberty assumed for both sexes. We note that results are not sensitive to the choice of the value of ​P​. Under this
where ​P =
​ re mathematically equiva- lent to models with the same ​bP​ ​(or ​bM
formulation, models with different values of ​P a ​ )​ value but different ​c​P ​(or ​c​M​) values.
Indeed, we confirmed the MLEs for ​bP​ ​and ​b​M ​are the same for different ​P ​values (even for ​P ​= 0).
We obtained the MLEs and corresponding log likelihoods of all four models for all point mutations combined and for each mutation type sep- arately and
used the AIC to compare the relative fits of different models (a smaller AIC indicates a better fit of the model). We took ΔAIC < −6 as the threshold for
evidence for a significantly better fit (∼20-fold more probable). The models with exponential paternal age effect provide worse fits (ΔAIC > 0) for all
mutation types.
For all DNMs combined, models with exponential effects of maternal age or both parental ages provide significantly better fits but are not significantly
different from each other. As verification, we split the 1,548 trios into two groups with maternal age at conception over and under 27 y (the median
maternal ages in the dataset), respectively, and fitted both with linear pa- rental age effects (see results in ​SI Appendix,​ Table S5​).
Among all mutation types considered, C > G transversions are the only type for which the model with exponential maternal age effect provides a
significantly better fit by the criterion of ΔAIC < −6 (​SI Appendix​, Table S4​). Therefore, in all analyses for C > G transversions (eg, calculation of α), we
used the estimates from the model with an exponential maternal age effect (and linear paternal age effect) fitted to all 1,548 trios. For all DNMs com-
bined, the model with an exponential maternal age effect also provides a significantly better fit than the linear model. Interestingly, considering all
9498 ​| w ​ ww.pnas.org/cgi/doi/10.1073/pnas.1901259116 Gao et al.
​ ​ ​ ​ ​ ​ ​ ​ ​ X​ P​ ​ ​ ​ ​ ​ ​ ​ ​
y​M​i,​​ y​Pi​ ,​ ​y​U​i​ ​ ​XM
​ i​ ,​ ​X​P ​i​, ​p​i​ P​ XM
​ ​i​ ​ β​0,​M,​ β​M,​ ​GM ​ ​P​i​ = ​ xM​ ​i,​​ xP​ ​i​ yM
​ i​ ​ P​ XP​ i​ ​ ​ β​0,​P,​ β​P​, G ​ i​ ​,​y​P​i,​ ​yU​ i​ ​ ​ ​X​M​i ​= ​xM
​ ​i​, ​X​P​i ​= ​x​P​i​,​pi​ ​ P​ XM
​ ​i ​= ​xM
​ i​ ​ ​ β​0,​M,​ β​M​, ​G​M​i​ × ​P​ XP​ ​i ​=​xP​ i​ ​ ​ β​0,​P,​
β​P,​ ​GP​ i​
X​y​
=​ U​
i​
k​=0

​ ​ ​ ​ ​ ​ ​ ​ ​
P​ y​M​i​, ​yP​ i​ ,​ ​yU
​ i​ ​ ​ X
​ ​M​i ​=​yM ​
​ i​ +​ k,​ ​X​P​i ​ = ​yP​ ​i ​+​yU ​
​ i​ −​ k,​ ​p​i​P​ X​M​i ​= ​xM ​ i​ ​ P​ XP​ i​ =
​ ​i​ ​ β​0,​M,​ β​M,​ ​GM ​
​x​P​i​ ​ β​0,​P​, β​P​, ​G​P​i​ .
We note that the likelihood function of Jónsson et al. (21) does not include the first term, which is the probability of the observed data given possible
partitions of the unphased mutations into paternal and maternal origins (assuming the same phasing rates of maternal and paternal mutations). As an

​ ​i,​ ​yP​ ​i,​ ​y​Ui​ ​) = (10, 30, 80) is more ​probable under (​x​Mi​ ,​ ​xP​ i​ )​ = (30, 90), where one-third of DNMs were phased ​for both
illustration, the set of observations (​yM

​ i​ ​, ​xP​ i​ ​) = (80, 40), where 75% pa- ​ternal DNMs were phased but only 12.5% of maternal DNMs.
parental origins, than under (​xM
The likelihood function for proband ​i c​ an be simplified as (see derivation in ​SI Appendix)​ :
i​(​y​ i​
Li​ = ​ ​ M​y​ U​+​yi​P i​ )​​ À​1 −​p!
​ p ​ ​yM ​ Pi​ ​
​ i​ !​ y​ !
Á​
i​ y​U ​i

​ ​ (​β​ +β​ G​ i ​ ​
​ β​M​G​M​i​ y​Mi​ ​ ​β​0,​P ​+ β​PG
· ​β​0,​M + ​ P ​ i​ ​ yP​ ​i​ ​β​0,​M +β​
​ M​G​M​i ​+ β​0,​P e
​ ​ 0,​M ​ M​ M ​ +β​0,​P +β​
​ ​ ​i​ y​U ​i ​.
​ ​i​ + β​P​GP
P​GP )​
i​
The first term of the likelihood contains the phasing rate (​p​ ) but is independent of the mutation parameters, whereas the second term is dependent on
the mutation parameters but independent of ​p​i​. Therefore, the maximum likeli- hood estimator (MLE) of ​pi​ ​and those of the mutation parameters can be
identified by maximizing the first and second terms separately.
with trios, even after C > G transversions (or C > G transversions and CpG tran-
a model without a maternal age effect on paternal mutations (model 0), sitions) are excluded, an exponential maternal age effect still provides a
and the model with the same maternal effect on both maternal and paternal significantly better fit for other point mutations combined (ΔAIC < −9; ​SI
mutations gives the best fit based on AIC (ΔAIC = −3.7; MLE of maternal age ​Appendix,​ Table S6​), suggesting that the signal is not driven by C > G mu-
effect is 0.34 mutations per year; ​SI Appendix,​ Table S8​). tations alone. This effect is no longer discernible when trios with maternal
We also carried out a “pairwise analysis” of the same data conditional on age above 40 are excluded (​SI Appendix,​ Table S6​).
paternal age. Specifically, we compared all pairs of trios with the same pa-
Processing of Ovary and Testis Methylation Data at CpG Sites. ​The methylation

ternal age, ​G​P​, but different maternal ages, ​GM


​ ​, (ie, a pairwise analysis). Because
​ some pairs include the same probands and are thus not indepen-
data were generated as part of the Roadmap Epigenomics Project (48, 49).
dent, we did a permutation test by swapping the maternal ages within We downloaded the methylation data from GEO (​https://www.ncbi.nlm.nih.
paternal age bin and calculating the adjusted z-score of Kendall's tau-b ​gov/geo/​) with accession numbers GSM1010980 for ovary and GSM1127119
statistic. 220 out of 10,000 permutations had statistics equal to or greater for testis (sperm). The methylation levels were measured by bisulfate se-
quencing of testis spermatozoa primary cells from a male donor (age and descent unknown) and ovary cells from a 30-y-old female donor of European
descent, respectively. Methylation levels (measured as percentage methyl- ated) are reported only for CpG sites in the reference human genome:
27,057,581 (94.3%) of the ∼28,700,000 CpG sites (∼57,400,000 bp) have reported methylation levels in ovary and 26,693,016 (93%) have that in-
formation for testis. CpG sites with data available were sorted based on their modification levels and grouped into bins of 100,000 sites (ie, 50,000
CpGs). The average methylation level of each bin was then correlated with the total number of C > T DNMs in the 1,548 Icelandic trios that occurred at
the 100,000 sites (an estimate of the average mutation rate of these sites). We note that the methylation profile of ovary cells may be a poor proxy for
that of (primary) oocytes, so the correlation between CpG > TpG DNM rate and methylation may be underestimated. In addition, there is likely interindi-
vidual variation in methylation profiles, but such variation is typically smaller than intertissue variation (81), so it is expected to reduce the correlation
between methylation and mutation rates in both tissues by a small amount.
than that observed with in real data (corresponding to an empirical one- tailed ​P v​ alue of 0.022). To estimate the effect size of maternal age, we ran
weighted linear regression of the difference in paternal counts on the dif- ference in maternal ages for each pair of trios with the same paternal age (with
an intercept of zero), with the weight of each data point specified as the inverse of the paternal age, which is approximately proportional to the variance
in the observed difference in paternal mutation counts (​SI Ap- pendix​, Table S8​). Because the mutation counts are integers and do not follow a normal
distribution, the SEs are inaccurate.
One concern is that parental ages are assigned to integer bins in the Icelandic dataset, and there is potentially a subtle correlation between maternal

and paternal ages even within a paternal age bin, in which case variation in paternal age counts caused by small ​GP​ v​ ariation may be mis- takenly

​ .​ To address this concern, we simulated data
ascribed to an effect of ​GM ​ of 199 trios with similar parental age structure but no maternal age effect on
paternal DNMs and asked how frequently analysis of simulated data based on binned parental ages would generate signals comparable to those
observed in actual data. To mimic the distributions of maternal and
Detection and Estimation of Maternal Age Effect on Paternal Mutation Rate. ​For analyses in this section, we focused on the 199 probands in which
almost all DNMs were phased (>95% DNM phased). We first did a Poisson regression (with an identity link) of the count of paternal point mutations on

both pa- rental ages and found a marginally significant effect of the maternal age (​P =
paternal ages and the correlation between them in the actual dataset, we simulated an exact maternal age for each trio by adding a random variable
that is uniform on (0,1) to the integer maternal age given in the dataset, and a corresponding exact paternal age taken from 2.70 + 1.076​G​M ​+ ​e,​ where
e f​ ollows Normal(0, 4.5) (parameters obtained by ordinary linear regression on 0.035) and a slight but nonsignificant improvement in the fit compared
with a
the binned parental ages in the dataset). We then simulated the paternal model with paternal age only (ΔAIC = −2.4; ∼3.3-fold more probable); ​P
DNM count as a Poisson random variable with expectation of either 1.51​G​P +
​ values and AIC were obtained by the glm function in R [with the option
6.05 [as estimated by Jónsson et al. (21)] or 1.41​G​P + ​ 5.56 (estimated by our “family = poisson(link = “identity”)”]. In contrast, regressing the maternal
maximum likelihood model) and ran Poisson regression or pairwise analysis mutation count on both parental ages does not provide any improvement in
on the mutation counts and integer parts of parental ages, as described the fit compared with a model with maternal age alone (ΔAIC = 0.2; ​SI Ap-
above. The simulated data generated either a greater or equal maternal age ​pendix​, Table S8​), although the power to detect an effect of paternal age
on
effect on paternal mutations by Poisson regression or a z-score of Kendall's maternal mutation, if any, is lower due to the low mutation counts.
tau-b statistic as significant or more significant in only about 3.5% of Concerned about violation of the equidispersion assumption (ie, that E[X] =
10,000 replicates and both in ∼0.7%, suggesting that this scenario is unlikely Var[X]) in Poisson regression, we tested for an overdispersion of the
mutation
to lead to the patterns observed (​SI Appendix,​ Table S9​). counts using the dispersiontest function in the R package AER and found a significant
overdispersion in paternal mutation counts even under a model with
ACKNOWLEDGMENTS. ​We thank Michel Georges for useful discussions in person both parental ages (dispersion factor = 1.36; ​P ​= 0.0074). We
therefore also
and in his BioRxiv preprint on postzygotic mutations in cattle; Ipsita Agarwal, Mike tested the maternal age effect on paternal mutations with a negative
binomial
Eisen, Arbel Harpak, Jonathan Pritchard, Zev Williams, and members of the MP regression using the glm.nb function with option “link = identity” and
signifi-
and Pritchard laboratories for helpful discussions; and Graham Coop's laboratory, cance was somewhat reduced (to ​P = ​ 0.062; ​SI Appendix,​ Table S8​).
However, when we limited the analysis to a smaller but more stringent dataset, the 130 trios with >98% DNMs phased, the effect of maternal age on
paternal mutations was significant at the 5% level (​P = ​ 0.0075; ​SI Appendix​, Table S8​).
Motivated by these findings, we reestimated the mutation parameters by maximum likelihood under models including a maternal age effect on paternal
mutations (ie, “maternal-on-paternal effect”) of the same size (model 1) or a
Chuck Langley, Wendy Wong, Vladimir Seplyarskiy, and anonymous reviewers for comments on an earlier version of the manuscript. This work was
supported by a Burroughs Wellcome Fund Career Award at the Scientific Interface (to PM); NIH Grants R01GM122975 (to MP) and R01GM059290,
R01GM104390, and R35GM118335 (to LBJ); NIH National Human Genome Research Institute Grants R01HG006693 and R01HG009141 (to ARQ and
BSP); National In- stitute of General Medical Sciences Grant R01GM124355 (to ARQ and BSP); National Cancer Institute Grant U24CA209999 (to
ARQ and BSP); and NIH different size (model 2) than the maternal age effect on maternal mutations.
Training Grant T32GM007464 (to TAS). ZG is partially supported by NIH Both models provide slight but insignificant improvements in fit compared
Grants U01HG009431 and R01HG008140 (awarded to J. Pritchard).
1. Huttley GA, Jakobsen IB, Wilson SR, Easteal S (2000) How important is DNA replication
for mutagenesis? ​Mol Biol Evol ​17:929–937. 2. Kumar S, Subramanian S (2002) Mutation rates in mammalian genomes. ​Proc Natl
Acad Sci USA 9 ​ 9:803–808. 3. Poulos RC, Olivier J, Wong JWH (2017) The interaction between cytosine methylation and processes of DNA replication and repair shape the
mutational landscape of cancer genomes. ​Nucleic Acids Res ​45:7786–7795. 4. Wu CI, Li WH (1985) Evidence for higher rates of nucleotide substitution in rodents
than in man. ​Proc Natl Acad Sci USA 8 ​ 2:1741–1745. 5. Hwang DG, Green P (2004) Bayesian Markov chain Monte Carlo sequence analysis reveals varying neutral substitution
patterns in mammalian evolution. ​Proc Natl Acad Sci USA 1 ​ 01:13994–14001. 6. Wilson Sayres MA, Venditti C, Pagel M, Makova KD (2011) Do variations in sub- stitution rates
and male mutation bias correlate with life-history traits? A study of 32 mammalian genomes. ​Evolution ​65:2800–2815. 7. Lynch M (2010) Evolution of the mutation rate. ​Trends
Genet 2 ​ 6:345–352.
8. Lynch M, et al. (2016) Genetic drift, selection and the evolution of the mutation rate.
Nat Rev Genet 1 ​ 7:704–714. 9. Crow JF (1997) The high spontaneous mutation rate: Is it a health risk? ​Proc Natl Acad
Sci USA 9 ​ 4:8380–8386. 10. Acuna-Hidalgo R, Veltman JA, Hoischen A (2016) New insights into the generation
and role of de novo mutations in health and disease. ​Genome Biol 1 ​ 7:241. 11. Drost JB, Lee WR (1995) Biological basis of germline mutation: Comparisons of spontaneous
germline mutation rates among drosophila, mouse, and human. ​Environ Mol Mutagen ​64:48–64. 12. Li WH, Ellsworth DL, Krushkal J, Chang BHJ, Hewett-Emmett D (1996)
Rates of nu- cleotide substitution in primates and rodents and the generation-time effect hy- pothesis. ​Mol Phylogenet Evol 5 ​ :182–187. 13. Crow JF (2000) The origins, patterns
and implications of human spontaneous muta-
tion. ​Nat Rev Genet ​1:40–47. 14. Strachan T, Read A (2018) ​Human Molecular Genetics ​(Garland, New York),
5th Ed.
Gao et al. PNAS ​| ​May 7, 2019 ​| ​vol. 116 ​| ​tidak. 19 ​| ​9499
47. 15. Müller H (1954) The nature of genetic effects produced by irradiation. ​Radiation
Kobayashi H, et al. (2013) High-resolution DNA methylome analysis of primordial ​Biology: Ionizing Radiations​, ed Hollaender A (McGraw-Hill, New York), pp 351–473.
germ cells identifies gender-specific reprogramming in mice. ​Genome Res ​23: 16. Gao Z, Wyman MJ, Sella G, Przeworski M (2016) Interpreting the dependence of
616–627. mutation rates on age and time. ​PLoS Biol ​14:e1002355.
48. Lister R, et al. (2009) Human DNA methylomes at base resolution show widespread 17. Seplyarskiy VB, et al. (2019) Error-prone bypass of DNA lesions during
lagging-strand
epigenomic differences. ​Nature 4 ​ 62:315–322. replication is a common source of germline and cancer mutations. ​Nat Genet 5 ​ 1:
49. Gascard P, et al. (2015) Epigenetic and transcriptional determinants of the human 36–41.
breast. ​Nat Commun 6 ​ :6351. 18. Makova KD, Li WH (2002) Strong male-driven evolution of DNA sequences in humans
50. Goriely A (2016) Decoding germline de novo point mutations. ​Nat Genet 4 ​ 8:823–824. and apes. ​Nature ​416:624–626.
51. Polani PE, Crolla JA (1991) A test of the production line hypothesis of mammalian 19. Taylor J, Tyekucheva S, Zody M, Chiaromonte F, Makova KD (2006) Strong and weak
oogenesis. ​Hum Genet ​88:64–70. male mutation bias at different sites in the primate genomes: Insights from the
52. Fulton N, Silva SJM, Bayne RAL, Anderson RA (2005) Germ cell proliferation and ap- human-chimpanzee comparison. ​Mol Biol Evol ​23:565–573.
optosis in the developing human ovary. ​J Clin Endocrinol Metab 9 ​ 0:4664–4670. 20. Thomas GWC, et al. (2018) Reproductive longevity predicts mutation rates in pri-
53. Harland C, et al. (October 9, 2016) Frequency of mosaicism points towards mutation- mates. ​Curr Biol 2 ​ 8:3193–3197.e5.
prone early cleavage cell divisions. bioRxiv:10.1101/079863. 21. Jónsson H, et al. (2017) Parental influence on human germline de novo mutations in
54. Lindsay SJ, Rahbari R, Kaplanis J, Keane TM, Hurles ME (May 23, 2018) Striking dif- 1,548 trios from Iceland. ​Nature ​549:519–522.
ferences in patterns of germline mutation between mice and humans. bioRxiv: 22. Vogel F, Rathenberg R (1975) Spontaneous mutation in man. ​Adv Hum Genet ​5:
10.1101/082297. 223–318.
55. Huang AY, et al. (2014) Postzygotic single-nucleotide mosaicisms in whole-genome 23. Ségurel L, Wyman MJ, Przeworski M (2014) Determinants of mutation rate variation
sequences of clinically unremarkable individuals. ​Cell Res 2 ​ 4:1311–1327.
in the human germline. ​Annu Rev Genomics Hum Genet ​15:47–70. 24. Scally A (2016) Mutation rates and the evolution of germline structure. ​Philos Trans R
Soc B Biol Sci 3 ​ 71:20150137. 25. Wong WSW, et al. (2016) New observations on maternal age effect on germline de
novo mutations. ​Nat Commun ​7:10486. 26. Goldmann JM, et al. (2016) Parent-of-origin-specific signatures of de novo mutations.
Nat Genet 4 ​ 8:935–939. 27. Nielsen CT, et al. (1986) Onset of the release of spermatozoa (spermarche) in boys in relation to age, testicular growth, pubic hair, and height. ​J Clin
Endocrinol Metab ​62: 532–535. 28. Rahbari R, et al.; UK10K Consortium (2016) Timing, rates and spectra of human
germline mutation. ​Nat Genet ​48:126–133. 29. Agarwal I, Przeworski M (January 15, 2019) Signatures of replication, recombination and sex in the spectrum of rare variants on
the human X chromosome and autosomes. bioRxiv:10.1101/519421. 30. Forster P, et al. (2015) Elevated germline mutation rate in teenage fathers. ​Proc R Soc
B Biol Sci 2​ 82:1–7. 31. Kondrashov AS (2003) Direct estimates of human per nucleotide mutation rates at
20 loci causing Mendelian diseases. ​Hum Mutat 2 ​ 1:12–27. 32. Hodgkinson A, Ladoukakis E, Eyre-Walker A (2009) Cryptic variation in the human
mutation rate. ​PLoS Biol ​7:e1000027. 33. Francioli LC, et al.; Genome of the Netherlands Consortium (2015) Genome-wide
patterns and properties of de novo mutations in humans. ​Nat Genet 4 ​ 7:822–826. 34. Nachman MW, Crowell SL (2000) Estimate of the mutation rate per nucleotide in
humans. ​Genetics 1 ​ 56:297–304. 35. Elango N, Kim SH, Vigoda E, Yi SV (2008) Mutations of different molecular origins exhibit contrasting patterns of regional substitution rate
variation. ​PLOS Comput Biol ​4:e1000015. 36. Kong A, et al. (2012) Rate of de novo mutations and the importance of father's age to
disease risk. ​Nature ​488:471–475. 37. Goldmann JM, et al. (2018) Germline de novo mutation clusters arise during oocyte aging in genomic regions with high
double-strand-break incidence. ​Nat Genet ​50: 487–492. 38. Montgomery SB, et al. (2013) The origin, evolution, and functional impact of short insertion–deletion variants
identified in 179 human genomes. ​Genome Res 2 ​ 3:
56. Acuna-Hidalgo R, et al. (2015) Post-zygotic point mutations are an underrecognized
source of de novo genomic variation. ​Am J Hum Genet 9 ​ 7:67–74. 57. Ju YS, et al. (2017) Somatic mutations reveal asymmetric cellular dynamics in the early
human embryo. ​Nature ​543:714–718. 58. Lim ET, et al. (2017) Rates, distribution and implications of postzygotic mosaic mu-
tations in autism spectrum disorder. ​Nat Neurosci 2 ​ 0:1217–1224. 59. Dal GM, et al. (2014) Early postzygotic mutations contribute to de novo variation in a
healthy monozygotic twin pair. ​J Med Genet ​51:455–459. 60. Smith TB, et al. (2013) The presence of a truncated base excision repair pathway in
human spermatozoa that is mediated by OGG1. ​J Cell Sci 1 ​ 26:1488–1497. 61. Braude P, Bolton V, Moore S (1988) Human gene expression first occurs between the
four- and eight-cell stages of preimplantation development. ​Nature ​332:459–461. 62. Dobson AT, et al. (2004) The unique transcriptome through day 3 of human pre-
implantation development. ​Hum Mol Genet ​13:1461–1470. 63. Zhang P, et al. (2009) Transcriptome profiling of human pre-implantation develop-
ment. ​PLoS One ​4:e7844. 64. Titus S, et al. (2013) Impairment of BRCA1-related DNA double-strand break repair
leads to ovarian aging in mice and humans. ​Sci Transl Med ​5:172ra21. 65. Wei H, et al. (2015) Age-specific gene expression profiles of Rhesus monkey Ovaries
detected by microarray analysis. ​BioMed Res Int ​2015:625192. 66. Jónsson H, et al. (2018) Multiple transmissions of de novo mutations in families. ​Nat
Genet 5 ​ 0:1674–1680. 67. De Iuliis GN, et al. (2009) DNA damage in human spermatozoa is highly correlated with the efficiency of chromatin remodeling and the formation of
8-hydroxy-2​′​- deoxyguanosine, a marker of oxidative stress. ​Biol Reprod 8 ​ 1:517–524. 68. Lim J, Luderer U (2011) Oxidative damage increases and antioxidant gene expression
decreases with aging in the mouse ovary. ​Biol Reprod ​84:775–782. 69. Ferreira J, Carmo-Fonseca M (1997) Genome replication in early mouse embryos fol-
lows a defined temporal and spatial order. ​J Cell Sci 1 ​ 10:889–897. 70. Mayer W, Niveleau A, Walter J, Fundele R, Haaf T (2000) Demethylation of the zygotic
paternal genome. ​Nature ​403:501–502. 71. Ohno M, et al. (2014) 8-oxoguanine causes spontaneous de novo germline mutations
in mice. ​Sci Rep 4 ​ :4689. 72. Sasani TA, et al. (2019) Large, three-generation CEPH families reveal post-zygotic mosaicism and variability in germline mutation accumulation.
bioRxiv:10.1101/552117. Preprint, posted February 17, 2019. 749–761.
73. Venn O, et al. (2014) Strong male bias drives germline mutation in chimpanzees. 39. Kloosterman WP, et al.; Genome of Netherlands Consortium (2015) Characteristics of
Science ​344:1272–1275. de novo structural changes in the human genome. ​Genome Res ​25:792–801.
74. Chang BH, Shimmin LC, Shyue SK, Hewett-Emmett D, Li WH (1994) Weak male-driven 40. Lindahl T, Nyberg B (1974) Heat-induced deamination of cytosine residues in
deoxy-
molecular evolution in rodents. ​Proc Natl Acad Sci USA 9 ​ 1:827–831. ribonucleic acid. ​Biochemistry 1
​ 3:3405–3410.
75. Chang BHJ, Hewett-Emmett D, Li WH (1996) Male-to-female ratios of mutation rate in 41. Fryxell KJ, Zuckerkandl E (2000) Cytosine deamination plays a primary role in the
higher primates estimated from intron sequences. ​Zool Stud ​35:36–48. evolution of mammalian isochores. ​Mol Biol Evol ​17:1371–1383.
76. Amster G, Sella G (2016) Life history effects on the molecular clock of autosomes and 42. Tomkova M, Mcclellan M, Kriaucionis S, Schuster-böckler B (2018) DNA
replication
sex chromosomes. ​Proc Natl Acad Sci USA ​113:1588–1593. and associated repair pathways are involved in the mutagenesis of methylated cy-
77. Li WH, Tanimura M (1987) The molecular clock runs more slowly in man than in apes tosine. ​DNA Repair 6 ​ 2:1–7.
and monkeys. ​Nature 3 ​ 26:93–96. 43. Zhu YO, Siegal ML, Hall DW, Petrov DA (2014) Precise estimates of mutation rate and
78. Kim SH, Elango N, Warden C, Vigoda E, Yi SV (2006) Heterogeneous genomic mo- spectrum in yeast. ​Proc Natl Acad Sci USA ​111:E2310–E2318.
lecular clocks in primates. ​PLoS Genet ​2:e163. 44. Behringer MG, Hall DW (2015) Genome-wide estimates of mutation rates and spec-
79. Moorjani P, Amorim CEG, Arndt PF, Przeworski M (2016) Variation in the molecular trum in Schizosaccharomyces pombe indicate CpG sites are highly mutagenic despite
clock of primates. ​Proc Natl Acad Sci USA 1 ​ 13:10607–10612. the absence of DNA methylation. ​G3 (Bethesda) ​6:149–160.
80. Martin AP, Palumbi SR (1993) Body size, metabolic rate, generation time, and the 45. Sharp NP, Sandell L, James CG, Otto SP (2018) The genome-wide rate and spectrum
of
molecular clock. ​Proc Natl Acad Sci USA 9 ​ 0:4087–4091. spontaneous mutations differ between haploid and diploid yeast. ​Proc Natl Acad Sci
81. Schultz MD, et al. (2015) Human body epigenome maps reveal noncanonical DNA ​USA ​115:E5046–E5055.
methylation variation. ​Nature 5 ​ 23:212–216. 46. Reik W, Dean W, Walter J (2001) Epigenetic reprogramming in mammalian devel-
82. Moorjani P, Gao Z, Przeworski M (2016) Human germline mutation and the erratic opment. ​Science 2 ​ 93:1089–1093.
evolutionary clock. ​PLoS Biol 1 ​ 4:e2000744.
9500 ​| ​www.pnas.org/cgi/doi/10.1073/pnas.1901259116 Gao et al.

Anda mungkin juga menyukai