Anda di halaman 1dari 11

ARTIKEL

https://doi.org/10.1038/s41467-020-19093-1 BUKA

Akurasi kimia kuantum dari perkiraan fungsional


kepadatan melalui pembelajaran mesin
2,3,4, Klaus-Robert Muller1,5,6&
Mihail Bogojeski1,9, Leslie Vogt-Maranto 2,9, Mark E. Tuckerman
Kieron Burke 7,8✉

Teori fungsional kepadatan Kohn-Sham (DFT) adalah alat standar di sebagian besar cabang kimia,
1234567890():,;

tetapi akurasi untuk banyak molekul terbatas pada 2-3 kkal ⋅ mol-1 dengan fungsi yang tersedia saat ini.
Metode ab initio, seperti kluster berpasangan, secara rutin menghasilkan akurasi yang jauh lebih
tinggi, tetapi biaya komputasi membatasi penerapannya pada molekul kecil. Dalam makalah ini, kami
memanfaatkan pembelajaran mesin untuk menghitung energi cluster gabungan dari kepadatan DFT,
mencapai akurasi kimia kuantum (kesalahan di bawah 1 kkal⋅ mol-1) pada data percobaan. Selain itu,
berbasis kepadatan-pembelajaran (hanya mempelajari koreksi terhadap perhitungan DFT standar,
disebut, -DFT ) tandafitidak dapat mengurangi jumlah data pelatihan yang diperlukan, terutama ketika
simetri molekuler disertakan. Kekokohan dari-DFT disorot dengan mengoreksi “di flkamu”
Simulasi dinamika molekuler (MD) berbasis DFT dari resorsinol (C6H4(oh)2) untuk mendapatkan lintasan MD
dengan akurasi klaster berpasangan. Oleh karena itu, kami menyimpulkan bahwa-DFT memfasilitasi
menjalankan simulasi MD fase gas dengan akurasi kimia kuantum, bahkan untuk geometri
tegang dan perubahan konformer di mana DFT standar gagal.

1Grup Pembelajaran Mesin, Technische Universität Berlin, Marchstr. 23, 10587 Berlin, Jerman.2Departemen Kimia, Universitas New York, New York, NY 10003, AS. 3
Institut Ilmu Matematika Courant, Universitas New York, New York, NY 10012, AS. 4Pusat Kimia Komputasi NYU-ECNU di NYU Shanghai, 3663 Zhongshan Road North,
Shanghai 200062, Cina. 5 Departemen ArtifiIntelijen sosial, Universitas Korea, Anam-dong, Seongbuk-gu, Seoul 02841, Korea. 6Max-Planck-Institut für Informatik,
Stuhlsatzenhausweg, 66123 Saarbrücken, Jerman. 7Departemen Fisika dan Astronomi, Universitas California, Irvine, CA 92697, AS. 8Departemen Kimia, Universitas
California, Irvine, CA 92697, AS. 9Para penulis ini memberikan kontribusi yang sama: Mihail Bogojeski, Leslie Vogt-Maranto. ✉surel: mark.tuckerman@nyu.edu; klaus-
robert.mueller@tu-berlin.de; kieron@uci.edu

KOMUNIKASI ALAM | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications 1


ARTIKEL KOMUNIKASI ALAM | https://doi.org/10.1038/s41467-020-19093-1

T
model yang digunakan dalam pekerjaan ini adalah regresi kernel ridge
metode telah melahirkan banyak kemajuan dalam ilmu (KRR), prinsip dasar yang dalam pembangunan fungsi kepadatan telah
diamolekuler. Ini termasuk
baru-baru ini meningkatkan prediksipembelajaran
popularitas sifat mesin (ML) dikembangkan selama beberapa tahun.63-69. Untuk memajukan kerangka
sistem atomistik melintasi ruang kimia1-26, konstruksi kekuatan yang kerja ML kami53 untuk prediksi energi kluster berpasangan (CC), sebagai
akurat fitua27-39 untuk simulasi dinamika molekuler (MD) berbasis ML, lawan dari energi DFT, kita hanya perlu mengenali bahwa prosedur
representasi distribusi statistik (dimensi tinggi) dari konformer konstruksi ML dasar tidak bergantung pada sumber input. Oleh karena itu,
molekuler40-42, atau prediksi kinetika transformasi struktural material orang dapat dengan mudah membayangkan melatih peta-peta yang
43. Dalam banyak aplikasi, tugas utama model ML adalah memprediksi disebutkan di atas pada satu set kepadatan dan energi CC. Namun, dalam
hasil perhitungan struktur elektronik tanpa perhitungan's harus praktiknya, beberapa paket kimia kuantum menghasilkan kerapatan
secara eksplisit dilakukan. Hal ini dapat dilakukan pada setiap tingkat elektron CC, karena itu bukan sesuatu yang diperlukan untukfidan energi
yang diinginkan dari teori struktur elektronik dari teori fungsi densitas CC. Oleh karena itu, untuk menghindari kebutuhan menghitung kerapatan
(DFT) hingga standar emas saat ini, yaitu, kluster berpasangan elektron CC, kami menunjukkan bahwa peta kerapatan-energi dapat dibuat
dengan eksitasi rangkap tiga tunggal, ganda, dan perturbatif dengan mempertimbangkan energi CC sebagai fungsi kerapatan DFT yang
(CCSD(T)). Sementara yang terakhir umumnya lebih disukai, itu diduga diperoleh dalam pendekatan standar seperti PBE, yaitu, regresi energi CC
tidak7 penskalaan komputasi dengan ukuran sistem membuatnya dari kepadatan PBE. Kepadatan digunakan sebagai deskripsi yang
menjadi penghalang untuk sistem molekul besar atau bahkan untuk disebutkan di atas untuk potensi tertentu dan juga dapat berfungsi
sistem kecil jika banyak perhitungan energi dan gradien energi sebagai masukan untuk mempelajari sifat-sifat lainnya. Algoritme ML
diperlukan, seperti yang akan terjadi dalam simulasi MD atau kemudian belajar memprediksi energi CC sebagai fungsi dari perkiraan
optimasi geometri. Oleh karena itu, Kohn-Sham (KS) DFT, dengan kepadatan (deskriptor) yang diprediksi ML. Yang penting, kamifidan kira-
putatifnyatidak3 penskalaan, sering digunakan sebagai kompromi kira mudah untuk melatih model yang mengembalikan energi CC dari
yang dapat diterima antara efek komputasifisiensi dan akurasi. kerapatan DFT seperti halnya melatih energi DFT yang konsisten sendiri.
Sayangnya, fungsi gelombang dan formalisme DFT sangat berbeda Kami tambahanfidan bahwa penggunaan densitas yang mendekati kasar
sehingga tidak ada cara yang diketahui untuk menggabungkan menghasilkan pengurangan akurasi (bahkan untuk energi DFT),
akurasi yang pertama dengan kecepatan yang terakhir. Dengan menunjukkan pentingnya menggunakan densitas yang akurat.
demikian, kemajuan penting dapat dicapai jika kekuatan ML dapat Memanfaatkan pengalaman ML yang ada70, kami selanjutnya
dimanfaatkan untuk memungkinkan sejumlah besar perhitungan menunjukkan bahwa adalah mungkin untuk mempelajari perbedaan
CCSD(T) dilakukan dengan biaya yang sama atau bahkan kurang dari antara energi DFT dan CC sebagai fungsi dari densitas DFT masukan. Yang
jumlah perhitungan DFT yang sama untuk sistem tertentu. . penting, ini bisa dilakukan dengan lebih efektiffidaripada mempelajari
Skema ML yang mampu mewujudkan tujuan tersebut di atas harus energi DFT atau CC secara terpisah. Mengacu pada pendekatan ini sebagai-
memenuhi beberapa kriteria penting: Pertama, kerangka kerja ML harus DFT , kami menunjukkan bahwa kesalahan dalam kurva pelatihan untuk -
mampu memberikan sifat molekul dasar, seperti energi total, geometri, DFT turun jauh lebih cepat daripada untuk mempelajari energi DFT atau CC
dan, pada prinsipnya, sifat elektronik, semuanya pada CCSD(T) ketepatan. itu sendiri, menunjukkan bahwa kesalahan dalam DFT jauh lebih dapat
Di luar ini, bagaimanapun, itu juga harus memungkinkan optimasi diterima untuk dipelajari daripada energi DFT itu sendiri. Selain itu, dengan
geometri dan MD skala waktu yang lama untuk dilakukan dengan energi memanfaatkan simetri kelompok titik molekul, kami secara drastis
dan gaya pada tingkat akurasi CCSD(T). Konstruksi pendekatan ML mengurangi jumlah data pelatihan yang diperlukan untuk mencapai
semacam itu membutuhkan deskriptor molekulerflcukup fleksibel untuk akurasi kimia kuantum (~1 kkal mol-1), memungkinkan kami untuk
menyelesaikan kedua jenis tugas, dan untuk ini, tampaknya wajar untuk mengekstrak energi CC dari perhitungan DFT standar, pada dasarnya
menggunakan kerapatan elektron. Perlu dicatat bahwa karena deskriptor tanpa biaya tambahan (di luar generasi awal data pelatihan). Artinya, kami
molekuler telah berevolusi dari objek seperti string SMILES44,45, grafik membuat spesifikasi sistemfic Model ML yang mampu menghasilkan
molekul46,47, dan grafik molekul dengan vektor fitur24,25,48, telah ada akurasi CCSD(T) dengan biaya perhitungan DFT standar. Satu molekul air
kemajuan menuju deskriptor yang mencoba menangkap fitur kunci dari (lihat Gambar.1a) digunakan sebagai fitolok ukur pertama dari skema baru.
kerapatan elektron dengan cara yang sederhana.15,48-51. Diakui, Kami menggunakan kerapatan PBE yang sama sebagai fungsi potensial
menggunakan kerapatan elektron penuh membawa serta biaya komputasi seperti pada ref.53 tetapi sekarang dengan berbagai peta ML energi
yang cukup besar; meskipun demikian, akan berguna untuk sebagai fungsi kepadatan. Sementara perhitungan DFT kehilangan akurasi
mengembangkan kerangka kerja tersebut, mengingat algoritma yang dengan cepat ketika molekul dikompresi atau diperpanjang,-DFT
lebih optimal dapat mengikuti. Sebelumnya, kami telah menunjukkan memperbaiki kesalahan ini. Kami kemudian mempertimbangkan contoh
bahwa kerapatan elektron dapat digunakan secara konsisten untuk etanol, benzena, dan resorsinol, yang semuanya mengandung internal
melatih spesifikasi sistemfic kepadatan fungsional (mirip dengan yang lebih besarflfleksibilitas. Kami membahas masalah geometri input
spesifikasi sistemfic kekuatan sampling menggunakanfisimulasi MD malam-suhu, dengan alasan bahwa
fitua52) menggunakan pemetaan dari potensial eksternal ke perawatan harus dilakukan ketika ini configurasi tidak kembaliflect target
kerapatan elektron dan peta kedua kerapatan ke energi total53. permukaan energi CCSD(T) (lihat Gambar. 1b sebagai ilustrasi untuk air).
Alih-alih memberikan solusi untuk persamaan KS, fipeta pertama Resorcinol selanjutnya digunakan sebagai contoh penggunaan skema ML
(dilambangkan dengan peta ML-HK) melewati persamaan KS untuk menghasilkan lintasan MD ab initio pada permukaan energi CCSD(T)
dengan cara yang mirip dengan menyelesaikan persamaan dasar yang diprediksi. Mendapatkan lintasan seperti itu biasanya
diferensial fungsional Hohenberg-Kohn asli54. Peta kedua dari membutuhkan ratusan hingga ribuan atau puluhan ribu energi dan
kepadatan ke energi memprediksi hasil dari memasukkan solusi perhitungan gaya, yang akan menjadi penghalang menggunakan
itu kembali ke fungsi Hohenberg-Kohn untuk mendapatkan perhitungan CCSD(T) eksplisit tetapi rutin menggunakan model ML. Contoh
energi keadaan dasar. Sementara metode pembelajaran mesin ini mengungkapkan pentingnya memiliki akurasi CCSD(T) untuk
lainnya untuk prediksi kerapatan elektron atau fungsi kerapatan menggambarkan perubahan konformasi dimana DFT menghasilkan
telah muncul baru-baru ini50,51,55-62, peta ML-HK memfasilitasi hambatan yang salah secara kuantitatif. Akhirnya, kami mengambil
penggunaan kedua densitas yang dipelajari mesin, dari mana langkah untuk menciptakan model yang lebih umum yang mampu
properti elektronik dapat dihitung, dan fungsi densitas untuk memprediksi energi CCSD(T) dari sekumpulan kecil molekul yang serupa,
memperoleh energi total dan gradien untuk optimasi geometri tetapi tidak identik. Resorsinol, fenol, dan benzena adalahfiakhirnya
dan simulasi MD. digunakan untuk membuat fungsi ML yang mampu mendeskripsikan
Dalam makalah ini, kami menjelaskan pendekatan untuk menghasilkan banyak molekul. Di sini, simetri kelompok titik molekul dieksploitasi untuk
kerangka kerja ML yang memuaskanfiadalah kriteria yang diuraikan di atas. ML memperluas

2 KOMUNIKASI ALAM | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications


KOMUNIKASI ALAM | https://doi.org/10.1038/s41467-020-19093-1 ARTIKEL

Sebuah b c 4
100
EDFT
EDFT[ML
tidak
ML]DFT
75

Conformer energy
ECCML
[tidakDFT
Nuklir 3
ML]

(kcal⋅mol–1)
koordinat 50 ECC-DFT
[tidakDFT
ML ]

MAE (kcal⋅mol–1)
25
2

0
4

CC - DFT energy
1

(kcal⋅mol–1)
0
Potensi sebagai
orang gaussian
–4
0
0.8 1.0 1.2 20 30 40 50
r-(SEBUAH) Jumlah sampel pelatihan
ML-HK

d
r-(SEBUAH)

0,90 0,95 1.00


DFT 3.0
energi 110 2.4
1.8
100 1.2
ML 0.6
90 0,0

CCSD(T) 3.0

(kcal⋅mol–1)
ML 110 2.4
energi

(deg)
1.8
100 1.2
0.6
ML 90 0,0
Elektron -DFT 1.5
massa jenis (CCSD(T) - DFT) 110 1.0
0,5
energi 0,0
100 – 0,5
– 1.0
90 – 1,5

Gambar. 1 Ilustrasi pembelajaran mesin berbasis kepadatan untuk energi konformer air. Untuk semua panel, energi DFT (oranye) ditampilkan di samping energi CC (biru) untuk
konformer molekul yang sama, dengan geometri yang dioptimalkan yang ditunjukkan oleh berlian terbuka. Sebuah Potensial inti, yang diwakili oleh perkiraan potensial Gauss,
adalah masukan ke satu set model ML yang mengembalikan kerapatan elektron53. Kepadatan yang dipelajari ini adalah masukan untuk prediksi ML independen dari energi
molekuler berdasarkan perhitungan struktur elektronik DFT atau CC, atau perbedaan antara energi ini, untuk mengoreksi energi DFT (fiistilah akhir dalam Persamaan. (3)). b Energi
yang dihitung untuk CC (biru tua) dan DFT (oranye tua) untuk 102 geometri sampel relatif terhadap energi pelatihan terendah (atas), bersama dengan kesalahan energi relatif
untuk DFT dibandingkan dengan CC untuk setiap konformer (bawah). Perhatikan bahwa kesalahan energi DFT bukanlah fungsi sederhana dari energi relatif terhadap geometri
energi minimum (lihat Gambar Tambahan 2), sebagai O-Panjang ikatan H cenderung terlalu tinggi energinya dan ikatan teregang terlalu stabil. c Rata-rata kesalahan prediksi di
luar sampel untuk fungsi ML yang berbeda dibandingkan dengan referensi ECC

energi. MAE-nyaEDFT energi wrt ECC juga ditampilkan sebagai garis putus-putus. d Energi permukaan (dalam kkal mol-1) geometri air simetris untuk
EDFT
ML (oranye) dan ECC Δ DFT (biru) setelah menerapkan -Koreksi DFT (bawah). Untuk inifigambar, perhitungan DFT menggunakan fungsi PBE, dan CC
perhitungan menggunakan CCSD(T) (lihat “Metode” untuk lebih jelasnya).

dataset pelatihan, sehingga mengurangi jumlah perhitungan CCSD(T) perhitungan menggunakan beberapa perkiraan fungsional XC dan
eksplisit yang diperlukan untuk mendapatkan akurasi kimia. menyelesaikan persamaan Kohn-Sham secara konsisten. Namun, pendekatan
alternatif telah lama dipertimbangkan (misalnya, ref.73), di mana
energi yang tepat, E, ditemukan dengan mengoreksi perkiraan diri-
Hasil perhitungan DFT yang konsisten:
Teori. Perbedaan sentralfikultus dalam kimia kuantum adalah
E ¼ EDFT½tidakDFT þ ΔE½tidakDFT ; ð1Þ
ketidakcocokan mendasar dari formalisme DFT dan metode ab initio
berbasis fungsi gelombang seperti CCSD(T). Keduanya bertujuan di mana DFT menunjukkan perkiraan perhitungan DFT, dan ΔE,
untuk memberikan energi keadaan dasar molekul sebagai fungsi dievaluasi pada kepadatan perkiraan, adalah defined, secara formal,
koordinat nuklirnya. Metode ab initio secara langsung memecahkan sehingga E adalah energi yang tepat. Ini bukan fungsi dari KS-DFT standar,
persamaan Schrödinger elektronik, meskipun dalam pendekatan yang tetapi masih menghasilkan energi yang tepat dan dapat menjadi alternatif
sistematis dan dapat dikontrol. KS-DFT, sebaliknya, mengubur semua yang lebih praktis di mana seseorang memecahkan persamaan KS dalam
kompleksitas kuantum ke dalam fungsi kepadatan yang tidak pendekatan itu tetapi mengoreksifienergi akhir oleh ΔE. Jika tidakDFT
diketahui, yaitu energi pertukaran-korelasi (XC), yang harus didekati71, adalah pendekatan yang sangat akurat, maka ΔE seharusnya tidak jauh
72. Segudang bentuk yang berbeda untuk pendekatan KS-DFT berbeda dari kesalahan intrinsik dari pendekatan DFT XC. Baru-baru ini,
tersebut ada. Sayangnya, saat ini tidak ada rute praktis untuk beberapa kelas perhitungan DFT telah ditingkatkan dengan menggunakan
mengubah pendekatan dalam satu formalisme ke pendekatan yang kepadatan yang tidak konsisten74,75. Dengan demikian, regresi kepadatan
lain, karena tidak ada rute matematika sederhana untuk DFT keFT find CC energi dapat dianggap sebagai sistem-spesifikfic
menggabungkan dua formalisme. konstruksi ΔE[nDFT] dari jenis yang sama dengan spesifikasi sistemfic
Dalam pekerjaan ini, kami memanfaatkan ML untuk melewati perbedaan inifi konstruksi peta HK53. Ini berbeda dari tujuan umum, pendekatan
budaya, dengan mengoreksi energi DFT menjadi energi CCSD(T). DFT Rutin fungsional XC eksplisit dalam hal (i) mungkin

KOMUNIKASI ALAM | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications 3


ARTIKEL KOMUNIKASI ALAM | https://doi.org/10.1038/s41467-020-19093-1

hanya akurat untuk sistem yang telah dilatih, (ii) tidak memiliki bentuk kepadatan, yang menyebabkan banyak kegagalan fungsi standar78.
tertutup sederhana, dan (iii) fungsional minimum hanya menghasilkan Kebutuhan untuk find kerapatan akurat dilewati oleh peta energi ML-CC,
perkiraan kepadatan. Namun, dengan menggunakan hasil dari Diskusi karena ia mempelajari energi akurat bahkan sebagai fungsi kerapatan
Tambahan 2.1, pada prinsipnya seseorang dapat membangun kerapatan yang tidak akurat, seperti pada Persamaan. (1).
eksak dari urutan perhitungan tersebut. Untuk menghindari kebingungan,
kami mencatat bahwa-DFT tidak memiliki kesamaan dengan, misalnya, - Mengurangi biaya CC dengan -DFT. Terinspirasi oleh konsep pembelajaran delta
SCF, alternatif yang berguna untuk TDDFT untuk mengekstraksi energi 79, kami juga mengusulkan kerangka pembelajaran mesin yang mampu
keadaan tereksitasi di DFT76. memanfaatkan kepadatan dan energi dari teori tingkat yang lebih rendah
(misalnya, DFT) untuk memprediksi energi tingkat CC. Ini dicapai dengan
Akurasi cluster digabungkan dari ML DFT. Detail pendekatan kami mengoreksi energi DFT menggunakan pembelajaran delta, yang kami nyatakan
dapat ditemukan di “Metode” bagian. Singkatnya, pendekatan sebagai-DFT. Alih-alih memprediksi energi CC secara langsung menggunakan
tersebut merupakan realisasi dari bagian dari teorema model pembelajaran mesin kami, kami dapat melatih peta baru
HohenbergKohn yang menetapkan pemetaan satu-satu antara ΔECCML
DFT½tidakDFT
ML yang menghasilkan kesalahan dalam perhitungan DFT (relatif
potensi eksternalv(r) dan kepadatan keadaan dasar n(r) untuk sebuah terhadap CC) untuk setiap geometri (yaitu, suku kedua dalam Persamaan (1)).
spesifikasifijumlah elektron. Peta ini ePL kamu diekspresikan
ðÞ melalui Kami memutuskanfine energi total yang sesuai sebagai
hubungan fungsional n[v](r). Dalam praktiknya, kami memperluas kepadatan
DFT DFT DFT þ ΔEML CC DFT½tidakDFT
aku ECC
Δ DFT½tidakML ¼ E
ð3Þ
ML ½v ¼ ð ½tidak
dalam basis ortonormal (r) sebagai tidak ML :
aku ¼ 1 ml½
aku aku
pelajari koefisien ekspansi densitas yang ditetapkanfiilmuwan f kamu
ML
gv v53φuntuk
rÞ dan Mengoreksi energi DFT dengan cara ini mengarah pada
membangun kepadatan DFT yang dipelajari tidakDFT r.ML
SEBUAH ðÞ s dicatat sebelumnya, peningkatan dramatis dalam kinerja model, seperti yang terlihat pada
KRR digunakan di sini sebagai model ML. Model KRR kedua kemudian digunakan Gambar. 1c. Hebatnya, dengan hanya 10 sampel pelatihan, MAE ini
DFT
untuk memprediksi energi dari tingkat teori yang lebih tinggi, dalam hal ini ECC
Δ DFT ½tidakML model sudah lebih rendah dari kesalahan ECC ML
ML½tidakDFT
energi CC kasus: dilatih dengan 50 sampel; menggunakan 50 sampel pelatihan mengurangi
MAE dari -Model DFT menjadi hanya 0,013 kkal mol-1. Itu -Koreksi DFT
Xsaya
ECC
ML½tidak
MLDFT ¼ saya ML ½v ; kamuML ½v
α kðkamu :
saya ð2Þ lebih mudah dipelajari daripada energi itu sendiri, seperti yang
saya¼1
diilustrasikan pada Gambar. 1d untuk geometri air simetris yang tidak
disertakan dalam kumpulan data sebelumnya. Meskipun geometri
dimana k(kamuML[v], kamuML[vsaya]) adalah kernel, dan {} adalah coeffiyang yang dioptimalkan sedikit berbeda antara DFT dan CC,-Pendekatan
dipelajari pada model KRR kedua. Ini memungkinkan kita untuk membuat DFT memberikan peta halus antara dua jenis perhitungan struktur
ECC ½ DFT
ML tidakML, energi CC yang akurat secara kimia, sebagai fungsi dari elektronik sebagai fungsional dari kepadatan. Untuk geometri yang
kepadatan DFT yang dipelajari. (Ini sesuai dengan pembelajaranEDFT + paling ekstrim, kesalahan model untuk-DFT lebih kecil daripada model
ΔE dalam Persamaan. (1)). langsung (lihat Gambar Tambahan 3) dan bergantung secara berbeda
Untuk menunjukkan metodologi di balik peta dalam Persamaan. (1 pada geometri, menunjukkan bahwa ada informasi yang terkandung
), kita mulai dengan menggambarkan proses belajar energi CC secara dalam kerapatan di luar potensi nuklir eksternal. Kami mencatat
langsung melalui Persamaan. (2) berdasarkan satu set 102 geometri secara sepintas bahwa-DFT menautkan perhitungan DFT tertentu ke
air acak (Gbr. 1b dan Gambar Tambahan. 1). Perhatikan bahwa tingkat teori CC tertentu, membuat perbandingan antara model yang
kesalahan absolut rata-rata (MAE) energi DFT relatif terhadap energi dilatih pada perhitungan yang berbeda tidak valid (lihat Diskusi
CC (relatif terhadap konformer energi terendah dalam set pelatihan) Tambahan 2.2). Perbandingan antara-Model DFT dan energi total ML
adalah 1,86 kkal mol-1, dengan kesalahan maksimum lebih dari 6 kkal dieksplorasi lebih lanjut dengan molekul yang lebih besar di bagian
mol-1. Performa dari EDFT tidakDFTML ½ EML
dan CC tidakDFT ½ model
ML ML selanjutnya.
dievaluasi untuk subset pelatihan yang berisi 10, 15, 20, 30, 40 atau 50
geometri, sedangkan set uji terdiri dari 52 geometri (Gbr. 2). 1c). -DFT dengan simetri molekul. Molekul berikutnya yang dipilih
Karena ukuran dataset yang kecil, kami menggunakan validasi silang untuk mengevaluasi model ML kami adalah etanol menggunakan
untuk mendapatkan estimasi yang lebih stabil untuk akurasi prediksi geometri dan energi dari dataset MD1732,33. Molekul ini memiliki
model69. Rincian prosedur evaluasi disediakan di “Metode” bagian. dua jenis minimum geometris, di mana alkohol OH anti
Seperti yang diharapkan, akurasi setiap model meningkat dengan atau merosot dua kali lipat kurang ajar posisi; CH yang berputar bebas3
bertambahnya ukuran set pelatihan, tetapi manfaatnyafit kelompok memperkenalkan variabilitas tambahan ke dalam kemungkinan geo-
memprediksi energi CC dibandingkan dengan energi DFT segera metrik. Gambar Tambahan. 4 menunjukkan distribusi atom dari dataset
terlihat jelas. Untuk dataset ini, MAE dariEDFT relatif etanol setelah penyelarasan berdasarkan posisi atom berat. Fakta bahwa
untuk Ecc (digunakan di sini sebagai kebenaran dasar) dicapai dengan EDFT ½ ML
ML tidakDFT etanol memiliki internalflfleksibilitas dan jumlah derajat kebebasan yang
dengan 40 geometri pelatihan. Akurasi kimia kuantum 1 kkal mol-1 lebih besar daripada air secara alami membuat masalah belajar lebih sulitfi
diperoleh dengan menggunakan sedikit lebih sedikit (30) sampel untuk kultus. Oleh karena itu, kami berharap bahwa lebih banyak sampel
energi fungsional ECC ½ ML
ML tidakDFT, dan peningkatan MAE sebesar 0,24 kkal
pelatihan diperlukan untuk mencapai akurasi kimia untuk rentang
mol-1 dengan 50 sampel pelatihan. Setelah dibangun, saatnya untuk geometri yang dapat diakses secara termal. Dataset berisi 1000 pelatihan
evaluasi EML[n] adalah sama terlepas dari energi yang dilatihnya dan 1000 sampel uji dengan energi DFT dan CC (lihat Gambar Tambahan
(untuk a fijumlah data pelatihan tetap). Ada yang jelas 5). Peta ML-HK secara otomatis menggabungkan ekivalensi untuk setiap
untungfit melatih model pada energi CC yang lebih akurat unsur kimia, tetapi kita juga dapat memanfaatkan simetri cermin molekul
selama kinerja yang baik dapat dicapai dengan sejumlah kecil denganflmempengaruhi atom H melalui bidang defididorong oleh tiga
sampel dari metode yang lebih mahal secara komputasi. atom berat, yang secara efektif menggandakan ukuran set pelatihan,
Fungsi densitas semilokal standar seperti PBE biasanya menghasilkan sebagaimana diuraikan dalam “Metode” bagian. Untuk membedakan
densitas yang sangat akurat di dekat kesetimbangan, dan kesalahan dalam model yang dilatih pada kumpulan data yang ditambah dengan simetri ini,
energi atomisasi didominasi oleh kesalahan dalam energi daripada kerapatan kami menambahkans
yang konsisten sendiri.77. Namun, jauh dari keseimbangan, kerapatan yang di depan model pembelajaran mesin (misalnya, sML). Meja1
konsisten sendiri ini dapat berbeda secara substansial dari kerapatan yang tepat. menunjukkan akurasi prediksi dari berbagai sModel ML untuk etanol
Dalam kasus sensitif-densitas seperti itu, kesalahan energi dapat ditingkatkan dibandingkan dengan beberapa metode ML canggih lainnya untuk set
secara substansial oleh kesalahan dalam konsistensi-diri data yang sama. Kesalahan prediksi untuk energi DFT dan CC adalah

4 KOMUNIKASI ALAM | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications


KOMUNIKASI ALAM | https://doi.org/10.1038/s41467-020-19093-1 ARTIKEL

kira-kira sama dengan model ML lainnya yang hanya dilatih tentang lebih dari 4,5 kkal mol-1 lebih tinggi dari minimum global, model
energi. ML mampu memprediksi energi minimum dengan kesalahan di
Penting juga untuk dicatat bahwa menggunakan ECC sΔ DFT½tidaksML
DFT
bawah akurasi kimia (lihat Tabel 2).
fungsional untuk mengoreksi energi DFT berbiaya rendah mencapai MAE Selain itu, fungsi energi yang dipelajari mesin cukupfisangat lancar
untuk energi CC yang sebanding dengan model berbasis gaya yang paling untuk mengoptimalkan etanol menggunakan komputasi gradien
akurat, (tanpa menimbulkan biaya untuk mengevaluasi gaya CC untuk energi dari model ML itu sendiri. Perhitungan untuk setiap konformer
setiap titik pelatihan). Kami mencatat bahwa-pembelajaran tidak dimulai dari geometri yang dioptimalkan menggunakan MP2/6-31G*,
meningkatkan prediksi energi melalui model sGDML berbasis gaya yang sedikit berbeda dari geometri yang dioptimalkan DFT dan CC.
langsung untuk energi CC (lihat Tabel Tambahan 1). Angka2b menunjukkan bahwa meskipun sparity data pelatihan
Itu ECCΔ DFT½tidakML
DFTfungsional hanya berdasarkan 1000 . asli
mendekati con energi minimumfigurasi, model ML yang dilatih
geometri pelatihan memiliki MAE 0,15 kkal mol-1 (lihat Tabel dengan energi berbeda dapat membedakan antara DFT dan CC
Tambahan 2), maka menggunakan simetri etanol mengurangi minima dengan luar biasa fikelezatan.
MAE model ML hingga setengahnya sementara membutuhkan
jumlah perhitungan CC yang sama.
Sensitivitas model ML terhadap input kepadatan. Hasil kami menunjukkan bahwa kami
dapat menggunakan model ML untuk memetakan kepadatan elektron yang dipelajari

Optimalisasi molekul menggunakan fungsi ML. Baik pelatihan maupun tes ke beberapa jenis target energi. Ini secara alami menimbulkan pertanyaan tentang

configurasi dari dataset MD1732,33 termasuk konformer energi minimum seberapa sensitif hasil kami terhadap kepadatan input. Jika seseorang tidak

etanol. Dengan menggunakan model ML, kami memperkirakan energi dari membutuhkan kerapatan diri yang akurat, mengapa repot-repot dengan kerapatan

anti dan kurang ajar konformer dioptimalkan menggunakan MP2/6-31G* sama sekali? Mengapa tidak, sebaliknya, hanya mempelajari energi langsung dari

dan metode struktur elektronik yang digunakan untuk menghasilkan potensi nuklir? Untuk menjawab ini, pertimbangkan benzena dan 1500 geometri dalam

energi untuk setiap model. Perhatikan bahwa MP2 dan PBE memiliki dataset MD1734 (lihat Gambar Tambahan. 7, 8).

kurang ajar sebagai minimum global, tetapi minimum global CCSD(T) Karena benzena's 24 poin grup (D6h) simetri, menerapkan pendekatan
adalah anti. Meskipun semua geometri pelatihan memiliki energi simetri kami pada 1000 titik pelatihan CC menghasilkan
ukuran dataset efektif dari 24.000 geometri.
Kita fipertama-tama selidiki perbedaan antara EsML model yang dilatih
Tabel 1 MAE (kkal mol-1) peta etanol sML dibandingkan menggunakan kepadatan DFT yang konsisten (tidakDFT) dan yang diciptakan

ke ML lainnya model menggunakan ng kekuatan dan energie s. dengan peta kepadatan ML-HK (tidakDFT
sml). Sama seperti untuk etanol, ini
model memiliki akurasi yang sebanding dengan pendekatan lain yang
membutuhkan kekuatan CC untuk pelatihan (lihat Tabel Tambahan 3). Meja
metode ML EsML½tidaksML
DFT EsΔ DFT ½tidakDFT ESchNet 12 EsGDML 33
sML 3 menunjukkan bahwa untuk setiap fungsi energi kita (EDFT
DFT 0,99 tidak ada 0,08 (0,93Sebuah) 0,07 sml, ECCsml,

CC 1.10 0,09 t/d 0,05 atau EsΔ


CC
DFT), kinerja model sangat berbeda ketika dilatih
menggunakan representasi densitas dua elektron ini karena
tidak ada tak dapat diterapkan, t/d tidak ditentukan.
SebuahEDFT
kesalahan berbasis densitas dari peta ML-HK kecilHK53. Estimasi
SchNet dilatih pada energi saja.
dimensi yang relevan (RDE)80 kuantitasfiadalah kompleksitas efektif
yang dibutuhkan model ML untuk memprediksi, misalnya, a

Tabel 2 Kesalahan energi (kkal mol-1) dari peta sML-HK untuk etanol pada geometri yang dioptimalkan secara konvensional.

MP2 anti MP2 kurang ajar DFT anti DFT kurang ajar CC anti CC kurang ajar

EDFT sML
sML½tidak DFT 0,22 0,44 0,30 0,55 0,04 0,58
ECC sML
sML½tidak DFT 0.12 0,49 0.19 0,62 0.13 0,66
ECC
sΔ DFT ½tidakDFT
sML 0,06 0,01 0,06 0,02 0,01 0,01

Sebuah 130 b
114

120 112
C-C-O angle (deg)
C–C–O angle (deg)

kurang ajar
110 110

anti 108
100
106

1.3 1.4 1.5 1.6 1.415 1.420 1,425 1.430 1.435 1.440
Panjang ikatan C–O (Å) Panjang ikatan C–O (Å)

Training set Optimized geometries


EDFT EMP2 EDFT ECC EDFT
sML ECC
sML ECC
sΔ–DFT

Fig. 2 Molecular geometries of ethanol from the ML training set and optimizations. a 1000 unique configurations used for training (light orange circles), along with the
anti and gauche minima optimized using conventional electronic structure methods (open diamonds). The distribution of anti and gauche
conformers is shown in Supplementary Fig. 6. b The configurational space near the minima. Starting fromMP2 geometries (EMP2, grey diamonds), the EML-
based optimizations reproduce the subtle differences in DFT- and CC-optimized geometries (dark orange and dark blue diamonds, respectively). For this
figure, DFT calculations use the PBE+TS functional and CC calculations use CCSD(T) (see refs. 32,33 for more details).

NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications 5


ARTICLE NATURE COMMUNICATIONS | https://doi.org/10.1038/s41467-020-19093-1

Table 3 MAEs (kcal mol−1) for the MD17 benzene test set
Resorcinol has two rotatable OH groups, two molecular
symmetry operations, and more degrees of freedom than water,
for the different density inputs and energy labels.
ethanol, or benzene, making this a more stringent test of the ML
functionals. The initial datasets are generated from 1 ns classical
Density/energy EDFT ECC ECC ESAD ECC
sML sML sΔ DFT sML sΔ SAD
MD simulations at 500 K and 300 K for the training and test sets,
nDFT 0.02 0.03 0.01 n/d n/d respectively (details are found in the “Methods” section). For the
nsML
DFT 0.02 0.03 0.01 n/d n/d density representation, the 1000 conformer training set is
nSAD 0.03 0.08 0.06 0.22 0.22
augmented with the two symmetries, resulting in an effective
n/d not determined training set size of 4000 samples (see Supplementary Fig. 10). The
molecular geometries in the MD-generated training set have
energies between 7 and 50 kcal mol−1 above the equilibrium
particular set of energies given a set of densities (see conformer (as shown in Supplementary Fig. 11); the four local
Supplementary Tables 4, 5, 6). The direct EsML models for minima are also included in the dataset using geometries from
benzene using the ground-state densities are all of similar MP2/6-31G* optimizations, leading to 1004 unique training
complexity, with a comparable number of relevant data geometries and a total effective training set size of 4004 samples.
dimensions required to obtain similar accuracy. ECCsΔ DFT achieves These local minima, which differ in the orientation of the two
higher accuracy with fewer relevant data dimensions than either alcohol groups, are separated by a rotational barrier of ~ 4 kcal
direct model because the energy difference landscape is smoother mol−1 (see Supplementary Fig. 12). The maximum relative energy
and easier to learn. errors between the DFT and the (ground truth) CC energies are
Next, we consider model performance when the molecular electron 6.1 and 6.7 kcal mol−1, respectively, for geometries included in the
density is approximated by a superposition of atomic densities (SAD), training and test sets.
which are conceptually similar to the pseudo- densities used in other As with the other examples, ML model performance improves
ML models9,15 and effectively translate the nuclear potential into with increasing training set size (see Supplementary Fig. 13).
electron densities, albeit without a proper description of the chemical When trained on 1004 unique training geometries (4004 training
bonds. While such densities (denoted as nSAD) cost little to generate, points), the MAE of predicted energies is around 1.3 kcal mol−1
Table 3 shows that ML models trained on these inputs have errors for both EDFT DFT and ECC sML½nsML
sML ½nsML DFT , and the error, when using
that are at least twice those of models using more accurate densities. ECC
sΔ DFT ½nDFT
sML , is only 0.11 kcal mol−1. The Δ-DFT accuracy is
The RDE analysis shows that models based on nSAD have comparable insensitive to the use of the ML-HK map for the density input, as
dimensionality for direct energy models but significantly lower signal- shown in Supplementary Table 7, and is sufficient to run an MD
to-noise ratios (defined in SI for RDE analysis, Supplementary Eq. 2), simulation based on CC energies without the need of CC forces.
thus rendering the energy models less accurate. Nonetheless, given Although DFT energies may be sufficient for some molecules,
the ever-present trade-off between accuracy and computational cost, the ability to use CC energies to determine the equilibrium
SAD densities may be useful to avoid self-consistent optimization of geometries and thermal fluctuations is a promising advance. For
the electron density for each geometry. In the case of SAD inputs, resorcinol, the relative DFT energies can differ significantly from
energy labels for the ML models would reflect the DFT functional the CC energies, particularly near the OH rotational barrier that
evaluated on the approximate density (e.g., ESAD). For benzene, results separates conformers (see Supplementary Fig. 12).
are poorer for both the direct ML energy model Conformational changes are also rare events in the MD
trajectories, making it crucial to describe the transitions
(ESAD
sML ) and Δ-DFT (ECC
sΔ SAD), although they are still within accurately. For example, the exploration of the OH dihedral
chemical accuracy. We understand the larger errors to be due to angles over a 10 ps MD trajectory from a DFT-based constant-
the increased variance of ESAD labels (seven times that of the temperature simulation at 350 K is shown in Supplementary Fig.
selfconsistent dataset—see Supplementary Fig. 9) as well as their 14. In this simulation, only one conformational change is
overall lower signal-to-noise ratio, as evidenced by the RDE observed, despite several excursions away from the local minima.
analysis (see Supplementary Table 6). Using the ECC
sΔ DFT approach, we could easily correct energies
The results presented thus far demonstrate that reasonably after running a conventional DFT-MD simulation. However, as
accurate ML models can be created using approximate densities shown in Supplementary Fig. 15, for snapshots along a 1.5 ps
that are inconsistent with the energy targets. Such ML models constant-energy simulation starting from a point near a
can be generated for applications where speed is more important conformer change, the MAE of DFT energies compared to CC
than accuracy, for example, in the first few cycles of an active energies for each snapshot is 1.0 kcal mol−1, with a maximum of
learning scheme17, where a cheap approximate density provides just under 4.5 kcal mol−1. Therefore, a more promising use of the
sufficient information to train models that ultimately would ML functionals is to run MD simulations using the CC energy
return CC energies with chemical accuracy. Finally, using accurate function directly. An example ECC sΔ DFT ½nDFTsML trajectory starting
self- consistent densities as input significantly improves model from a random training point is shown in Supplementary Fig. 16,
performance for the same training and test geometries. These with an MAE of 0.2 kcal mol−1.
findings provide clear evidence that the electron density contains Starting from a different point in the DFT-generated trajectory
highly useful machine-learnable information about the molecular serves to illustrate the importance of generating MD trajectories
system beyond that contained in atomic positions alone. directly on the CC energy surface. As seen in Fig. 3, for constantenergy
simulations starting from the same initial condition, a DFT- based
trajectory does not have sufficient kinetic energy to traverse the
MD using CC energies. The final molecular example of 1,3- rotational barrier, while the conformer switch does occur for the
benzenediol (resorcinol) illustrates the utility of learning multiple ML CC-based trajectory. Astonishingly, the ECCsΔ DFT ½nDFTsML trajectory
functionals for the same system. Combining the ECCsML½nsML DFT with the has a MAE of only 0.18 kcal mol−1 relative to the true CC energies over
more expensive and accurate ECC sΔ DFT ½nDFTsML method, we demon- a range of more than 15 kcal mol−1.
strate how to run self-consistent MD simulations that can be used to As the Δ-DFT method requires performing a DFT calculation at
explore the configurational phase space based on CC energies. each step of the trajectory, we can overcome this computational

6 NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications


NATURE COMMUNICATIONS | https://doi.org/10.1038/s41467-020-19093-1 ARTICLE

a b 40
EDFT

20

Conformer energy (kcal mol–1)


0
40
ECC
sML

20

0
40
ECC- DFT

20

1
c 360

1 (deg)
180

0
0 20 40 60 80 100
Simulation time (fs)

Fig. 3 Resorcinol dynamics from an initial condition near a conformational change. a The atomic positions explored during 100 fs NVE MD trajectories
run with standard DFT (dark orange), ECC sML½nsML DFT with RESPA-corrected forces (light blue), and ECC sΔ DFT ½nDFT
sML (blue). b The conformer energy along each
trajectory (solid lines), with the error relative to CC shown as a shaded line width. c The evolution of the C–C–O–H dihedral angle for each trajectory with
dashed grey lines indicating the barrier between conformers. For this figure, all DFT calculations use PBE and all CC energies are from CCSD(T).

cost by combining the ML models. The middle panel of Fig. 3b


Table 4 ECCsML MAEs (kcal mol−1) for combinations of
shows the CC trajectory using a reversible reference-system
molecular datasets evaluated on the resorcinol test set.
based multi-time-step integrator81 to evaluate energies and forces
primarily with the ECCsML½nsML
DFT model as a reference and with
Resorcinol Resorcinol phenol Resorcinol phenol benzene
periodic force corrections based on the more accurate
nDFT 0.99 0.49 0.53
ECC
sΔ DFT ½nDFT
sML every three steps (see Supplementary Note 1.4
nsML
DFT 1.37 1.04 0.70
and Supplementary Fig. 17 for more details). The resulting
nsML
DFT c n/a 0.69 0.71
trajectory has a MAE of 3.8 kcal mol−1 relative to the true CC
energies, with the largest errors in regions that are sparsely n/a not applicable

represented in the training set. This self-consistent exploration of


the configurational space with the combined ML models provides
an opportunity to improve the sampling in a cost-effective
manner. Table 5 ECCsΔ DFT MAEs (kcal mol−1) for combinations of
molecular datasets evaluated on the resorcinol test set.

Combining densities for improved sampling. The electron density Resorcinol Resorcinol phenol Resorcinol phenol benzene
provides some advantages as a descriptor of a chemical system
nDFT 0.11 0.06 0.07
over inputs that rely solely on local atomic environments or nsML
DFT 0.11 0.09 0.08
connectivity11,12,82. For a given periodic cell and number of basis nsML
DFT c n/a 0.07 0.09
functions, the same density input structure is able to describe
systems with different numbers, types, and orders of atoms. In n/a not applicable

contrast, models that rely on an atomistic decomposition of the


energy must have representations for the envir- onment of each
separate element (for example, see refs. 6,26). To improve the combinations of true or independently learned densities,
sampling represented in the training set for resor- cinol, we can displayed in Tables 4 and 5 and Supplementary Tables 8 and 9,
leverage overlap with configurational spaces sampled by similar, show significant improvements in performance, with the predic-
yet smaller and less costly, molecules. For example, adding data tion error being reduced by 30–60%. The results for models
for phenol can provide better sampling of the rotation of an OH trained on DFT energies are similar to those for CC energies and
group, while the dynamics of benzene contains extensive can be found in Supplementary Table 10.
sampling of C–C bonds. In addition, we can analogously train an ML-HK map by
To demonstrate this feature of density-based ML models, we combining the artificial potentials of the different molecules into
use 1001 geometries for each of these two molecules as input con one dataset in order to produce a combined map (nDFT sML c). Using
figurations (see Supplementary Figs. 8, 18), along with the 1004 the combination of symmetrized phenol and resorcinol data to
resorcinol configurations. We trained a set of density-toenergy train the ML-HK map improves the performance of the direct ML
maps, combining the symmetrized datasets, pairwise and as a energy models, although the Δ-DFT approach is again less
complete set, and then we used the resorcinol test set to evaluate sensitive to the density representation. We note that, unlike the
the performance of this model. In each case, the density- to- models with independently learned densities, simply adding more
energy map was learned by combining the densities of the training data by including benzene in the ML-HK map, does not
different molecules into a single dataset. The models using significantly change the results. Molecular similarity clearly

NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications 7


ARTICLE NATURE COMMUNICATIONS | https://doi.org/10.1038/s41467-020-19093-1

affects the combination of ML-HK maps (see Supplementary Table The success of our new ML approach connecting DFT densities to CC
9 for resorcinol and benzene), but the ML density functionals are energies provides a new framework and strategy for linking formerly
less sensitive and show improvement for all molecular inconsistent calculations to reduce the penalty of this tradeoff. We
combinations. We view this as a stepping stone toward learning a have also demonstrated that the densities from a simpler molecule
truly transferable model capable of predicting both densities and can be combined with a more complex system to improve the
energies for a wide range of configurations and molecules. coverage of critical degrees of freedom. This promising result
indicates that the smart use of combined den- sities from smaller
molecular fragments could yield more accurate energies at even
lower cost. Given that the CC-DFT energy dif- ference landscape does
Discussion not resemble the intrinsic energy landscapes of either of the
DFT is used in at least 30,000 scientific papers each year83, and underlying electronic structure methods, themselves, we hope future
because of its low cost relative to wave function based ab initio work will further explore this dissimilarity as a function of training set
methods, it can be used to compute energies of large molecules. size and composition for Δ-
Moreover, if geometry optimizations or MD simulations are DFT models.
desired, these would be beyond the reach of CCSD(T) level cal- ML represents an entirely new approach to extracting energies
culations owing to the high computational cost. However, if from DFT calculations, avoiding some of the biases built into
CCSD(T) is affordable for a small number of carefully chosen confi human-designed functionals, while also bypassing the need for
gurations, then our methodology provides one possible bridge strict self-consistency between the electron density and the
between the DFT and CCSD(T) levels of theory. resulting energy when an approximate result is sufficient. As
There are two distinct modes in which our results can be shown here, ML provides a natural framework for incorporating
applied. With Δ-DFT, the cost of a gas-phase MD simulation is results from more accurate electronic structure methods, thus
essentially that of the DFT-based MD with a given approximate bridging the gap between the CC and the DFT worlds while
functional, plus the cost of evaluating a few dozen CCSD(T) maintaining the versatility of DFT to describe electronic prop-
energies. While the optimal selection of training points is an open erties beyond energy and forces such as the dipole moment,
question in the field of machine learning, the Δ-DFT approach molecular polarizability, NMR chemical shifts, etc. Along with
presented here may help to reduce the number of points these insights, the long and successful history of KS-DFT suggests
necessary by learning an inherently smoother energy correction that using the density as a descriptor may thus prove to be an
map. We stress that no forces are needed for training, making excellent strategy for improved simulations in the future.
training set generation cheaper than other methods with similar
perfor- mance. Compared to other machine-learning models, Δ- Methods
DFT is well behaved and stable outside of the training set, since Machine-learning model. In order to predict the total energy of a system given
the zeromean prior allows it to fall back on DFT results when far only the Na atomic positions of a molecule and using the electron density as a
key descriptor, we can use the ML-HK map introduced in ref. 53, with the entire
from the training set. The combination of Δ-DFT with the ML
procedure being illustrated in Fig. 1a. by Initially, we characterize the Hamiltonian
models for DFT energies of ref. 53 yields both the efficiency from the external nuclear potential v(r), which we approximate using a sum of
bypassing the KS equations and the accuracy of CCSD(T). While Gaussians as94
this yields accurate energy functions within the training manifold,
it occa- sionally yields inaccurate energy gradients or forces in an X jjr R jj2 α
MD simulation, which can be corrected with the Δ-DFT forces vðrÞ ¼ Na Zα exp ; ð4Þ
α¼1
2γ2
using the appropriate integrators, as shown above.
Clearly, our methodology can be applied to any gas-phase MD where r are the coordinates of a spatial grid, Rα is a vector containing the atom
simulation or geometry optimization for which CCSD(T) coordinates of atom α, and Zα is the nuclear charges of atom α. Finally, γ is a width
calculations can be performed for a reasonable number of hyperparameter. This Gaussian potential is then evaluated on a 3D grid around the
carefully selected configurations. Gas-phase MD, for example, has molecule and used as a descriptor for the ML-HK model. For each molecule,
crossvalidation is used to determine the width parameter, γ, and the grid spacing for
many applications. Earlier studies focused on comparing discretization of the associated Gaussian potential.
equilibrium properties from simulations excluding or including After obtaining the Gaussian potential, we use a KRR model to learn the
(via the Feynman path integral) nuclear quantum effects84–88. approximate DFT valence electron density. In order to simplify the learning problem
More recent studies have focused on accurate spectroscopy and and avoid representing the density on a 3D grid, we expand the density
map in an orthonormal basis set, and consequently learn the basis coefficients
exploration of reactivity in small complexes and clusters89–92. For instead of the density grid points:
geometry optimization at the CCSD(T) level or testing of DFT
energetics against CCSD(T) energies, DFT geometries often must XL
nML½v ðrÞ ¼ uML ½ϕl ðr Þ:
ðlÞ v ð5Þ
be used due to the prohibitive cost of finding an optimum l¼1

CCSD(T) geometry. For molecules with many soft modes, finding


the geometry can require hundreds of evaluations of energies where ϕl(r) is a basis function. In this work, a Fourier basis is employed. In the
applications presented in this work, 12,500 basis functions (25 per dimension) proved
and forces. Here, we have shown how relatively few energies are sufficient for good performance. Use of KRR to learn these basis coefficients makes the
needed in Δ-DFT to produce an accurate energy functional, problem more tractable for 3D densities, and more importantly, the orthogonality of
suggesting the possibility of using Δ-DFT to speed up such the basis functions allows us to learn the individual coefficients independently:
searches, producing CC geometries for molecules that were
previously prohibitive. For larger molecules and/or molecules XM
interacting with an environment, recent schemes that embed an uðlÞ
ML ½v ¼ i¼1
βiðlÞkv½
; v; i ð6Þ
ab initio core within a larger DFT calculation93 could also be
treated by this method, especially if Δ-DFT need only be applied to where β(l) are the KRR coefficients and k is a kernel functional.
the ab initio portion of the calculation. With suitable training sets, The independent and direct prediction of the basis coefficients makes the MLHK
the ML approaches presented here have the potential to enable map more efficient and easier to scale to larger molecules, since the complexity only
depends on the number of basis functions. In addition, we can use the predicted basis
MD simulations for each of these systems. coefficients to reconstruct the continuous density at any point in space, making the
Standard electronic structure methods require users to choose predicted density independent of a fixed grid and enabling computations such as
between accuracy and computational cost for each application. numerical integrals to be performed at an arbitrary accuracy.

8 NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications


NATURE COMMUNICATIONS | https://doi.org/10.1038/s41467-020-19093-1 ARTICLE

As a final step, another KRR model is used to learn the total energy from the Data availability
density basis coefficients: The data generated and used in this study are available at quantum-machine.org/datasets.

X Code availability
EML½nML ¼ M αikðuML½ v ; M
u½L vi ;Þ ð7Þ The code generated and used for this study is available at https://github.com/
i¼1 MihailBogojeski/ml-dft.

where k is the Gaussian kernel. Received: 1 June 2020; Accepted: 24 September 2020;

Exploiting point group symmetries. Training datasets for our machine-learning model
can be easily enriched using the point group symmetries. To extract the point group
symmetries and the corresponding transformation matrices we used the SYVA software
package95. Consequently, we can multiply the size of the training set by the number of
point group symmetries without performing any additional quantum chemical References
calculations simply by applying the point group transformations on our existing data. 1. Rupp, M., Tkatchenko, A., Müller, K.-R. & von Lilienfeld, O. A. Fast and
accurate modeling of molecular atomization energies with machine learning.
Phys. Rev. Lett. 108, 058301 (2012).
2. Montavon, G. et al. Learning invariant representations of molecules for
Cross-validation and hyperparameter optimization. Due to the small number of training
atomization energy prediction. Adv. Neural. Inf. Process. Syst. 25, 440–448
and test samples, when evaluating the models on the water dataset, the data were shuf
(2012).
fled 40 times, and for each shuffle a subset of 50 geometries was selected as the
training set, with the remaining 52 being used as the out-of-sample test set. For the
3. Montavon, G. et al. Machine learning of molecular electronic properties in
smaller training sets, a subset of the 50 training geometries was selected using k-
chemical compound space. N. J. Phys. 15, 095003 (2013).
means sampling. 4. Botu, V. & Ramprasad, R. Learning scheme to predict atomic forces and
The hyperparameters for all models were tuned using fivefold cross-validation on accelerate materials simulations. Phys. Rev. B 92, 094306 (2015). Hansen, K. et
the training set. For the ML-HK map from potentials to densities, the following three 5. al. Machine learning predictions of molecular properties: accurate many-body
hyperparameters were optimized individually for each dataset: the width parameter of potentials and nonlocality in chemical space. J. Phys. Chem. Lett. 6, 2326–2331
the Gaussian potential γ, the spacing of the grid on which Gaussian (2015).
potential is evaluated, and the width parameter σ of the Gaussian kernel k[v, vi]. 6. Bartók, A. P. & Csányi, G. Gaussian approximation potentials: a brief tutorial
For each subsequent density to energy map EML½n , only the width parameter of the introduction. Int. J. Quantum Chem. 115, 1051–1057 (2015).
Gaussian kernel k(uML[v], uML[vi]) needs to be chosen using cross-validation. Specific 7. Rupp, M., Ramakrishnan, R. & von Lilienfeld, O. A. Machine learning for
values are reported in the Supplementary Tables 11–15. quantum mechanical properties of atoms in molecules. J. Phys. Chem. Lett. 6,
3309–3313 (2015).
8. Bereau, T., Andrienko, D. & von Lilienfeld, O. A. Transferable atomic
Classical molecular dynamics. Training and test set geometries for resorcinol (1,3-
multipole machine learning models for small organic molecules. J. Chem.
benzenediol) and phenol were selected from a 1 ns trajectory generated via classical
Theory Comput. 11, 3225–3233 (2015).
MD using the GAFF force field96. The local minima were optimized using MP2/6-31g* in
Gaussian0997. Symmetric atomic charge assignments were determined from a RESP fit98
9. De, S., Bartók, A. P., Csányi, G. & Ceriotti, M. Comparing molecules and
solids across structural and alchemical space. Phys. Chem. Chem. Phys. 18,
to the HF/6-31g* calculations, using the three distinct geometries with Boltzmann
weights determined by the relative MP2 energies for resorcinol. All other standard GAFF 13754–13769 (2016).
parameters96 for the MD simulations were assigned using the AmberTools package99. 10. Podryabinkin, E. V. & Shapeev, A. V. Active learning of linearly parametrized
To generate resorcinol and phenol conformers, classical MD simulations in a canonical interatomic potentials. Comput. Mater. Sci. 140, 171–180 (2017).
ensemble were run at 300 K and 500 K using the PINY_MD package100 with massive 11. Schütt, K. T., Arbabzadah, F., Chmiela, S., Müller, K.-R. & Tkatchenko, A. Quantum-
Nosé-Hoover chain (NHC) thermostats101 for atomic degrees of freedom (length = 4, τ = chemical insights from deep tensor neural networks. Nat. Commun.
20 fs, SuzukiYoshida order = 7, multiple time step = 4) and a time step of 1 fs. 8, 13890 (2017).
12. Schütt, K. T., Sauceda, H. E., Kindermans, P.-J., Tkatchenko, A. & Müller, K.-
For the resorcinol and phenol training sets, we selected 1000 conformers closest to R. SchNet–a deep learning architecture for molecules and materials. J. Chem. Phys.
k-means centers from the 1 ns classical MD trajectory run at 500 K. The test sets 148, 241722 (2018).
comprise 1000 randomly selected snapshots from the 1 ns 300 K classical MD 13. Faber, F. A. et al. Prediction errors of molecular machine learning models
simulations. Datasets are aligned by minimizing the root mean square deviation (RMSD) lower than hybrid DFT error. J. Chem. Theory Comput. 13, 5255–5264 (2017).
of carbon atoms to the global minimum energy conformer. 14. Yao, K., Herr, J. E. & Parkhill, J. The many-body expansion combined with
neural networks. J. Chem. Phys. 146, 014106 (2017).
15. Eickenberg, M., Exarchakis, G., Hirn, M., Mallat, S. & Thiry, L. Solid harmonic
DFT molecular dynamics. Born-Oppenheimer MD simulations of a resorcinol
wavelet scattering for predictions of molecule properties. J. Chem. Phys. 148,
molecule in the gas phase were run using DFT in the QUICKSTEP package102 of
CP2K v. 2.6.2103. The PBE XC functional104 was used to approximate exchange and 241732 (2018).
correlation, and a mixed Gaussian/plane wave (GPW) basis-set scheme105 was 16. Ryczko, K., Mills, K., Luchak, I., Homenick, C. & Tamblyn, I. Convolutional neural
employed with DZVP-MOLOPT-GTH (m-DZVP) basis sets106 paired with networks for atomistic systems. Comput. Mater. Sci. 149, 134–142 (2018). Smith, J.
appropriate dual-space GTH pseudopotentials107,108. Wave functions were 17. S., Nebgen, B., Lubbers, N., Isayev, O. & Roitberg, A. E. Less is more: sampling
converged to 1E-7 Hartree using the orbital transformation method109 on a chemical space with active learning. J. Chem. Phys. 148, 241733
multiple grid (n = 5) with a cutoff of 900 Ry for the system in a cubic box (L = 20 (2018).
bohr). For the constant-temperature simulation, a temperature of 350 K was 18. Grisafi, A., Wilkins, D. M., Csányi, G. & Ceriotti, M. Symmetry-adapted machine
maintained using massive NHC thermostats101 (length = 4, τ = 10 fs, Suzuki- learning for tensorial properties of atomistic systems. Phys. Rev. Lett.
Yoshida order = 7, multiple time step = 4) and a time step of 0.5 fs. 120, 036002 (2018).
19. Pronobis, W., Tkatchenko, A. & Müller, K.-R. Many-body descriptors for predicting
molecular properties with machine learning: analysis of pairwise and three-body
ML molecular dynamics. We used the atomistic simulation environment110 with a
interactions in molecules. J. Chem. Theory Comput. 14,
0.5 fs time-step to run MD with ML energies. For the constant-temperature simulation,
2991–3003 (2018).
a temperature of 350 K maintained via a Langevin thermostat with a friction value of
0.01 atomic units (0.413 fs−1). Atomic forces were calculated using the finite difference
20. Faber, F. A., Christensen, A. S., Huang, B. & von Lilienfeld, O. A. Alchemical and
structural distribution based representation for universal quantum machine
method with ϵ = 0.001 Å.
learning. J. Chem. Phys. 148, 241717 (2018). Thomas, N. et al.Tensor field networks:
21. rotation-and translation-equivariant neural networks for 3D point clouds. Preprint
Electronic structure calculations. Optimizations for ethanol conformers were run at http://arXiv.org/abs/
using MP2/6-31g* in Gaussian0997. DFT calculations for the ML models were run 1802.08219 (2018).
using Quantum ESPRESSO code111 with the PBE XC functional104 and 22. Hy, T. S., Trivedi, S., Pan, H., Anderson, B. M. & Kondor, R. Predicting
projectoraugmented wave approach112,113 with Troullier-Martin pseudopotentials molecular properties with covariant compositional networks. J. Chem. Phys.
replacing explicit ionic core electrons114. Molecules were simulated in a cubic box (
148, 241745 (2018).
L = 20 bohr) with a wave function cutoff of 90 Ry. The valence electron densities
23. Schütt, K. T., Gastegger, M., Tkatchenko, A., Müller, K.-R. & Maurer, R. J.
were evaluated on a grid with 125 points in each dimension. All CC calculations
Unifying machine learning and quantum chemistry with a deep neural
were run using Orca115 with CCSD(T)/aug-cc-pVTZ116 for water or CCSD(T)/ccpVDZ
network for molecular wavefunctions. Nat. Comm. 10, 1–10 (2019).
116 for resorcinol and phenol.

NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications 9


ARTICLE NATURE COMMUNICATIONS | https://doi.org/10.1038/s41467-020-19093-1

24. von Lilienfeld, O. A., Müller, K.-R. & Tkatchenko, A. Exploring chemical 54. Hohenberg, P. & Kohn, W. Inhomogeneous electron gas. Phys. Rev. 136,
compound space with quantum-based machine learning. Nat. Rev. Chem. 4, B864–B871 (1964).
347–358 (2020). 55. Welborn, M., Cheng, L. & Miller, T. F. Transferability in machine learning for
25. Noé, F., Tkatchenko, A., Müller, K.-R. & Clementi, C. Machine learning for electronic structure via the molecular orbital basis. J. Chem. Theory Comput.
molecular simulation. Annu. Rev. Phys. Chem. 71, 361–390 (2020). 14, 4772–4779 (2018).
26. Smith, J. S. et al. Approaching coupled cluster accuracy with a general-purpose 56. Seino, J., Kageyama, R., Fujinami, M., Ikabata, Y. & Nakai, H. Semi-local
neural network potential through transfer learning. Nat. Commun. 10, 1–8 machine-learned kinetic energy density functional with third-order
(2019). gradients of electron density. J. Chem. Phys. 148, 241705 (2018).
27. Li, Z., Kermode, J. R. & De Vita, A. Molecular dynamics with on-the-fly machine 57. Ryczko, K., Strubbe, D. & Tamblyn, I. Deep learning and density functional
learning of quantum-mechanical forces. Phys. Rev. Lett. 114, 096405 theory. Phys. Rev. A 100, 022512 (2019).
(2015). 58. Sinitskiy, A. V. & Pande, V. S. Deep neural network computes electron
28. Gastegger, M., Behler, J. & Marquetand, P. Machine learning molecular densities and energies of a large set of organic molecules faster than
dynamics for the simulation of infrared spectra. Chem. Sci. 8, 6924–6935 density functional theory (DFT). Preprint at http://arXiv.org/abs/1809.02723
(2017). (2018).
29. Schütt, K. et al. SchNet: a continuous-filter convolutional neural network for 59. Grisafi, A. et al. A transferable machine-learning model of the electron
modeling quantum interactions. Adv. Neural Inf. Process. Syst. 30, 991–1001 density. ACS Cent. Sci. 5, 57–64 (2019).
(2017). 60. Chandrasekaran, A. et al. Solving the electronic structure problem with
30. John, S. T. & Csányi, G. Many-body coarse-grained interactions using gaussian machine learning. npj Comput. Mater. 5, 22 (2019).
approximation potentials. J. Phys. Chem. B 121, 10934–10949 (2017). 61. Cheng, L., Welborn, M., Christensen, A. S. & Miller, T. F. III A universal
31. Huan, T. D. et al. A universal strategy for the creation of machine density matrix functional from molecular orbital-based machine learning:
learningbased atomistic force fields. J. Comput. Mater. 3, 37 (2017). Transferability across organic molecules. J. Chem. Phys. 150, 131103
32. Chmiela, S. et al. Machine learning of accurate energy-conserving molecular (2019).
force fields. Sci. Adv. 3, e1603015 (2017). 62. Sebastian, D. & Fernandez-Serra, M. Learning from the density to correct total
33. Chmiela, S., Sauceda, H. E., Müller, K.-R. & Tkatchenko, A. Towards exact energy and forces in first principle simulations. J. Chem. Phys. 151, 144102
molecular dynamics simulations with machine-learned force fields. Nat. (2019).
Commun. 9, 3887 (2018). 63. Snyder, J. C., Rupp, M., Hansen, K., Müller, K.-R. & Burke, K. Finding density
34. Chmiela, S., Sauceda, H. E., Poltavsky, I., Müller, K.-R. & Tkatchenko, A. functionals with machine learning. Phys. Rev. Lett. 108, 253002 (2012).
sGDML: Constructing accurate and data efficient molecular force fields 64. Snyder, J. C. et al. Orbital-free bond breaking via machine learning. J. Chem.
using machine learning. Comput. Phys. Commun. 240, 38–45 (2019). Phys. 139, 224104 (2013).
35. Kanamori, K. et al. Exploring a potential energy surface by machine learning 65. Snyder, J. C., Rupp, M., Müller, K.-R. & Burke, K. Nonlinear gradient denoising: fi
for characterizing atomic transport. Phys. Rev. B 97, 125124 (2018). nding accurate extrema from inaccurate functional derivatives.
36. Zhang, L., Han, J., Wang, H., Car, R. & E, W. Deep potential molecular Int. J. Quantum Chem. 115, 1102–1114 (2015).
dynamics: a scalable model with the accuracy of quantum mechanics. Phys. 66. Li, L. et al. Understanding machine-learned density functionals. Int. J.
Rev. Lett. 120, 143001 (2018). Quantum Chem. 116, 819–833 (2016).
37. Glielmo, A., Zeni, C. & De Vita, A. Efficient nonparametric n-body force fields 67. Li, L., Baker, T. E., White, S. R. & Burke, K. Pure density functional for strong
from machine learning. Phys. Rev. B 97, 184307 (2018). correlation and the thermodynamic limit from machine learning. Phys. Rev. B
38. Christensen, A. S., Faber, F. A. & von Lilienfeld, O. A. Operators in quantum 94, 245129 (2016).
machine learning: response properties in chemical space. J. Phys. Chem. 150, 68. Hollingsworth, J., Li, L., Baker, T. E. & Burke, K. Can exact conditions
064105 (2019). improve machine-learned density functionals? J. Chem. Phys. 148, 241743
39. Sauceda, H. E., Chmiela, S., Poltavsky, I., Müller, K.-R. & Tkatchenko, A. (2018).
Molecular force fields with gradient-domain machine learning: Construction 69. Hansen, K. et al. Assessment and validation of machine learning methods for
and application to dynamics of small molecules with coupled cluster forces. predicting molecular atomization energies. J. Chem. Theory Comput. 9,
J. Chem. Phys. 150, 114102 (2019). 3404–3419 (2013).
40. Schneider, E., Dai, L., Topper, R. Q., Drechsel-Grau, C. & Tuckerman, M. E. Stochastic 70. Ginzburg, I. & Horn, D. Combined neural networks for time series analysis.
neural network approach for learning high-dimensional free energy surfaces. Adv. Neural Inf. Process. Syst. 224–231 (1994).
Phys. Rev. Lett. 119, 150601 (2017). 71. Parr, R. G. & Yang, W. Density Functional Theory of Atoms and Molecules
41. Mardt, A., Pasquali, L., Wu, H. & Noé, F. VAMPnets for deep learning of (Oxford University Press, 1989).
molecular kinetics. Nat. Commun. 9, 5 (2018). 72. Fiolhais, C., Nogueira, F. & Marques, M. A Primer in Density Functional
42. Noé, F., Olsson, S., Köhler, J. & Wu, H. Boltzmann generators: Sampling Theory. (Springer-Verlag, New York, 2003).
equilibrium states of many-body systems with deep learning. Science 365, 73. Levy, M. & Görling, A. Correlation energy density-functional formulas from
eaaw1147 (2019). correlating first-order density matrices. Phys. Rev. A 52, R1808 (1995).
43. Rogal, J., Schneider, E. & Tuckerman, M. E. Neural-network-based path collective 74. Kim, M.-C., Sim, E. & Burke, K. Understanding and reducing errors in density
variables for enhanced sampling of phase transformations. Phys. Rev. Lett. 123, functional calculations. Phys. Rev. Lett. 111, 073003 (2013).
245701 (2019). 75. Vuckovic, S., Song, S., Kozlowski, J., Sim, E. & Burke, K. Density functional
44. Putin, E. et al. Reinforced adversarial neural computer for de novo molecular analysis: the theory of density-corrected DFT. J. Chem. Theory Comput. 15,
design. J. Chem. Info Model. 58, 1194 (2018). 6636–6646 (2019).
45. Popova, M., Isayev, O. & Tropsha, A. Deep reinforcement learning for de 76. Zhu, W., Botina, J. & Rabitz, H. Rapidly convergent iteration methods for
novo drug design. Sci. Adv. 4, eaap7885 (2018). quantum optimal control of population. J. Chem. Phys, 108, 1953 (1998).
46. Kearnes, S., McCloskey, K., Berndl, M., Pande, V. & Riley, P. Molecular graph 77. Wasserman, A. et al. The importance of being self-consistent. Annu. Rev.
convolutions: Moving beyond fingerprints. J. Computer-Aided Molec. Des. 30, Phys. Chem. 68, 555–581 (2017).
595 (2016). 78. Sim, E., Song, S. & Burke, K. Quantifying density errors in DFT. J. Phys. Chem.
47. Schütt, K. T. et al. Machine Learning Meets Quantum Physics, volume 968 Lett. 9, 6385–6392 (2018).
(Springer Lecture Notes in Physics, 2020). 79. Ramakrishnan, R., Dral, P. O., Rupp, M. & von Lilienfeld, O. A. Big data meets
48. Faber, F. A. et al. Prediction errors of molecular machine learning models quantum chemistry approximations: the Δ-machine learning approach. J.
lower than hybrid DFT error. J. Chem. Theor. Comput. 13, 5255 (2017). Chem. Theory Comput. 11, 2087–2096 (2015).
49. Fabrizio, A., Grisafi, A., Meyer, B., Ceriotti, M. & Corminboeuf, C. Electron 80. Braun, M. L., Buhmann, J. M. & Müller, K.-R. On relevant dimensions in
density learning of non-covalent systems. Chem. Sci. 10, 9424–9432 (2019). kernel feature spaces. J. Mach. Learn. Res. 9, 1875–1908 (2008).
50. Nagai, R., Akashi, R. & Sugino, O. Completing density functional theory by machine 81. Tuckerman, M. E., Berne, B. J. & Martyna, G. J. Reversible multiple time scale
learning hidden messages from molecules. npj Comput. Mater. 6, 1–8 molecular dynamics. J. Chem. Phys. 97, 1990–2001 (1992).
(2020). 82. Behler, J. Atom-centered symmetry functions for constructing highdimensional
51. Sebastian, D. & Fernandez-Serra, M. Machine learning accurate exchange and neural network potentials. J. Chem. Phys. 134, 074106 (2011).
correlation functionals of the electronic density. Nat. Commun. 11, 1–10 83. Pribram-Jones, A., Gross, D. A. & Burke, K. DFT: a theory full of holes? Annu.
(2020). Rev. Phys. Chem. 66, 283–304 (2015).
52. Steffen, J. & Hartke, B. Cheap but accurate calculation of chemical reaction rate 84. Tuckerman, M. E., Marx, D., Klein, M. L. & Parrinello, M. On the quantum
constants from ab initio data via system-specific black-box force fields. J. Chem. nature of the shared proton in hydrogen bonds. Science 275, 817 (1997).
Phys. 147, 161701 (2017). 85. Miura, S., Tuckerman, M. E. & Klein, M. L. An ab initio path integral molecular
53. Brockherde, F. et al. Bypassing the Kohn-Sham equations with machine dynamics study of double proton transfer in the formic acid dimer.
learning. Nat. Commun. 8, 872 (2017). J. Chem. Phys. 109, 5920 (1998).

10 NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications


NATURE COMMUNICATIONS | https://doi.org/10.1038/s41467-020-19093-1 ARTICLE

86. Tuckerman, M. E. & Marx, D. Heavy-atom skeleton quantization and proton 113. Blöchl, P. E. Projector augmented-wave method. Phys. Rev. B 50, 17953–17979
tunneling in “intermediate-barrier” hydrogen bonds. Phys. Rev. Lett. 86, 4946 (1994).
(2001). 114. Troullier, N. & Martins, J. L. Efficient pseudopotentials for plane-wave
87. Li, X. Z., Walker, B. & Michaelides, A. Quantum nature of the hydrogen bond. calculations. Phys. Rev. B 43, 1993–2006 (1991).
Proc. Natl Acad. Sci. USA 108, 6369 (2011). 115. Neese, F. The ORCA program system. Wiley Interdiscip. Rev.: Comput. Mol.
88. Peŕez, A., Tuckerman, M. E., Hjalmarson, H. P. & von Lilienfeld, O. A. Enol Sci. 2, 73–78 (2012).
tautomers of Watson−Crick base-pair models are metastable because of 116. Dunning, T. H. Gaussian basis sets for use in correlated molecular calculations. I.
nuclear quantum effects. J. Am. Chem. Soc. 132, 11510–11515 (2010). the atoms boron through neon and hydrogen. J. Chem. Phys.
89. Kaczmarek, A., Shiga, M. & Marx, D. Quantum effects on vibrational and 90, 1007–1023 (1989).
electronic spectra of hydrazine studied by “on-the-fly. J. Phys. Chem. A 113,
1985 (2009).
90. Wang, H. & Agmon, N. Complete assignment of the infrared spectrum of the Acknowledgements
gas-phase protonated ammonia dimer. J. Phys. Chem. A 120, 3117 (2016). The authors thank Dr. Felix Brockherde and Joseph Cendagorta for helpful discussions, Dr. Li Li
91. Samala, N. R. & Agmon, N. Structure, spectroscopy, and dynamics of the for the initial water dataset, and Dr. Huziel Sauceda and Dr. Stefan Chmiela for the optimized
phenol-(water)(2) cluster at low and high temperatures. J. Chem. Phys. 147, geometries of ethanol and for helpful discussions. Calculations were run on NYU IT High
234307 (2017). Performance Computing resources and at TUB. Work at NYU was supported by the U.S. Army
92. Jarvinen, T., Lundell, J. & Dopieralski, P. Ab initio molecular dynamics study of Research Office under contract/grant number W911NF-131-0387 (L.V.-M. and M.E.T.). K.-R.M.
overtone excitations in formic acid and its water complex. Theor. Chem. Acc. was supported in part by the Institute of Information & Communications Technology Planning
137, 100 (2018). & Evaluation (IITP) grant funded by the Korea Government (No. 2019-0-00079, Artificial
93. Lee, S. J. R., Welborn, M., Manby, F. R. & Miller, T. F. Projection-based Intelligence Graduate School Program, Korea University), and was partly supported by the
wavefunction-in-DFT embedding. Acc. Chem. Res. 52, 1359–1368 (2019). German Ministry for Education and Research (BMBF) under Grants 01IS14013A-E, 01GQ1115,
94. Bartók, A. P., Payne, M. C., Kondor, R. & Csányi, G. Gaussian approximation 01GQ0850, 01IS18025A, 031L0207D and 01IS18037A; the German Research Foundation (DFG)
potentials: the accuracy of quantum mechanics, without the electrons. Phys. under Grant Math+, EXC 2046/1, Project ID 390685689. K.B. was supported by NSF grant CHE
Rev. Lett. 104, 136403 (2010). 1856165. This publication only reflects the authors views. Funding agencies are not liable for
95. Gyevi-Nagy, L. & Tasi, G. SYVA: a program to analyze symmetry of molecules based any use that may be made of the information contained herein.
on vector algebra. Comput. Phys. Commun. 215, 156–164 (2017).
96. Wang, J., Wolf, R. M., Caldwell, J. W., Kollman, P. A. & Case, D. A. Development
and testing of a general amber force field. J. Comput. Chem. 25,
Author contributions
1157–1174 (2004).
L.V.-M. initiated the project and M.B. and L.V.-M. ran all simulations. M.E.T, K.-R.M., and K.B.
97. Frisch, M. J. et al. Gaussian 09 (2009).
conceived the theory and co-supervised the project. All authors guided the project design,
98. Bayly, C. I., Cieplak, P., Cornell, W. & Kollman, P. A. A well-behaved
contributed to data analysis, and co-wrote the manuscript.
electrostatic potential based method using charge restraints for deriving
atomic charges: the RESP model. J. Phys. Chem. 97, 10269–10280 (1993).
99. Wang, J., Wang, W., Kollman, P. A. & Case, D. A. Antechamber: an accessory Competing interests
software package for molecular mechanical calculations. J. Am. Chem. Soc. The authors declare no competing interests.
222, U403 (2001).
100. Tuckerman, M. E., Yarne, D. A., Samuelson, S. O., Hughes, A. L. & Martyna,
G. J. Exploiting multiple levels of parallelism in molecular dynamics based
Additional information
Supplementary information is available for this paper at https://doi.org/10.1038/
calculations via modern techniques and software paradigms on distributed
s41467020-19093-1.
memory computers. Comput. Phys. Commun. 128, 333–376 (2000).
101. Martyna, G. J., Klein, M. L. & Tuckerman, M. Nosé–Hoover chains: the canonical
Correspondence and requests for materials should be addressed to M.E.T., K.-R.M. or
ensemble via continuous dynamics. J. Chem. Phys. 97, 2635–2643 (1992).
K.B.
102. VandeVondele, J. et al. Quickstep: fast and accurate density functional calculations
using a mixed Gaussian and plane waves approach. Comput. Phys. Commun. 167,
Peer review information Nature Communications thanks Reinhard Maurer and the other
103–128 (2005).
anonymous reviewers for their contribution to the peer review of this work.
103. Hutter, J., Iannuzzi, M., Schiffmann, F. & VandeVondele, J. CP2K: atomistic
simulations of condensed matter systems. Wiley Interdiscip. Rev.: Comput.
Reprints and permission information is available at http://www.nature.com/reprints
Mol. Sci. 4, 15–25 (2014).
104. Perdew, J. P., Burke, K. & Ernzerhof, M. Generalized gradient approximation made
Publisher’s note Springer Nature remains neutral with regard to jurisdictional claims in
simple. Phys. Rev. Lett. 77, 3865–3868 (1996).
published maps and institutional affiliations.
105. Lippert, G., Hutter, J. & Parrinello, M. A hybrid Gaussian and plane wave
density functional scheme. Mol. Phys. 92, 477–488 (2010).
106. VandeVondele, J. & Hutter, J. Gaussian basis sets for accurate calculations on molecular
systems in gas and condensed phases. J. Chem. Phys. 127, 114105 (2007). Open Access This article is licensed under a Creative Commons Attribution 4.0
107. Goedecker, S., Teter, M. & Hutter, J. Separable dual-space Gaussian International License, which permits use, sharing,
pseudopotentials. Phys. Rev. B 54, 1703–1710 (1996). adaptation, distribution and reproduction in any medium or format, as long as you give
108. Krack, M. Pseudopotentials for H to Kr optimized for gradient-corrected exchange- appropriate credit to the original author(s) and the source, provide a link to the Creative
correlation functionals. Theoretica Chim. Acta 114, 145–152 (2005). Commons license, and indicate if changes were made. The images or other third party material
109. VandeVondele, J. & Hutter, J. An efficient orbital transformation method for in this article are included in the article’s Creative Commons license, unless indicated otherwise
electronic structure calculations. J. Chem. Phys. 118, 4365 (2003). in a credit line to the material. If material is not included in the article’s Creative Commons
110. Bahn, S. R. & Jacobsen, K. W. An object-oriented scripting interface to a license and your intended use is not permitted by statutory regulation or exceeds the permitted
legacy electronic structure code. Comput. Sci. Eng. 4, 56–66 (2002). use, you will need to obtain permission directly from the copyright holder. To view a copy of this
111. Giannozzi, P. et al. QUANTUM ESPRESSO: a modular and open-source license, visit http://creativecommons.org/
software project for quantum simulations of materials. J. Phys.: Condens. licenses/by/4.0/.
Matter 21, 395502 (2009).
112. Kresse, G. & Joubert, D. From ultrasoft pseudopotentials to the projector
augmented-wave method. Phys. Rev. B 59, 1758–1775 (1999). © The Author(s) 2020

NATURE COMMUNICATIONS | (2020)11:5223 | https://doi.org/10.1038/s41467-020-19093-1 | www.nature.com/naturecommunications 11

Anda mungkin juga menyukai