Anda di halaman 1dari 11

Nama : Tarisa Amalia

Npm : 26219283

Kelas : 4EB02

Artificial Intelligence atau Kecerdasan Buatan, istilah baru dan teknologi baru bagi para
peneliti. Bahkan sejarah Artificial Intelligence itu sendiri jauh lebih tua dari yang kita bayangkan,
Sejarah membuktikan Artificial Intelligence telah menjadi lingkup penelitian para ahli bahkan
sebelum internet berkembang dan menyentuh segala lini kehidupan kita seperti hari ini.
Meskipun perkembangannya baru terasa secara masif sejak beberapa tahun di belakang ini.
Tanpa disadari berbagai aplikasi dewasa ini telah memanfaatkan teknologi Artificial Intelligence.
Contohnya saja membuka ponsel canggih dengan fitur Face ID, navigasi di Google Maps, mobil
self-driving dan masih banyak lagi. Arti Artificial Intelligence (AI) mengacu pada simulasi
kecerdasan manusia di mesin yang diprogram untuk berpikir seperti manusia dan meniru
tindakan mereka. Saat mesin menjadi cerdas, mereka dapat memahami permintaan,
menghubungkan titik data, dan menarik kesimpulan. Mereka juga dapat bernalar, mengamati dan
merencanakan. Manfaat dari teknologi AI ini tentu saja meningkatkan kualitas hidup manusia,
dengan kata lain dapat memudahkan kehidupan masyarakat sehari-hari.

Jaringan Permusuhan Generatif (GAN)

GAN adalah pembelajaran mendalam generatif yang membuat contoh data baru yang
menyerupai pelatihan data. GAN memiliki dua komponen, yaitu generator yang belajar
menghasilkan data palsu, dan diskriminator yang belajar dari informasi palsu tersebut.
Penggunaan GAN telah meningkat selama periode waktu tertentu. GAN membantu
menghasilkan gambar realistis dan karakter kartun, membuat foto wajah manusia, dan membuat
objek 3D.

Sejarah GAN

Gagasan untuk memainkan dua algoritma terhadap satu sama lain berasal dari Arthur Samuel,
seorang peneliti terkemuka di bidang ilmu komputer, yang diberi istilah "pembelajaran mesin".
Selama berada di IBM, ia mengembangkan permainan catur – Program Samuel Checkers –
yang merupakan yang pertama berhasil dipelajari, termasuk dengan menghargai peluang
masing-masing pihak untuk memenangkan posisi tertentu.

Tetapi jika Samuel adalah kakek dari GAN, Ian Goodfellow, seorang mantan peneliti Google
Brain dan direktur pembelajaran mesin di Apple Special Projects Group, bisa menjadi ayahnya.
Dalam sebuah makalah penelitian inovatif yang berjudul "Generative Adversarial Nets" dari
2014, Goodfellow dan rekan-rekannya menggambarkan implementasi fungsi pertama dari model
generatif berdasarkan pada jaringan permusuhan.

Goodfellow sering menyatakan bahwa ia terinspirasi oleh beberapa jenis estimasi kontras
kebisingan untuk mempelajari distribusi data dengan membandingkannya dengan distribusi
kebisingan yang ditentukan (yaitu fungsi matematika yang mewakili data yang rusak atau
terdistorsi). Estimasi kontras-kebisingan menggunakan fungsi kerugian yang sama seperti GAN,
yaitu ukuran kinerja yang sama dalam hal kemampuan model untuk memprediksi hasil yang
diharapkan.

Goodfellow tentu saja bukan satu-satunya yang mengejar desain model AI yang berlawanan.
Dalle-Molle-Institut untuk Co-Direktur Penelitian Kecerdasan Buatan Jürgen Schmidhuber
menganjurkan meminimalkan prediktabilitas, sebuah teknik yang memodelkan distribusi melalui
encoder yang melakukan fungsi tujuan (fungsi yang dilakukan sistem)) pemecahan masalah)
diminimalkan oleh prediktor . Aturan keputusan minimum yang disebut diterapkan di mana
kemungkinan kerugian untuk skenario terburuk (kerugian maksimum) dijaga serendah mungkin.

GAN terdiri dari dua bagian: generator dan diskriminator. Model generator menghasilkan
sampel sintetis (mis., Gambar) dari noise acak yang disampel menggunakan distribusi dan,
bersama dengan sampel nyata dari kumpulan data pelatihan, diumpankan ke diskriminator yang
mencoba membedakan keduanya. Generator dan pembeda meningkatkan kemampuan
masingmasing sampai pembeda tidak lagi dapat membedakan contoh nyata dari contoh yang
disintesis dengan akurasi yang diharapkan lebih dari 50%.

GAN melatih tanpa pengawasan, yang berarti bahwa mereka didasarkan pada pola yang
disimpulkan dalam catatan tanpa merujuk pada hasil yang diketahui, ditandai, atau dijelaskan.
Menariknya, pekerjaan diskriminator memberikan informasi tentang generator – setiap kali
diskriminator mengidentifikasi pekerjaan yang disintesis dengan benar, ia memberi tahu
generator bagaimana mengoptimalkan outputnya sehingga menjadi lebih realistis di masa
depan.

Dalam praktiknya, GAN menderita sejumlah kekurangan karena arsitekturnya. Pelatihan


simultan generator dan model diskriminator secara inheren tidak stabil. Kadang-kadang
parameter – nilai konfigurasi dalam model – berosilasi atau destabilisasi, yang tidak
mengherankan karena jenis masalah optimasi yang harus dipecahkan berubah setelah setiap
pembaruan parameter. Atau, generator runtuh dan sebagian besar pola data homogen dibuat.

Atas: Arsitektur dari Jaringan Adversarial Generatif (GAN).


Kredit Gambar: Google
Generator dan pembeda juga berisiko saling mengalahkan. Jika generator menjadi terlalu
akurat, kerentanan dalam diskriminator yang mengarah pada hasil yang tidak diinginkan
dieksploitasi, dan jika diskriminator menjadi terlalu akurat, kemajuan konvergensi generator
terhambat.

Kurangnya data pelatihan juga mengancam untuk menghambat kemajuan GAN di area
semantik, yang dalam konteks ini berkaitan dengan hubungan antara objek. Misalnya, GAN
terbaik saat ini berusaha untuk mendamaikan perbedaan antara telapak tangan dan memegang
objek – perbedaan yang dibuat kebanyakan orang dalam hitungan detik.

Namun, sebagaimana Hanlin Tang, direktur senior laboratorium AI Intel, VentureBeat


menjelaskan dalam sebuah wawancara telepon, yang mengemuka pada teknik-teknik yang
mengatasi batasan-batasan ini. Anda harus memasukkan beberapa diskriminator ke dalam
model dan mencocokkannya dengan data tertentu. Pilihan lain adalah memasukkan representasi
embedding diskriminator-ketat atau representasi numerik data untuk mendapatkan informasi
lebih lanjut.

"Ada [aren’t] begitu banyak catatan yang dikuratori dengan baik sehingga GAN perlu
diterapkan," kata Tang. "GAN hanya mengikuti kemana catatan data pergi."

Mengenai topik komputasi, Youssef Mroueh, seorang asisten peneliti di grup IBM untuk
algoritma dan mesin multimoda, bekerja dengan kolega dalam pengembangan model ringan
yang disebut GAN "kecil" mengurangi waktu pelatihan dan persyaratan memori. Sebagian besar
penelitiannya berfokus pada MIT-IBM Watson AI Lab, sebuah proyek penelitian AI gabungan
antara Massachusetts Institute of Technology dan IBM.

"[It’s a] Pertanyaan bisnis yang menantang: Bagaimana kita dapat mengubah model tanpa
[the]? Seluruh perhitungan dan semua upaya? Tanya Mroueh. "Kami sedang mengerjakannya."

Aplikasi GAN

Sintesis Gambar dan Video

GAN mungkin paling dikenal karena kontribusinya dalam sintesis gambar.

StyleGAN, model yang dikembangkan oleh Nvidia, telah menghasilkan banyak headshots
resolusi dari orang fiksi dengan mempelajari atribut seperti postur wajah, bintik-bintik dan
rambut. Versi yang baru dirilis – StyleGAN 2 – meningkatkan arsitektur dan metode pelatihan
dan mendefinisikan kembali seni dalam hal kualitas yang dirasakan.
Pada Juni 2019, peneliti Microsoft memperkenalkan ObjGAN, sebuah novel GAN yang dapat
memahami teks film, tata letak garis besar, dan menyaring detail berdasarkan kata-katanya.
Rekan penulis studi terkait mengusulkan sistem – StoryGAN – yang menyusun storyboard dari
paragraf.

Model-model semacam itu telah memasuki produksi. Startup Vue.ai's GAN menjelaskan sifatsifat
pakaian dan belajar menciptakan pose realistis, warna kulit, dan karakteristik lainnya. Dengan
snapshot pakaian, gambar model dengan ukuran apa pun dapat dibuat hingga lima kali lebih
cepat daripada dengan pemotretan konvensional.

GAN diterapkan di tempat lain untuk masalah resolusi super (upampling gambar) dan estimasi
pose (transformasi objek). Menurut Tang, salah satu timnya menggunakan GAN untuk melatih
model untuk meningkatkan gambar satelit pada 200 x 200 piksel menjadi 1.000 x 1.000 piksel
dan membuat gambar yang terlihat seolah diambil dari sudut yang berbeda.

Atas: Contoh pekerjaan yang dilakukan oleh GAN Paint Studio.


Ilmuwan Carnegie Mellon mendemonstrasikan Recycle-GAN tahun lalu, sebuah pendekatan
berbasis data untuk mentransfer konten dari satu video atau foto ke yang lain. Selama pelatihan
dengan rekaman subjek manusia, klip dibuat dengan GAN yang menangkap ekspresi halus
seperti lesung pipit dan garis yang terbentuk ketika subjek tersenyum dan menggerakkan mulut
mereka.

Baru-baru ini para peneliti dari Hyperconnect di Seoul menerbitkan MarioNETte, yang
mensintesis wajah yang disimulasikan dengan gerakan seseorang sambil mempertahankan
penampilan wajah.

Di sisi sintesis objek dari persamaan, Google dan Laboratorium Ilmu Pengetahuan dan
Kecerdasan Buatan (CSAIL) MIT mengembangkan GAN yang dapat menghasilkan gambar
model 3D dengan pencahayaan dan refleksi realistis, dan memungkinkan pengeditan bentuk dan
tekstur juga. perspektif yang bergerak.

Video

Prediksi peristiwa masa depan hanya dari beberapa bingkai video – tugas yang sebelumnya
dianggap mustahil – hampir nyata dengan GAN dan kumpulan data baru berkat pendekatan
terbaru.

Salah satu publikasi DeepMind terbaru tentang subjek ini menggambarkan kemajuan terbaru di
bidang pemula dalam pembuatan klip AI. Berkat komponen dan teknik yang "efisien secara
komputasi" dan kumpulan data baru yang dibuat khusus, para peneliti dapat menggunakan
model mereka yang paling kuat, Dual Video Discriminator GAN (DVD-GAN), untuk membuat
video 256 x 256 piksel yang koheren dengan "kesetiaan luar biasa". Panjangnya hingga 48
bingkai.
Konsultan Cambridge tahun lalu meluncurkan model yang disebut DeepRay yang menciptakan
bingkai video untuk mengurangi distorsi yang disebabkan oleh hujan, kotoran, asap, dan
puingpuing lainnya.

Grafik

GAN dapat melakukan lebih dari sekadar menghasilkan gambar dan video. Terlatih dengan
catatan yang tepat, mereka dapat menghasilkan karya seni de novo.

Para peneliti dari institut teknologi India Hyderabad dan Institut Universitas Sri Sathya Sai
mengembangkan GAN yang disebut SkeGAN, yang menghasilkan sketsa vektor stroke kucing,
mobil pemadam kebakaran, nyamuk dan pose yoga.

Para ilmuwan dari Universitas Maastricht di Belanda telah menciptakan GAN yang
menciptakan logo dalam salah satu dari 12 warna berbeda.

Victor Dibia, interaksi manusia-komputer. Peneliti dan lulusan Carnegie Mellon telah melatih
GAN untuk sintesis topeng suku Afrika.
Sementara itu, tim dari Institut Persepsi dan Institut Astronomi di Universitas Edinburgh
merancang model yang menghasilkan gambar galaksi fiksi yang dengan cermat mengikuti
distribusi galaksi nyata yang erat mengikuti distribusi galaksi nyata .

Pada bulan Maret, selama Konferensi Teknologi GPU (GTC) di San Jose, California, Nvidia
mengambil kemasan dari GauG AN, sistem AI musuh generatif yang dapat digunakan pengguna
untuk membuat lanskap seperti manusia yang tidak pernah ada. GauGAN – yang namanya
berasal dari pelukis pasca-impresionis Paul Gauguin – memperbaiki sistem Pix2PixHD Nvidia,
diperkenalkan tahun lalu, yang mampu mereproduksi dunia sintetis tetapi meninggalkan artefak
dalam lukisannya. Model pembelajaran mesin yang menjadi dasar GauGAN dilatih pada lebih
dari satu juta gambar Flickr untuk memahami hubungan antara lebih dari 180 objek seperti
salju, pohon, air, bunga, semak, bukit dan gunung. Dalam praktiknya, pohon memiliki refleksi di
samping air, misalnya, dan jenis curah hujan berubah tergantung pada musim yang ditunjukkan.

Musik
GAN secara arsitektur sangat cocok untuk generasi media, termasuk musik.

Dalam sebuah artikel yang diterbitkan pada bulan Agustus, para peneliti di National Institute of
Informatics di Tokyo menggambarkan suatu sistem yang dapat menghasilkan melodi "yang
berhubungan dengan teks" dari hubungan yang dipelajari antara suku kata dan catatan.

Tidak bisa dikalahkan, Amazon's December Web Services merinci DeepComposer, layanan
berbasis cloud yang mengetuk GAN untuk mengisi celah komposisi dalam lagu.

“Untuk waktu yang lama, [GANs research] telah tentang meningkatkan ketidakstabilan
pelatihan terlepas dari modalitas – teks, gambar, kalimat dan sebagainya. Rekayasa adalah satu
hal, tetapi juga tergantung pada arsitektur, ”kata Mroueh. "Ini adalah kombinasi dari banyak
hal."

Pidato

Para peneliti dari Google dan Imperial College London baru-baru ini ingin mengembangkan
sistem text-to-speech berbasis GAN yang akan mencapai (atau meningkatkan) keadaan terkini
dari seni. bisa menjadi metode -art. Sistem yang mereka usulkan – GAN-TTS – terdiri dari
jaringan saraf yang telah belajar menghasilkan data audio mentah dengan melatih tubuh pidato
dengan 567 kode volume, durasi, dan data nada. Untuk memungkinkan model menghasilkan
kalimat dengan panjang berapa pun, penulis bersama memindai cuplikan 44 jam dua detik
bersama dengan fitur linguistik terkait yang dihitung untuk lima milidetik cuplikan. Sebuah
ensemble dari 10 diskriminator – beberapa menilai pengkondisian linguistik dan lainnya menilai
realisme umum – mencoba untuk membedakan antara bahasa nyata dan sintetik.

Kedokteran

Di bidang medis, GAN digunakan untuk menghasilkan data tentang model AI lainnya – dalam
beberapa kasus juga GAN lainnya – dapat mengembangkan dan menemukan perawatan untuk
penyakit langka yang sejauh ini hanya mendapat sedikit perhatian.

Pada bulan April, Imperial College London, Universitas Augsburg dan Universitas Teknik
Munich berusaha untuk mensintesis data untuk mengisi kesenjangan dalam data nyata dengan
model bernama Snore-GAN. Demikian pula, para peneliti dari Nvidia, Mayo Clinic, dan MGH
dan BWH Center for Clinical Data Science mengusulkan model yang menghasilkan gambar
resonansi magnetik sintetis (MRI) otak dengan tumor kanker.

https: // venturebeat. com / wp-content / uploads / 2019/09 / abstract.wav

Insilico Medicine, yang berbasis di Baltimore, memelopori penggunaan GAN untuk menciptakan
struktur molekul untuk penyakit dengan ligan yang diketahui (biomolekul kompleks) tetapi tidak
ada target (protein terkait) dengan proses penyakit). Tim peneliti secara aktif bekerja pada
program penemuan obat untuk kanker, penyakit kulit, fibrosis, Parkinson, Alzheimer, ALS,
diabetes, sarkopenia dan penuaan.

Robotika

Bidang robotika, ternyata, bisa mendapat banyak manfaat dari GAN.

Seorang diskriminator yang dicari dapat menentukan dari distribusi demonstrasi manusia atau
dari contoh-contoh yang disintesis apakah lintasan sebuah mesin telah ditarik. Dengan cara ini,
agen dapat dilatih untuk melakukan tugas dengan tepat, bahkan jika mereka hanya dapat
mengakses informasi posisi robot. (Biasanya, pelatihan AI dengan kontrol robot membutuhkan
data posisi dan tindakan. Yang terakhir menunjukkan motor mana yang bergerak seiring waktu.)

bekerja dengan data yang jauh lebih sedikit, "kata Tang." Trik dalam menggunakan ini
Pendekatan kontroversial untuk belajar adalah untuk mencari tahu input apa yang dapat diakses
oleh diskriminator – informasi apa yang tersedia untuk menghindari penipuan [by the
discriminator] … [In state-of-the-art approaches] Diskriminator hanya memerlukan akses ke
data [positional] sehingga kita dapat berlatih dengan demonstrasi ahli di yang kami hanya
memiliki data keadaan. “

Tang mengatakan ini akan memungkinkan pelatihan model yang jauh lebih kuat daripada
sebelumnya – model yang hanya membutuhkan sekitar dua lusin demonstrasi manusia. "Jika
Anda mengurangi jumlah data yang dapat diakses oleh diskriminator, Anda mengurangi
kerumitan set data yang harus Anda sediakan untuk model. Jenis metode pembelajaran yang
berlawanan ini bekerja sangat baik dalam sistem dengan jumlah data yang sedikit."

Deepfake- Deteksi

Kemampuan GAN untuk mengambil foto dan video orang yang menarik membuat mereka
menjadi target dewasa untuk pelecehan, dan aktor jahat telah menggunakan model untuk
membuat pornografi selebriti palsu.

Penelitian awal menunjukkan bahwa GAN dapat memberantas deepfakes seefektif yang mereka
hasilkan, sebuah artikel yang diterbitkan di server pracetak Arxiv.org pada bulan Maret
menjelaskan spamGAN, yang belajar dari kumpulan data yang terbatas dengan data yang
dikomentari dan yang tidak dikomentari spamGAN melampaui teknik deteksi spam sebelumnya
dengan data berlabel terbatas dan mencapai akurasi antara 71% dan 86% saat pelatihan
dengan hanya 10% dari data berlabel.

Instruksi Masa Depan

Tetap Menjaga Masa Depan GAN? Terlepas dari lompatan dan batasan yang dibawa oleh
penelitian dekade terakhir ini, Tang memperingatkan bahwa ini masih awal.

"GAN masih merupakan kendali yang sangat halus," katanya. "[That’s] tantangan besar."

Mroueh percaya bahwa semakin sulit untuk membedakan dari konten yang sebenarnya.

"Perasaan saya adalah bahwa lapangan akan membaik," katanya. “Jika saya membandingkan
pencitraan tahun 2014 dengan pencitraan hari ini, saya tidak akan mengharapkan kualitas
sebesar itu. Jika kemajuan berlanjut seperti ini, [GANs] akan tetap menjadi proyek penelitian
yang sangat penting. "

Anda mungkin juga menyukai