Anda di halaman 1dari 98

Bab 1

Memperkenalkan Ai

J
rtificial Intelligence (AI) telah memiliki beberapa palsu dimulai dan
berhenti selama bertahun-tahun, sebagian karena orang tidak benar-benar
mengerti apa AI adalah semua tentang, atau bahkan apa yang harus dicapai.
Bagian utama dari masalah ini adalah bahwa
film, acara televisi, dan buku memiliki semua bersekongkol untuk memberikan
harapan palsu tentang apa yang akan dicapai AI. Selain itu, kecenderungan manusia
untuk antropomorphize (memberikan karakteristik manusia) teknologi
membuatnya tampak seolah-olah Ai harus melakukan lebih dari yang dapat
berharap untuk mencapai. Jadi, cara terbaik untuk memulai buku ini adalah untuk
mendefinisikan apa sebenarnya AI, apa yang tidak, dan bagaimana
menghubungkan ke komputer hari ini.

Tentu saja, dasar untuk apa yang Anda harapkan dari Ai adalah kombinasi dari
bagaimana Anda mendefinisikan AI, yang teknologi yang Anda miliki untuk
mengimplementasikan AI, dan tujuan yang Anda miliki untuk AI. Akibatnya, semua
orang melihat AI berbeda. Buku ini mengambil pendekatan Middle-of-The-Road
dengan melihat AI dari berbagai perspektif yang berbeda mungkin. Itu tidak
membeli ke hype ditawarkan oleh para pendukung, juga tidak memanjakan diri
dalamnega-
tivitydukungdenganpengkritiknya,begitubahwakamumendapatkanparaterbaikdi
mungkinkanpemandangandariAikarenasebuahteknologi-nologi. Sebagai hasilnya,
Anda mungkin mendapati bahwa Anda memiliki ekspektasi yang agak berbeda dari
yang Anda temui dalam buku ini, yang baik, tapi penting untuk mempertimbangkan
apa yang sebenarnya dapat dilakukan oleh teknologi untuk Anda, daripada
mengharapkan sesuatu yang tidak bisa.

Mendefinisikan istilah Ai
Sebelum Anda dapat menggunakan istilah dalam cara yang bermakna dan
berguna , Anda harus memiliki def-inition untuk itu.Setelahsekali,kalautak
seorang punsetujudi atassebuahartinya,paraistilahmemilikitidak ada;ituhanya
saja
Koleksi karakter. Mendefinisikan idiom (istilah yang artinya tidak jelas dari makna
dari elemen konstituen) sangat penting dengan istilah Tech-ekumene yang telah
menerima lebih dari sedikit liputan pers di berbagai kali dan dalam berbagai cara.

Dengan mengatakan bahwa AI adalah kecerdasan buatan yang tidak memberi tahu
Anda apa-apa berarti-ingful, itulah sebabnya ada begitu banyak diskusi dan
perselisihan dalam istilah ini. Ya, Anda dapat berpendapat bahwa apa yang terjadi
adalah buatan, tidak datang dari sumber alami. Namun, Bagian intelijen adalah, di
terbaik, ambigu. Bahkan jika Anda tidak selalu setuju dengan definisi AI seperti
yang muncul di bagian yang mengikuti, buku ini menggunakan AI sesuai dengan
definisi itu, dan mengetahui itu akan membantu Anda mengikuti sisa teks dengan
lebih mudah.

Kecerdasan cerdas
Orang mendefinisikan kecerdasan dalam berbagai cara.Namun
demikian,kamubisamengatakan bahwabahwaIntel-ligence melibatkan kegiatan
mental tertentu terdiri dari berikutkegiatan:

» Belajar: memiliki kemampuan untuk mendapatkan dan memproses informasi baru.


» Penalaran: mampu memanipulasi informasi dalam berbagai cara.
» Understanding: mempertimbangkan hasil manipulasi informasi.
» Menggenggam kebenaran: menentukan validitas informasi dimanipulasi.
» Melihat hubungan: ramalan bagaimana data tervalidasi berinteraksi dengan data lain.
» Mempertimbangkan makna: menerapkan kebenaran pada situasi tertentu
dengan cara yangkonsisten dengan hubungan mereka .

» Memisahkan fakta dari kepercayaan: menentukan Apakah data tersebut didukung


secara memadai oleh sumber yang dapat
dibuktikanbahwabisamenjadidiperlihatkanmelakukanmenjadisecara konsistenberlaku.

Daftar dapat dengan mudah mendapatkan cukup panjang, tetapi bahkan daftar ini
relatif rentan terhadap antar-pretasi oleh siapa saja yang menerima sebagai layak.
Seperti yang dapat Anda lihat dari daftar, bagaimana-pernah, kecerdasan sering
mengikuti proses yang sistem komputer dapat meniru sebagai bagian dari
simulasi:

1. Menetapkan tujuan berdasarkan kebutuhan atau keinginan.

2. Menilai nilai dari setiap informasi yang saat ini diketahui dalam mendukung tujuan.
3. Mengumpulkan informasi tambahan yang dapat mendukung tujuan.

BAB KE 1 Memperkenalkan Ai 8
4. Memanipulasi data sedemikian rupa sehingga mencapai bentuk yang
konsisten dengan informasi yang ada .
5. Mendefinisikan hubungan dan nilai kebenaran antara yang ada dan baru
Informasi.

6. Menentukan Apakah tujuan tercapai.

7. Memodifikasi tujuan dalam terang data baru dan efeknya pada probabilitas
Sukses.

8. Ulangi langkah 2 hingga 7 sesuai kebutuhan sampai tujuan tercapai


(ditemukan benar) atau kemungkinan untuk mencapainya adalah
kelelahan (ditemukan false).

Meskipun Anda dapat membuat algoritma dan memberikan akses ke data dalam
mendukung proses ini dalam komputer, kemampuan komputer untuk mencapai
kecerdasan sangat terbatas. Misalnya, komputer tidak mampu memahami apa pun
karena bergantung pada proses mesin untuk memanipulasi data menggunakan
matematika murni dalam mode mekanis yang ketat. Demikian juga, komputer tidak
dapat dengan mudah memisahkan kebenaran dari mistruth (seperti yang
dijelaskan dalam Bab 2). Bahkan, tidak ada komputer yang dapat sepenuhnya
menerapkan salah satu kegiatan mental yang dijelaskan dalam daftar yang
menggambarkan kecerdasan.

Sebagai bagian dari memutuskan apa yang sebenarnya melibatkan intelijen, kategorisasi
kecerdasan juga membantu. Manusia tidak menggunakan hanya satu jenis kecerdasan, tapi
lebih mengandalkan pada kecerdasan Mul- tiple untuk melakukan tugas. Howard Gardner
dari Harvard telah mendefinisikan sejumlah jenis intelijen (Lihat
http://www.PZ.Harvard.edu/Projects/ Multiple-Intelligences untuk rincian), dan
mengetahui mereka membantu Anda untuk menghubungkan mereka dengan jenis tugas
yang komputer dapat mensimulasikan sebagai kecerdasan (Lihat tabel 1-1 untuk versi
yang dimodifikasidariinikecerdasandengantambahanDescription).

TABEL 1-1 memahami jenis kecerdasan


Jenis simulasi Deskripsi alatmanusia potensial

BAB KE 1 Memperkenalkan Ai 9
Visual-Spasial Moderat Model, grafik, grafik, Kecerdasan lingkungan
foto, Gambar,
pemodelan 3-D, fisik yang digunakan oleh
video, televisi, dan orang seperti pelaut dan arsitek
multimedia (di antara banyak lainnya).Untuk
bergerak sama sekali, manusia
perlu memahami lingkungan fisik
mereka-yaitu,yangdimensi dan
karakteristik. Setiap robot atau
kecerdasan komputer portabel
membutuhkan kemampuan ini,
tetapi kemampuannya sering sulit
untuk mensimulasikan
(sebagaidenganmengemudi
sendirimobil)atau kurangdari
sekadarAccurate(seperti dengan
Vacuums yang mengandalkan
sebanyak menabrak karena
mereka bergerak cerdas).
terus

BAB KE 1 Memperkenalkan Ai
1
0
TABLE 1-1 (lanjutan)

Jenis simulasi Deskripsi alatmanusia potensial

Fisik- Sedang hingga tinggi Peralatan khusus dan Gerakan tubuh, seperti
kinestetik benda nyata yangdigunakan oleh seorang
ahli bedah atau penari,
memerlukan presisi dan
kesadaran tubuh
.Robotsumumnyagunakaninibaik
hatidarikecerdasanmelakukanmel
akukan berulangTasks,kerap
kalidenganlebih tinggipresisi
daripada
manusia,tetapiterkadang
dengan sedikit kasih karunia.
Ini penting untuk membedakan
antara augmentasi manusia,
seperti perangkat bedah yang
menyediakan ahli bedah
dengankemampuan
fisik yang disempurnakan,
dan gerakan independen yang
benar
.Parabekastidaksekadarsebuah
demonstrasimatematisabilitasd
alam
tahunbahwaiatergantungdi
atasparaahli bedah
untukmasukan.
Kreatif Tidak Artistik output, pola Kreativitas adalah tindakan
baru pemikiran, mengembangkan pola pikir baru
penemuan, jenis baru dari yang menghasilkan output
komposisi musik yang unik
dalamparabentukdariseni,musik,
danmenulis.Sebuahsungguhbarus
emacamProducttidakparaberakiba
tdarikreativitas.SebuahAibisamensi
mulasikanyang
adaPatternsdarimengiradanbahkan
gabungkanmerekauntuk
menciptakan apa yang
tampaknya
menjadiUniquepenyajiantetapitidak
sangathanya satu secara
matematisberpusatversidarisebuahy
ang adapattern.Dalam
tahunpesanmelakukanciptakan,se
buahAiakanperlumelakukanmilik
ikesadaran diri, yang akan
memerlukan
Intrapersonalkecerdasan.

BAB KE 1 Memperkenalkan Ai
1
1
Interpersonal Rendah sampai Telepon, Berinteraksi dengan orang lain
sedang konferensi audio, terjadi di beberapa
konferensi video , tingkatan.ParaGoaldariinibentukda
menulis, konferensi rikecerdasantidakmelakukanmempe
komputer, email roleh,Exchange,memberi,danmem
anipulasiinformasiberpusatdi
atasparapengalamandariorang
lain.Komputer dapat menjawab
dasarpertanyaan karena kata
kuncimasukan,belumkarenamerek
amengertiparapertanyaan.
Kecerdasan terjadi saat
memperoleh informasi, mencari
kata kunci yang sesuai, dan
kemudian memberikan informasi
berdasarkan kata kunci
tersebut.Referensi
silangketentuandalam
tahunsebuahlookupmejadankemud
ianaktingdi atasparapetunjuk yang
diberikan oleh tabelmenunjukkan
kecerdasan
logis,beluminterpersonalkecerdas
an.

BAB KE 1 Memperkenalkan Ai
1
2
Jenis simulasi Deskripsi alatmanusia potensial

Intrapersonal Tidak Buku, materi Melihat ke dalam untuk memahami


kreatif, Diaries, kepentingan seseorang dan
privasi, dan kemudian menetapkan tujuan
waktu berdasarkan kepentingan
tersebut saat ini merupakan
jenis manusia
kecerdasan.Karenamesin,
komputer tidak
memilikihasrat,minat,ingin,atauCr
eativekemampuan.SebuahAiProce
ssesinput
numerikmenggunakansebuahmen
gaturdarialgoritmedanmenyediak
ansebuahoutput,iaBukankahAWA
REdariapa
punbahwaiatidak,NorApakahia
mengertiapa punbahwaiatidak.
Linguistik Rendah Permainan, Bekerja dengan kata adalah
multimedia, buku, alat penting untuk komunikasi
perekam suara, dan karena pertukaran informasi
kata yang diucapkan lisan dan tertulis jauh lebih cepat
daripadalainnyabentuk. Bentuk
intelijen ini termasuk memahami
masukan lisan dan tulisan ,
mengelola input untuk
mengembangkanmenjawab, dan
memberikan jawaban
dimengerti sebagai
output.Dalam
tahunbanyakkasus,Computersbisa
nyarisparse input ke dalam kata
kunci, tidak
bisasebenarnyamengertiparaperm
intaansama
sekali,danoutputnyaResponsesba
hwaMeibelummenjadimudah
dimengertiatsemua.Pada
manusia, lisan dan
tulisankecerdasan linguistik
berasal dari
berbagaiareadariparaBrain(http://
Releases.jhu.edu/2015/05/05/
mengatakan-apa-
bagaimana-The-Brain-
memisahkan-our-
kemampuan-to- Talk-dan-
Write/), yang
berartibahwabahkandenganman
usia,seseorangyang memiliki
linguistik tertulis
tinggikecerdasanMeibelummemili
kidemikian
pulatinggidiucapkanlinguistikkecer
BAB KE 1 Memperkenalkan Ai
1
3
dasan.
tidak
Komputer saat ini
memisahkan
kemampuan linguistik
tertulis dan lisan .

Logika- Tinggi Game logika, Menghitung hasil, melakukan


matematika investigasi, perbandingan, mengeksplorasi pola,
misteri, dan dan mempertimbangkan
permainan hubungan adalah semua bidang
asah otak di mana komputer saat
iniExcel.SaatkamumelihatsebuahCo
mputerBeatsebuahmanusiadi
atassebuahgamemenunjukkan,init
idakparahanya
sajabentukdarikecerdasanbahwaA
nda
sedangsebenarnyamelihat,keluardar
itujuh.Ya,kamumungkinmelihatkeci
lBitsdarilainnyamacamdarikecerd
asan,tetapiinitidakparafokus.
Mendasarkan penilaian manusia
versus kecerdasan komputer hanya
pada satu daerah bukanlah ide
yang baik.

BAB KE 1 Memperkenalkan Ai
1
4
Menemukan empat cara untuk mendefinisikan AI
Seperti yang dijelaskan di bagian sebelumnya, konsep pertama yang penting untuk
di bawah-Stand adalah bahwa AI tidak benar ada hubungannya dengan kecerdasan
manusia. Ya, beberapa AI dimodelkan untuk mensimulasikan kecerdasan manusia,
tapi itulah apa itu: sebuah simu-lation. Ketika berpikir tentang AI, perhatikan
interaksi antara tujuan pencarian, pengolahan data yang digunakan untuk
mencapai tujuan itu, dan akuisisi data yang digunakan untuk lebih baik di bawah-
Stand tujuan. AI mengandalkan algoritma untuk mencapai hasil yang mungkin atau
mungkin tidak ada hubungannya dengan tujuan manusia atau metode mencapai
tujuan tersebut. Dengan pemikiran ini , Anda dapat mengkategorikan Ai dalam
empat cara:

» Bertindak manusiawi: ketika komputer bertindak seperti manusia, yang terbaik


mencerminkan tes Turing , dalam komputer yang berhasil ketika diferensiasi antara komputer
dan manusia tidak mungkin(lihat http://www.Turing.org.uk/scrapbook/Test.HTMLbagirincian).
Kategori ini juga mencerminkan apa yang media akan Anda percaya Ai adalah semua
tentang.KamumelihatiadipekerjakanbagiTechnologiesseperti itukarenaalamipemrosesan
bahasa, representasi pengetahuan, penalaran otomatis, danmesinpembelajaran(semua empat
yang harus hadir untuk lulus tes).

Tes Turing asli tidak termasuk kontak fisik .Paralebih baru,Total


TuringUjiApakahmeliputijasmaniContactdalam
tahunparabentukdaripersepsiabilitasinterogasi, yang berarti bahwaparakomputer juga
harus
menggunakanComputerVisiondanRobotikamelakukanberhasil.BerdesainTechniquesmeliputi
paraideadaripencapaianparatujuan daripada meniru manusia
sepenuhnya.Bagicontoh,paraWrightBersaudaratidakberhasildalam
tahunmembuatsebuahpesawatdenganjustrupenyalinanparapenerbangandariburung;melainkan,p
araBirdsdisediakanIdeasbahwaLEDmelakukanaerodinamika
yangakhirnyaLEDmelakukanmanusiapenerbangan.ParaGoaltidakmelakukanfly.KeduaBirdsda
nmanusiamencapaiiniGoal,tetapimerekagunakanberbagaipendekatan.

» Berpikir manusiawi: ketika komputer berpikir sebagai manusia, ia melakukan tugas yang
memerlukan kecerdasan (seperti yang berlawanan dengan prosedur Rote ) dari manusia
untuk berhasil, seperti
mengendaraimobil.MelakukanmenentukanApakahsebuahprogrammengirasepertisebuahma
nusia,kamumestimemilikisebagianmethoddaripenentuanbagaimana caramanusiaberpikir,
yangparakognitifmodelingApproachmendefinisikan.Inimodelnyabergantungdi
atastigateknik:

• Introspeksi: mendeteksi dan mendokumentasikan teknik yang


digunakan untuk mencapai tujuan dengan memantau pikiran
seseorang proses.

• Tes psikologis: mengamati perilaku seseorang dan


menambahkannya kedatabase perilaku serupa
darilainnyaPersonsdiberikansebuahyang serupa
denganmengaturdarikeadaan,tujuan,sumber
daya,danlingkunganketentuan(di antara
hal lainnya).

BAB KE 1 Memperkenalkan Ai
1
5
• Pencitraan otak: pemantauan aktivitas otak langsung melalui berbagai
cara mechani- Cal , seperti komputerisasi Aksial tomography
(cat), positron Emission tomography (PET), Magnetic Resonance
Imaging (MRI), dan
Magnetoencephalography (MEG).

BAB KE 1 Memperkenalkan Ai
1
6
Setelah membuat model, Anda dapat menulis sebuah program yang mensimulasikan
model. Mengingat jumlah variabilitas di antara proses berpikir manusia dan kesulitan secara
akurat mewakili proses pemikiran ini sebagai Bagian dariprogram, hasilnya eksperimental
di terbaik.IniCategorydariberpikir secara manusiawitidakkerap kalidigunakandalam
tahunPsychologydanlainnyaladangdalam
tahunmanamodelingparamanusiamengiramengolahmelakukanciptakanrealistiksimulas
itidakpenting.

» Berpikir secara rasional: mempelajari bagaimana manusia berpikir menggunakan


beberapa standar memungkinkan penciptaan
pedomanbahwamenguraikankhasmanusiaperilaku.Sebuahorangtidakdianggap rasional ketika
mengikuti perilaku ini dalam
beberapatingkatandarideviasi.SebuahComputerbahwamengirasecara rasionalbergantungdi
atasparaperilaku yang
direkammelakukanciptakansebuahmembimbingkarenamelakukanbagaimana
caramelakukanberinteraksidengansebuahlingkunganberpusatdi
atasparadataattangan.ParaGoaldariiniApproachtidakmelakukanselesaikanpermasalahanLo
gikanya, ketikadimungkinkan.Dalam
tahunbanyakkasus,iniApproachakanmemampukanparaciptaandarisebuahbaselinetehnikba
gipemecahansebuahmasalah,manaakankemudianmenjadidimodifikasimelakukansebenarny
aselesaikanparamasalah.Dalam
tahunlainnyaWords,parapemecahandarisebuahproblemdalam
tahunprinsipnyatidakkerap kaliberbagaidaripemecahaniadalam
tahunprakteknya,tetapikamumasihperlusebuahmemulaititik.

» Bertindak secara rasional: mempelajari bagaimana manusia bertindak dalam situasi


tertentu di bawahkendala khusus memungkinkan
AndamelakukanmenentukanmanaTechniquestidakkeduaefisiendanefektif.SebuahComputerbahw
aActssecara rasionalbergantungdi atasparadirekamperbuatanmelakukanberinteraksi
dengansebuahlingkungan berbasisdi ataskondisi, faktor lingkungan, danyang
adadata.Karenadenganrasionalberpikir,rasionalActstergantungdi atassebuahsolusinyapada
prinsipnya,manaMeibelumbuktikanbergunadalam tahunpraktek.Namun
demikian,rasionalActslakukan memberikansebuahbaselinepada saat Check -
manasebuahComputerbisamemulainyabernegosiasiparasukses-
FULpenyelesaiandarisebuahtujuan.

proses manusia Versus rasional


Proses manusia berbeda dari proses rasional dalam hasil mereka
.SebuahmengolahtidakrasionalkalauiaselaluApakahparatepathalberpusatdi atasparasaat
iniinformasi,diberikansebuahidealperformansiukur.Dalam
tahunpendek,rasionalProcessespergidenganparabukudanberasumsibahwaparabukutidaksebenarnyabenar.M
anusiaProcessesmelibatkannaluri,intuisi,danlainnyavariablesbahwaTidakkahtentumerefleksikanparabukudan
Meibelumbahkanpertimbangkanlahparayang
adadata.Karenasebuahcontoh,pararasionalcaramelakukanmenggerakkansebuahmobiltidakmelakukanselalu
Followparahukum.Namun
demikian,TrafficBukankahrasional.KalaukamuFollowparahukumtepatnya,kamuakhirnaikterjebakdi
suatu tempatkarenalainnyapembalapBukankahberikut
iniparahukumtepat.Melakukanmenjadiberhasil,sebuahmengemudi sendirimobilmestikarena
ituActmanusiawi,agakdari sekadarsecara rasional.

BAB KE 1 Memperkenalkan Ai
1
7
Kategori yang digunakan untuk mendefinisikan AI menawarkan cara untuk
mempertimbangkan berbagai kegunaan atau cara untuk menerapkan AI. Beberapa sistem
yang digunakan untuk mengklasifikasikan AI menurut jenisnya sewenang-wenang dan
tidak dis- tringkas. Sebagai contoh, beberapa kelompok memandang AI sebagai kuat
(kecerdasan umum yang dapat beradaptasi dengan berbagai situasi) atau lemah
(kecerdasan khusus yang dirancang untuk melakukan tugas tertentu dengan baik).
Masalah dengan AI yang kuat adalah bahwa hal itu tidak per- bentuk tugas apapun dengan
baik, sementara Ai lemah terlalu spesifik untuk melakukan tugas secara independen.
Meskipun demikian, hanya dua jenis klasifikasi tidak akan melakukan pekerjaan bahkan
dalam arti umum. Empat klasifikasi jenis dipromosikan oleh Arend Hintze (Lihat
http://theconversation.com/memahami-The-empat-jenis-of-Ai-dari-reaktif-Robots-to-
sadar diri-makhluk-67616bagidetails)bentuksebuahlebih
baikdasarbagipemahamanAI:

» Mesin reaktif : mesin yang Anda Lihat mengalahkan manusia di catur atau bermain di
game Show adalah contoh mesin reaktif .Sebuahreaktifmesinmemilikitidak ada
memoriataupengalamanpada saat Check - manamelakukandasarsebuahkeputusan.Sebagai
gantinya,iabergantungdi atasmurni
komputasidayadancerdasalgoritmemelakukanmenciptakansetiapkeputusansetiapwaktu.Initida
ksebuahcontohdarisebuahlemasAidigunakanbagisebuahspesifiktujuan.

» Memori terbatas : mobil mengemudi sendiri atau robot otonom tidak mampu
meluangkan waktu untuk membuat setiapkeputusandariScratch.Inimesinbersandardi
atassebuahkeciljumlahdari memorimelakukanmemberikan pengetahuan
pengalamandariberbagai situasi. Ketika mesin melihat situasi yang sama , dapat mengandalkan
pengalaman untuk mengurangi waktu reaksi dan untuk menyediakan lebih banyak sumber daya
untuk membuat keputusan baru yang belum dibuat.Initidaksebuahcontohdariparasaat
initingkatdarikuatAI.

» Teori pikiran: sebuah mesin yang dapat menilai kedua tujuan yang diperlukan
dan tujuan potensial dari entitas lain dalam lingkungan yang sama memiliki
semacampemahaman yang layak sampai batas tertentu hari ini, tetapi tidak dalam
bentuk commer-cial .Namun demikian,bagimengemudi
sendirimobilmelakukanmenjadisungguhotonom,tingkat
inidariAimestimenjadisepenuhnyadikembangkan.Sebuahmengemudi
sendirimobilakanbelumhanya sajaperluuntuk mengetahuibahwaiamestipergidarisalah
satutitikmelakukanlain,tetapijugaIntuitparaberpotensibertentanganGoaldaripembalapdi
sekitariadanbereaksisesuai dengan itu.

» Self-kesadaran: ini adalah jenis Ai yang Anda Lihat dalam film.Namun


demikian,iamensyaratkanTechnologiesbahwaBukankahbahkanjarak
jauhdimungkinkankinikarenaseperti itusebuahmesin akan memilikisebuahSensedaribaik
diridankesadaran.Dalam tahunSelain itu,malahdarisekadarintuisiparaGoaldariorang
lainberpusatdi
ataslingkungandanlainnyaentityreaksi,iniketikkandarimesinakanmenjadiablemelakukanmen
yimpulkanparaniatdariorang lainberpusatdi atasexperientialpengetahuan.

BAB KE 1 Memperkenalkan Ai
1
8
Memahami sejarah Ai
Bagian sebelumnya dari bab ini membantu Anda memahami kecerdasan dari sudut
pandang manusia dan melihat bagaimana komputer modern sangat tidak memadai
untuk mensimulasikan kecerdasan tersebut, apalagi sebenarnya menjadi cerdas
diri mereka sendiri.

BAB KE 1 Memperkenalkan Ai
1
9
Namun, keinginan untuk membuat mesin cerdas (atau, di zaman kuno, berhala)
adalah sebagai tua sebagai manusia. Keinginan untuk tidak sendirian di alam
semesta, untuk memiliki sesuatu yang untuk berkomunikasi tanpa inkonsistensi
manusia lain, adalah salah satu yang kuat. Tentu saja, satu buku tidak bisa
merenungkan semua sejarah manusia, jadi bagian berikut ini memberikan
gambaran singkat yang relevan tentang sejarah usaha AI modern.

Dimulai dengan logika simbolis di Dartmouth


Komputer yang paling awal hanya itu: perangkat komputasi. Mereka meniru
kemampuan manusia untuk memanipulasi simbol dalam rangka untuk melakukan
tugas matematika dasar, seperti penambahan. Penalaran Logis kemudian
menambahkan kemampuan untuk melakukan penalaran matematis melalui
perbandingan (seperti menentukan Apakah satu nilai lebih besar dari yang lain
nilainya). Namun, manusia masih diperlukan untuk menentukan algoritma yang
digunakan untuk melakukan perhitungan, memberikan data yang diperlukan
dalam format yang tepat, dan kemudian menafsirkan hasilnya. Selama musim
panas 1956, berbagai ilmuwan menghadiri lokakarya yang diselenggarakan di
kampus Dartmouth College untuk melakukan sesuatu yang lebih. Mereka
meramalkan bahwa mesin yang dapat alasan seefektif manusia akan
membutuhkan, paling banyak, sebuah generasi yang akan datang
.Merekamasihsalah.Hanya sajakinimemilikikitamenyadari mesin yang dapat
melakukan penalaran matematis dan logis sebagai manusia secara efektif (yang
berarti bahwa komputer harus menguasai setidaknya enam kecerdasan lebih
sebelum mencapai sesuatu bahkan dekat dengan kecerdasan manusia).

Masalah yang dinyatakan di Dartmouth College dan upaya lain pada waktu itu
berkaitan dengan perangkat keras — kemampuan pemrosesan untuk melakukan
penghitungan cukup cepat untuk membuat simulasi. Namun, itu tidak sepenuhnya
masalah keseluruhan. Ya, perangkat keras tidak menjadi gambar dalam gambar,
tetapi Anda tidak dapat mensimulasikan proses yang tidak Anda pahami. Meskipun
demikian, alasan bahwa AI agak efektif saat ini adalah bahwa perangkat keras
akhirnya menjadi cukup kuat untuk mendukung jumlah yang
diperlukanpenghitungan.

Masalah terbesar dengan upaya awal ini (dan masih masalah besar hari ini) adalah
bahwa kita tidak mengerti bagaimana manusia alasan cukup baik untuk
menciptakan sebuah simulasi dari segala macam-mengasumsikan bahwa arah
simulasi bahkan mungkin. Pertimbangkan lagi isu seputar penerbangan berawak
yang dijelaskan sebelumnya dalam bab. The Wright Brothers tidak berhasil dengan
mensimulasikan burung melainkan dengan memahami proses yang digunakan
burung, sehingga menciptakan bidang aerody-namics. Akibatnya, ketika seseorang
mengatakan bahwa inovasi AI besar berikutnya adalah tepat di tikungan dan belum
ada disertasi konkret ada prosesterlibat, inovasi adalah sesuatu tapi tepat di
sekitartendangan penjuru.

BAB KE 1 Memperkenalkan Ai
2
0
Melanjutkan dengan sistem ahli
Sistem ahli pertama kali muncul pada tahun 1970-an dan lagi pada tahun 1980 -an
sebagai upaya untuk mengurangi persyaratan komputasi yang diajukan oleh AI
menggunakan pengetahuan ahli. Sejumlah representasi ahli sistem muncul,
termasuk aturan berbasis (yang menggunakan jika... kemudian pernyataan untuk
keputusan dasar pada aturan praktis), frame berbasis (yang menggunakan
database yang diatur ke dalam hierarki yang terkait generik Informa-tion disebut
frame), dan logika berbasis (yang bergantung pada set teori untuk membangun
rela-tionships). Munculnya sistem ahli adalah penting karena mereka menyajikan
pertama implementasi yang benar berguna dan sukses AI.

Anda masih melihat sistem ahli yang digunakan saat ini (meskipun mereka tidak
disebut lagi). Sebagai contoh, ejaan dan tata bahasa Checker dalam aplikasi Anda
adalah jenis sistem ahli. Pemeriksa tata bahasa, terutama, adalah aturan kuat
berbasis. Ini membayar untuk melihat-lihat untuk melihat tempat lain di mana
sistem ahli masih dapat melihat PRAC-tical digunakan dalam aplikasi sehari-hari.

Sebuah masalah dengan sistem ahli adalah bahwa mereka dapat sulit untuk membuat dan
memelihara. Pengguna awal harus belajar bahasa pemrograman khusus seperti daftar
proses-ing (LisP) atau prolog. Beberapa vendor melihat kesempatan untuk menempatkan
sistem ahli di tangan programmer kurang berpengalaman atau pemula dengan
menggunakan produk seperti VP- expert (Lihat
http://www.CSIS.YSU.edu/~John/824/vpxguide.html dan https://
www.Amazon.com/exec/Obidos/asin/155622057X/datacservip0f -20/ ), yang
bergantung pada pendekatan berbasis aturan. Namun, produk ini umumnya Pro- wajan
fungsionalitas sangat terbatas dalam menggunakan basis pengetahuan bertubuh kecil .

Pada 1990-an, frase sistem ahli mulai menghilang. Gagasan bahwa ahli sys- Tems adalah
kegagalan memang muncul, tetapi kenyataannya adalah bahwa sistem ahli hanya begitu
sukses sehingga mereka menjadi tertanam dalam aplikasi yang mereka dirancang untuk
mendukung. Menggunakan contoh pengolah kata, pada satu waktu Anda perlu membeli
aplikasi pemeriksaan tata bahasa terpisah seperti rightwriter (http://www.Right-
Writer.com/).Namun demikian,katapemroseskinimemilikitata
bahasaCheckersdibangun di karena mereka terbukti sangat berguna (jika tidak selalu
akurat) melihathttps://www.washingtonpost.com/Archive/Opinions/1990/04/29/Hello-
Mr-Chips-pcs-belajar-Inggris/6487ce8a-18df-4bb8-b53f-62840585e49d/untuk rincian).

Mengatasi musim dingin AI


Istilah musim dingin Ai mengacu pada periode pendanaan yang DIKURANGI dalam
pengembangan AI. Secara umum, Ai telah mengikuti jalan di mana pendukung
melebih-lebihkan apa yang pos-Sible, menginduksi orang tanpa pengetahuan
teknologi sama sekali, tapi banyak uang, untuk membuat investasi. Sebuah periode
kritik kemudian mengikuti ketika AI gagal untuk memenuhi expec-otasi, dan

BAB KE 1 Memperkenalkan Ai
2
1
akhirnya, pengurangan pendanaan terjadi. Sejumlah siklus ini telah terjadi selama
bertahun-tahun — semuanya menghancurkan kemajuan sejati .

BAB KE 1 Memperkenalkan Ai
2
2
AI saat ini dalam fase hype baru karena pembelajaran mesin, sebuah teknologi yang
membantu komputer belajar dari data. Memiliki komputer belajar dari data berarti
tidak tergantung pada programmer manusia untuk mengatur operasi (tugas),
melainkan berasal mereka langsung dari contoh yang menunjukkan bagaimana
komputer harus berperilaku. Ini seperti mendidik seorang bayi dengan
menunjukkan cara berperilaku melalui contoh. Pembelajaran mesin memiliki
perangkap karena komputer dapat belajar bagaimana melakukan sesuatu dengan
tidak benar melalui pengajaran ceroboh.

Lima suku ilmuwan bekerja pada algoritma pembelajaran mesin, masing-masing


dari sudut pandang yang berbeda (Lihat bagian "menghindari AI hype", kemudian
dalam bab ini, untuk rincian). Pada saat ini, solusi yang paling sukses adalah
pembelajaran mendalam, yang merupakan teknologi yang berusaha untuk meniru
otak manusia. Pembelajaran yang mendalam dimungkinkan karena tersedianya
komputer yang kuat, algoritma yang lebih cerdas, dataset besar yang dihasilkan
oleh digitalisasi masyarakat kita, dan investasi besar dari bisnis seperti Google,
Facebook, Amazon, dan lain-lain yang mengambil advan-tage dari Renaisans AI ini
untuk bisnis mereka sendiri.

Orang mengatakan bahwa musim dingin AI sudah berakhir karena pembelajaran


yang mendalam, dan itu benar untuk saat ini. Namun, ketika Anda melihat
sekeliling pada cara-cara di mana orang melihat AI, Anda dapat dengan mudah
mengetahui bahwa fase kritik lain pada akhirnya akan terjadi kecuali pendukung
nada retorika turun. AI bisa melakukan hal menakjubkan, tapi mereka semacam
biasa menakjubkan, seperti yang dijelaskan di bagian berikutnya.

Sedang mempertimbangkan AI Uses


Anda menemukan AI digunakan dalam banyak aplikasi besar hari ini. Satu-satunya
masalah adalah bahwa teknologi bekerja dengan baik sehingga Anda tidak tahu
bahwa itu bahkan ada. Bahkan, Anda mungkin akan terkejut menemukan bahwa
banyak perangkat di rumah Anda sudah memanfaatkan AI. Misalnya, beberapa
termostat cerdas secara otomatis membuat jadwal untuk Anda berdasarkan cara
Anda mengontrol suhu secara manual. Demikian pula, input suara yang digunakan
untuk mengontrol beberapa perangkat belajar bagaimana Anda berbicara sehingga
dapat lebih baik berinteraksi dengan Anda. AI pasti muncul di mobil Anda dan
terutama di tempat kerja. Bahkan, penggunaan nomor AI dalam jutaan-semua
aman dari pandangan meskipun mereka cukup dramatis di alam. Berikut adalah
beberapa cara di mana Anda mungkin melihat AI digunakan:

» Penipuan deteksi: Anda mendapatkan panggilan dari perusahaan kartu kredit Anda
menanyakan Apakah Anda membuatpembelian tertentu
.ParaCreditkartuperusahaanBukankahmenjadi
usil;itusekadarmemperingatkankamumelakukanparafaktanyabahwaseseoranglainbisamenja
BAB KE 1 Memperkenalkan Ai
2
3
dimembuatsebuahpembelianmenggunakanAndakartu.ParaAiEmbeddeddalam
waktuparaCreditkartukode perusahaanterdeteksisebuahterbiasapembelanjaanpoladandiberi
peringatanseseorangmelakukanitu.

BAB KE 1 Memperkenalkan Ai
2
4
» Penjadwalan sumber daya : banyak organisasi perlu menjadwalkan
penggunaansumber daya secara efisien.Bagicontoh,sebuahrumah
sakitMeimemilikimelakukanmenentukandimanamelakukanmenempatkansebuahPatientberpusatd
i
atasparapasienkebutuhan,ketersediaannyadariterampilExperts,danparajumlahdariwaktupara
doktormengharapkanparaPatientmelakukanmenjadidalam tahunpararumah sakit.

» Analisis kompleks : manusia sering membutuhkan bantuan dengan analisis yang


kompleks karena secara harfiahada terlalu banyak faktor yang perlu
dipertimbangkan.Bagicontoh,parasama sepertimengaturgejalabisamengindikasikanlebih
banyakdari sekadarsalah satumasalah.Sebuahdoktorataulainnyaahli
mungkinperlumembantumembuatsebuahdiagnosisdalam tahunsebuahtepat
waktumannermelakukanhematsebuahpasienhidup.

» Automation: segala bentuk otomatisasi bisa mendapatkan keuntungan dari penambahan


Ai untuk menangani perubahan yang tidak diharapkan atauacara.Sebuahmasalah dengan
beberapa jenisotomatisasisaat initidakbahwasebuahtak terdugaperistiwa,seperti
itukarenasebuahobjectdalam
tahunparakelirutempat,bisasebenarnyamenyebabkanparaotomatisasimelakukanberhenti.Penamb
ahanAimelakukanparaotomatisasibisaIzinkanparaotomatisasimelakukanhandletak
terdugaacaradanteruskarenakalautidak adaterjadi.

» Layanan pelanggan : lini Layanan pelanggan yang Anda Panggil hari ini bahkan
mungkin tidakmemiliki manusia di belakangnya
.ParaotomatisasitidakbaikcukupmelakukanFollowScriptsdangunakanberbagai sumber
dayamelakukanhandleparasebagian besar daripertanyaan Anda. Dengan infleksi suara
yang baik (disediakan oleh Ai juga ), Anda mungkin bahkan tidak dapat memberi
tahubahwaAnda sedangpembicaraandengansebuahComputer.

» Sistem keselamatan : banyak sistem keselamatan yang ditemukan dalam berbagai


macam mesin saat ini bergantung pada Ai untuk mengambil alih kendaraan di masa
krisis.Bagicontoh, banyakAutomaticpengeremanSystemsbersandardi
atasAimelakukanHentikanparamobilberpusatdi
atassemuaparainputbahwasebuahVehiclebisasediakan,seperti
itukarenaparaarahandarisebuahSkid.

» Efisiensi mesin : Ai dapat membantu mengontrol mesin sedemikian rupa untuk


mendapatkan maksimum
efisiensi.ParaAiControlsparagunakandariResourcesbegitubahwasistemBukankahovershootk
ecepatanataulainnyatujuan.Setiapouncedaridayatidakdigunakanjustrukarenadibutuhkanme
lakukanmenyediakanparainginkanlayanan.

Menghindari Ai hype
Bab ini menyebutkan AI hype cukup banyak. Sayangnya, Bab bahkan tidak menggaruk
permukaan semua hype di luar sana. Jika Anda menonton film seperti dia
(https://www.Amazon.com/exec/Obidos/asin/B00H9HZGQ0/datacservip0f-20/) dan mantan
machina (https://www.Amazon.com/exec/Obidos/asin/B00XI057M0/datac servip0f-20/),
Anda mungkin akan dituntun untuk percaya bahwa Ai lebih jauh dari itu. Masalahnya
adalah bahwa Ai sebenarnya dalam masa pertumbuhan dan segala macam aplikasi seperti

BAB KE 1 Memperkenalkan Ai
2
5
yang ditunjukkan dalam film adalah output kreatif dari imajinasi yang terlalu aktif .

BAB KE 1 Memperkenalkan Ai
2
6
Anda mungkin pernah mendengar sesuatu yang disebut singularitas, yang
bertanggung jawab atas klaim potensial yang disajikan di media dan film. The
singularitas adalah Essen-tially algoritma Master yang mencakup semua lima suku
belajar yang digunakan dalam pembelajaran mesin. Untuk mencapai apa sumber
ini memberitahu Anda, Mesin harus dapat belajar sebagai manusia akan-seperti
yang ditentukan oleh tujuh jenis Intel-ligence dibahas dalam "cerdas kecerdasan"
bagian, di awal bab. Berikut adalah lima suku belajar:

» Simbologi: asal-usul suku ini adalah dalam logik dan falsafah.Inikelompokbergantungdi


atasInversepenguranganmelakukanselesaikanmasalah.

» Connectionists: asal suku ini adalah di Neuroscience dan kelompok bergantung pada
backpropagation untuk memecahkan masalah.

» Evolusionis: suku evolusionis berasal dari evolusi biologi, dengan mengandalkan


pemrograman genetik untuk memecahkan masalah.

» Bayesians: asal suku ini adalah dalam Statistik dan bergantung pada probabilistik infer- ence
untuk memecahkan masalah.

» Analogizers: asal-usul suku ini dalam psikologi.Parakelompokbergantungdi


ataskernelmesinmelakukanselesaikanmasalah.

Tujuan utama dari pembelajaran mesin adalah untuk menggabungkan teknologi dan
strate-Gies dianut oleh lima suku untuk membuat algoritma tunggal ( Master algoritma)
yang dapat belajar apa-apa. Tentu saja, mencapai tujuan itu adalah jauh. Meskipun
demikian, para ilmuwan seperti Pedro Domingos
(http://Homes.cs.Washington.edu/~pedrod/) sedang bekerja menuju tujuan itu .

Untuk membuat hal yang bahkan kurang jelas, kelima suku mungkin tidak dapat
memberikan informasi yang
cukupmelakukansebenarnyaselesaikanparaproblemdarimanusiakecerdasan,b
egitumembuatMas-ter algoritma untuk semua lima suku mungkin masih tidak
menghasilkan singularitas. Pada titik ini, Anda harus kagum pada berapa
banyak orang tidak tahu tentang bagaimana mereka Pikirkan atau mengapa
mereka berpikir dengan cara tertentu .Setiaprumorkamudengartentang
caraAimengambilatas dunia atau menjadi lebih unggul daripada orang yang
hanya polosfalse.

Menyambungkan AI ke komputer dasar


Untuk melihat Ai di kantor, Anda perlu memiliki semacam sistem komputasi ,
sebuah aplikasi yang berisi perangkat lunak yang diperlukan, dan basis
pengetahuan. Sistem komputasi bisa apa saja dengan chip di dalamnya; Faktanya,
sebuah smartphone tidak sama baiknya dengan sebuah komputer desktop untuk
beberapa aplikasi. Tentu saja, jika Anda Amazon dan Anda ingin memberikan
BAB KE 1 Memperkenalkan Ai
2
7
nasihat pada keputusan pembelian berikutnya orang tertentu, ponsel pintar tidak
akan melakukan - Anda perlu yang sangat
besarkomputasisistemnyabagibahwaaplikasi.

BAB KE 1 Memperkenalkan Ai
2
8
Ukuran sistem komputasi berbanding lurus dengan jumlah pekerjaan yang Anda
harapkan untuk dilakukan AI.

Aplikasi ini juga dapat bervariasi dalam ukuran, kompleksitas, dan bahkan lokasi.
Misalnya, jika Anda adalah bisnis dan ingin menganalisis data klien untuk
menentukan cara terbaik untuk membuat penjualan Anda dapat mengandalkan
aplikasi berbasis server untuk melakukan tugas. Di sisi lain, jika Anda seorang
pelanggan dan ingin mencari produk di Amazon untuk pergi dengan item
pembelian Anda saat ini, aplikasi ini bahkan tidak berada di komputer Anda; Anda
mengaksesnya melalui aplikasi berbasis web yang terletak di server Amazon.

Basis pengetahuan bervariasi di lokasi dan ukuran juga. Semakin kompleks data,
semakin Anda dapat memperoleh dari itu, tetapi semakin Anda perlu untuk
memanipulasi juga. Anda tidak mendapatkan makan siang gratis ketika datang ke
manajemen pengetahuan. Interaksi antara lokasi dan waktu juga penting. Sebuah
koneksi jaringan affords Anda akses ke basis pengetahuan yang besar secara online
tetapi biaya Anda dalam waktu karena latensi koneksi jaringan. Namun, database
lokal, sementara cepat, cenderung kurangnya rincian dalam banyak kasus.

BAB KE 1 Memperkenalkan Ai
2
9
DALAM BAB INI

Bab ke- 2
Menentukan peran data

T
di sini adalah sesuatu yang baru tentang data. Setiap aplikasi menarik yang
pernah ditulis untuk komputer memiliki data yang terkait dengannya. Data
datang dalam berbagai bentuk-beberapa terorganisir, beberapa tidak. Apa
yang telah berubah adalah jumlah data. Beberapa
orang merasa hampir menakutkan bahwa kita sekarang memiliki akses ke begitu
banyak data yang detail hampir setiap aspek kehidupan sebagian besar orang,
kadang ke tingkat yang bahkan orang tidak menyadari.Dalam tahunSelain
itu,paragunakandarimajuperangkat kerasdanmeningkatkan-mentsdalam
tahunalgoritmemembuatdataparaUniversalResourcebagiAihari ini.

Untuk bekerja dengan data, Anda harus terlebih dahulu mendapatkannya. Hari ini,
aplikasi mengumpulkan data secara manual, seperti yang dilakukan di masa lalu,
dan juga secara otomatis, menggunakan metode baru. Namun, ini bukan masalah
hanya satu sampai dua teknik pengumpulan data; metode pengumpulan
berlangsung pada kontinum dari sepenuhnya manual untuk sepenuhnya otomatis.

Data mentah biasanya tidak bekerja dengan baik untuk tujuan analisis. Bab ini juga
membantu Anda memahami perlunya memanipulasi dan membentuk data
sehingga memenuhi persyaratan khusus. Anda juga menemukan kebutuhan untuk
menentukan nilai kebenaran data untuk memastikan bahwa hasil analisis sesuai
dengan tujuan yang ditetapkan untuk aplikasi di tempat pertama.

Menariknya, Anda juga memiliki batas akuisisi data untuk menangani. Tidak ada
teknologi yang ada saat ini untuk meraih pikiran dari pikiran seseorang melalui
sarana telepati. Tentu saja, batas lain ada, juga-sebagian besar yang Anda mungkin
sudah tahu tentang tetapi mungkin tidak dipertimbangkan.

Bab 2 Mendefinisikan Tje Peran dari Data 21


Menemukan data Ubiquitous di usia ini
Lebih dari kata kunci yang digunakan oleh vendor untuk mengusulkan cara-cara
baru untuk menyimpan data dan menganalisis itu, revolusi data besar adalah
realitas sehari-hari dan kekuatan pendorong zaman kita. Anda mungkin telah
mendengar data besar yang disebutkan dalam banyak publikasi ilmiah dan bisnis
khusus dan bahkan bertanya-tanya apa istilah sebenarnya berarti. Dari perspektif
teknis, data besar mengacu pada jumlah besar dan kompleks data komputer, begitu
besar dan rumit bahwa aplikasi tidak dapat menangani dengan data dengan
menggunakan penyimpanan tambahan atau meningkatkan daya komputer.

Data besar menyiratkan sebuah revolusi dalam penyimpanan data dan manipulasi.
Ini mempengaruhi apa yang dapat Anda capai dengan data dalam istilah yang lebih
kualitatif (Selain melakukan lebih banyak, Anda dapat melakukan tugas yang lebih
baik). Komputer menyimpan data besar dalam format yang berbeda dari perspektif
manusia, tetapi komputer melihat data sebagai aliran yang dan nol (inti bahasa
komputer).Kamubisapemandangandatakarenamenjadisalah
satudariduatypes,bergantung-ing pada bagaimana Anda memproduksi dan
mengkonsumsi. Beberapa data memiliki struktur yang jelas (Anda tahu persis apa
yang dikandungnya dan di mana untuk menemukan setiap bagian dari data),
sedangkan data lainnya tidak terstruktur (Anda memiliki gagasan tentang apa yang
dikandungnya, tetapi Anda tidak tahu persis bagaimana itu diatur).

Contoh khas data terstruktur adalah tabel database, di mana informasi diatur ke
kolom dan setiap kolom berisi jenis informasi tertentu. Data sering disusun
berdasarkan desain. Anda mengumpulkannya secara selektif dan merekamnya di
tempat yang rekamnya. Misalnya, Anda mungkin ingin menempatkan jumlah orang
yang membeli produk tertentu di kolom tertentu, dalam tabel tertentu, di basis data
tertentu. Seperti Perpustakaan, jika Anda tahu apa data yang Anda butuhkan, Anda
dapat menemukannya segera.

Data yang tidak terstruktur terdiri dari gambar, video, dan rekaman suara. Anda
dapat menggunakan formulir yang tidak terstruktur untuk teks sehingga Anda
dapat menandai dengan karakteristik, seperti ukuran, tanggal, atau jenis konten.
Biasanya Anda tidak tahu persis di mana data muncul dalam dataset tidak
terstruktur karena data muncul sebagai urutan yang dan nol bahwa aplikasi harus
menafsirkan atau memvisualisasikan.

Mentransformasikan data yang tidak terstruktur ke dalam bentuk terstruktur


dapat menghabiskan banyak waktu dan usaha dan dapat melibatkan pekerjaan
banyak orang. Sebagian besar data dari revolusi data besar tidak terstruktur dan
disimpan seperti itu, kecuali jika seseorang menulisnya terstruktur.

Penyimpanan data yang berlebihan dan canggih ini tidak muncul mendadak dalam
semalam. Butuh waktu untuk mengembangkan teknologi untuk menyimpan
jumlah data. Selain itu, butuh waktu untuk menyebarkan teknologi yang
Bab 2 Mendefinisikan Tje Peran dari Data 22
menghasilkan dan memberikan data, yaitu com-puters, sensor, ponsel pintar,
internet, dan World Wide Web ser-vices. Bagian berikut ini membantu Anda
memahami apa yang membuat data menjadi sumber daya Universal hari ini.

Bab 2 Mendefinisikan Tje Peran dari Data 23


Memahami implikasi Moore
Pada 1965, Gordon Moore, salah satu pendiri Intel dan Fairchild Semiconductor, menulis
dalam sebuah artikel berjudul "menjejalkan komponen lebih ke sirkuit terpadu"
(http://IEEEXplore.IEEE.org/Document/4785860/) bahwa jumlahponents ditemukan di
sirkuit terpadu akan ganda setiap tahun untuk dekade berikutnya. Pada saat itu, transistor
didominasi elektronik. Mampu hal lebih transis- Tors ke sirkuit terpadu (IC) berarti
mampu membuat perangkat elektronik lebih mampu dan berguna. Proses ini disebut
integrasi dan menyiratkan proses yang kuat dari miniaturisasi elektronik (membuat
sirkuit yang sama jauh lebih kecil). Komputer hari ini tidak semua yang jauh lebih kecil
daripada komputer dari satu dekade yang lalu, namun mereka tegas lebih kuat. Hal yang
sama berlaku untuk ponsel. Meskipun ukurannya sama dengan pendahulunya, mereka
menjadi mampu untuk setiap bentuk tugas.

Apa Moore menyatakan dalam artikel yang sebenarnya telah benar selama bertahun-
tahun. Industri semikonduktor menyebutnya hukum Moore (Lihat
http://www.mooreslaw.org/ untuk rincian). Dua kali lipat memang terjadi selama
sepuluh tahun pertama, seperti yang diperkirakan. Pada 1975, Moore mengoreksi
pernyataannya, meramalkan penggandaan setiap dua tahun. Gambar 2-1 menunjukkan
efek dari dua kali lipat ini. Tingkat dua kali lipat ini masih berlaku, meskipun sekarang
pendapat umum bahwa itu tidak akan tahan lebih lama dari akhir dekade ini (sampai
sekitar 2020). Mulai tahun 2012, ketidakcocokan mulai terjadi antara peningkatan
kecepatan yang diharapkan dan perusahaan semikonduktor apa yang dapat dicapai
sehubungan dengan miniaturisasi.

GAMBAR 2-1:
Memasukkan lebih
dan lebih transistor
ke CPU.

Bab 2 Mendefinisikan Tje Peran dari Data 24


Hambatan fisik ada untuk mengintegrasikan lebih sirkuit pada IC menggunakan komponen
silika saat ini karena Anda dapat membuat hal yang hanya begitu kecil. Namun Innova
berlanjut, seperti yang diuraikan http://www.nature.com/news/the-chips-are- down-
untuk-Moores-Law-1,19338. Di masa depan, Hukum Moore mungkin tidak berlaku
karena industri akan beralih ke teknologi baru (seperti membuat komponen dengan
menggunakan laser optik bukan transistor; Lihat artikel di http://www.
extremetech.com/extreme/187746-by-2020-you-could-have-an-exascale- kecepatan-of-
Light-Optical-computeron-meja Anda untuk rincian tentang optik menempatkan). Yang
penting adalah bahwa sejak 1965, penggandaan komponen setiap dua tahun telah
mengantarkan kemajuan besar dalam elektronik digital yang telah memiliki konsekuensi
yang menjangkau jauh dalam akuisisi, Penyimpanan, manipulasi, dan pria dari Data.

Hukum Moore memiliki efek langsung pada


data.IabermuladenganSmarterperangkat.Paracerdas perangkat, semakin difusi
(seperti yang dibuktikan oleh elektronik berada di mana-mana hari ini). Semakin
besar difusi, semakin rendah harganya, menciptakan lingkaran tak berujung yang
mendorong penggunaan mesin komputasi yang kuat dan sensor kecil di mana-
mana.DenganbesarjumlahdariComputeringatantersediadanlebih
besarpenyimpanan
diskbagidata,parakonsekuensitidaksebuahekspansidaridataketersediaan,seperti
itukarenasitus web, catatan transaksi, pengukuran, gambar digital, dan jenis lain
daridata.

Menggunakan data di mana saja


Para ilmuwan membutuhkan komputer yang lebih kuat daripada orang rata karena
eksperimen ilmiah mereka. Mereka mulai berurusan dengan jumlah data yang
mengesankan tahun sebelum orang menciptakan istilah data besar. Pada titik ini,
internet tidak menghasilkan sejumlah besar data yang dilakukannya hari
ini.IngatlahbahwabesardataBukankahsebuahmodedibuat oleh vendor perangkat
lunak dan perangkat keras tetapi memiliki dasar di banyak bidang ilmiah,
sepertiastronomi (ruang misi),satelitpengawasan dan Monitoring),
Meteorology,Physics (akselerator partikel) dan Genomics (urutan DNA ).

Meskipun aplikasi Ai dapat mengkhususkan pada bidang ilmiah, seperti IBM Watson, yang
menawarkan kemampuan diagnosis medis yang mengesankan karena dapat
mempelajari infor-mation dari jutaan makalah ilmiah tentang penyakit dan obat-
obatan, driver aplikasi Ai yang sebenarnya sering memiliki aspek yang lebih duniawi
.AktualAiaplikasitidaksebagian besardihargai karena mampu mengenali objek,
bergerak sepanjang jalur, atau memahami apa yang orangmengatakan
bahwadanmelakukanmereka.DatakontribusimelakukanparaaktualAiRenaisansba
hwaMoldeddalam mode seperti itu tidak datang dari sumber klasik ilmiahdata.

Internet sekarang menghasilkan dan mendistribusikan data baru dalam jumlah


besar. Produksi data harian kami-sewa diperkirakan berjumlah sekitar 2,5 triliun

Bab 2 Mendefinisikan Tje Peran dari Data 25


(a num-ber dengan 18 nol) byte, dengan bagian singa pergi ke data tidak
terstruktur seperti video dan audio. Semua data ini terkait dengan aktivitas
manusia umum, perasaan, pengalaman, dan hubungan. Roaming melalui data ini,
AI dapat dengan mudah mempelajari bagaimana

Bab 2 Mendefinisikan Tje Peran dari Data 26


penalaran dan bertindak lebih manusiawi-seperti karya. Berikut adalah beberapa contoh
data yang lebih menarik Anda dapat menemukan:

» Repositori besar wajah dan ekspresi dari foto dan video yang diposting di situs web media
sosial seperti Facebook, YouTube, dan Google memberikan Informa- tion tentang jenis kelamin,
usia, perasaan, dan mungkin seksual preferensi, orientasi politik, atau IQ (Lihat
https://www.theguardian.com/Technology/2017/ Sep/12/Artificial-Intelligence-Face-
Recognition-Michal-kosinski).

» Informasi medis yang diadakan secara pribadi dan data biometrik dari jam tangan pintar,
yang mengukur data
tubuhkarenaTemperaturedanhatitingkatselamakeduasakitdanbaikkesehatan.
» Dataset tentang bagaimana orang berhubungan satu sama lain dan apa yang mendorong minat
mereka dari sumber seperti media sosial dan mesin
pencari.Bagiinstance,sebuahpenelaahandariCambridgeUniversity'sPsikometrikPusatmengakuba
hwaFacebook
interaksi mengandung banyak data tentang hubungan intim (Lihat https://
www.theguardian.com/Technology/2015/Jan/13/your-computer-Knows-You- peneliti-
Cambridge-Stanford-University).

» Informasi tentang cara kami berbicara direkam oleh ponsel


.Bagiinstance,OKGoogle,sebuahfungsinyaditemukandi atasAndroidHandphonetelepon,
secara rutinRecords
pertanyaan dan kadang bahkan lebih: https://QZ.com/526545/Googles- telah-diam-
rekaman-Anda-suara-Heres-bagaimana-untuk-mendengarkan-untuk-dan-
menghapus-Arsip/.

Setiap hari, pengguna menghubungkan lebih banyak perangkat ke internet yang mulai
menyimpan data pribadi baru. Sekarang ada asisten pribadi yang duduk di rumah, seperti
Amazon Echo dan perangkat rumah pintar terintegrasi lainnya yang menawarkan cara
untuk mengatur dan memfasilitasi lingkungan domestik. Ini hanya puncak gunung es
karena banyak alat umum lainnya kehidupan sehari-hari menjadi saling berhubungan
(dari lemari es ke sikat gigi) dan mampu mengolah, merekam, dan mengirimkan data.
Internet of Things (IoT) menjadi kenyataan. Para ahli memperkirakan bahwa dengan
2020, enam kali lebih banyak hal yang terhubung akan ada karena akan ada orang, tetapi
tim penelitian dan berpikir tank sudah meninjau kembali angka-angka
(http://www.Gartner.com/Newsroom/id/3165317).

Menempatkan algoritma ke dalam tindakan


Umat manusia sekarang di persimpangan yang luar biasa dari volume yang belum
pernah terjadi sebelumnya data, yang dihasilkan oleh semakin kecil dan kuat
hardware. Data juga semakin diproses dan dianalisis oleh komputer yang sama yang
proses membantu menyebar dan berkembang. Pernyataan ini mungkin tampak
jelas, tetapi data telah menjadi begitu di mana-mana nilainya tidak lagi berada
hanya dalam informasi berisi (seperti kasus data yang disimpan dalam database
perusahaan yang memungkinkan operasi sehari-hari), tetapi
Bab 2 Mendefinisikan Tje Peran dari Data 27
Sebaliknya dalam penggunaannya sebagai sarana untuk menciptakan nilai
baru;seperti itudatatidakdijelaskankarenapara"minyak baru." Nilai baru ini
sebagian besar ada dalam cara aplikasi manicure, Store, dan mengambil data, dan
bagaimana Anda benar menggunakannya dengan cara Smart algoritma.

Algoritma dan AI mengubah permainan data. Seperti disebutkan dalam bab


sebelumnya, algoritma AI telah mencoba pendekatan yang berbeda di sepanjang
jalan, melewati dari algoritma sederhana untuk penalaran simbolis berdasarkan
logika dan kemudian untuk ahli sys-Tems. Dalam beberapa tahun terakhir, mereka
menjadi jaringan saraf dan, dalam bentuk yang paling matang, pembelajaran
mendalam. Sebagai bagian metodologi ini terjadi, data berubah dari menjadi
informasi yang diproses oleh algoritma yang telah ditentukan untuk menjadi apa
yang dibentuk algoritma menjadi sesuatu yang berguna untuk tugas. Data berbalik
dari hanya menjadi bahan baku yang memicu solusi untuk tukang dari solusi itu
sendiri, seperti yang ditunjukkan pada gambar 2-2.

GAMBAR 2-2:
Dengan solusi Ai
saat ini , lebih
banyak data setara
dengan lebih
banyak kecerdasan.

Dengan demikian, foto dari beberapa anak kucing Anda telah menjadi semakin
berguna bukan hanya karena nilai afektif- menggambarkan kucingkecil yang lucu Anda
— tetapikarena bisamenjadi bagian daripembelajaranproses Aimenemukanlebih
umumcon-cepts, sepertikarenaapa karakteristik
menunjukkansebuahkucing,ataumemahami apa yangmendefinisikanimut.

Pada skala yang lebih besar, perusahaan seperti Google feed algoritma dari data
yang tersedia secara bebas, seperti isi dari situs web atau teks yang ditemukan
dalam teks yang tersedia secara umum dan buku. Software Spider Google merayapi
web, melompat dari situs web ke situs web, mengambil halaman web dengan
konten teks dan gambar mereka. Bahkan jika Google memberikan kembali bagian
dari data ke pengguna sebagai hasil pencarian, itu ekstrak jenis informasi lain dari
data menggunakan algoritma AI, yang belajar dari itu bagaimana untuk mencapai
tujuan lain.

Bab 2 Mendefinisikan Tje Peran dari Data 28


Algoritme yang memproses kata dapat membantu Google AI sistem memahami dan
melakukan antici-pate kebutuhan Anda bahkan ketika Anda tidak mengutarakan
mereka dalam satu set kata kunci tetapi di polos, bahasa alami tidak jelas , bahasa
yang kita berbicara setiap hari ( dan ya,

Bab 2 Mendefinisikan Tje Peran dari Data 29


bahasa sehari-hari seringkali tidak jelas). Kalausaat ini Anda mencoba untuk mengajukan
pertanyaan, bukan hanya rantai kata kunci, ke mesin pencari Google, Anda akan melihat
bahwa ia cenderung untuk menjawab dengan benar. Sejak 2012, dengan diperkenalkannya
Hummingbird update (http://SearchEngineLand.com/Google-Hummingbird-172816), Google
menjadi lebih mampu memahami sinonim dan konsep, sesuatu yang melampaui data awal
yang diperoleh, dan ini adalah hasil dari proses AI. Algoritma yang lebih maju ada di
Google, bernama RankBrain, yang belajar langsung dari jutaan pertanyaan setiap hari dan
dapat menjawab pertanyaan pencarian ambigu atau tidak jelas, bahkan dinyatakan dalam
istilah Gaul atau sehari-hari atau hanya dikuasai dengan kesalahan. Rank- Brain tidak
melayani semua query, tapi belajar dari data bagaimana jawaban yang lebih baik query. Ini
sudah menangani 15 persen dari permintaan mesin, dan di masa depan, persentase ini bisa
menjadi 100 persen.

Menggunakan data dengan sukses


Memiliki banyak data yang tersedia tidak cukup untuk membuat AI yang sukses.
Saat ini, algoritme AI tidak dapat mengekstrak informasi secara langsung dari data
mentah. Kebanyakan algoritma bergantung pada koleksi eksternal dan manipulasi
sebelum analisis. Ketika sebuah algoritma mengumpulkan informasi yang berguna,
itu mungkin tidak mewakili informasi yang tepat. Bagian fol membantu Anda
memahami bagaimana untuk mengumpulkan, memanipulasi, dan
mengotomatisasi pengumpulan data dari perspektif Ikhtisar.

Mengingat sumber data


Data yang Anda gunakan berasal dari sejumlah sumber. Sumber data yang paling
umum adalah dari informasi yang dimasukkan oleh manusia di beberapa
titik.Bahkansaatsebuahsistemnyamengumpulkan data belanja-situs secara
otomatis, manusia awalnya masukkan informasi. Manusia mengklik berbagai item,
menambahkannya ke keranjang belanja, menentukan karakteristik (seperti
ukuran) dan kuantitas, dan kemudian Check Out. Kemudian, setelah penjualan,
manusia memberikan pengalaman belanja , produk, dan metode pengiriman rating
dan membuatkomentar. Singkatnya, setiap pengalaman belanja juga menjadi
latihan pengumpulan data .

Banyak sumber data saat ini bergantung pada masukan yang dikumpulkan dari
sumber manusia. Manusia juga memberikan masukan manual. Anda menelepon
atau pergi ke kantor di suatu tempat untuk membuat janji dengan seorang
profesional. Seorang resepsionis kemudian mengumpulkan informasi dari Anda
yang diperlukan untuk pengangkatan. Data yang dikumpulkan secara manual ini
akhirnya berakhir di dataset di suatu tempat untuk tujuan analisis.

Data juga dikumpulkan dari sensor, dan sensor ini dapat mengambil hampir semua

Bab 2 Mendefinisikan Tje Peran dari Data 30


bentuk. Misalnya, banyak organisasi mendasarkan pengumpulan data fisik, seperti
num-ber dari orang yang melihat objek di jendela, pada deteksi ponsel. Facial
recog-Software konten berpotensi mendeteksi pelanggan berulang.

Bab 2 Mendefinisikan Tje Peran dari Data 31


Namun, sensor dapat membuat dataset dari hampir semua hal. Layanan cuaca
bergantung pada dataset yang dibuat oleh sensor yang memantau kondisi
lingkungan seperti hujan, suhu, kelembaban, Tutupan awan , dan sebagainya
.RobotikMonitoringbantuan sistemmengoreksikecilkekurangandalam
tahunrobotikoperasinyadengansenantiasamenganalisadatadikumpulkan dengan
memonitor sensor. Sebuah sensor, dikombinasikan dengan aplikasi AI kecil, bisa
memberitahu Anda ketika makan malam Anda dimasak untuk kesempurnaan
malam ini.Parasensormengumpulkandata,tetapiaplikasi Ai menggunakan aturan
untuk membantu menentukan kapan makanandimasak.

Mendapatkan data yang andal


Kata handal tampaknya begitu mudah untuk menentukan, namun begitu sulit
untuk menerapkan. Sesuatu yang dapat diandalkan ketika hasil yang dihasilkan
baik yang diharapkan dan konsisten. Sumber data yang handal menghasilkan data
biasa yang tidak mengandung kejutan; tidak ada yang terkejut setidaknya oleh
hasil. Tergantung pada perspektif Anda, itu sebenarnya bisa menjadi hal yang baik
bahwa kebanyakan orang tidak menguap dan kemudian jatuh tertidur saat review-
ing data. Kejutan membuat data bernilai menganalisis dan meninjau. Conse-
quently, data memiliki aspek dualitas.Kitainginkanandal,duniawi,sepenuhnyadata
yang diantisipasi yang hanya menegaskan apa yang kita sudah tahu, tapi yang tak
terduga adalah apa yang membuatmengumpulkanparadatabergunadalam
tahunparapertama kalitempatnya.

Namun, Anda tidak ingin data yang begitu jauh dari biasa bahwa itu menjadi
hampir menakutkan untuk
ditinjau.Neracakebutuhanmelakukanmenjadidipeliharasaatmendapatkandata.
Datamestimuatdalam waktubeberapabatasan(seperti yang dijelaskan dalam
"manikur data" SEC-tion, kemudian dalam bab ini
).IamestijugatemuispesifikcriteriakarenamelakukanTruthnilainya(sebagaiman
a diuraikan dalam bagian "menimbang lima Mistruths dalam data", kemudian
dalam bab
ini).Paradatamestijugadatangatdiharapkaninterval,dansemuaparaladangdaric
atatan data yang masuk haruslengkap.

Hingga batas tertentu, keamanan data juga memengaruhi keandalan data.


Konsistensi data datang dalam beberapa
bentuk.Saatparadatatiba,kamubisamemastikan bahwabahwaiajatuhdalam
wakturentang yang diharapkan dan muncul dalam bentuk tertentu. Namun, setelah
Anda menyimpan data, keandalan dapat mengurangi kecuali Anda memastikan
bahwa data tetap dalam bentuk yang diharapkan. Sebuah entitas mengutak-atik
data mempengaruhi keandalan, membuat data tersangka dan berpotensi tidak
dapat digunakan untuk analisis nanti. Memastikan kehandalan data berarti bahwa
setelah data tiba, tidak ada yang merusak dengan itu untuk membuatnya cocok
dalam domain yang diharapkan (sehingga duniawi sebagai hasilnya).

Bab 2 Mendefinisikan Tje Peran dari Data 32


Membuat masukan manusia lebih dapat
diandalkan
Manusia membuat kesalahan — itu bagian dari menjadi manusia. Bahkan,
mengharapkan bahwa manusia tidak akan membuat kesalahan adalah tidak masuk
akal. Namun, banyak desain aplikasi

Bab 2 Mendefinisikan Tje Peran dari Data 33


berasumsi bahwa manusia entah bagaimana tidak akan membuat kesalahan
apapun. Desain mengharapkan bahwa setiap orang akan hanya mengikuti aturan.
Sayangnya, sebagian besar-ity pengguna dijamin bahkan tidak membaca aturan
karena sebagian besar manusia juga malas atau terlalu ditekan untuk waktu ketika
datang untuk melakukan sesuatu yang tidak sangat membantu mereka secara
langsung.

Pertimbangkan masuknya suatu negara ke dalam


bentuk.Kalaukamumenyediakanhanya
sajasebuahtekslapangan,sebagianpengguna mungkin memasukkan seluruh nama
negara, seperti Kansas. Tentu saja, beberapa pengguna akan membuat kesalahan
ketik atau kapitalisasi dan muncul dengan Kansus atau kANSAS. Menetapkan
kesalahan ini, orang dan organisasi memiliki berbagai pendekatan untuk
melakukan tugas. Seseorang di industri penerbitan mungkin menggunakan
panduan gaya Associated Press (AP) dan masukan kan. seseorang yang lebih tua
dan terbiasa dengan pedoman kantor Percetakan pemerintah (GPO) mungkin
masukan kans. sebagai gantinya. Singkatan lainnya digunakan juga. Kantor pos A.S.
(USPS) menggunakan KS, tetapi U.S. Coast Guard menggunakan KA. Sementara itu,
formulir organisasi standar internasional (ISO) berjalan dengan US-KS. Pikiran
Anda, ini hanya sebuah entri negara, yang cukup sederhana-atau sehingga Anda
berpikir sebelum membaca bagian ini. Jelas, karena negara tidak akan mengubah
nama dalam waktu dekat, Anda hanya bisa menyediakan drop-down kotak Daftar
pada formulir untuk memilih negara dalam format yang diperlukan, sehingga
menghilangkan berbeda-ences dalam singkatan menggunakan, typos, dan
kesalahan kapitalisasi dalam satu kejadian .

Kotak daftar drop-down bekerja dengan baik untuk array yang menakjubkan dari
input data, dan menggunakan mereka memastikan bahwa input manusia ke dalam
bidang tersebut menjadi sangat handal karena manusia tidak memiliki pilihan
selain menggunakan salah satu entri default. Tentu saja, manusia dapat selalu
memilih entri yang salah, yang mana cek ganda datang ke dalam bermain. Beberapa
aplikasi yang lebih baru membandingkan kode pos ke entri kota dan negara untuk
melihat apakah mereka cocok. Ketika mereka tidak cocok, pengguna akan diminta
lagi untuk memberikan masukan yang benar. Ini Double-Check verges menjadi
menjengkelkan (Lihat "lebih menjengkelkan daripada berguna input AIDS" sidebar
untuk rincian), tetapi pengguna tidak mungkin untuk melihatnya sangat sering, jadi
seharusnya tidak menjadi terlalu menjengkelkan.

Bahkan dengan Cross-cek dan statis entri, manusia masih memiliki banyak ruang
untuk membuat kesalahan. Misalnya, memasukkan angka dapat bermasalah.
Ketika pengguna perlu memasukkan 2,00, Anda mungkin melihat 2, atau 2,0, atau
2., atau salah satu dari berbagai entri lainnya. Untungnya, parsing entri dan
reformatting itu akan memperbaiki masalah, dan Anda dapat melakukan tugas ini
secara otomatis, tanpa bantuan pengguna .

Sayangnya, pemformatan ulang tidak akan mengoreksi masukan numerik yang

Bab 2 Mendefinisikan Tje Peran dari Data 34


tidak menan. Anda dapat par-tially mengurangi kesalahan tersebut dengan
memasukkan rentang cek. Pelanggan tidak dapat membeli – 5 batang sabun. Cara
yang sah untuk menunjukkan pelanggan kembali Bar sabun adalah untuk
memproses kembali, bukan penjualan. Namun, pengguna mungkin hanya
membuat kesalahan, dan Anda dapat memberikan pesan yang menyatakan rentang
input yang tepat untuk nilai.

Bab 2 Mendefinisikan Tje Peran dari Data 35


Menggunakan pengumpulan data otomatis
Beberapa orang berpikir bahwa pengumpulan data otomatis memecahkan semua
masalah input manusia yang terkait dengan dataset. Bahkan, pengumpulan data
otomatis tidak memberikan sejumlah manfaat:

» Konsistensi yang lebih baik


» Meningkatkan keandalan
» Probabilitas rendah data yang hilang
» Peningkatan akurasi
» Mengurangi varians untuk hal-hal seperti input berjangka waktu
Sayangnya, untuk mengatakan bahwa pengumpulan data otomatis memecahkan
setiap masalah hanya salah. Pengumpulan data otomatis masih bergantung pada
sensor, aplikasi, dan perangkat keras com-puter yang dirancang oleh manusia yang
menyediakan akses hanya untuk data yang manusia memutuskan untuk
memungkinkan. Karena batas bahwa manusia menempatkan pada charac-
canegara pengumpulan data otomatis, hasilnya sering memberikan informasi yang
kurang bermanfaat daripada yang diharapkan oleh para desainer. Akibatnya,
otomatis data Col-lection dalam keadaan konstan fluks sebagai desainer mencoba
untuk memecahkan masalah input.

Pengumpulan data otomatis juga menderita kesalahan perangkat lunak dan


perangkat keras hadir dalam sistem komputasi, tetapi dengan potensi yang lebih
tinggi untuk masalah lembut (yang muncul ketika sistem tampaknya bekerja tetapi
tidak memberikan hasil yang diinginkan ) daripada jenis lain dari setup berbasis
komputer. Ketika sistem bekerja, yang reliabil-ity dari input jauh melebihi
kemampuan manusia. Namun, ketika terjadi masalah lembut, sistem sering gagal
untuk mengenali bahwa ada masalah, sebagai manusia mungkin, dan oleh karena
itu dataset bisa berakhir mengandung lebih biasa atau bahkan data yang buruk .

Manikur data
Beberapa orang menggunakan istilah manipulasi ketika berbicara tentang data,
memberikan kesan bahwa data entah bagaimana berubah dalam cara yang tidak
bermoral atau licik. Mungkin istilah yang lebih baik akan manikur, yang membuat
data yang dibentuk dengan baik dan indah.Tidak adamasalahapa
yangistilahkamudigunakan,Namun demikian,Rawdatajarangmemenuhi
persyaratan untuk pengolahan dan analisis. Untuk mendapatkan sesuatu dari data,
Anda harus manikur itu untuk memenuhi kebutuhan tertentu. Bagian berikut
membahas kebutuhan manikur data .

Bab 2 Mendefinisikan Tje Peran dari Data 36


Berurusan dengan data yang hilang
Untuk menjawab pertanyaan yang diberikan dengan benar, Anda harus memiliki
semua fakta. Anda bisa menebak jawaban untuk pertanyaan tanpa semua fakta,
tapi kemudian jawabannya adalah sama mungkin menjadi salah sebagai benar.
Seringkali, seseorang yang membuat keputusan, pada dasarnya menjawab-ing
pertanyaan, tanpa semua fakta dikatakan untuk melompat ke sebuah kesimpulan.
Ketika menganalisis data, Anda mungkin telah melompat ke lebih kesimpulan
daripada yang Anda pikirkan karena data yang hilang .SebuahdataRekam,salah
satumasukdalam tahunsebuahdataset(yang merupakan semua data),terdiri
dariladangyang berisi fakta yang digunakan untuk menjawab pertanyaan. Setiap
bidang berisi satu jenis data yang membahas satu fakta. Jika bidang tersebut
kosong, Anda tidak memiliki data yang diperlukan untuk menjawab pertanyaan
menggunakan catatan data tertentu tersebut .

Sebagai bagian dari proses berurusan dengan data yang hilang, Anda harus tahu
bahwa data hilang. Mengidentifikasi bahwa dataset Anda hilang informasi
sebenarnya bisa sangat sulit karena mengharuskan Anda untuk melihat data pada
tingkat rendah-sesuatu yang kebanyakan orang tidak siap untuk melakukan dan
memakan waktu bahkan jika Anda memiliki keterampilan yang diperlukan.
Seringkali, petunjuk pertama Anda bahwa data hilang adalah jawaban yang masuk
akal bahwa pertanyaan Anda dapatkan dari algoritma dan dataset terkait. Ketika
algoritma yang tepat untuk menggunakan, dataset harus pada kesalahan.

Masalah dapat terjadi ketika proses pengumpulan data tidak mencakup semua data
yang diperlukan untuk menjawab pertanyaan tertentu .KadangAnda sedanglebih
baikmatimelakukansebenarnyaJatuhkanfaktanyaagakdari
sekadargunakansebuahjauhrusakfakta.Kalaukamumenemukanbahwasebuahkhus
uslapangan disebuahdatasettidakhilang90percentataulebih
banyakdariyangdata,parabidangmenjadiberguna,danAnda perlu menjatuhkannya
dari dataset (atau menemukan beberapa cara untuk mendapatkan semua data
tersebut ).

Bidang yang kurang rusak dapat memiliki data yang hilang dalam salah satu dari
dua cara. Data yang hilang secara acak sering merupakan hasil dari kesalahan
manusia atau sensor. Ini terjadi ketika catatan data seluruh Dataset telah hilang
entri. Terkadang kesalahan sederhana akan menyebabkan kerusakan. Data secara
berurutan hilang terjadi selama beberapa jenis kegagalan umum. Seluruh segmen
catatan data dalam dataset tidak memiliki informasi yang diperlukan, yang berarti
bahwa analisis yang dihasilkan dapat menjadi sangat miring.

Memperbaiki data yang hilang secara acak adalah termudah. Anda dapat
menggunakan median sederhana atau nilai rerata sebagai penggantinya. Tidak,
dataset tidak sepenuhnya akurat, tetapi kemungkinan akan bekerja dengan cukup
baik untuk mendapatkan jawaban yang wajar. Dalam beberapa kasus, ilmuwan
data menggunakan algoritma khusus untuk menghitung nilai yang hilang, yang
dapat membuat data-set lebih akurat dengan mengorbankan waktu komputasi.
Bab 2 Mendefinisikan Tje Peran dari Data 37
Data yang hilang secara berurutan secara signifikan lebih sulit, jika tidak mustahil,
untuk memperbaiki karena Anda tidak memiliki data di sekitarnya yang untuk
mendasarkan segala macam
menebak.Kalaukamubisamenemukanpenyebabnyadariparahilangdata,kamubi
sakadangmerekonstruksiitu.Namun demikian,saatRecon-
structionmenjadimustahil,Anda
dapatPilihlahmelakukanAbaikanlapangan.Sayangnya, beberapa jawaban akan
memerlukanlapangan,manaberertibahwaAnda
mungkinperlumelakukanAbaikan bahwakhususberurutandaridataRecords—
yang berpotensimenyebabkan tidak benaroutput.

Bab 2 Mendefinisikan Tje Peran dari Data 38


Mempertimbangkan misalignments data
Data mungkin ada untuk setiap rekaman data dalam dataset, namun mungkin
tidak selaras dengan data lain di dataset lain yang Anda
miliki.Bagicontoh,paranumerikdatadalam tahunsebuahlapangan disalah
satudatasetmungkinmenjadisebuahFloating-Pointketikkan(dengan titik
desimal ),tetapisebuahjenis integerdalam
tahunlaindataset.Sebelumkamubisagabungkanparaduadataset,paraladanghar
us berisi jenis yang samadata.

Segala macam jenis misalignment dapat terjadi. Misalnya, kolom tanggal


terkenal karena telah diformat dengan berbagai
cara.MelakukanBandingkankurma,paradataformat
harusmenjadiparasama.Namun demikian,kurmatidakjugaberbahayadalam
tahunmerekakecenderunganbagimelihat-
ingparasama,tetapibelummenjadiparasama.Bagicontoh,kurmadalam
tahunsalah satudatasetmungkingunakan
GreenwichMeanWaktu(GMT)karenasebuahdasar,sementaraparakurmadalam
tahunlaindatasetmungkin
menggunakansebagianlainnyawaktuzona.SebelumkamubisaBandingkanparak
ali,kamumestialignmereka ke zona waktu yang sama. Hal ini dapat menjadi
lebih aneh ketika tanggal dalam satu dataset berasal dari lokasi yang
menggunakan Daylight Saving Time (DST), tetapi tanggal dari lokasi lain tidak.

Bahkan ketika jenis data dan format yang sama, data lain misalignments dapat
terjadi. Sebagai contoh, kolom dalam satu dataset mungkin tidak cocok dengan
kolom di dataset lainnya. Dalam
tahunsebagiankasus,iniperbedaantidakmudahmelakukanbenar.Salah
satudatasetMeiPerlakukan nama depan dan belakang sebagai satu bidang,
sementara dataset lain mungkin menggunakan kolom terpisah untuk nama depan
dan belakang. Jawabannya adalah untuk mengubah semua dataset untuk
menggunakan satu bidang atau untuk mengubah mereka semua untuk
menggunakan bidang yang terpisah untuk nama depan dan belakang. Sayangnya,
banyak misalignments dalam konten data lebih sulit untuk mengetahui. Bahkan,
sangat mungkin bahwa Anda mungkin tidak dapat mencari mereka sama sekali.
Namun, sebelum Anda menyerah, pertimbangkan solusi potensial ini untuk
masalah:

» Hitung data yang hilang dari data lain yang dapat Anda akses.
» Temukan data yang hilang di dataset lain.
» Menggabungkan dataset untuk membuat keseluruhan yang menyediakan bidang yang konsisten.
» Mengumpulkan data tambahan dari berbagai sumber untuk mengisi data yang hilang.
» Mendefinisikan ulang pertanyaan Anda sehingga Anda tidak lagi memerlukan data yang hilang.

Bab 2 Mendefinisikan Tje Peran dari Data 39


Memisahkan data yang berguna dari data lain
Beberapa organisasi berpendapat bahwa mereka tidak akan pernah memiliki
terlalu banyak data, tetapi kelebihan data menjadi masalah yang tidak cukup. Untuk
mengatasi masalah secara efisien, AI hanya membutuhkan cukup data.
Mendefinisikan pertanyaan yang Anda ingin menjawab secara ringkas dan jelas
membantu, seperti halnya menggunakan algoritma yang benar (atau algo-rithm
Ensemble).DariCourse,parabesarpermasalahandenganmemilikiterlalubanyakdata
tidakbahwa

Bab 2 Mendefinisikan Tje Peran dari Data 40


menemukan solusi (setelah rendam melalui semua data tambahan) membutuhkan waktu lebih
lama, dan
Terkadang Anda mendapatkan hasil yang membingungkan karena Anda tidak dapat melihat
hutan untuk pepohonan.

Sebagai bagian dari pembuatan dataset yang Anda perlukan untuk analisis, Anda
membuat salinan dari data asli daripada memodifikasinya. Selalu menjaga data
mentah asli, murni sehingga Anda dapat menggunakannya untuk analisis lain nanti.
Selain itu, menciptakan output data yang tepat untuk analisis dapat memerlukan
sejumlah mencoba karena Anda mungkin menemukan bahwa output tidak
memenuhi kebutuhan Anda. Intinya adalah membuat dataset yang hanya berisi
data yang dibutuhkan untuk analisa, namun perlu diingat bahwa data mungkin
memerlukan jenis pemangkasan spesifik untuk memastikan output yang
diinginkan.

Mempertimbangkan lima Mistruths dalam data


Manusia digunakan untuk melihat data untuk apa itu dalam banyak kasus:
pendapat. Bahkan, dalam beberapa kasus, orang condong data ke titik di mana
menjadi tidak berguna, sebuah mistruth.Sebuah komputer tidak dapat
membedakan antara data yang jujur dan tidak benar — semua yang dilihat adalah
data. Salah satu masalah yang membuat sulit, jika tidak mustahil, untuk membuat
AI yang benar-benar berpikir seperti manusia adalah bahwa manusia dapat
bekerja dengan mistruths dan komputer tidak bisa. Yang terbaik yang dapat Anda
harapkan untuk mencapai adalah untuk melihat data errant sebagai Out-Liers dan
kemudian menyaring itu, tetapi teknik itu tidak selalu memecahkan prob-lem
karena manusia masih akan menggunakan data dan mencoba untuk menentukan
kebenaran yang didasarkan pada mistruths yang ada e.

Sebuah pemikiran umum tentang pembuatan dataset yang kurang terkontaminasi


adalah bahwa daripada memungkinkan manusia untuk memasukkan data,
mengumpulkan data melalui sensor atau cara lain harus mungkin. Sayangnya,
sensor dan metodologi input mekanis lainnya mencerminkan tujuan penemu
manusia mereka dan batas apa teknologi tertentu mampu mendeteksi. Akibatnya,
bahkan data turunan atau sensor yang diturunkan oleh mesin juga dapat
menghasilkan mistruths yang cukup menyebar untuk AI untuk dideteksi dan
diatasi.

Bagian berikut ini menggunakan kecelakaan mobil sebagai contoh utama untuk
menggambarkan lima jenis mistruths yang dapat muncul dalam data. Konsep
bahwa kecelakaan sedang mencoba untuk menggambarkan mungkin tidak selalu
muncul dalam data dan mereka mungkin muncul dalam cara yang berbeda dari
yang dibahas. Faktanya tetap bahwa Anda biasanya perlu berurusan dengan hal
semacam ini saat melihat data.

Bab 2 Mendefinisikan Tje Peran dari Data 41


Komisi
Mistruths komisi adalah mereka yang mencerminkan upaya langsung untuk
menggantikan informasi yang benar untuk informasi yang tidak benar. Sebagai
contoh, ketika mengisi laporan kecelakaan, seseorang dapat menyatakan bahwa
matahari sesaat buta mereka,

Bab 2 Mendefinisikan Tje Peran dari Data 42


sehingga mustahil untuk melihat seseorang yang mereka memukul.Dalam
tahunReality,mungkin orang itu
terganggudengansesuatulainatautidaksebenarnyaberpikirtentang mengemudi
(mungkin con- sidering makan malam yang menyenangkan).Jika tidak ada yangdapat
menyangkal hal iniTheory,orang tersebut
mungkinmendapatkandengansebuahLesserdikenakan biaya.Namun,
intinyatidakbahwa dataakanjugamenjaditerkontaminasi.ParaEffecttidakyang
sekarangsebuahperusahaan asuransi akanBase premidi ataserrant data.

Meskipun akan tampak seolah-olah salah komisi yang sama sekali dapat dihindari,
seringkali mereka tidak. Manusia mengatakan "kebohongan putih kecil" untuk
menyelamatkan orang lain malu atau untuk menangani masalah dengan sedikitnya
jumlah usaha pribadi. Terkadang sebuah mis-kebenaran Komisi didasarkan pada
masukan errant atau desas-desus. Faktanya, sumber kesalahan Komisi begitu
banyak sehingga sangat sulit untuk datang dengan skenario di mana seseorang bisa
menghindari mereka sepenuhnya. Semua ini mengatakan, mistruths komisi adalah
salah satu jenis mistruth bahwa seseorang dapat menghindari lebih sering
daripada tidak.

Kelalaian
Mistruths kelalaian adalah orang-orang di mana seseorang mengatakan kebenaran
dalam setiap fakta yang dinyatakan, tetapi daun keluar sebuah fakta penting yang
akan mengubah persepsi sebuah insiden secara keseluruhan. Berpikir lagi tentang
laporan kecelakaan, mengatakan bahwa seseorang menyerang rusa, menyebabkan
kerusakan yang signifikan pada mobil mereka. Dia dengan jujur mengatakan
bahwa jalan itu basah; itu adalah dekat senja sehingga cahaya tidak sebaik
mungkin; Dia sedikit terlambat dalam menekan
rem;danpararusasekadarberlarikeluardarisebuah semak belukaratparaSide
ofparaRoad.Parakesimpulanakanmenjadibahwaparakejadiantidaksekadarsebuah
kecelakaan.

Namun, orang itu telah meninggalkan sebuah fakta penting. Dia texting pada saat
itu. Jika penegakan hukum tahu tentang texting, itu akan mengubah alasan untuk
acci-Dent untuk lalai mengemudi. Pengemudi mungkin didenda dan asuransi
Adjuster akan menggunakan alasan yang berbeda ketika memasuki insiden ke dalam
database.Karenadengan mistruth komisi, data errant yang dihasilkan akan
mengubah cara perusahaan asuransi menyesuaikanpremi.

Menghindari ketidakmungkinan kelalaian adalah hampir mustahil. Ya, ada orang


yang bisa dengan sengaja meninggalkan fakta dari laporan, tapi itu hanya mungkin
bahwa seseorang hanya akan lupa untuk memasukkan semua fakta. Setelah semua,
kebanyakan orang cukup bingung setelah acci-Dent, sehingga mudah untuk
kehilangan fokus dan hanya melaporkan kebenaran yang meninggalkan kesan
yang paling signifikan. Bahkan jika seseorang kemudian mengingat rincian
tambahan dan laporan mereka, database tidak mungkin pernah berisi satu set
Bab 2 Mendefinisikan Tje Peran dari Data 43
penuh kebenaran.

Perspektif
Mistruths perspektif terjadi ketika beberapa pihak melihat insiden dari mul-tiple
titik pandang. Sebagai contoh, dalam mempertimbangkan kecelakaan yang
melibatkan pejalan kaki menghantam, orang yang mengendarai mobil, orang
mendapatkan dipukul oleh mobil, dan pengamat yang menyaksikan acara itu
semua akan memiliki perspektif yang berbeda.

Bab 2 Mendefinisikan Tje Peran dari Data 44


Seorang petugas yang mengambil laporan dari setiap orang akan dimengerti
mendapatkan fakta yang berbeda dari masing-masing, bahkan dengan asumsi
bahwa setiap orang mengatakan kebenaran karena masing-masing
mengetahuinya. Bahkan, pengalaman menunjukkan bahwa ini hampir selalu
terjadi dan apa yang Offi-CER mengajukan sebagai laporan adalah dasar dari apa
yang masing-masing negara yang terlibat, ditambah dengan pengalaman pribadi.
Dengan kata lain, laporan akan dekat dengan kebenaran, tetapi tidak cukup dekat
untuk AI.

Ketika berhadapan dengan perspektif, penting untuk mempertimbangkan sudut


pandang. Pengemudi mobil dapat melihat dashboard dan mengetahui kondisi
mobil pada saat kecelakaan. Ini adalah informasi yang kekurangan dua pihak
lainnya. Demikian juga, orang yang terkena mobil memiliki sudut pandang terbaik
untuk melihat ekspresi wajah pengemudi (niat). Penonton mungkin berada dalam
posisi terbaik untuk melihat apakah driver membuat upaya untuk menghentikan,
dan menilai masalah sepertiApakahsopir mencoba untuk menyimpang. Masing-
masing pihak harus membuat laporan berdasarkan data yang terlihat tanpa
manfaat data tersembunyi .

Perspektif mungkin adalah yang paling berbahaya dari mistruths karena siapa pun
yang mencoba untuk memperoleh kebenaran dalam skenario ini akan, di terbaik,
berakhir dengan rerata dari berbagai cerita, yang akantidak
pernahmenjadisepenuhnyabenar.Sebuahmanusiamelihatparainformasi
dapatbersandardi
atasintuisidannalurimelakukanberpotensimendapatkansebuahlebih
baikpendekatandariparakebenaran, tetapi Ai akan selalu menggunakan hanya rata,
yang berarti bahwa Ai adalahselalupada kerugian yang signifikan. Sayangnya,
menghindari mistruths perspektif adalah mustahil karena tidak peduli berapa
banyak saksi Anda harus acara, yang terbaik yang dapat Anda berharap untuk
mencapai adalah perkiraan kebenaran, bukan kebenaran yang sebenarnya .

Ada juga semacam lain mistruth untuk dipertimbangkan, dan itu salah satu
perspektif. Pikirkan tentang skenario ini: anda adalah orang yang tuli di 1927. Setiap
minggu, Anda pergi ke teater untuk melihat film bisu, dan selama satu jam atau
lebih, Anda merasa seperti orang lain. Anda dapat mengalami film dengan cara
yang sama orang lain tidak; tidak ada perbedaan. Pada bulan Oktober tahun itu,
Anda melihat tanda mengatakan bahwa teater adalah upgrade ke sup-Port sebuah
sistem suara sehingga dapat menampilkan Talkies - film dengan Sound Track.
Tanda mengatakan bahwa itu hal terbaik yang pernah, dan hampir semua orang
tampaknya setuju, kecuali untuk Anda, orang yang tuli, yang sekarang dibuat
merasa seperti warga kelas dua, DIF-ferent dari orang lain dan bahkan cukup
banyak dikecualikan dari teater. Di mata orang yang tuli, tanda itu adalah salah satu
mistruth; menambahkan sebuah sistem suara adalah hal terburuk, bukan hal
terbaik yang mungkin. Intinya adalah bahwa apa yang tampaknya gen-erally benar
sebenarnya tidak benar untuk semua orang. Gagasan tentang kebenaran umum —
satu yang benar bagi semua orang — adalah sebuah mitos. Itu tidak ada.

Bab 2 Mendefinisikan Tje Peran dari Data 45


Bias
Ketidakberpihakan bias terjadi ketika seseorang dapat melihat kebenaran, tetapi
karena keprihatinan pribadi atau kepercayaan tidak dapat benar-benar
melihatnya. Misalnya, ketika berpikir tentang kecelakaan, pengemudi mungkin
memusatkan perhatian sepenuhnya di tengahjalan
yangpararusaatparatepidariparajalan Rayamenjadi tidak
terlihat.Akibatnya,parasupir

Bab 2 Mendefinisikan Tje Peran dari Data 46


tidak memiliki waktu untuk bereaksi ketika rusa tiba-tiba memutuskan untuk baut keluar ke
tengah
jalan dalam upaya untuk menyeberang.

Masalah dengan bias adalah bahwa hal itu dapat sangat sulit untuk
mengkategorikan. Sebagai contoh, seorang sopir yang gagal untuk melihat rusa
dapat memiliki kecelakaan asli , yang berarti bahwa rusa itu tersembunyi dari
pandangan oleh semak. Namun, pengemudi mungkin juga bersalah karena
mengemudi lalai karena fokus yang salah. Pengemudi mungkin juga mengalami
gangguan sesaat. Singkatnya, fakta bahwa pengemudi tidak melihat rusa tidak
pertanyaan; Sebaliknya, itu soal mengapa pengemudi tidak melihat rusa. Dalam
banyak kasus, mengkonfirmasikan sumber bias menjadi penting ketika
menciptakan sebuah algo-rithm dirancang untuk menghindari sumber bias .

Secara teoritis, menghindari mistruths bias selalu mungkin. Namun, pada


kenyataannya, semua manusia memiliki bias dari berbagai jenis dan bias yang akan
selalu menghasilkan mistruths yang condong dataset. Hanya mendapatkan
seseorang untuk benar-benar melihat dan kemudian melihat sesuatu-untuk
memilikinya mendaftar di otak seseorang-adalah tugas yang sulit. Manusia
bergantung pada filter untuk menghindari informasi yang berlebihan, dan filter ini
juga merupakan sumber bias karena mereka mencegah orang dari sebenarnya
melihat sesuatu.

Kerangka acuan
Dari lima mistruths, kerangka acuan tidak perlu sebenarnya hasil dari segala macam
kesalahan, tapi salah satu pemahaman. Sebuah mistruth bingkai-referensi terjadi ketika
salah satu pihak menggambarkan sesuatu, seperti peristiwa seperti kecelakaan, dan
karena pihak kedua tidak memiliki pengalaman dengan acara tersebut, rincian menjadi
kacau atau sepenuhnya disalahpahami. Komedi rutinitas berlimpah yang mengandalkan
frame-of- kesalahan referensi. Salah satu contoh yang terkenal adalah dari Abbott dan
Costello, siapa yang pertama?, seperti yang ditunjukkan
padahttps://www.youtube.com/watch?v=kTcRRaXV-FG. Mendapatkan satu orang
untuk memahami apa yang orang kedua katakan bisa mustahil ketika orang pertama
kurang pengalaman pengetahuan - frame darireferensi.

Contoh lain frame-of-Reference mistruth terjadi ketika salah satu pihak tidak
dapat pos-sibly memahami yang lain. Sebagai contoh, seorang pelaut
mengalami badai di laut. Mungkin itu adalah muson, tetapi asumsikan sejenak
bahwa badai yang substansial -mungkin mengancam nyawa
.Bahkandenganparagunakandarivideo,wawancara,dansebuahSimulator,
Thepengalamandarimenjadiatlautdalam tahunsebuahmengancam
nyawaStormakanmenjadimustahiluntuk
menyampaikanmelakukanseseorangSiapakahbelumdialamiseperti
itusebuahStormpertama kalitangan;bahwaorang tidak memiliki
kerangkareferensi.
Bab 2 Mendefinisikan Tje Peran dari Data 47
Cara terbaik untuk menghindari bingkai-of-Reference mistruths adalah untuk
memastikan bahwa semua pihak yang terlibat dapat mengembangkan frame
yang sama referensi. Untuk menyelesaikan tugas ini, berbagai pihak
memerlukan pengetahuan pengalaman serupa untuk memastikan transfer data
yang akurat dari satu orang ke yang lain.Namun demikian,saatbekerja
samadengansebuahdata-set,manatidaktentudirekam,statikdata,kerangka
acuankesalahanakanmasih terjadisaatparaprospektifpenampil tidak
memilikiparadiharuskanexperientialpengetahuan.

Bab 2 Mendefinisikan Tje Peran dari Data 48


Ai akan selalu mengalami masalah kerangka acuan karena Ai tentu tidak
memiliki kemampuan untuk membuat sebuah
pengalaman.SebuahDatabankdaridiakuisisipengetahuantidak cukupparasama
sepertihal.ParaDatabankakanmengandungfakta,tetapipengalamantidakberpus
aton nothanya sajafaktatetapijugakesimpulanbahwasaat
initeknologinyatidaktidak dapatmelakukanduplikasi.

Menentukan batas akuisisi data


Ini mungkin tampak seolah-olah semua orang memperoleh data Anda tanpa pemikiran
atau alasan, dan Anda benar; mereka. Faktanya, organisasi mengumpulkan,
mengkategorikan, dan menyimpan data setiap orang — tampaknya tanpa tujuan atau niat.
Menurut data tidak pernah tidur (https://www.Domo.com/blog/data-Never-Sleeps-5/),
dunia adalah mengumpulkan data pada tingkat 2,5 triliun byte per hari. Data harian ini
datang dalam segala macam bentuk, seperti contoh ini membuktikan:

» Google melakukan 3.607.080 pencarian.


» Twitter pengguna mengirim 456.000 tweets.
» Pengguna YouTube menonton video 4.146.600.
» Kotak masuk menerima email spam 103.447.529.
» Weather Channel menerima 18.055.555,56 permintaan cuaca.
» Giphy melayani 694.444 GIF.
Akuisisi data telah menjadi narkotika bagi organisasi di seluruh dunia, dan beberapa orang
berpikir bahwa organisasi yang mengumpulkan yang paling entah bagaimana
memenangkan hadiah. How-pernah, data akuisisi, dalam dan dari dirinya sendiri,
menyelesaikan apa-apa. Buku The hitch-hiker's Guide to The Galaxy, oleh Douglas Adams
(https://www.Amazon.com/exec/ Obidos/asin/1400052920/ datacservip0f-20/),
menggambarkan masalah ini dengan jelas. Dalam buku ini, perlombaan makhluk Super
membangun komputer yang sangat besar untuk menghitung makna "kehidupan, alam
semesta, dan segala sesuatu." Jawaban dari 42 tidak menyelesaikan apa-apa, jadi beberapa
makhluk mengeluh bahwa koleksi, kategoriza-tion, dan analisis dari semua data yang
digunakan untuk jawaban belum menghasilkan hasil yang dapat digunakan. Komputer,
sebuah makhluk satu, tidak kurang, mengatakan kepada orang yang menerima jawaban
bahwa jawabannya memang benar, tetapi mereka perlu tahu pertanyaan agar jawaban
yang masuk akal. Akuisisi data dapat terjadi dalam jumlah yang tidak terbatas, tetapi
mencari tahu pertanyaan yang tepat untuk bertanya bisa menakutkan, jika tidakmustahil.

Bab 2 Mendefinisikan Tje Peran dari Data 49


Masalah utama bahwa setiap organisasi perlu alamat berkenaan dengan akuisisi
data adalah pertanyaan mana yang harus ditanyakan dan mengapa pertanyaan
penting. Menyesuaikan akuisisi data untuk menjawab pertanyaan yang perlu
dijawab masalah.Bagiujian-PLE,kalauAnda sedangmenjalankansebuahtokodalam
tahunTown,kamumungkinperlupertanyaansepertiinimenjawab:

» Berapa banyak orang yang berjalan di depan toko setiap hari?


» Berapa banyak orang yang berhenti untuk melihat di jendela?
» Berapa lama mereka melihat?
» Apa waktu hari yang mereka Cari?
» Apakah tampilan tertentu cenderung menghasilkan hasil yang lebih baik?
» Manakah dari tampilan ini yang sebenarnya menyebabkan orang datang ke toko dan berbelanja?
Daftar bisa terus, tapi Idenya adalah bahwa membuat daftar pertanyaan yang
alamat kebutuhan bisnis tertentu sangat penting. Setelah Anda membuat daftar,
Anda harus memverifikasi bahwa setiap pertanyaan sebenarnya penting-yaitu,
alamat kebutuhan-dan kemudian memastikan jenis informasi yang Anda butuhkan
untuk menjawab pertanyaan.

Tentu saja, mencoba mengumpulkan semua data ini dengan tangan akan mustahil,
dimana otomatisasi datang ke dalam bermain.Tampaknya, otomatisasi
akanmenghasilkanandal, berulangable,dankonsistendatamasukan.Namun
demikian,banyakFactordalam tahunMengotomasikandataakuisisidapat
menghasilkan data yang tidak terlalu berguna. Misalnya, pertimbangkan masalah
berikut:

» Sensor hanya dapat mengumpulkan data yang dirancang untuk dikumpulkan, sehingga Anda
mungkin melewatkan data ketika sensor yang digunakan tidak dirancang untuk tujuan
tersebut .

» Orang membuat data errant dalam berbagai cara (Lihat bagian "mengingat lima mistruths
dalam data" bab untukrincian), yang berarti bahwa data yang Anda terima mungkin palsu.

» Data dapat menjadi bias ketika kondisi untuk mengumpulkan salah didefinisikan.
» Menafsirkan data secara tidak benar berarti bahwa hasil juga akan salah.
» Mengubah pertanyaan dunia nyata menjadi algoritme yang dapat dipahami komputer adalah
proses yang rawan kesalahan .

Banyak masalah lain perlu dipertimbangkan (cukup untuk mengisi buku). Ketika
Anda com-bine buruk dikumpulkan, buruk-terbentuk data dengan algoritma yang
tidak sebenarnya menjawab pertanyaan Anda, Anda mendapatkan output yang
sebenarnya dapat memimpin bisnis Anda ke arah yang salah, itulah sebabnya AI
sering disalahkan untuk hasil yang tidak konsisten atau tidak dapat diandalkan.

Bab 2 Mendefinisikan Tje Peran dari Data 50


Mengajukan pertanyaan yang tepat, mendapatkan data yang benar, melakukan hak
Pro-cessing, dan kemudian benar menganalisis data semua diperlukan untuk
membuat data Acqui-mencegah jenis alat yang dapat Anda andalkan.

Bab 2 Mendefinisikan Tje Peran dari Data 51


DALAM BAB INI

Bab ke- 3
Mempertimbangkan
penggunaan
dari algoritma

D
ATA adalah pengubah permainan di AI. Kemajuan baru dalam AI
mengisyaratkan bahwa untuk beberapa prob-lems, memilih jumlah data
yang tepat lebih penting daripada algoritma yang tepat. Misalnya, dalam
2001, dua peneliti dari Microsoft, Banko
dan Brill, dalam kertas kenangan mereka "scaling untuk corpora sangat sangat besar
untuk bahasa alam disambiguasi" (http://www.aclweb.org/Anthology/P01- 1005)
menunjukkan bahwa jika Anda ingin komputer untuk membuat model bahasa, Anda tidak
perlu algoritma cerdas di kota. Setelah membuang lebih dari 1.000.000.000 kata dalam
konteks masalah, algoritme apa pun akan mulai tampil dengan sangat baik. Bab ini
membantu Anda memahami hubungan antara algo- rithms dan data yang digunakan untuk
melakukan hal- hal yang bergunabekerja.

Namun, tidak peduli berapa banyak data yang Anda miliki, Anda masih
memerlukan algoritma untuk membuatnya berguna. Selain itu, Anda harus
melakukan analisis data (serangkaian ditentukan langkah), untuk membuat data
bekerja dengan benar dengan algoritma yang dipilih. Anda tidak bisa mengambil
jalan pintas apapun. Meskipun AI adalah otomatisasi cerdas, terkadang otomatisasi
harus mengambil kursi belakang untuk dianalisis. Mesin yang belajar sendiri
berada di masa depan yang jauh. Anda tidak akan menemukan mesin yang tahu apa
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 39
yang tepat dan dapat sepenuhnya memotong intervensi manusia hari ini. Paruh
kedua bab ini membantu Anda memahami peran sistem ahli, pembelajaran mesin,
pembelajaran mendalam, dan aplikasi seperti AlphaGo dalam membawa
kemungkinan masa depan sedikit lebih dekat dengan kenyataan.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 40
Memahami peran algoritma
Orang cenderung mengenali AI ketika alat menyajikan pendekatan baru dan
berinteraksi dengan pengguna dengan cara yang mirip manusia. Contohnya
termasuk asisten digital seperti siri, Alexa, dan Cortana. Namun, beberapa alat
umum lainnya, seperti GPS Rout-ERS dan perencana khusus (seperti yang
digunakan untuk menghindari tabrakan otomotif, Auto-pilot pesawat, dan
mengatur rencana produksi) bahkan tidak terlihat seperti AI karena mereka terlalu
umum dan diambil begitu saja ketika mereka bertindak di belakang layar.

Ini jelas merupakanefek AI, seperti yang disebutkan dan dideskripsikan oleh
Pamela Mccorduck, penulis amerika yang menulis sejarah penting Ai di
1979.ParaAiEffectnegara bagianbahwa program komputer cerdas yang sukses
segera kehilangan pengakuan oleh orang dan menjadi aktor diam, sementara
perhatian bergeser ke masalah Ai yang masih memerlukan resolusi. Orang menjadi
tidak sadar akan pentingnya klasik algo-rithms untuk AI dan mulai berfantasi
tentang AI diciptakan dari teknologi Esoterik atau menyamakan itu untuk kemajuan
terbaru , seperti pembelajaran mesin dan pembelajaran mendalam .

Algoritma adalah prosedur, yang merupakan urutan operasi, biasanya ditangani


oleh komputer yang menjamin untuk menemukan solusi yang tepat untuk masalah
dalam waktu terbatas atau memberitahu Anda bahwa tidak ada solusi yang ada.
Meskipun orang telah memecahkan algo-rithms secara manual selama ribuan
tahun, melakukan hal itu dapat menghabiskan sejumlah besar waktu dan
memerlukan banyak perhitungan numerik, tergantung pada kompleksitas masalah
yang ingin Anda selesaikan. Algoritma adalah semua tentang menemukan solusi,
dan lebih cepat dan lebih mudah, semakin baik. Algoritma telah menjadi keras-
kode dalam kecerdasan manusia yang merancang mereka, dan setiap mesin
operat-ing pada algoritma tidak bisa tetapi mencerminkan kecerdasan tertanam ke
dalam prosedur algoritmik tersebut.

Memahami apa algoritma berarti


Algoritme selalu menyajikan serangkaian langkah namun tidak selalu melakukan
semua langkah ini untuk memecahkan masalah. Lingkup algoritma yang sangat
besar. Opera-tions mungkin melibatkan penyimpanan data, menjelajahi, dan
memesan atau mengaturnya ke dalam struktur data. Anda dapat menemukan
algoritma yang memecahkan masalah dalam ilmu pengetahuan, Kedokteran,
keuangan, produksi industri dan pasokan, dan komunikasi.

Semua algoritma adalah urutan operasi untuk menemukan solusi yang tepat untuk
prob-lem dalam waktu yang wajar (atau melaporkan kembali jika tidak ada solusi
yang ditemukan). Algoritma AI membedakan diri dari algoritma generik dengan
memecahkan masalah yang reso-lution dianggap biasanya (atau bahkan secara
eksklusif) produk perilaku Intelli-gen manusia. Algoritma AI cenderung menangani

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 41
masalah yang kompleks, yang sering menjadi bagian dari kelas NP-Complete
masalah (di mana NP adalah non deterministik polyno-waktu mial) bahwa manusia
secara rutin berurusan dengan menggunakan campuran pendekatan rasional dan
intuisi. Berikut adalah beberapa contoh:

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 42
» Penjadwalan masalah dan mengalokasikan sumber daya langka
» Mencari rute di ruang fisik atau figuratif yang kompleks
» Mengenali pola dalam gambar visi (versus sesuatu seperti restorasi gambar
atau pemrosesan gambar) atau persepsi suara

» Pengolahan bahasa (baik pemahaman teks dan terjemahan bahasa)


» Bermain (dan menang) Permainan kompetitif
NP-Complete masalah membedakan diri dari masalah algoritmik lain karena
menemukan solusi untuk mereka dalam jangka waktu yang wajar belum mungkin.
NP-Complete bukanlah jenis masalah yang Anda selesaikan dengan mencoba
semua kemungkinan com-binations atau kemungkinan. Bahkan jika Anda memiliki
komputer yang lebih kuat daripada yang ada saat ini, pencarian solusi akan
berlangsung hampir selamanya. Dengan cara yang sama, di AI, masalah semacam
ini disebut Ai-Complete.

Mulai dari perencanaan dan percabangan


Perencanaan membantu Anda menentukan urutan tindakan yang akan dilakukan
untuk mencapai tujuan CER-Tain. Ini adalah masalah AI klasik, dan Anda
menemukan contoh perencanaan dalam produksi industri, alokasi sumber daya,
dan memindahkan robot di dalam ruangan. Mulai dari keadaan sekarang, AI
menentukan semua kemungkinan tindakan dari negara yang pertama. Secara
teknis, itu memperluas keadaan saat ini menjadi sejumlah negara masa depan.
Kemudian memperluas semua keadaan masa depan ke negara mereka sendiri
masa depan, dan sebagainya. Ketika Anda tidak dapat memperluas negara lagi dan
AI berhenti ekspansi, AI telah CRE-ated ruang negara, yang terdiri dari apa pun
yang bisa terjadi di masa depan. Sebuah AI dapat mengambil keuntungan dari
ruang negara bukan hanya sebagai prediksi mungkin (sebenarnya memprediksi
segalanya, meskipun beberapa negara masa depan lebih mungkin daripada yang
lain) tetapi juga karena AI dapat menggunakan ruang negara untuk
mengeksplorasi keputusan yang dapat membuat untuk mencapai tujuannya di wa
terbaik y. ini dikenal sebagai pencarian negara-ruang.

Bekerja dengan ruang negara memerlukan penggunaan kedua struktur data


tertentu dan algoritma. Struktur data inti yang biasa digunakan adalah pohon dan
grafik. Algoritma yang disukai digunakan untuk efisien mengeksplorasi grafik
termasuk luas-pertama pencarian atau dalam pencarian pertama.

Membangun pohon bekerja sama seperti membangun pohon di dunia fisik. Setiap
item yang Anda tambahkan ke pohon adalah node.Node terhubung satu sama lain
menggunakan link. Combi-Nation dari node dan link membentuk struktur yang
terlihat seperti pohon, seperti yang ditunjukkan pada gambar 3-1.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 43
GAMBAR 3-1:
Sebuah pohon
mungkin terlihat
seperti alternatif fisik
atau memiliki akar
menunjuk ke atas.

Pohon memiliki satu simpul akar, sama seperti pohon fisik. Node akar adalah titik
awal untuk pemrosesan yang Anda
lakukan.Terhubungmelakukanparaakartidakbaikrantingatau
daun.SebuahLeafsimpultidaksebuahEndingtitikbagiparaTree.Rantingnodesmenunj
angbaikcabang atau dedaunan lainnya. Jenis pohon yang ditunjukkan pada gambar
3-1 adalah pohon biner karena setiap node memiliki, paling banyak, dua koneksi
(tapi pohon yang mewakili ruang negara dapat memiliki beberapa Cabang).

Dalam melihat pohon, cabang B adalah anak dari simpul akar. Itu karena node root
muncul pertama dalam daftar. Daun E dan daun F adalah anak dari cabang B,
membuat cabang B induk dari daun e dan daun f. Hubungan antara node penting
karena diskusi tentang pohon sering mempertimbangkan anak/orangtua rela-
tionship antara node. Tanpa istilah ini, diskusi tentang pohon bisa menjadi sangat
membingungkan.

Sebuah grafik adalah semacam ekstensi pohon. Seperti pohon, Anda memiliki node
yang terhubung satu sama lain untuk membuat hubungan. Namun, tidak seperti
pohon biner, sebuah Graf node dapat memiliki lebih dari satu atau dua koneksi.
Bahkan, grafik node sering memiliki multi-tude koneksi, dan, yang paling penting,
node dapat terhubung ke segala arah, tidak hanya dari orangtua ke anak. Untuk
menjaga semuanya tetap sederhana, pertimbangkan grafik yang ditunjukkan pada
gambar 3-2.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 44
GAMBAR 3-2:
Grafik node dapat
terhubungsa
tu sama lain
dalam berbagai
cara.

Grafik adalah struktur yang menyajikan sejumlah node (atau vertexes) yang
dihubungkan oleh sejumlah tepi atau busur (tergantung pada representasi). Ketika
Anda berpikir tentang sebuah grafik, pikirkan tentang sebuah struktur seperti peta,
di mana setiap lokasi pada peta adalah sebuah simpul dan jalan adalah tepinya.
Presentasi ini berbeda dari pohon, di mana setiap jalur berakhir di simpul daun.
Lihat gambar 3-2 untuk melihat grafik yang telah di-pre-sented. Grafik sangat
berguna ketika mencari tahu negara yang mewakili semacam ruang fisik. Misalnya,
GPS menggunakan grafik untuk mewakili tempat dan jalan.

Grafik juga menambahkan beberapa tikungan baru yang mungkin tidak Anda
pertimbangkan. Untuk ujian-PLE, sebuah grafik dapat mencakup konsep
directionality. Tidak seperti pohon, yang memiliki hubungan orangtua/anak, node
grafik dapat terhubung ke node lain dengan arah tertentu dalam pikiran. Pikirkan
tentang jalanan di kota. Sebagian besar jalan adalah bidirec-tional, tetapi beberapa
jalan satu arah yang memungkinkan gerakan hanya dalam satu arah.

Presentasi dari koneksi grafik mungkin tidak benar mencerminkan realitas grafik.
Grafik dapat menetapkan bobot pada koneksi tertentu. Bobot dapat menentukan
jarak antara dua titik, menentukan waktu yang dibutuhkan untuk melintasi rute,
atau memberikan jenis informasi lainnya.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 45
Sebuah pohon tidak lebih dari grafik di mana setiap dua simpul dihubungkan
dengan tepat satu jalur dan yang tidak memungkinkan siklus (untuk dapat kembali
ke orangtua dari setiap anak). Banyak algoritma grafik hanya berlaku untuk pohon.

Melintasi grafik berarti mencari (mengunjungi) setiap simpul (node) dalam


urutan tertentu . Proses mengunjungi sebuah simpul dapat mencakup membaca
dan memperbaruinya .Kamudis-Coverbelum
dikunjungivertexeskarenakamumelintasisebuahGraf.Parasimpulmenjadiditem
ukan (karena Anda hanya mengunjungi itu)ataudiolah(karena algoritma
mencoba semua tepi berangkat dari
itu)setelahparapencarian.Parapesandariparapencarianmenentukanparabaik
hatipencarian dilakukan: tidak diberitahu (blind Search) dan informasi
(heuristic). Dalam strategi yang tidak informasi , Ai menjelajahi ruang negara tanpa
informasi tambahan kecuali struktur grafik itu menemukan seperti melintasi itu.
Berikut SEC-tions membahas dua Common Blind algoritma pencarian: lebar-
pertama pencarian dan kedalaman-pertama pencarian.

Sebuah lebar-pencarian pertama (BFS) dimulai pada akar grafik dan


mengeksplorasi setiap node yang melekat pada akar. Kemudian pencarian tingkat
berikutnya, menjelajahi setiap tingkat pada gilirannya sampai mencapai akhir.
Akibatnya, dalam Graf contoh, pencarian mengeksplorasi dari A ke B dan C sebelum
berpindah untuk mengeksplorasi D. BFS mengeksplorasi grafik secara sistematis,
menjelajahi vertexes di sekitar simpul awal dalam lingkaran Fash-ion. Ini dimulai
dengan mengunjungi semua vertexes satu langkah dari simpul awal; kemudian
bergerak dua langkah keluar, kemudian tiga langkah keluar, dan seterusnya.

Sebuah kedalaman-pencarian pertama (DFS) dimulai pada akar grafik dan


kemudian menjelajahi setiap node dari akar itu ke bawah satu jalur sampai
akhir.IakemudianbacktracksdanbermulaExplor-ing lintasan yang tidak diambil di
lintasan pencarian saat ini sampai mencapai akar lagi. Pada saat itu, jika jalur lain
untuk mengambil dari akar yang tersedia, algoritma memilih salah satu dan
memulai pencarian yang sama lagi. Idenya adalah untuk menjelajahi setiap jalur
sepenuhnya sebelum menjelajahi jalan lain .

Memainkan permainan permusuhan


Hal yang menarik tentang negara-ruang pencarian adalah bahwa hal itu mewakili
baik AI-sewa fungsi dan peluang masa depan. Ini adalah kasus permainan
permusuhan (permainan di mana satu menang dan yang lain kalah) atau situasi
yang sama di mana pemain mengejar tujuan yang bertentangan dengan tujuan
orang lain. Sebuah permainan sederhana seperti Tic-Tac-Toe menyajikan contoh
sempurna dari permainan pencarian ruang Anda mungkin sudah melihat Ai bermain.
Dalam wargames 1983 film, superkomputer WOPR (perang operasi rencana
respon) bermain melawan dirinya sendiri pada kecepatan yang terik, namun tidak
bisa menang karena permainan ini memang sederhana dan jika Anda
menggunakan pencarian negara-ruang, Anda tidak akan pernah kehilangan.
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 46
Anda memiliki sembilan sel untuk diisi dengan X dan O untuk setiap pemain. Yang
pertama untuk menempatkan tiga tanda berturut-turut (horisontal, vertikal, atau
diagonal) menang. Ketika membangun sebuah

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 47
negara- pohon ruang untuk pohon, setiap tingkat pohon mewakili giliran
permainan.Paranode akhir mewakili negara papan akhir dan menentukan
kemenangan, imbang, atau kekalahan untuk AI. Setiap node terminal memiliki Skor
yang lebih tinggi untuk menang, lebih rendah untuk menggambar, dan bahkan
lebih rendah atau negatif untuk
kalah.ParaAimenyebarkanparascoresmelakukanparaUppernode dan cabang
menggunakan penjumlahan sampai mencapai simpul awal. Node awal mewakili
situasi aktual. Menggunakan strategi sederhana memungkinkan Anda untuk Trav-
erse pohon: ketika itu AI's turn dan Anda harus menyebarkan nilai dari banyak
node, Anda jumlah nilai maksimum (mungkin karena AI harus mendapatkan hasil
Maxi-mum dari permainan); ketika giliran lawan, Anda menjumlahkan nilai ibu-
Mini sebagai gantinya. Pada akhirnya, Anda mendapatkan pohon yang cabang yang
memenuhi syarat dengan Skor. Ketika giliran AI, ia memilih langkah yang
didasarkan pada cabang yang nilainya adalah yang tertinggi karena itu
menyiratkan memperluas node dengan possibil tertinggi untuk menang.Figure3-
3menunjukkansebuahvisualnyacontohdariiniStrategy.

GAMBAR 3-3:
Sekilas
tentang
perkiraan min-Max di
Tic-Tac-Toe
Permainan.

Pendekatan ini disebut perkiraan min-Max. Ronald Rivest, dari laboratorium ilmu
komputer di MIT, diperkenalkan dalam 1987 (Anda dapat membaca makalah di
https://People.CSAIL.MIT.edu/Rivest/pubs/Riv87c.pdf ). Sejak itu, algoritma ini dan variannya
telah didukung banyak game kompetitif, bersama dengan kemajuan game-Playing baru-
baru ini, seperti alphago dari Google deepmind, yang menggunakan pendekatan yang
menggemakan perkiraan min-Max (yang juga ditemukan dalam film WarGames dari
1983).
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 48
Terkadang Anda mendengar tentang pemangkasan Alfa-Beta sebagai terhubung ke
min-Max approx-Imation. Pemangkasan Alpha-betaadalah cara yang cerdas untuk
menyebarkan nilai sampai pohon hier-Arki di ruang negara kompleks yang
membatasi perhitungan. Tidak semua permainan fitur kompak pohon negara-
Ruang; Ketika cabang Anda dalam jumlah jutaan, Anda perlu untuk memangkas
mereka dan mempersingkat perhitungan Anda.

Menggunakan pencarian lokal dan heuristik


Banyak berjalan di belakang pendekatan negara-ruang pencarian. Pada akhirnya,
tidak ada mesin, tidak peduli seberapa kuat, dapat menghitung semua
kemungkinan yang musim semi dari situ-ation. Bagian ini berlanjut dengan
permainan karena mereka dapat diprediksi dan memiliki aturan tetap, sedangkan
banyak situasi dunia nyata tidak dapat diprediksi dan tidak memiliki aturan yang
jelas, membuat game menjadi pengaturan yang optimis dan menguntungkan.

Checkers, permainan yang relatif sederhana dibandingkan dengan catur atau Go, memiliki
500.000.000.000 (500000000000000000000) kemungkinan papan posisi, nomor yang,
menurut perhitungan oleh matematikawan di Hawaii University, setara dengan semua
butir s pasir di bumi. Itubenar bahwa lebih sedikit bergerak mungkin sebagai
permainandari Checkers berlangsung. Namun jumlah yang berpotensi mengevaluasi pada
setiap langkah terlalu tinggi. Butuh 18 tahun menggunakan komputer yang kuat
(http://sciencenetlinks.com/ Science-News/Sains-update/Checkers-solved/) untuk
menghitung semua 500.000.000.000 miliar kemungkinan bergerak. Coba bayangkan berapa
lama itu bisa mengambil konsumen com- puter untuk bekerja di luar bahkan subset yang
lebih kecil dari bergerak. Untuk dikelola, itu harus menjadi subset yang sangat kecil dari
semua potensi bergerak.

Optimasi menggunakan pencarian lokal dan bantuan heuristik dengan


menggunakan kendala untuk membatasi jumlah awal
dimungkinkanevaluasi(seperti dalam pemangkasan Alpha, di mana beberapa
perhitungan yang ditinggalkan karena mereka tidak menambahkan apa-apa
untuk pencarian sukses). Pencarian lokal adalah pendekatan pemecahan
masalah umum yang terdiri dari berbagai macam algoritma yang membantu
Anda menghindari kompleksitas eksponensial banyak NP prob-
lems.SebuahlocalpencariandimulaidariAndamempresentasikansituasiatauseb
uah tidak sempurnasolusi
masalahdanbergerakjauhnyadariitu,sebuahmelangkahatsebuahwaktu.Sebuahl
ocalpencarianmenentukankelangsungan hidup solusi terdekat, berpotensi
mengarah ke solusi sempurna, berdasarkan pilihan acak atau heuristik cerdik
(yang berarti bahwa tidak ada metode yang tepat yang terlibat).

Heuristic adalah menebak tentang solusi, seperti aturan praktis yang menunjuk ke
arah hasil yang diinginkan tetapi tidak bisa tahu persis bagaimana untuk
mencapainya. Ini seperti tersesat di kota yang tidak diketahui dan memiliki orang

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 49
memberitahu Anda cara tertentu untuk mencapai Hotel Anda (tapi tanpa instruksi
yang tepat) atau seberapa jauh Anda dari itu.

Algoritme penelusuran lokal secara iteratif meningkatkan dari keadaan awal,


memindahkan satu langkah sekaligus melalui solusi tetangga di ruang negara
hingga mereka tidak dapat meningkatkan solusi lebih jauh. Karena algoritma
pencarian lokal sangat sederhana dan

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 50
intuitif, merancang pendekatan pencarian lokal untuk masalah algoritmik tidak
diffi-kultus; sehingga efektif biasanya lebih sulit. Kuncinya adalah menentukan
prosedur yang benar:

1. Mulailah dengan situasi yang ada ( bisa jadi situasi sekarang atau acak atau dikenal
larutan).

2. Mencari sekumpulan solusi baru yang mungkin dalam


lingkungan solusi saat ini, yang merupakanparakandidat
'Daftar.

3. Menentukan solusi yang digunakan sebagaitempat solusi saat ini


berdasarkanoutput dariheuristic yang menerima Daftar kandidat
sebagai masukan.

4. Lanjutkan melakukan langkah 2 dan 3 hingga Anda tidak melihat


perbaikan solusi lebih lanjut, yang
berartibahwakamumemilikiparaterbaiksolusinyatersedia.

Meskipun mudah untuk desain, solusi pencarian lokal mungkin tidak


menemukan solusi dalam waktu Rea-sonable (Anda dapat menghentikan proses
dan menggunakan solusi saat ini )ataumenghasilkandengan kualitas
minimumsolusinya.Kamumemilikitidak
adamenjaminbahwasebuahlocalpencarianakantiba
disebuahproblemSolution,tetapiAndakemungkinanmelakukanmenyempurnak
andariparamemulaititiksaat
Andamenyediakancukupwaktubagiparapencarianmelakukanmenjalankanyang
komputasi.Iaperhentianhanya sajasetelah itutidak bisamenemukansetiaplebih
jauh
lagicaramelakukanmenyempurnakanparasolusinya.Pararahasiatidakmelakuka
nmenentukantepatlingkunganmelakukanJelajahi.KalaukamuJelajahisemuanya,
Anda akankejatuhankembalimelakukanyang
lengkappencarian,manamenyiratkansebuahExplosiondarikemungkinanmelak
ukanJelajahidanTest.

Mengandalkan heuristik batas di mana Anda melihat berdasarkan aturan praktis.


Terkadang sebuah heuristik adalah keacak, dan solusi seperti itu, meskipun
menjadi pendekatan yang tidak cerdas, dapat bekerja dengan baik. Hanya sedikit
orang, misalnya, tahu bahwa Roomba, penyedot debu robot auton-omous yang
dibuat oleh tiga lulusan MIT, awalnya tidak merencanakan jalan pembersihan tapi
hanya berkeliaran secara acak. Namun itu dianggap perangkat pintar oleh
pemiliknya dan melakukan pekerjaan pembersihan yang sangat baik. (Kecerdasan
sebenarnya dalam gagasan menggunakan keacak untuk memecahkan masalah
yang sebaliknya terlalu rumit.)

Pilihan acak bukanlah satu-satunya heuristik yang


tersedia.Sebuahlocalpencarianbisabersandardi ataslebih
beralasaneksplorasiSolutionsmenggunakandirancang dengan
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 51
baikheuristikmelakukanmendapatkanarah,seperti dalammendaki bukit-
optimasiatautwiddle,dan menghindari perangkap menerima solusi biasa-biasa
saja,karenadalam tahundisimulasikanAnildantabupencarian.Mendaki
bukitoptimasi,
twiddle,disimulasikanAnildantabupencariantidaksemuapencarianalgoritmeba
hwaeffec-tively menggunakan heuristik untuk mendapatkanbimbingan.

Mendaki bukit mengambil inspirasi dari gaya gravitasi. Ini bergantung pada
observa-tion bahwa sebagai bola menggelinding menuruni lembah, dibutuhkan
keturunan yang paling curam. Ketika memanjat bukit, bola cenderung mengambil
arah ke atas yang paling langsung untuk mencapai puncak, yang merupakan satu
dengan kecenderungan terbesar. Masalah AI, oleh karena itu, dipandang sebagai
keturunan ke lembah atau sebagai pendakian ke puncak gunung, dan heuristik
adalah setiap

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 52
aturan yang mengisyaratkan pendekatan menurun atau menanjak terbaik di antara
negara-negara yang mungkin dari ruang negeri. Ini adalah algoritma yang efektif,
meskipun terkadang mendapat dipukul dalam situasi yang dikenal sebagai dataran
tinggi (Lembah menengah) dan puncak (poin maksimum lokal).

Twiddle, atau koordinat keturunan algoritma, mirip dengan mendaki bukit


algoritma. Twiddle yang heuristic adalah untuk mengeksplorasi semua
kemungkinan arah, tetapi untuk berkonsentrasi pencarian ke arah lingkungan
yang bekerja terbaik. Seperti halnya itu, itu Cali-brates langkah, melambat karena
menemukan kesulitan untuk menemukan solusi yang lebih baik, sampai mencapai
berhenti.

Istilah simulasi Anil mengambil namanya dari teknik metalurgi, yang memanaskan logam
dan kemudian perlahan-lahan mendingin untuk melunakkan logam untuk bekerja dingin
dan menghilangkan Cacat kristalin (Lihat http://www.brighthubengineering.com/
manufaktur-teknologi/30476-apa-adalah-Heat-Treatment/ untuk rincian).Localpencarian
meniru teknik ini dengan melihat pencarian solusi sebagai atomstruc-Ture bahwa
perubahan untuk meningkatkan workability. Suhu adalah permainan Changer dalam
proses optimasi. Sama seperti suhu tinggi membuat struktur bahan rileks (padatan
mencair dan cairan menguap pada suhu tinggi), sehingga suhu tinggi dalam algoritma
pencarian lokal menginduksi relaksasi tujuan func- tion, memungkinkan untuk pra solusi
yang lebih buruk untuk yang lebih baik. Simulasi Anil memodifikasi prosedur mendaki
bukit, menjaga fungsi objektif untuk solusi tetangga evaluasi, tetapi memungkinkan untuk
menentukan pilihan solusi pencarian dengan cara yang berbeda.

Pencarian tabu menggunakan menghafal untuk mengingat Bagian mana dari


lingkungan untuk mengeksplorasi. Ketika tampaknya telah menemukan solusi,
cenderung untuk mencoba menelusuri kembali ke jalur lain yang mungkin tidak
mencoba untuk memastikanterbaiksolusinya.

Menggunakan ukuran arah (ke atas, ke bawah), suhu (dikendalikan berlari-


domness) atau hanya membatasi atau menapak bagian dari pencarian semua cara
untuk secara efektif menghindari mencoba segala sesuatu dan berkonsentrasi pada
solusi yang baik. Con-Sider, misalnya, robot berjalan. Membimbing robot di
lingkungan yang tidak diketahui berarti menghindari rintangan untuk mencapai
target tertentu. Ini adalah tugas yang mendasar dan menantang dalam kecerdasan
buatan. Robot dapat mengandalkan Laser Rangefinder (LIDAR) atau Sonar (yang
melibatkan perangkat yang menggunakan suara untuk melihat lingkungan mereka )
untuk menavigasi mereka Lingkungan. Namun, tidak peduli tingkat hardware
sophistica-tion, robot masih membutuhkan algoritma yang tepat untuk

» Cari jalur terpendek ke tujuan (atau setidaknya yang cukup singkat)


» Menghindari rintangan di jalan
» Melakukan perilaku kustom seperti meminimalkan memutar atau mengerem
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 53
Algoritme pathfinding membantu robot dimulai di satu lokasi dan mencapai tujuan
dengan menggunakan jalur terpendek di antara keduanya, mengantisipasi dan
menghindari rintangan di sepanjang jalan. (Bereaksi setelah memukul dinding
tidak cukup.) Pathfinding juga berguna ketika memindahkan perangkat lain ke
target dalam ruang, bahkan virtual, seperti dalam video game atau halaman web.
Ketika menggunakan pathfinding dengan robot, robot merasakan gerakan sebagai
aliran ruang negara ke perbatasan sensornya. Jika tujuannya tidak dalam
jangkauan, robot tidak akan tahu ke mana harus pergi. Heuristics dapat menunjuk
ke arah yang benar (misalnya, dapat mengetahui bahwa target adalah di arah
utara) dan membantu untuk menghindari rintangan secara tepat waktu tanpa
harus menentukan semua cara yang mungkin untuk melakukannya .

Menemukan mesin belajar


Semua contoh algoritmik sejauh ini terkait dengan AI karena mereka adalah solusi cerdas
yang memecahkan masalah yang berulang-ulang dan dibatasi dengan baik, namun rumit,
yang membutuhkan kecerdasan. Mereka membutuhkan seorang arsitek yang mempelajari
masalah dan memilih algoritma yang tepat untuk menyelesaikannya. Masalah perubahan,
mutasi, atau menampilkan karakteristik yang tidak biasa dapat menjadi masalah nyata
untuk keberhasilan pelaksanaan algoritma. Hal ini karena belajar masalah dan solusinya
terjadi sekali dan untuk semua pada saat algoritma muncul dalam perangkat lunak.
Misalnya, Anda dapat dengan aman program AI untuk memecahkan Sudoku (permainan
populer yang mengharuskan Anda untuk menempatkan nomor di papan sesuai dengan
aturan tertentu: https://www.Learn-Sudoku.com/What-is-Sudoku.HTML). Anda bahkan
dapat memberikan fleksibilitas yang memungkinkan algoritma untuk menerima lebih
banyak aturan atau papan yang lebih besar kemudian. Peter Norvig, Direktur penelitian di
Google, telah menulis esai yang sangat menarik tentang topik ini
(http://norvig.com/Sudoku.HTML) yang menunjukkan bagaimana bijaksana
penggunaan kedalaman-pertama pencarian, membatasi jumlah komputasi (jika tidak
perhitungan dapat mengambil selamanya), menggunakan kendala, dan menjelajahi cabang
yang lebih kecil pertama dapat membuat solusi Sudoku mungkin.

Sayangnya, tidak semua masalah dapat mengandalkan solusi seperti Sudoku.


Masalah kehidupan nyata tidak pernah diatur dalam dunia sederhana dari
informasi yang sempurna dan tindakan yang didefinisikan dengan baik.
Pertimbangkan masalah menemukan kecurangan penipu pada klaim asuransi atau
masalah mendiagnosis penyakit medis:

» Satu set besar aturan dan kemungkinan: jumlah kemungkinan penipuan adalah
sangat tinggi; banyak penyakit memiliki gejala yang sama.

» Informasi yang hilang: penipu dapat menyembunyikan informasi; dokter sering mengandalkan
informasi yang tidak lengkap (pemeriksaan mungkin hilang).

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 54
» Aturan masalah tidak dapat berubah: penipu menemukan cara baru untuk mengatur
penipuan atau penipu;barupenyakit timbulatauditemukan.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 55
Untuk memecahkan masalah tersebut, Anda tidak dapat menggunakan pendekatan
yang telah ditentukan, tetapi perlu pendekatan yang fleksibel dan harus
mengumpulkan pengetahuan yang berguna untuk menghadapi setiap baru Chal-
lenge. Dengan kata lain, Anda terus belajar, sebagai manusia harus dilakukan
sepanjang hidup mereka untuk mengatasi lingkungan yang berubah dan
menantang.

Memanfaatkan sistem pakar


Sistem ahli adalah usaha pertama untuk melarikan diri dari dunia keras-kode algo-
rithms dan menciptakan cara yang lebih fleksibel dan cerdas untuk memecahkan
masalah kehidupan nyata. Ide pada inti dari sistem ahli sederhana dan cocok pada
saat ketika Stor-ing dan berurusan dengan banyak data dalam memori komputer
masih mahal. Ini mungkin terdengar aneh hari ini, tetapi pada tahun 1970-an
seorang ilmuwan AI seperti Ross Quillian harus menunjukkan bagaimana untuk
membangun model bahasa bekerja berdasarkan Kosakata hanya 20 kata karena
memori komputer dari waktu bisa memegang hanya itu banyak. Beberapa pilihan
yang tersedia jika komputer tidak dapat memegang semua data, dan solusi adalah
untuk menangani informasi masalah kunci dan mendapatkannya dari manusia
yang tahu yang terbaik.

Ahli sistem tidak ahli karena mereka mendasarkan pengetahuan mereka pada proses
belajar mereka sendiri, melainkan karena mereka mengumpulkan dari ahli
manusia yang memberikan sistem dicerna informasi kunci yang diambil dari
belajar buku, belajar dari ahli lain, atau menemukan sendiri. Pada dasarnya ini
adalah cara cerdas untuk mengekstersialisasi pengetahuan ke dalam sebuah mesin.

Contoh dari salah satu sistem pertama semacam ini adalah Mycin, sebuah sistem
untuk mendiagnosa penyakit pembekuan darah atau infeksi yang disebabkan oleh
bakteri, seperti bakteria (Bac-Teria menginfeksi darah) dan meningitis (peradangan pada membran
yang pro-dungi
BraindanSpinalkabel).Mycindirekomendasikanparatepatdosisdariantibiotik
dengan menggunakan lebih dari 500 aturan dan itu bergantung, bila diperlukan,
pada dokter menggunakan sistem. Ketika tidak ada informasi yang cukup, misalnya
tes laboratorium yang hilang, MYCIN kemudian memulai dialog konsultatif dengan
mengajukan pertanyaan yang relevan untuk mencapai diagnosis dan terapi yang
percaya diri .

Ditulis dalam LisP sebagai disertasi doktor oleh Edward Shortliffe di Stanford
UNIVER-sitas, MYCIN mengambil alih lima tahun untuk menyelesaikan dan
dilakukan lebih baik daripada dokter Junior, mencapai akurasi diagnosis
ditinggikan dokter yang berpengalaman. Itu berasal dari laboratorium yang sama
yang merancang DENDRAL, sistem ahli pertama yang pernah CRE-ated, beberapa
tahun sebelumnya. DENDRAL, yang mengkhususkan diri dalam kimia organik,
adalah aplikasi yang menantang di mana Brute-Force algoritma terbukti tidak
layak ketika dihadapkan dengan heuristik berbasis manusia yang mengandalkan
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 56
pengalaman lapangan.

Adapun keberhasilan MYCIN, beberapa masalah muncul. Pertama, persyaratan


tanggung jawab tidak jelas. (Jika sistem itu untuk memberikan diagnosis yang
salah, yang mengambil individual-ity?) Kedua, MYCIN memiliki masalah kegunaan
karena dokter harus terhubung ke MYCIN dengan menggunakan terminal remote
ke Mainframe di Stanford, sesuatu yang cukup

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 57
sulit dan lambat pada saat Internet masih pada masa pertumbuhan. MYCIN masih
terbukti khasiat dan kegunaan dalam mendukung keputusan manusia, dan
membuka jalan bagi banyak sistem ahli lain yang berkembang biak kemudian di
tahun 1970-an dan 1980-an.

Umumnya, sistem ahli dari waktu itu terbuat dari dua komponen yang berbeda:
basis pengetahuan dan mesin inferensi. Basis pengetahuan mempertahankan
pengetahuan sebagai kumpulan aturan dalam bentuk pernyataan if-Then (dengan
jika melibatkan satu atau Mul-tiple kondisi dan kemudian melibatkan pernyataan
kesimpulan). Pernyataan ini terjadi dalam bentuk simbolis, membedakan antara
instance, (peristiwa tunggal atau fakta), kelas, dan subkelas, yang semuanya bisa
dimanipulasi dengan menggunakan logika Boolean atau logika orde pertama yang
canggih, yang terdiri dari lebih banyak kemungkinan operasi .

Pertama-Orde logika adalah seperangkat operasi yang melampaui hanya terikat untuk
menggabungkan pernyataan benar dan palsu. Sebagai contoh, ia memperkenalkan konsep
seperti untuk semua atau ada ada, memungkinkan Anda untuk menangani pernyataan
yang mungkin benar, tetapi tidak dapat dibuktikan dengan bukti yang Anda miliki di
tangan pada saat itu. Anda dapat membaca dan menemukan lebih banyak tentang bentuk
logika ini mulai dari artikel ini: http:// whatis.techtarget.com/Definition/First-
order-Logic.

Mesin inferensi adalah seperangkat instruksi yang memberitahu sistem bagaimana


memanipulasi kondisi berdasarkan set logika Boolean operator
sepertikarenaDan,Atau,Tidak.Menggunakan set logika ini, True (sebuah aturan
dipicu atau, secara teknis, "dipecat") atau false (aturan tidak berlaku) kondisi
simbolis dapat menggabungkan menjadi komplekspenalaran.

Karena sistem ini dibuat pada inti dari serangkaian IFS (kondisi) dan thens
(kesimpulan), dan bersarang dan terstruktur dalam lapisan, memperoleh Informa-
awal membantu mengesampingkan beberapa kesimpulan sementara juga
membantu sistem berinteraksi dengan pengguna mengenai informasi yang dapat
menyebabkan jawaban. Ketika berhadapan dengan mesin inferensi, operasi umum
oleh sistem ahli adalah sebagai berikut:

» Teruskan chaining: bukti yang tersedia memicu serangkaian aturan dan dikecualikan
orang lain pada setiap tahapan.Parasistemnyaawalnyaterkonsentrasidi
atasperaturanbahwabisapemicusebuahakhirkesimpulandenganpenembakan.IniApproachtid
akjelasdatadidorong.

» Backward chaining: sistem mengevaluasi setiap kesimpulan yang mungkin dan mencoba
untuk membuktikan masing-masing atas dasarbuktitersedia.Ini
pendekatan berbasis sasaran membantu menentukan pertanyaan mana yang
harus diajukan dan mengecualikan seluruh kumpulan
sasaran.Mycindigunakanbackwardchaining;majudarihipotesisbackwardmelakukanbuktitidakseb
uahumum terjadiStrategydalam tahunpengobatandiagnosis.

» Resolusi konflik : jika sistem mencapai lebih dari satu kesimpulan pada saat yang
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 58
sama , bantuan sistem kesimpulan yang memiliki karakteristik tertentu (dalam hal dampak,
risiko, atau faktor lain
).KadangparasistemnyaberkonsultasiparapenggunadanparaResolutiontidakterwujudberpusatdi
ataspenggunaevaluasi.Bagiinstance,MycindigunakansebuahkepastianFactorbahwataksiranpa
raprobabilitasdaridiagnosisketepatan.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 59
Salah satu keuntungan besar dari sistem tersebut adalah untuk mewakili
pengetahuan dalam bentuk yang dapat dibaca manusia, render sebuah keputusan
transparan untuk memahami dan modifica-tion. Jika sistem mencapai kesimpulan,
itu mengembalikan aturan yang digunakan untuk mencapai kesimpulan itu.
Pengguna secara sistematis dapat meninjau pekerjaan sistem dan setuju atau
meninjau untuk tanda kesalahan input. Selain itu, sistem ahli yang mudah untuk
Pro-gram menggunakan bahasa seperti LisP atau ALGOL. Pengguna meningkatkan
sistem ahli seiring berjalannya waktu dengan menambahkan aturan baru atau
memperbarui aturan yang ada. Mereka bahkan bisa dibuat untuk bekerja melalui
kondisi yang tidak menentu dengan menerapkan logika Fuzzy (semacam logika
multi-nilai yang nilainya dapat berisi apa-apa antara 0, atau benar-benar palsu, dan
1, atau mutlak benar). Logika Fuzzy menghindari langkah mendadak memicu
aturan berdasarkan ambang batas. Misalnya, jika aturan diatur untuk memicu
ketika ruangan panas, aturan tidak dipicu pada suhu yang tepat tetapi lebih ketika
suhu sekitar ambang batas itu. Sistem Expert menyaksikan senja pada akhir 1980-
an, dan perkembangannya dihentikan, sebagian besar karena alasan berikut :

» Logika dan simbolisme dari sistem tersebut terbukti terbatas dalam mengekspresikan aturan
di balik keputusan, mengarah ke penciptaan sistem kustom , yaitu , jatuh kembali lagi
pada aturan pengkodean keras dengan algoritme klasik.
» Untuk banyak masalah yang menantang, sistem ahli menjadi begitu kompleks dan
rumit bahwa mereka kehilangan daya tarik mereka dalam hal kelayakan dan biaya ekonomi.

» Karena data menjadi lebih menyebar dan tersedia, itu membuat sedikit akal untuk berjuang
untukcermat wawancara, mengumpulkan,danpengetahuan ahli yang masih langka saatparasama
seperti(atau bahkan lebih baik)pengetahuanbisamenjadidiayakdaridata.

Sistem ahli masih ada. Anda dapat menemukan mereka digunakan dalam penilaian
kredit, pelepasan penipuan, dan bidang lain dengan keharusan untuk tidak hanya
memberikan jawaban tetapi juga jelas dan transparan menyatakan aturan di balik
keputusan dengan cara yang dianggap pengguna sistem diterima (sebagai ahli
subjek akan dilakukan).

Memperkenalkan pembelajaran mesin


Solusi mampu belajar langsung dari data tanpa prepencernaan untuk Ren-der itu
sebagai simbol muncul beberapa dekade sebelum sistem ahli
.SebagianmasihStatistik di alam; lain meniru alam dengan cara yang berbeda; dan
masih lain mencoba gen-masyarakat secara otonom simbolis logika dalam bentuk
aturan dari informasi mentah. Semua solusi ini berasal dari sekolah yang berbeda
dan muncul di bawah nama yang berbeda yang saat ini terdiri dari pembelajaran
mesin. Pembelajaran mesin adalah bagian dari dunia algoritma, meskipun,
bertentangan dengan banyak algoritma yang dibahas sejauh ini, itu tidak
dimaksudkan sebagai serangkaian standar langkah apt untuk memecahkan
masalah. Sebagai aturan, pembelajaran mesin berurusan dengan masalah bahwa

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 60
manusia tidak tahu bagaimana untuk detail ke dalam langkah-langkahnya, tetapi
bahwa manusia secara alami memecahkan. Contoh dari masalah seperti itu adalah
mengenali wajah dalam gambar atau kata tertentu dalam pembahasan yang
diucapkan. Pembelajaran mesin adalah

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 61
disebutkan di hampir setiap bab buku ini, tetapi Bab 9 sampai 11 dikhususkan untuk
mengungkapkan bagaimana algoritma pembelajaran mesin besar bekerja,
terutama mendalam belajar-ing, yang merupakan teknologi memberdayakan
gelombang baru aplikasi Ai yang mencapai berita utama hampir setiap hari.

Menyentuh ketinggian baru


Peran mesin belajar di gelombang baru algoritma Ai adalah sebagian mengganti, di bagian
suplemen, algoritma yang ada dengan render kegiatan yang dapat diakses yang
memerlukan kecerdasan dari sudut pandang manusia yang tidak mudah untuk
memformalkan sebagai pra Cise urutan langkah. Sebuah contoh yang jelas dari peran ini
adalah penguasaan ditampilkan oleh seorang Go-Expert yang, sekilas, memahami ancaman
dan peluang dari konfigurasi papan dan menangkap intuisi yang tepat bergerak. (Baca
sejarah Go di http://www.usgo.org/Brief-History-Go.)

Go adalah permainan yang sangat kompleks untuk AI. Catur memiliki 35 yang mungkin
bergerak untuk mengevaluasi di papan, dan permainan biasanya mencakup lebih dari 80
bergerak, sementara permainan Go memiliki sekitar 140 bergerak untuk mengevaluasi,
dan permainan biasanya mencakup lebih dari 240 bergerak. Tidak ada kekuatan
komputasi saat ini ada di dunia untuk menciptakan negara-ruang lengkap untuk
permainan Go. Tim DeepMind Google di London mengembangkan AlphaGo, sebuah
program yang telah mengalahkan sejumlah pemain Go peringkat atas (lihat
https://deepmind.com/Research/alphago/). Program ini tidak bergantung pada
pendekatan algoritmik yang didasarkan pada pencarian sebuah State-space yang sangat
besar, melainkan menggunakan yang berikut ini:

» A Smart- metode pencarian berdasarkan tes acak kemungkinan bergerak.ParaAi


berlakusebuahmendalam-pertamapencarianbanyakkali
lipatmelakukanmenentukanApakahparahasil
pertamaditemukantidaksebuahpositiveataunegativesalah satu( tidak lengkap dan
sebagian ruang negara ).

» A Deep-Learning algoritma proses gambar dari papan ( sekilas) dan berasal


baikterbaikdimungkinkanberpindahdalam tahunbahwasituasi( algoritma disebut
jaringankebijakan)dansebuahmemperkirakandaribagaimana
carakemungkinanparaAitidakmelakukanMenangkanparagamemenggunakanbahwaber
pindah( algoritma disebut jaringannilai).

» Sebuah kemampuan untuk belajar dengan melihat game masa lalu oleh para ahli Go dan
bermain melawan dirinya sendiri, seperti yang dilakukan WOPR dalam film 1983 WarGames
.SebuahRecentversidariprogram, yang disebut AlphaGo Zero,bisaPelajariAll olehitu sendiri,
tanpasetiapcontoh manusia (lihat https://deepmind.com/blog/alphago-Zero-Learning-
Scratch/).Inipembelajarankemampuantidakdisebutpenguatanbelajar.

Bab 3 Mempertimbangkan Tje Menggunakan dari


Algoritma 62
Bab 3 Mempertimbangkan Tje Menggunakan dari
Algoritma 63
DALAM BAB INI

Bab ke- 4
Perintis hardware khusus

I
n Bab 1, Anda menemukan bahwa salah satu alasan untuk kegagalan awal Ai Upaya
Adalah a Kekurangan dari Cocok Hardware. Tje Hardware Hanya Tidak Melakukan
Tugas Cepat Cukup Untuk Bahkan Biasa Kebutuhan Banyak Kurang Sesuatu Sebagai
Kompleks Sebagai simulasi pikiran manusia. Masalah ini dijelaskan dengan panjang Tje
Bergerak Imitasi Permainan (https://www.amazon.com/exec/obidos/ASIN/B00RY86HSU/
datacservip0f-20/), In Yang Alan Turing Akhirnya Retak Tje Enigma Kode Oleh
dengan cerdik mencari frasa tertentu, "Heil Hitler," di setiap Pesan. Tanpa yang cacat
tertentu dalam cara yang operator menggunakan Enigma, komputer Peralatan Yang
Turing Digunakan Akan Pernah Hve Bekerja Cepat Cukup Untuk Memecahkan Tje
masalah (dan bergerak tidak memiliki sejumlah kecil mengeluh tentang masalah). Jika
setiap Hal Tje Sejarah Account — Apa Sedikit dari Itu adalah Sepenuhnya
dideklasifikasi — Menunjukkan Yang Masalah Turing lebih mendalam daripada film yang
diungkapkan (Lihat https:// www.scienceabc.com/innovation/cracking-the-uncrackable-
how-did-alan- Turing-and-His-Team-Crack-The-Enigma-Code. html Untuk rincian). Untungnya
Standar Rak Hardware Dapat Mengatasi Tje Kecepatan Masalah Untuk Banyak
masalah hari ini, yang mana bab ini dimulai.

Untuk benar mulai untuk mensimulasikan pikiran manusia memerlukan perangkat keras
khusus, dan bahkan yang terbaik perangkat keras khusus tidak sampai tugas hari ini.
Hampir semua perangkat keras standar bergantung pada arsitektur von Neumann
(http://www.c-Jump.com/CIS77/ CPU/VonNeumann/Lecture.html), yang
memisahkan memori dari komputasi, CRE- Ating indah lingkungan pengolahan generik yang
hanya tidak bekerja dengan baik

BAB KE 4 Perintis Khusus Hardware 55


untuk beberapa jenis algoritma karena kecepatan bus antara prosesor dan memori
menciptakan bottleneck von Neumann.Bagian kedua dari bab ini membantu Anda
memahami berbagai metode yang digunakan untuk mengatasi kemacetan von
Neumann sehingga kompleks, data algoritma intensif berjalan lebih cepat.

Bahkan dengan hardware kustom yang dirancang khusus untuk mempercepat


komputasi, sebuah mesin yang dirancang untuk mensimulasikan pikiran manusia
dapat berjalan hanya secepat input dan output akan memungkinkan. Akibatnya,
orang bekerja untuk menciptakan lingkungan yang lebih baik di mana perangkat
keras dapat beroperasi.Iniperlubisamenjadidiatasidalam
tahunsebuahNumberdaricara, tapi bab ini terlihat pada dua: meningkatkan
kemampuan yang mendasari hard-ware dan menggunakan sensor khusus.
Perubahan ini untuk lingkungan hardware bekerja dengan baik, tetapi sebagai
bahan berikut menjelaskan, masih belum cukup untuk membangun otak manusia .

Pada akhirnya, perangkat keras tidak berguna, bahkan dengan perangkat


tambahan, jika manusia yang bergantung padanya tidak dapat berinteraksi
dengannya secara efektif. Bagian terakhir dari bab ini menjelaskan teknik untuk
membuat interaksi tersebut lebih efisien. Interaksi ini hanyalah hasil dari
kombinasi dari output yang disempurnakan dan pemrograman yang cerdas. Sama
seperti Alan Turning menggunakan trik untuk membuat komputernya tampak
berbuat lebih banyak daripada yang bisa dilakukan, teknik ini membuat komputer
modern terlihat seperti pekerja keajaiban. Bahkan, komputer mengerti apa-apa;
Semua kredit pergi ke orang yang memprogram komputer.

Mengandalkan perangkat keras standar


Kebanyakan proyek Ai yang Anda buat setidaknya akan dimulai dengan hardware
standar karena komponen modern off-the-Shelf sebenarnya memberikan daya
pemrosesan yang signifikan, terutama bila dibandingkan dengan komponen dari
tahun 1980-an ketika AI pertama mulai menghasilkan hasil yang dapat digunakan.
Akibatnya, bahkan jika Anda tidak dapat akhirnya melakukan pekerjaan tingkat
Pro-duction dengan menggunakan perangkat keras standar, Anda bisa
mendapatkan cukup jauh bersama dengan kode eksperimental dan pra-produksi
untuk membuat model kerja yang pada akhirnya akan memproses dataset penuh.

Memahami perangkat keras standar


Arsitektur (struktur) dari PC standar belum berubah sejak John von Neumann pertama kali
diusulkan dalam 1946 (lihat artikel di https://www.Maa.org/
external_archive/Devlin/devlin_12_03. html untuk rincian). Meninjau his-Tory di
https://lennartb.Home.xs4all.nl/coreboot/col2.html menunjukkan bahwa prosesor
terhubung ke memori dan perangkat periferal melalui bus di PC produk sedini1981(dan
BAB KE 4 Perintis Khusus Hardware 56
jauh sebelum).SemuainiSystemsgunakanparaVon

BAB KE 4 Perintis Khusus Hardware 57


Arsitektur Neumann karena arsitektur ini memberikan manfaat yang signifikan
dalam modularitas. Membaca sejarah memberitahu Anda bahwa perangkat ini
memungkinkan upgrade ke setiap komponen sebagai keputusan individu,
memungkinkan peningkatan kemampuan.Misalnya, dalam batas, Anda dapat
meningkatkan jumlah memori atau penyimpanan yang
dapatmelakukansetiapPC.Kamubisajugagunakanmajuperiferal.Namun
demikian,semuainielemen terhubung melaluibus.

Bahwa PC menjadi lebih mampu tidak mengubah fakta penting Architec-Ture. Jadi, PC yang
Anda gunakan saat ini memiliki arsitektur yang sama dengan perangkat yang dibuat sejak
lama; mereka hanya lebih mampu. Selain itu, faktor bentuk perangkat tidak
mempengaruhi arsitekturnya, baik. Komputer di mobil Anda bergantung pada sistem bus
untuk konektivitas yang secara langsung bergantung pada arsitektur von Neumann.
(Bahkan jika jenis bus berbeda, arsitekturnya sama.) Jangan sampai Anda berpikir
perangkat apapun tetap tidak terpengaruh, lihat diagram blok untuk BlackBerry di http://
mobilesaudi.blogspot.com/2011/10/All-BlackBerry-Schematic-Complete.HTML. Itu,juga,
bergantung pada konfigurasi von Neumann. Akibatnya, hampir setiap perangkat Anda
dapat memahami hari ini memiliki arsitektur yang sama, meskipun memiliki faktor bentuk
yang berbeda, jenis bus , dan kemampuan penting .

Menggambarkan kekurangan hardware standar


Kemampuan untuk membuat sistem modular memang memiliki manfaat yang
signifikan, terutama dalam bisnis. Kemampuan untuk menghapus dan mengganti
komponen individu menjaga biaya rendah sementara memungkinkan perbaikan
inkremental dalam kecepatan dan efisiensi. Bagaimana-pernah, seperti
kebanyakan hal, tidak ada makan siang gratis. Modularitas yang disediakan oleh
arsitektur von Neumann datang dengan beberapa kekurangan yang serius:

» Von Neumann bottleneck: dari semua kekurangan, yang von Neumann botol- leher
adalah yang palingSerioussaatmempertimbangkanparapersyaratandaridisiplinseperti
itukarenaAI,mesinLearning,danbahkandatailmu pengetahuan.Kamubisamenemukaniniparticu-
Lardefisiensidibahasdalam tahunlebih banyakterperincidalam tahunpara"MengingatparaVon
Yang "sangat cocok untuk..." Bagian,belakangandalam tahuninibab ini.
» Titik tunggal kegagalan: setiap kehilangan konektivitas dengan bus tentu berarti
bahwaComputergagalsegera,agakdari sekadaranggun.Bahkandalam
sistemdenganbanyakprosesor,pararugidarisebuahSingleproses,manaseharusnya
hanyamenghasilkansebuahrugidarikemampuan,malahmenimbulkanlengkapsistemnyakegaga
lan.Parasama
sepertiproblemterjadidenganpararugidarilainnyasistemnyakomponen:Malahdarimengurangi
fungsi,paraseluruhsistemnyagagal.DiberikanbahwaAikerap kalimensyaratkanterus
menerussistemnyaoperasi,parapotensialbagiSeriouskonsekuensimeningkatdenganparam
annerdalam tahunmanasebuahaplikasinyabergantungdi atasparaperangkat keras.

BAB KE 4 Perintis Khusus Hardware 58


» Single-mindedness: bus von Neumann dapat mengambil instruksi atau mengambil data
diperlukan untuk mengeksekusi instruksi, tetapi tidak dapat melakukan keduanya.Akibatnya,
ketika pengambilan data memerlukan beberapabiscycles,paraprosesortetap
beradaidle,mengurangiyangabilitasmelakukanberperformainstruksi-intensifAiTasks
bahkan lebih.

» Tasking: ketika otak melakukan tugas, sejumlah api sinapsis pada satu waktu,
memungkinkan eksekusi simultan dari beberapa operasi.ParaorisinalVon Yang
berdesaindiperbolehkanhanya sajasalah satuoperasinyaatsebuahwaktu,danhanya
sajasetelahsistemdiambilkeduaparadiharuskaninstruksidandata.Computershari ini
biasanyamemilikibanyakCores,manaIzinkanserentakExecutiondariOpera-tionsdalam
tahuntiapinti.Namun demikian,aplikasinyakode etikmestisecara
khususAddressinipersyaratan,begituparafungsionalitasnyakerap kalitetap berada tidak
terpakai.

MENELITI PERBEDAAN ARSITEKTUR


HARVARD
Anda mungkin menemukan arsitektur Harvard selama perjalanan perangkat keras Anda karena beberapa
sistem menggunakandimodifikasibentukdariiniarsitekturmelakukankecepatanpengolahan.KeduaparaVon
Yang ArsitekturdanHarvardArsitekturbersandardi atassebuahbistopologi.
Namun, ketika bekerja dengan sistem arsitektur von Neumann , perangkat keras bergantung pada bus
tunggal dan area memori tunggal untuk kedua instruksi dan data, sedangkan Harvard Arsitektur
bergantung pada bus individu untuk instruksi dan data, dan dapat menggunakan area memori fisik yang
terpisah(Lihat perbandingan di
http://infocenter.ARM.com/help/topic/com.ARM.doc.FAQs/ka3839.html). Penggunaan bus individu
memungkinkan sistem arsitektur Harvard untuk mengambil instruksi berikutnya
sementaramenunggubagidatamelakukantibadariingatanbagiparasaat iniinstruksi, dengan
demikianmembuatparaHarvardArsitekturkedualebih cepatdanlebih banyakefisien.Namun
demikian,Reliabilitasmenderitakarenakinikamumemilikiduafailurepoinbagitiapoperasi:parainstruksibisda
nparadatabus.

Mikrokontroler, seperti yang kekuatan microwave Anda , sering menggunakan arsitektur Harvard
.Dalam tahunSelain itu,kamumungkinmenemukaniadalam
tahunsebagianUnusualtempatbagisebuahspesifikalasannya.ParaiPhonedanXbox360keduagunakandimodifikas
iVersionsdariparaHarvardArsitekturbahwabersandardi atassebuahSingleingatanarea(bukan
dua),tetapimasihbersandardi atasPisahkanbus.Paraalasannyabagimenggunakanparaarsitekturdalam
tahuninikasustidakDigitalHak asasiManajemennya(DRM).Kamubisamembuatparakode
etikareadariingatanbaca-sajabegitubahwatidak adasalah
satubisamodifikasiiaatauciptakanbaruaplikasitanpa
harusizin.DarisebuahAiperspektif,inibisamenjadibermasalahkarenasalah
satudarisebuahAi'scapabilitiestidakmelakukantulislahbarualgoritme( kode dapat dieksekusi)
karenadibutuhkanmelakukankesepakatandengantak terduga
situasi.KarenaPcsjarangmengimplementasikansebuahArsitektur Harvarddalam
tahunyangPurebentukataukarenayangutamabiskonstruksi,paraHarvardArsitekturBukankahterimabanyakpe
rhatiandalam tahuninibuku.

BAB KE 4 Perintis Khusus Hardware 59


Menggunakan GPU
Setelah membuat pengaturan prototipikal untuk melakukan tugas yang diperlukan
untuk mensimulasikan pemikiran manusia pada topik tertentu, Anda mungkin
perlu perangkat keras tambahan untuk memberikan kekuatan pemrosesan yang
cukup untuk bekerja dengan dataset penuh yang diperlukan dari sistem produksi.
Banyakcaratidaktersediamelakukanmenyediakanseperti
ituProcessingdaya,tetapisebuahcara yang umum adalah dengan menggunakan
Graphic processing unit (GPU) Selain prosesor pusat mesin. Bagian berikut
menjelaskan masalah domain yang alamat GPU, apa yang tepat dimaksudkan
dengan istilah GPU, dan mengapa GPU membuat Pro-cessing lebih cepat.

MENGINGAT ALAN TURING


MESIN BOMBE
Alan Turing mesin bombe bukan bentuk apapun dari AI.Dalam
tahunFaktanya,iaBukankahbahkansebuahnyataComputer.IapecahEnigmakriptografipesan,danituitu.Namun
demikian,iaApakahmenyediakanmakananuntuk
berpikirbagiTuring,manaakhirnyaLEDmelakukansebuahPaperberjudul"KomputasiMachinerydan kecerdasan
"(http://www.loebner.net/Prizef/TuringArticle.html)bahwadiaditerbitkandalam tahunpara1950-
anbahwamenguraikanParaImitasiPermainan.Namun
demikian,paraBombesendirinyamenjadisebenarnyaberpusatdi atassebuahSemirmesindisebutpara
Oleh Bomba.

Meskipun beberapa sumber menyiratkan bahwa Alan bekerja sendirian, bombe Pro- sakramen
denganparamembantudaribanyakorang,paling banyakkhususnyaGordonWelchman.Turingjuga
tidakmusim
semidarisebuahvakum,ReadydibuatmelakukanBreakGermanenkripsi.NyawaktuatPrincetonmenjadimelua
ngkan waktudenganhebatsepertiAlbertEinsteindanJohnvon Yang (siapa yang akan pergi untuk menciptakan
konsep perangkat lunak komputer).ParamakalahTuringmenulisInspiredinilainnyapara
ilmuwanmelakukanbereksperimendanmelihatapa yangtidakdimungkinkan.

Perangkat keras khusus dari segala macam akan terus muncul selama para ilmuwan menulis
makalah, memantul ide dari satu sama lain, menciptakan gagasan baru mereka sendiri, dan
bereksperimen.SaatkamumelihatMoviesataulainnyamedia, dengan asumsibahwamereka sedang
secara historisAccurateatsekali,TidakkahTinggalkandenganparaperasaanbahwainioranghanya
sajaterbangunnaiksalah satupagi,memproklamirkan,"Hari iniSayaakanmenjadi sangat bagus
"danpergidi atasmelakukanmelakukansesuatumenakjubkan.SemuanyaBuilddi
atassesuatulain,begitusejarahtidakpentingkarenaiamembantumenunjukkanparajalurdiikutidanmeneran
gilainnyamenjanjikanPaths— yang orang-belumdiikuti.

BAB KE 4 Perintis Khusus Hardware 60


Mengingat von Neumann kemacetan
Para kemacetan von Neumann adalah hasil alami menggunakan bus untuk
mentransfer data antara prosesor, memori, Penyimpanan jangka panjang, dan
perangkat periferal. Tidak peduli seberapa cepat bus melakukan tugasnya, luar
biasa itu-yaitu, membentuk kemacetan yang mengurangi kecepatan-selalu
mungkin. Seiring waktu, kecepatan prosesor terus meningkat saat memori dan
perbaikan perangkat lainnya fokus pada kepadatan-kemampuan untuk
menyimpan lebih dalam ruang yang lebih sedikit. Akibatnya, kemacetan menjadi
lebih dari masalah dengan setiap perbaikan, menyebabkan prosesor untuk
menghabiskan banyak waktu sedang menganggur.

Dalam alasan, Anda dapat mengatasi beberapa masalah yang melingkupi von
Neumann kemacetan dan menghasilkan kecil, tapi terlihat, peningkatan kecepatan
aplikasi. Berikut adalah solusi yang paling umum:

» Caching: ketika masalah dengan mendapatkan data dari memori cukup cepat dengan
von Neumann Arsitektur menjadi jelas, vendor perangkat keras dengan cepat merespon
dengan menambahkan memori lokal yang tidak memerlukan akses bus
.IniingatanmunculExternalmelakukanparaprosesortetapikarenaBagiandariparaprosesor
Package.Berkecepatan tinggitemboloktidakmahal,Namun
demikian,begitutemboloksizescenderung
menjadi kecil.

» Caching prosesor: Sayangnya, cache eksternal masih tidak memberikan kecepatan yang
cukup.BahkanmenggunakanparatercepatRAMtersediadanCuttingkeluarparabisakses
sepenuhnyaBukankahtemuiparaProcessingkapasitasnyakebutuhandariparaprosesor.
Akibatnya, vendor mulai menambahkan memori internal — sebuah cache lebih kecil
dari cache eksternal , tetapi dengan akses yang lebih cepat karena itu adalah Bagian
dariprosesor.

» Prefetching: masalah dengan cache adalah bahwa mereka terbukti berguna hanya ketika
mereka mengandungmengoreksidata.Sayangnya,tembolokhitsbuktikanrendahdalam
tahunapplica-
tionsbahwagunakansebuahbanyakdaridatadanberperformasebuahWideragamdariTasks.Pa
raberikutnyamelangkahdalam tahunmembuatpemroseskerjalebih
cepattidakmelakukanmenebakmanadataparaaplikasinyaakanmewajibkanberikutnyadanm
uatiake dalamtemboloksebelumparaaplikasinyamensyaratkanitu.

» Menggunakan Specialty RAM: Anda bisa mendapatkan dimakamkan dengan alfabet


RAM sup karena ada lebih banyak jenis RAM daripada kebanyakan orang
bayangkan.Tiapbaik
hatidariRAMdimaksudkanmelakukanselesaikanatleastBagiandariparaVon Yang
kemacetanmasalah,danmerekamelakukankerja— yang dalam waktulimit.Dalam
tahunpaling banyakkasus,paraimprovementsberputar di
sekitarparaideadarimendapatkandatadariingatandanOntoparabislebih cepat.Dua
besar(dan banyak minor)Factorberpengaruhkecepatan:ingatankecepatan(seberapa
cepatmemori bergerak data)danlatency(berapa lama waktu yang dibutuhkan untuk menemukan
Bagian tertentu dari data).Kamubisabacalahlebih banyaktentang
caraingatandanparaFactorbahwaberpengaruhiaat
http://www.computermemoryupgrade.net/types-of-computer-memory- Common-
BAB KE 4 Perintis Khusus Hardware 61
Uses. html.

BAB KE 4 Perintis Khusus Hardware 62


Seperti banyak bidang lain dari teknologi, hype bisa menjadi masalah. Untuk ujian-
PLE, multithreading, tindakan melanggar sebuah aplikasi atau set instruksi lain ke
dalam unit eksekusi diskrit bahwa prosesor dapat menangani satu pada suatu
waktu, sering disebut-sebut sebagai sarana untuk mengatasi terbottleneck von
Neumann, tetapi tidak actu-Ally melakukan sesuatu yang lebih dari menambahkan
overhead (membuat masalah lebih buruk). Multi-threading adalah jawaban untuk
masalah lain: membuat aplikasi lebih efisien. Ketika aplikasi menambahkan
masalah latensi untuk bottleneck von Neumann, seluruh sistem memperlambat.
Multithreading memastikan bahwa prosesor tidak menyia-nyiakan namun lebih
banyak waktu menunggu pengguna atau aplikasi, melainkan memiliki sesuatu
untuk dilakukan sepanjang waktu. Latensi aplikasi dapat terjadi dengan arsitektur
prosesor apa pun, bukan hanya arsitektur von Neumann. Meskipun demikian, apa
pun yang mempercepat operasi keseluruhan aplikasi dapat dilihat oleh pengguna
dan sistem sebagaiutuh.

Mendefinisikan GPU
Maksud asli dari Graphics Processing Unit (GPU) adalah untuk memproses data
gambar dengan cepat dan kemudian menampilkan gambar yang dihasilkan di
layar. Selama fase awal dari evolusi PC, CPU melakukan semua pengolahan, yang
berarti bahwa grafis bisa muncul perlahan-lahan sementara CPU melakukan tugas
lain. Selama waktu ini, PC biasanya dilengkapi dengan adapter tampilan , yang berisi
sedikit atau tidak ada daya proses-ing. Semua Adapter tampilan adalah untuk
mengubah data komputer menjadi bentuk visual. Bahkan, hanya menggunakan
satu prosesor terbukti hampir tidak bisa dilakukan setelah PC bergerak melewati
menampilkan hanya teks, atau sangat sederhana 16-warna grafis. Namun, GPU
tidak membuat banyak terobosan dalam komputasi sampai orang mulai
menginginkan output 3-D. Pada titik ini, kombinasi dari CPU dan Adapter tampilan
hanya tidak bisa melakukan pekerjaan.

Langkah pertama dalam arah ini adalah sistem seperti Hauppauge 4860
(http://www.geekdot.com/Hauppauge-4860/), yang mencakup CPU dan sebuah SPE-
cial chip grafis (80860, dalam hal ini) pada motherboard. 80860 memiliki keuntungan
dalam melakukan perhitungan sangat cepat (Lihat http://www.cpu-
World.com/CPUs/80860/index.html untuk rincian). Sayangnya, ini Multipro- cessor,
sistem asinkron tidak cukup memenuhi harapan bahwa orang telah untuk mereka
(meskipun mereka sangat cepat untuk sistem waktu) dan mereka terbukti sangat mahal.
Plus, ada seluruh masalah menulis applica- tions yang mencakup kedua (atau berikutnya)
chip. Dua chip juga berbagi memori ( yang ada banyak untuk sistem ini ).

Sebuah GPU memindahkan pemrosesan grafis dari motherboard ke grafis papan


peri. CPU dapat memberitahu GPU untuk melakukan tugas , dan kemudian GPU Deter -
Mines metode terbaik untuk melakukannya secara independen dari
CPU.SebuahGPUmemilikisebuahmemori terpisah, dan jalur data untuk bus sangat
besar. Selain itu, GPU dapat mengakses memori utama untuk mendapatkan data

BAB KE 4 Perintis Khusus Hardware 63


yang diperlukan untuk melakukan tugas dan memposting hasil secara terpisah dari
CPU. Akibatnya, pengaturan ini membuat grafis modern menampilkan mungkin.

BAB KE 4 Perintis Khusus Hardware 64


Namun, apa yang sebenarnya membedakan GPU adalah bahwa GPU biasanya berisi
ratusan Core (lihat http://www.NVIDIA.com/object/What-is-GPU-Computing.html untuk
detailnya), kontras dengan hanya beberapa Core untuk CPU. Meskipun CPU menyediakan
fungsi yang lebih umum-tujuan, GPU melakukan perhitungan sangat cepat dan dapat
memindahkan data dari GPU ke layar lebih cepat. Kemampuan ini adalah apa yang
membuat GPU tujuan khusus komponen penting dalam sistem saat ini .

Mengingat mengapa GPUs bekerja dengan baik


Seperti chip 80860 yang dijelaskan di bagian sebelumnya, GPU saat ini unggul
dalam melakukan tugas khusus yang terkait dengan pemrosesan grafis, termasuk
bekerja dengan vektor. Semua Core melakukan tugas secara paralel sangat
mempercepat penghitungan AI.

Di 2011, Google Brain Project (https://Research.Google.com/teams/Brain/) melatih AI


untuk mengenali perbedaan antara kucing dan orang dengan menonton film di Youtube.
Namun, untuk membuat tugas ini berfungsi, Google menggunakan 2.000 CPU di salah satu
pusat data raksasa Google. Hanya sedikit orang yang memiliki sumber daya yang
diperlukan untuk meniru karya Google .

Di sisi lain, Bryan Catanzaro (tim peneliti NVidia) dan Andrew ng (Stanford) mampu
meniru karya Google menggunakan satu set 12 NVidia GPU (Lihat
https://Blogs.NVIDIA.com/blog/2016/01/12/Accelerating-Ai-Artificial- Intelijen-GPUs/
untuk rincian).SetelahorangdimengertibahwaGPUsbisamengganti sejumlah sistem
komputer yang penuh dengan CPU, mereka bisa mulai bergerak maju dengan berbagai
proyek AI. Pada 2012, Alex Krizhevsky (Toronto University) memenangkan ImageNet
kompetisi pengenalan gambar komputer menggunakan GPU. Bahkan, sejumlah peneliti
sekarang telah menggunakan GPU dengan sukses luar biasa (Lihat artikel di
https://adeshpande3.GitHub.io/The-9-Deep-Learning-Papers-you-need- to-know-about.
html untuk rincian).

Menciptakan lingkunganpengolahan khusus


Pembelajaran yang mendalam dan Ai keduanya non-proses von Neumann,
menurut banyak ahli seperti Massimiliano Versace, CEO neurala Inc
(https://www.neurala.com/). Karena tugas algoritma melakukan tidak cocok
dengan perangkat keras dasar, segala macam ketidakefisienan ada, hacks
diperlukan, dan mendapatkan hasil jauh lebih sulit daripada yang seharusnya. Oleh
karena itu, merancang hard-ware yang sesuai dengan perangkat lunak cukup
menarik.ParaDefenseMajuProyek penelitianAgensi(DARPA)melakukansalah
satuseperti ituproyekdalam tahunparabentukdariSystemsdari

BAB KE 4 Perintis Khusus Hardware 65


Neuromorphic adaptif plastik scalable Electronics (SyNAPSE). Ide di balik pendekatan ini
adalah untuk menduplikasi pendekatan alam untuk memecahkan masalah dengan
menggabungkan memori dan pemrosesan daya, daripada menjaga keduanya terpisah.
Mereka sebenarnya membangun sistem (itu sangat besar), dan Anda dapat membaca lebih
lanjut tentang hal itu di http://www.artificialbrains.com/DARPA-synapse-program.

Proyek SyNAPSE bergerak maju. IBM membangun sistem yang lebih kecil dengan
menggunakan teknologi mod- Ern yang sangat cepat dan hemat daya (Lihat
http://www.Research.IBM.com/Cognitive-Computing/neurosynaptic-chips.shtml). Satu-satunya
masalah adalah bahwa tidak ada orang yang membeli mereka. Sama seperti banyak orang
akan berpendapat bahwa Betamax adalah cara yang lebih baik untuk menyimpan data dari
VHS, VHS memenangkan biaya, kemudahan penggunaan, dan fitur menarik (Lihat
https://Gizmodo.com/Betamax-vs-VHS- Bagaimana-Sony-hilang-The-asli-rumah-
video-1591900374). Hal yang sama berlaku untuk IBM synapse menawarkan, TrueNorth.
Mencoba untuk menemukan orang yang bersedia membayar harga yang lebih tinggi,
programer yang dapat mengembangkan perangkat lunak dengan menggunakan arsitektur
baru, dan produk yang benar-benar manfaat dari chip telah keras. Akibatnya, kombinasi
CPU dan GPU, bahkan dengan sifat lemah yang melekat , terus menang .

Akhirnya, seseorang mungkin akan membangun sebuah chip yang lebih mirip Bio- Logic
setara dengan otak. Sistem saat ini mungkin akan menjadi tidak mampu menghasilkan
peningkatan yang diinginkan dalam daya komputasi. Pada kenyataannya, perusahaan
seperti Google bekerja pada alternatif seperti tensor processing unit (TPU), yang
sebenarnya melihat digunakan dalam aplikasi seperti Google Search, Street View, Google
foto, dan Google Translate https://Cloud.Google.com/blog/Big-
(Lihat
data/2017/05/an-in-mendalam-Look-at-Googles-pertama-tensor-Processing- unit-TPU).
Karena Anda sekarang memiliki teknologi yang digunakan untuk aplikasi skala besar yang
sebenarnya, beberapa orang juga membeli chip, beberapa programmer tahu bagaimana
menulis aplikasi untuk mereka, dan produk menarik ada yang menuntut orang. Tidak
seperti SyNAPSE, TPU juga mengandalkan teknologi aplikasi khusus terpadu Circuit (ASIC)
yang dipahami dengan baik yang telah terlihat digunakan dalam berbagai applica-tions,
jadi apa yang sebenarnya dilakukan Google adalah repurpose teknologi yang ada.
Akibatnya, kemungkinan semacam ini chip berhasil di pasar jauh lebih tinggi daripada
sesuatu seperti sinaps, yang bergantung pada teknologi yang sama sekali baru .

Meningkatkan kemampuan perangkat keras


CPU masih bekerja dengan baik untuk sistem bisnis atau dalam aplikasi di mana
kebutuhan untuk fleksibilitas umum dalam pemrograman melebihi kekuatan
pemrosesan murni .Namun, GPU sekarang menjadi standar untuk berbagai jenis
ilmu data, pembelajaran mesin, AI, danpembelajaran
mendalamkebutuhan.DariCourse,semua
orangtidaksenantiasaLookingbagiparaberikutnyahal besar dalam lingkungan

BAB KE 4 Perintis Khusus Hardware 66


pengembangan. Kedua CPU dan GPU adalah tingkat produksi

BAB KE 4 Perintis Khusus Hardware 67


Prosesor. Dalam tahunparamasa depan,kamuMeimelihatsalah
satudariduamacamdaripemrosesdigunakandalam tahuntempat inistandar:

» Aplikasi sirkuit terpadu tertentu (ASICs): berbeda dengan prosesor umum ,


vendor menciptakan ASIC untukspesifiktujuan.SebuahASICsolusi
menawarkansangatFastperformansimenggunakansangatsedikitdaya,tetapiia tidak
memilikiflexibil-
ity.SebuahcontohdarisebuahASICsolusinyatidakGoogle'sTensorProcessingKesatuan(TPU),
yang digunakan untuk pemrosesan ucapan (Lihat https://Cloud.Google.com/
blog/Big-data/2017/05/an-In-depth-Look-at-Googles-pertama- tensor-
processing-unit-TPUbagirincian).

» Bidang Programmable Gate array (fpgas): seperti dengan ASIC, vendor gener- sekutu
kerajinan a FPGA untuk tujuan tertentu .Namun
demikian,berlawananmelakukansebuahASIC,kamubisaprogramsebuah Di bawah ini
melakukanmerubahyangmendasarifungsionalitas.SebuahcontohdarisebuahFPGA
solusitidakMicrosoft ' s Gelombang otak,manatidakdigunakanbagipembelajaran
mendalamProjects
(Lihat https://TechCrunch.com/2017/08/22/Microsoft-Brainwave-AIMS -to-
mempercepat-Deep-Learning-dengan-FPGA/ untuk rincian).

Pertempuran antara ASICs dan FPGA berjanji untuk memanas, dengan AI pengembang
muncul sebagai pemenang. Untuk saat ini, Microsoft dan FPGA tampaknya telah
mengambil memimpin (Lihat artikel di https://www.Forbes.com/Sites/
moorinsights/2017/08/28/Microsoft-FPGA-Wins-versus-Google-tpus-for-
Ai/#6448980d3904). Intinya adalah bahwa teknologi adalah cairan, dan Anda harus
mengharapkan untuk melihat perkembangan baru .

Vendor juga bekerja pada jenis pemrosesan yang sama sekali baru, yang mungkin atau
mungkin tidak bekerja seperti yang diharapkan. Sebagai contoh, Graphcore bekerja pada
sebuah unit pengolah intelijen (IPU), seperti yang dijelaskan di
https://www.PRNewswire.com/News- Release/Sequoia-Backs-graphcore-AS-
The-masa depan-dari-buatan- Intelligence-Processors-300554316.
html.KamumemilikimelakukanmengambilparaBeritadariiniprosesor baru dengan butiran
garam diberikan hype yang telah mengelilingi Indus-Try di masa lalu. Ketika Anda melihat
aplikasi nyata dari perusahaan besar seperti Google dan Microsoft, Anda dapat mulai
merasa sedikit lebih yakin tentang masa depan teknologi yang terlibat.

Menambahkan sensor khusus


Sebuah komponen penting dari Ai adalah kemampuan Ai untuk mensimulasikan
manusia Intel-ligence menggunakan set penuh indra. Masukan yang diberikan
melalui Indra membantu manusia mengembangkan berbagai macam
kecerdasan yang diuraikan dalam bab 1.SebuahmanusiaSenses

BAB KE 4 Perintis Khusus Hardware 68


menyediakanparatepatmengurutkandarimasukanmelakukanciptakansebuahI
ntelligentmanusia.Bahkan dengan asumsibahwa
itumenjadidimungkinkanbagisebuahAimelakukansepenuhnyamengimplement
asikansemuatujuhmacamdarikecerdasan,ini masih memerlukan jenis yang
tepat masukan untuk membuat kecerdasan yangfungsional.

BAB KE 4 Perintis Khusus Hardware 69


Manusia biasanya memiliki lima indera untuk berinteraksi dengan lingkungan:
penglihatan, suara, sentuhan, rasa, dan pendengaran. Anehnya, manusia masih belum
sepenuhnya memahami kemampuan mereka sendiri, sehingga tidak terlalu
mengherankan bahwa komputer lag ketika datang untuk merasakan lingkungan dengan
cara yang sama bahwa manusia lakukan. Sebagai contoh, sampai saat ini, rasa hanya
terdiri dari empat unsur: garam, manis, pahit, dan asam. Namun, dua rasa lagi sekarang
muncul pada daftar: umami dan lemak (lihat https://fivethirtyeight.com/features/Can-We-
Taste-Fat/ untuk rincian).Demikian juga, beberapa wanitatidaktetrachromats
(https://concettaantico.com/ tetrachromacy/),siapa yang dapat melihat100.000.000
warna daripadasemakinbiasa 1.000.000(hanya wanita dapat tetrachromats karena
memerlukan-ments kromosom ). Mengetahui berapa banyak wanita memiliki kemampuan
ini bahkan belum mungkin.(Beberapa sumber memiliki nomor setinggi 15
persen;melihathttp://www.raredr.com/kontributor/Ricki-Lewis-PhD/2016/12/a-good-
mutasi-melihat-The-dunia-dengan-ekstra-kerucutdanhttp://sciencevibe.com/2016/12/11/The-
Women-that-See-100-juta-warna-Live-in-a-different-World/bagirincian.)

Penggunaan data statis dan dinamis yang disaring memungkinkan AI berinteraksi dengan
manusia dengan cara tertentu saat ini. Sebagai contoh, pertimbangkan Alexa
(https://www.Amazon.com/ Amazon-Echo-dan-Alexa-Devices/b? node = 9818047011),
perangkat Amazon yang tampaknya mendengar Anda dan kemudian mengatakan sesuatu
kembali. Meskipun Alexa sebenarnya tidak mengerti apa-apa yang Anda katakan,
munculnya komunikasi cukup adiktif dan mendorong orang untuk antropomorphize
perangkat ini. Untuk melakukan tugasnya sama sekali, Alexa memerlukan akses ke sensor
khusus: mikrofon yang memungkinkannya untuk didengar. Sebenarnya, Alexa memiliki
sejumlah mikrofon untuk membantu mendengar cukup baikuntuk memberikan ilusi
pemahaman. Sayangnya, secanggih Alexa adalah, itu tidak bisa melihat, merasakan,
menyentuh, atau merasakan apa pun, yang membuatnya jauh dari manusia bahkan dengan
cara terkecil .

Dalam beberapa kasus, manusia sebenarnya ingin AI mereka memiliki indra unggul
atau berbeda. Sebuah AI yang mendeteksi gerak di malam hari dan bereaksi
terhadap itu mungkin bergantung pada inframerah daripada penglihatan normal.
Faktanya, penggunaan Indra alternatif adalah salah satu penggunaan yang valid
untuk AI hari ini. Kemampuan untuk bekerja dalam lingkungan yang orang tidak
dapat bekerja di adalah salah satu alasan bahwa beberapa jenis robot telah menjadi
begitu populer, tetapi bekerja di lingkungan ini sering memerlukan seperangkat
sensor bukan. Akibatnya , topik sensor sebenarnya jatuh ke dalam dua kategori
(tidak satupun yang sepenuhnya didefinisikan): manusia-seperti sensor dan
sensor lingkungan alternatif .

Merancang metode untuk


berinteraksi dengan lingkungan
BAB KE 4 Perintis Khusus Hardware 70
Sebuah AI yang mandiri dan tidak pernah berinteraksi dengan lingkungan tidak
berguna. Tentu saja, bahwa interaksi mengambil bentuk input dan
output.Paratradisional

BAB KE 4 Perintis Khusus Hardware 71


metode memberikan input dan output secara langsung melalui
aliran data yang komputer dapat memahami, seperti dataset, teks
query, dan sebagainya. Namun, pendekatan ini hampir tidak
manusiawi ramah dan memerlukan keterampilan khusus untuk
digunakan.

Berinteraksi dengan AI semakin terjadi dengan cara yang lebih


memahami manusia daripada mereka melakukan kontak komputer
langsung. Misalnya, input terjadi melalui serangkaian mikrofon
saat Anda mengajukan pertanyaan kepada Alexa. AI mengubah kata
kunci dalam pertanyaan menjadi Token yang dapat dimengerti.
Token ini kemudian memulai Compu-otasi yang membentuk
output. AI memberi tokenizes output menjadi bentuk dimengerti
manusia: kalimat yang diucapkan. Anda kemudian mendengar
kalimat sebagai Alexa berbicara kepada Anda melalui pembicara.
Singkatnya, untuk menyediakan fungsi yang berguna, Alexa harus
berinteraksi dengan lingkungan dalam dua cara yang berbeda yang
menarik bagi manusia, tetapi yang sebenarnya tidak mengerti
Alexa.

Interaksi dapat mengambil banyak bentuk. Faktanya,jumlah dan


bentukdari interac-tiontidakterus meningkat.Bagicontoh, Ai
dapatkinimencium bau(lihat http://
www.sciencemag.org/News/2017/02/Artificial-Intelligence-grows-Nose
untuk rincian).Namun
demikian,paraComputerBukankahsebenarnyamencium bauapa
saja.SensorPro-vide aberertimelakukanmengubah pendeteksian
kimia menjadi data yang dapat digunakan oleh Aidalam tahunhal
yang samacarabahwaitu semuadata lainnya. Kemampuan untuk
mendeteksi bahan kimia bukanlah hal baru; kemampuan untuk
mengubah analisis bahan kimia tersebut tidak baru; juga
tidakalgo-rithms yang digunakanmelakukanberinteraksi dengan
data yang dihasilkan baru. Apa yang baru adalah dataset yang
digunakan untuk menafsirkan data yang masuk sebagai bau, dan
dataset yang berasal dari studi manusia. Hidung Ai memiliki
segala macam kegunaan yang mungkin.Bagicontoh, pikirkan
tentangAi'skemampuanmelakukangunakansebuahhidung ketika
bekerjadalam tahunbeberapa berbahayaenviron-ments,seperti
itukarenamelakukanmencium
bausebuahgaskebocoransebelummenjadiablemelakukanmelihatiad
enganmenggunakanlainnyasensor.

Interaksi fisik juga meningkat. Robot yang bekerja di lini perakitan adalah
topi tua, tetapi mempertimbangkan efek dari robot yang dapat
mengemudi. Ini adalah penggunaan yang lebih besar dari interaksi fisik.
Pertimbangkan BABjuga bahwa
KE 4 AI Khusus
Perintis dapat bereaksi
Hardware dengan cara yang lebih72
kecil. Hugh Herr, misalnya, menggunakan AI untuk memberikan
interaksi dengan kaki cerdas (Lihat
https://www.smithsonianmag.com/Innovation/Future -Robotic-Legs-
180953040/ untuk rincian). Kaki yang dinamis ini memberikan
pengganti yang unggul bagi orang yang telah kehilangan kaki nyata
mereka. Daripada statis semacam umpan balik bahwa manusia mendapat
dari standar prostetik, ini kaki dinamis sebenarnya menyediakan jenis
umpan balik aktif bahwa manusia digunakan untuk mendapatkan dari
kaki nyata. Misalnya, jumlah Pushback dari kaki berbeda ketika berjalan
menanjak daripada berjalan menuruni bukit. Demikian pula, menavigasi
trotoar memerlukan jumlah yang berbeda dari Pushback dari menavigasi
sebuah langkah.

Intinya adalah bahwa sebagai AI menjadi lebih mampu melakukan


perhitungan kompleks dalam paket yang lebih kecil dengan dataset
yang lebih besar, kemampuan AI untuk melakukan tugas yang
menarik meningkat. Namun, tugas yang menjalankan AI mungkin
tidak skr memiliki kategori manusia. Anda mungkin tidak pernah
benar-benar berinteraksi dengan AI yang memahami pidato Anda,
tetapi Anda mungkin datang untuk mengandalkan AI yang
membantu Anda kehidupan utama atau setidaknya membuatnya
lebih layak Hali.

BAB KE 4 Perintis Khusus Hardware 73

Anda mungkin juga menyukai