Anda di halaman 1dari 14

A.

PEMATERI 1

Nah gue cuaca-cuaca hari ini nampaknya misal kita punya kalimat berbahasa
Indonesia Saya suka apel di sini translate-translate adalah Apple di sini cara paling
sederhana mesin Translate translate itu tadi adalah kita mempunyai kita menyiapkan
terlebih dahulu sebuah database yang berisi pasangan kata dalam dua bahasa tersebut
dalam kasus ini bahasa Indonesia ke Inggris jadi kita punya database yang isinya itu
kata berpasangan jadi kalau saya itu pasalnya dengan suka dengan dengan seperti itu
berada di database dan buat cowok translation itu simple mengganti kata berkata
seperti itu seperti ini dibuat manual oleh manusia dengan tangan seperti itu dengan
melihat kaos akan menjadi cara yang paling sederhana namun cara ini tuh cukup
nggak sih sebenarnya hanya dengan percuma jawabannya Tentu nggak cukup Nah
kenapa nggak cukup karena komponen dari bahasa itu terdiri dari minimal dua hal
yang pertama adalah kata atau dalam bahasa Indonesia sering disebut dengan token di
mana dia adalah bagian penyusun paling sederhana dari sebuah Bahasa apakah itu
sendiri kalau misalkan Saya suka apel saya suka itu apa itu seperti itu perlu diingat
bahwa token listrik sebenarnya kalau dalam itu berbeda dengan kata Ya tapi kan itu
udah Anggap saja itu kata kemarin yang kedua setelah kata komponen dari bahasa itu
yang juga tidak kalah penting adalah konteks-konteks di sini ini ini saya sendiri ya
jadi berbeda bagian yang mengatur bahasa dari bahasa dari sebuah bahasa itu sendiri
misalkan urutan kata dalam kalimat ada atau grammar atau Sintak atau Semantic
meaning dan lain sebagainya bisa kan kita punya kalimat seperti perempuan cantik itu
bekerja di Apple di sini itu contohnya adalah misalkan sebuah kata sifat atau adjective
itu harus mengikuti naon jadi ketika kita jadi seperti apa di sini perempuan cantik
perempuan itu cantik itu aja di sini aja itu harus selalu mengikuti mengikuti naon kita
tidak bisa hanya bilang cantik itu bekerja di Apple harus seperti ini disebut dengan
nama Kemudian untuk konteks itu sendiri adalah perbedaan arti sebuah token atau
kata berdasarkan konteksnya berdasarkan kalimat sebelumnya contohnya adalah
perempuan cantik itu bekerja di Apple Apple di sini bisa minimal tiga hal yaitu buah-
buahan atau device Apple iPhone iPad dan sebagainya atau Apple nah disini kita
dengan hanya melihat kata apple itu sendiri seperti dalam gua cuma translation kita
nggak tahu itu harganya yang masih buah di file atau gitu nah disini kita perlu melihat
kalimat sebelumnya sebelumnya melihat konteks dari kalimat itu untuk menentukan
arti dari siapa di sini karena kata sebelumnya adalah bekerja kita bisa menentukan
Halo apa di sini pasti bukan Gua bukan dia tapi aku dengan adanya komponen si
konteks atau cinta seperti ini metode translation yang barusan saya jelaskan tadi yang
hanya dengan pasangan itu menjadi tidak akurat lagi menjadi obsolet habis ini apa
yang kita lakukan sebenarnya jalannya itu agak panjang sangat panjang dari tadi
sampai ke yang sekarang yang sekarang ini adalah karena MMI adalah teknologi
terbaru yang dipakai algoritma terbaru yang dipakai dalam mesin translation untuk
mencapai tahap ini sangat panjang mulai dari statistik L1 statistik probability
probabilitas translation dan lain sebagainya sampai ke tahap ini tapi saya akan
langsung meloncat ke bagian yang paling penting terbaru kalau kalian ingin belajar
tentang proses dari bagaimana dari Respon yang sangat simpel sampeyan ini bisa
dibayar sendiri jadi untuk ke masjid translation yang dipakai sekarang itu
menggunakan Deep learning kalau istilah istilah kerennya adalah seperti yang sudah
di awal tadi bisa belajar sendiri tentang struktur bahasa konteks g g Rul arti sebuah
kata dan lain sebagainya Itu yang berada dalam suatu bahasa itu dengan mengamati
dengan mengobservasi peta yang ada dalam data-data di sini di contoh translasi
sampel translasi data dengan mengamati peta yang ada dalam data yang sangat banyak
bisa otomatis belajar sendiri struktur sebuah bahasa seperti itu Nah untuk lebih sedikit
lebih jelasnya di sini Jakarta yang barusan saya bilang itu biasa dalam bahasa Inggris
disebut dengan paralel dengan artian bahwa input dari sebuah masukan dari sebuah
norma dan translasi model itu tadi adalah sebuah kalimat atau sequence dalam istilah
energi disebut dengan frekuen seperti ini saya suka apel ke mana dia pergi Siapa
pemilik mobil itu teman saya cantik dan sebagainya inputnya itu adalah sekuens dan
outputnya output keluaran dari sini semoga ini juga sebuah frekuensi sebuah sistem
seperti ini yang inputnya dan sama-sama sama-sama kalimat ini disebut dengan siku-
siku pasangan input dan output ini sifat ini dalam Islam disebut dengan training data-
data yang dipakai oleh mesin untuk belajar untuk membuat rule secara otomatis Salah
satu ciri khas dari si Nur ini adalah data yang digunakan tuh nggak boleh sedikit
karena kena sihir ini belajar aturan translasi tetapi secara otomatis dengan mengamati
data otomatis ketika datanya itu kualitasnya misalkan atau datanya hanya sedikit kita
tidak akan bisa membangun sebuah model modern dan model yang bagus
kemungkinan akan menjadi tidak akurat dan lain sebagainya jadi yang perlu
digarisbawahi lagi adalah Dan ini juga bisa dibilang salah satu kelemahan dari uang
adalah dia membutuhkan data yang sangat banyak untuk bisa mendapatkan akurasi
yang bagus seperti itu untuk lebih jelasnya lagi komputer atau mesin itu tadi tidak
bersih atau komputer itu tidak bisa memahami kalimat seperti manusia seperti otak
manusia kita mempelajari kalimat ketika kita mendengar Saya suka apel itu kita
langsung paham Apa sih arti dari kalimat ini tapi kalau kamu nggak bisa seperti itu
komputer itu cuman bisa membaca angka ya salah satunya nah jadi itu yang pertama
dilakukan adalah mengubah masukkan tadi mengubah kalimat sisiku Saya suka apel
itu tadi menjadi angka terlebih dahulu istilahnya vektor matriks vektor nah kemudian
baru diproses oleh sinoro machine translation dengan melihat dengan proses belajar
dan sebagainya untuk kemudian outputnya itu tadi yang masih berupa angka harus
diikut lagi harus di keluarin lagi dalam bentuk kali Mat lagi karena translasikan
inputnya kalimat-kalimat inputnya Saya suka apel keluarnya itu harus Nah jadi vektor
ini juga pertama dari kalimat diubah menjadi vektor Kemudian dari vektor diubah
menjadi kalimat lagi nah sebuah arsitektur arsitektur yang seperti ini disebut dengan
encoder decoder encoder itu adalah mengubah sekuens menjadi vektor coba Terus
dikode ini mengubah air menjadi sequence dari tadi kita sudah membahas Terus yang
katanya itu adalah sebuah algoritma yang terinspirasi dari sumber lain yang punya
sinopsis yang sangat banyak tapi menurut saya pribadi ini adalah sebuah definisi yang
akan diselidiki karena otak manusia itu nggak sesimpel itu tidak tersimpan orang
Depok yang sekarang itu ya memang kita bisa bilang terinspirasi dari situ tapi itu
berbahaya karena tidak sendiri tidak tidak sama bentuknya aja mau ngambil dari situ
tapi cara kerjanya sangat beda itu ini menurut pribadi saya tapi ada banyak pendapat
yang lain sebenarnya apa sih sebenernya isinya dari itu isinya itu adalah hanya
sekumpulan matematika function jadi ini mengubah mengubah mengubah di sini
dengan dalam artian matematika transformation ya jangan menggunakan fungsi
matematika untuk yang tadi itu tadi itu dari 1 sektor ke sektor yang lain yang lain
berkali-kali sesuai dalamnya sesuai ketebalan kedalaman dari sini itu tadi ya isi dari
bagian yang ijo Ini yang isinya adalah Matematika Nah jadi vektor yang didapatkan
dari sisi input tadi di ubah di ganti-ganti terus dikalikan ditambahkan diubah dengan
fungsi dengan fungsi dan sebagainya sampai berubah ke bentuk yang lain dari
kelainan dievaluasi benar atau enggaknya kalau masih error yang masih tinggi diubah
lagi dengan yang lain dalam sesuai kedalamannya sampai akhirnya Tujuannya adalah
untuk mencari representasi yang paling tepat misalkan dalam kasus Apa itu tadi kan
memiliki tiga arti ya kapan perut sama dia Nah di sini representasi apel untuk kalimat-
kalimat yang berbeda itu bisa memiliki tiga representasi yang berbeda tentunya kita
akan untuk apa yang itu yang seperti ini itu yang tengah dan tujuannya adalah hanya
mengubah mengubah dengan dengan Matematika sampai menemukan representasi
vektor yang paling kecil Hanya seperti itu sedikit Saya ingin ngeshare disini Saya
ingin salah satu quote dalam bahasa Jepang yang percaya ya itu kemarin foto ini
terjemahan adalah memaksa diri melakukan hal yang membuat diriku menderita
kesusahan sambil berharap kalau suatu saat nanti kita akan Dapat reward kita akan
dapat balasan karena kita telah menderita Sebelumnya kan kita udah putus apa ya Dan
kita mengharapkan 1000 namun sayangnya Hidup ini tidak semanis gitu sebenarnya
Jadi intinya adalah yang pertama kita tidak perlu menghadiri menderita menjahit
adalah opsi yang valid yang kedua adalah jangan berekspektasi terlalu tinggi pada diri
sendiri pada diri sendiri terutama apalagi sama orang lain ini saya dapat dari YouTube
nggak ada hubungannya dengan akhirat nanti Translate pakaian LP juga oke makasih
Nah tadi itu sudah sedikit kurang lebih detail tentang si mas in translation yang ngasih
Google Translate yang lebih seperti itu tentunya Sebenarnya sekarang udah ada
sedikit berbeda tapi nanti inti-intinya Garis besarnya adalah seperti itu oh seperti itu
yang kedua dari Google Translate yang juga sebuah aplikasi dari NLP adalah teks
yang ketika kita memasukkan teks Google Translate akan langsung tahu Bahasa apa
sih itu di sini berbeda dengan simulasi Translate itu tadi Ini adalah sebuah
classification problem di mana inputnya masukannya Itu adalah sebuah teks kalimat
dan outputnya berupa label-label bahasa jadi misalkan kita memasukkan Saya suka
namakan itu harus bahasa Indonesia memasukkan dan alatnya harus bahasa Inggris itu
yang di sini tak semudah itu sendiri juga sama sebenarnya isinya yang berupa
matematika transformasi itu tadi yang mengubah foto menjadi Vector dulu itu diubah
lagi menjadi output seperti itu bedanya adalah datanya di sini datanya untuk sikap ini
harus pasangan input dan output yang berupa teks dan label outputnya sendiri itu
biasanya sebenarnya nggak langsung bel seperti itu tapi probabilitas jadi ketika kita
memasukkan misalkan Saya suka makan expected output yang kita harapkan itu harus
semacam bahasa Indonesia 90% bahasa Jepang 0,5 persen sama seperti itu kemudian
sih kita mengambil output kabel dengan probabilitas yang paling tinggi dan itu
menjadi prediksinya itu adalah inti dari sebuah klasifikasi problem dalam energi
banyak sekali dengan energi selain salah satu contohnya adalah misalkan dari website
artikel itu kan ada banyak misalkan ada suatu indikator kategorisasi in sebagai sport
atau atau politik atau sains dan lain sebagainya untuk seperti itu sebenarnya sudah
memakai otomatis juga mereka tidak menulis latin yaitu 11 tapi mereka sudah
menggunakan energi juga untuk otomatis karena jumlah berita Tuhan sangat banyak
ya arti kata sangat banyak jadi kalau untuk melabeli ini itu ini itu politik dan
sebagainya 11 membutuhkan banyak waktu di sini klasifikasi dari tadi juga sama
dikasih artikel classification program bisa deteksi otomatis kategori dari tadi
kemudian yang ketiga dari si Google Translate dari adalah text text to speech
recognition di mana ini adalah salah satu contoh yang bagus perpaduan antara energi
dengan tas yang lain dia wa Tadi saya sudah sedikit menyinggung kalau yang lain itu
ada banyak seperti image Processing speech Processing video Processing dan
sebagainya nah disini text to speech recognition ini perpaduan antara energi dengan
Processing dengan speech recognition bahasa bahasa manusia ke dalam bentuk atau
Jadi kita ngomong apa langsung otomatis muncul ada Kak ada yang seperti itu atau
videonya itu kan sendiri emang ada yang itu ditulis secara manual ditambah secara
manual oleh Ari atau orang lain gitu tapi ndak ada yang mendeteksi otomatis dari si
mirip-mirip di sini bedanya adalah diberikan input sebuah teks di mana Kalau ada lah
ya udah teks yang kita mau pipis Google Translate kemudian yang pertama itu di teks
analisis itu kita menganalisis memisahkan kalimat yang barusan kita masuk itu
menjadi kata selain itu di cocokkan dengan intonasi dan lain sebagainya masuk aspek
sintesis sintesis ini bukan bidang saya jadi saya kurang tahu paham tapi yang jelas dia
mengasosiasikan antara teks kalimat kata itu tadi kedalam ke gelombang suaranya
untuk sendiri dekat-dekat dengan energi sama dengan metode yang dipakai atau
sebagainya bedanya hanya kah datanya kalau si energi itu datanya itu teks bukan
muslim emang emang teks Nah kalau proses itu dan datanya adalah sebuah
gelombang suara alfabet yang seperti seperti itu dan tentunya ini juga bukan dalam
bentuk kelompok selain tadi Ya sudah dikonversi ke dalam bentuk angka juga dalam
bentuk vektor seperti si energi karena dia itu tadi mesin komputer itu hanya bisa
membaca vektor hanya bisa membaca angka Google Translate ini menurut saya
bagaimana Google itu semua adalah kalau kalian perhatikan hasil dari Translate itu
suka muncul ketika di klik suka muncul beberapa opsi Google Translate to foto asli
smart smart smart menggunakan cara menggunakan juicer untuk memperbaiki data
mereka seperti yang tadi saya bilang hal yang salah satu hal yang paling penting
dalam hening dalam data-datanya itu harus banyak kualitasnya harus bagus untuk bisa
dapat akurasi yang bagus juga nah kalau energi Biasanya kita mengumpulkan data itu
dengan meminta manusia beneran untuk produk istilahnya itu adalah anotasi data jadi
misalkan untuk translate itu kita harus menyiapkan datanya teksnya Kalau belum ada
si translasinya kita harus benar-benar minta orang untuk menulis langsung isinya 11
seperti itu untuk membuat datanya dan itu kan kita membutuhkan data yang sangat
banyak ya sebenarnya jutaan bahkan milyaran untuk Iya saya yakin dia nggak nggak
melakukan yang manual itu tadi ya mungkin sedikit tapi itu mengumpulkan data
dengan otomatis Nah di sini dia memperbaiki data itu lagi dengan menggunakan asas
Ius Soli yang itu lebih bagus Nah ini sangat penting karena yang melakukan Enggak
cuman kita doang yang kita asumsikan semua orang yang menggunakan Google
Translate melakukan hal ini data yang sangat mahal yang sangat penting untuk
transfer yang yang mereka dapatkan dengan cara gratis dan bahkan sengaja Nggak
sadar kalau mereka itu diam biasanya dipakai untuk mengumpulkan data oke itu tadi
chatnya sampai di sini saja yang lain aplikasi energi yang lain yang mungkin juga
kalian melihat yang pernah yang lain ada contohnya adalah rasa yakin kalian semua
menggunakan email dan ketika kalian memperhatikan folder spam itu itu yang masuk
ke dalam folder spam itu juga sebenarnya aplikasi dari Delphi itu seperti apa ini tuh
sama prinsipnya dengan model yang classification program itu tadi ya itu yang yang
dikasih input berupa teks atau email untuk kemudian outbound itu adalah kategori
kategori kategori di sini yaitu spam-spam Nah itu juga probabilitas jadi dikasih suatu
email outputnya itu adalah probabilitas itu adalah spam dan probabilitas email ini
bukan spam dari 2 itu Mana yang lebih tinggi itu di yang diambil sebagai output
jawaban dari apakah sistem seimbang atau tidak yang lain aplikasi anak yang lain itu
asisten yang mungkin beberapa makai Kalau di Jepang hampir semuanya sudah
makan seperti Alexa atau Google atau Siri di rumah masing-masing di smart speaker
dan lain sebagainya di sini ini adalah juga perpaduan dari tadi si kecil Processing
sama energi itu nah inputnya suara kita ya dengan sintesis itu harus diubah ke dalam
bentuk teks teks di sini kan ini ya komen kita perintah kita atau pertanyaan kita di sini
ada satu tas energi yang bernama question answering modal yang yang bertujuan itu
adalah memberikan respon terhadap Apa yang diucapkan oleh user dengan translation
yaitu inputnya adalah kalimat dan outputnya juga sebuah kalimat sekuens juga
bedanya adalah mereka itu pasangan dari pertanyaan dan jawaban UAS cendana
sementara konfirmasi translate-kan pasangan antara kalimat dalam satu bangsa dan
bahasa yang lain Jadi sebenarnya metode algoritma model yang kamu buat untuk si
Mas itu dia lebih bisa dipakai untuk pesanan sering model hanya dengan mengganti
datanya saja kita mungkin tidak mendapatkan akurasi yang sama bagusnya itu nanti
perlu diteliti dan sebagainya untuk disesuaikan dengan istilahnya tuh kalau dan energi
baru kita mendapatkan responsnya untuk diolah lagi oleh speech Processing sintesis
untuk dikeluarkan output dalam bentuk suara juga seperti itu Nah yang ini adalah
yang terakhir aplikasi ini mungkin bukan dalam daily life tapi ini adalah topik tesis
saya jadi saya ingin sedikit menyinggung saya tapi saya itu adalah otomotif itu dikasih
satu kata kita bisa sistemnya bisa membuat pertanyaan secara otomatis bisa
mengambil yang sebelah kiri itu mengambil artikel dari internet yang sudah di
spesifik kemudian mengambil kata itu membuat pertanyaan nya sampai membuat
pilihan gandanya mana jawaban yang benar mana jawaban yang salah itu adalah
untuk tes saya saya terus fokus membuat pertanyaan di atas sel-sel tes bahasa Inggris
ini juga salah satu aplikasi energi dalam kehidupan sehari-hari Tujuannya adalah
untuk kita untuk Sebelum kita ingin belajar yang banyak ya soal tanya jawab dan
sebagainya karena susah mendapatkan salah saya seperti itu ini juga sebenarnya bisa
membuat pertanyaan yang tidak secara otomatis yang tidak kalah dengan pertanyaan
buat Oke sampai sekarang di sini udah akhir dari materi ada sedikit bonus yang
pertama adalah ini ada titipan dari ko Hai saya dari adik-adik tingkat saya tinggal
Saya sekarang sedang di SD dan dia menulis buku untuk pengantar mata kuliah masih
learning dengan dengan utamanya contohnya itulah kasus-kasus jadi dia membahas
masih learning learning dan sebagainya dengan lebih detail sampai ke matematikanya
tapi tidak dengan bahasa yang susah saya jadi ada levelnya untuk kepentingan di
Indonesia dan karena contoh kasus Yaitu fokus ke energi Jadi mungkin untuk yang
tertarik dan energi bisa mencoba silahkan download karena dengan gratis dari alamat
di sini atau tertarik oleh Adik saya 

B. PEMATERI 2

Transjakarta juga sama temennya satunya dari Universitas Sebelas Maret kemudian
S2 nya di Universitas Indonesia kemudian meskipun Tensi saya masih di NLP
sebenarnya aturan bahasa dan sebagainya tapi kemudian di pekerjaan saya punya
banyak mainan yang ada di mata kuliah Jadi udah lama banget nggak mainin ke sana
tapi mungkin saya akan menjelaskan tentang Apa saja aplikasi ini masih sangat kasar
kemudian kemarin juga dapat info dari Bu Vina Kalau akhirnya dari semester 1 dan 3
jadi Mungkin saya agak lebih ringan aja dulu belum terlalu percaya mohon maaf lagi
Alfian siang sudah export korpus dan sebagainya Apa itu korpus sebenarnya itu
sendiri adalah suatu koleksi tumbuhan yang tidak dibaca oleh mesin bahasanya bahasa
manusia pasti natural dari ini ketika dia bisa dibaca oleh mesin harapannya mesin juga
bisa paham dokumen apa aja dari berita dari Twitter sosmed dari ml kemudian bisa
juga dari apa namanya buku-buku PQR dan sebagainya Itu semuanya bisa dijadikan
suatu korpus atau sumber teks Kalau orang-orang biasanya bilang itu namanya itu
bukan sekedar kata mungkin untuk segera saya minta teman-teman buka tidur silakan
buka menti.com silakan buka mimpi.com kemudian masukkan kodenya 18530 18 18
18 18 55 38 553 bisa semuanya 

Anggota Komisi A DPRD DKI Jakarta Santika mengatakan akan mempertanyakan


kebijakan pinjaman daerah sebagai sebesar 12 triliun dan sebagainya dari manakah
bagian teks tersebut diambil kira-kira dari mana teks ini diambil dari mana ini di
ambil silakan Tuliskan jawaban pilih jawaban teman-teman 

Kita bisa mengambil berita-berita online untuk digunakan sebagai code pemrosesan
teks apa yang diproses buat apa dan sebagainya tapi juga dapat dianalisis dapat juga
digunakan untuk menemukan fakta baru dalam bahasa Dayak istilah-istilah baru dan
sebagainya kemudian apa namanya kemudian pengembangan aplikasi berbasis teks
juga dapat dilatih secara otomatis aku juga sangat luas seperti yang dijelaskan
sebelumnya ada teknik buat sebagainya itu untuk Pelatihan tentara yang bisa dibaca
oleh misalnya misalnya kita mau melacak misalnya bukan semua baris yang
mengandung kata pinjaman misalnya dari teks ini ada pinjaman berapa sih kita cari itu
akhirnya punya punya punya kita

Tersebut itu 20 warna Mulawarman kemudian kementerian keuangan itu adalah buat
rame-rame struknya itu adalah sebagai salah satu dianggap sebagai satu kesatuan
kemudian Terus buat apa sih dihitung itu kita lihat dulu sedikit frekuensi kata
harapannya kalau kita punya kalau kita punya dokumen-dokumen punya teks dan
sebagainya harapannya kata yang sering muncul adalah kata-kata yang
merepresentasikan dokumen tersebut misalnya kita punya punya dokumen tentang
tetapi bisanya harapannya kemungkinan kata kunci yang ada di dalam kata-kata yang
sering muncul di dalam tubuh tersebut adalah pasti kata dan sebagainya itu yang akan
mendirikan mencirikan dari dokumen tersebut untuk membangun suatu sistem
informasi misalnya kalau kita buka-buka aja Sistem Informasi seperti itu sistem
informasi kemudian kita itung nih Apakah benar Apakah benar misalnya kita pakai
kemudian kita Buka Wikipedia ini kalau kita mau ya apa namanya ketika kita sistem
informasi dia ada di hutan Apakah benar kalau kita lihat kalau kita ekstrak kita cari
frekuensi katanya Apakah ia akan menjadi mayoritas bisanya kita coba pakai on
konter ya ternyata dan ternyata kita lihat bahwa memang di sini kata sistem kemudian
informasi yang dari dalam dan sebagainya ini menjadi kata yang frekuensinya paling
banyak 38 kali informasi 33 kali seterusnya ini berarti dari dokumen dari Wikipedia
sistem informasi dari yang mencirikan dokumen tersebut memang mayoritas adalah
kata systeminfo masih tapi kemudian perhatikan bahwa kata-kata yang berikutnya
adalah ada kata yang dari dalam untuk adalah dan seterusnya ini adalah dari web dari
dari bagian Bagaimana kalau tanahnya lebih panjang kita lihat kayaknya nggak terlalu
panjang ya satu nggak terlalu panjang kemudian kalau kita pakai yang lain yang lain
yang lain Saya mencari sistem informasi tapi jari lebih panjang Oke saya dapat di
repository UT konsep dasar sistem informasi isinya ternyata adalah suatu modul dari
sistem pencarian frekuensi B ternyata meskipun ya yang kita cari adalah sistem
informasi ternyata kata yang paling sering muncul adalah sistem yang berikutnya
adalah kata yang kemudian yang keempat informasi yang kelima adalah data bahwa 3
besarnya adalah sistem yang dan informasi lainnya sama dan misalnya misalnya saya
masukkan kata kuncinya gitu Pony kemudian saya ambil di Wikipedia juga ternyata
setelah kita cek frekuensi yang paling sering muncul hidroponik dan tanaman pada
berarti adalah frekuensi banyak frekuensi yang muncul berkali-kali masa kata yang
muncul berkali-kali yang frekuensinya besar belum tentu menjadikan sesuatu belum
tentu berikut adalah analisis dari beberapa dokumen skripsi S1 ini ada contoh 5
dokumen-dokumen 4 6 8 10 dan 14 ini tentang komputer semua ini adalah urutan
frekuensi paling banyak kata yang paling banyak muncul di dalam skripsi tersebut
kata yang paling sering yang pagi dan dengan dan seterusnya juga yang dan pada dan
seterusnya sampai dokumen ke-14 dapat dilihat disini ada kata-kata yang sering sekali
muncul kemudian ada yang mendengar dan sekutunya ini adalah inti dari skripsinya
ada mungkin lebih isi skripsinya tapi kata kata lain ini bukan bukanlah inti dari seperti
kata-kata yang paling sering muncul bukanlah yang paling deskriptif ya belum tentu
yang paling deskriptif atau belum tentu bisa mendeskripsikan inti dari dokumen pada
tahun 58 tahun ini mengatakan bahwa kata-kata yang paling umum dan paling tidak
umum adalah tidak berguna untuk indeks Maksudnya bagaimana Biasanya
frekuensinya yang paling banyak yang paling banyak sekali jarang banget keluar itu
bukanlah ini dari dokumen sebagai penciri atau ciri-ciri dari dong terdapat sejumlah
kata yang sering muncul dalam berbagai dokumen terus gimana mana mau dokumen
tentang hidroponik tentang sistem basis data tentang hewan langka kata-kata ada
banyak kata yang muncul hanya pada dokumen tertentu misalnya kata sistem muncul
di dokumen sistem informasi muncul di dokumen apa namanya data Pis muncul di
dokumen hidroponik hidroponik sistem ya kemudian ada sedikit kata yang sering
muncul yang merupakan kata pembeda atau yang tidak baik disebut ada sedikit terus
di mana-mana pasti ada hampir selalu ada dan tidak bisa dijadikan sebagai ciri anggap
sebagai suatu dari dokumen itu adalah kata yang kata dengan kata bulan tidak
dihitung dalam bahasa Inggris bisa nyapu on n dan sebagainya kalau di Indonesia
yang didengar pada terusnya Kakak diskriminator tidak-tidak ciri-ciri dari dokumen
tapi dia munculnya sering sekali itu statistik ini kenali karakteristik dari koleksi teks
dan cara pembersihannya bawa misalnya kita pakai dokumen dari sosmed seperti
Twitter dan sebagainya cukup Instagram prosesnya akan sangat berbeda dengan berita
atau jurnal yang ada editor pengertian bahasanya bahasa Arab bahasa Indonesianya
committee Twitter biasanya bahasanya bebas terserah saya yang bicara apa itu
mungkin banyak singkatan banyak kata-kata lebay banyak emoticon dan sebagainya
tidak banyak sekali kemudian apa namanya belum cara dia menyampaikan sesuatu
biasanya yang punya pun pakai bahasa daerah dan sebagainya untuk media sosial dan
apa namanya Adam teks-teks yang ada editorial biasanya setelah tahu karakteristik
bisa kita apa Bisa dibikin aplikasi yang berguna untuk pada dasarnya kita manusia
adalah selalu bikin aplikasi dan sebagainya adalah untuk mempermudah Pemuda apa
hidup kita pekerjaan yang sebaiknya kita hanya untuk perolehan informasi atau
information retrieval tadi mesin penerjemah kemudian competition atau dimensi topi
kemudian sentimen analisis geografi ajar perbatasan sebelah baratnya mana sih
misalnya batas sebelah utaranya misalnya Universitas Mulawarman sentimen analisis
ada yang belum tahu sentimen analisis itu apa namanya analisis sentimen misalnya
Emangnya kalau kita punya produk tertentu pengen tahu bagaimana sentimen
masyarakat terhadap produk tersebut misalnya kita ambil dari cerita kepada di mana
muncul nih muncul waktu handphone terbaru merk x sama merk dia memang sengaja
saingan dengan pasar kemudian pada nanti akan dicari apa komentar komentar atau
review orang-orang terhadap produk tersebut dari situ nanti akan dicari-cari sentimen
positif negatif positif negatif kemudian apa namanya Bisa juga cari yang spesifik
spesifik maksudnya bisa dari spesifik bisa cari sebenarnya kekurangan ini apa ini apa
zaman dulu yang sering yang seru yang seru di zaman dulu itu waktu itu mau Pilpres
ya Ada temen yang mainin ini iseng-iseng pakai media berita online pengen tahu
sebenarnya di toko online ini mengarah apa ke mana sih Apa iya Netral seperti itu
rolling-rolling sekian berita dari tanggal 9 sampai tanggal sekian dari macam-macam
ya Ada Kompas Ada simbol ada itu diambil kemudian dicari cantik ya dia nyari
bukannya waktu itu kan Prabowo sama Pak Jokowi ini apa namanya dicari berapa
sentimen positif nya terhadap Jokowi negatifnya terhadap Jokowi positif terhadap
Prabowo negatif terhadap Prabowo dari hasil statusnya itu statistiknya itu luar biasa
langsung kelihatan semua jadi misalnya media X ternyata memberitakan hal-hal
positif tentang Pak Jokowi itu pakai setiap kemudian negatifnya hanya sedikit
sementara Prabowo sekian banyaknya ya yang posisinya itu dia itu kelihatan
semuanya buat sentimen-sentimen dari media terhadap apa namanya calon presiden
waktu itu kelihatan semua jadi Oh ya Ternyata memang ya apa ternyata media itu
waktu itu memang terlihat tidak Netral kemudian belum lagi misalnya nih sentimen
terhadap kebijakan saya kemarin yang seru di Twitter Anies Baswedan Tadi nelpon ya
bukan bukan lagi apa itu menuai pro kontra dan pro kontra kontra semuanya langsung
menjadi trending topic habis itu yang kemudian hari berikutnya yang pro jadi trending
Bagaimana cara menganalisis kita untuk selalu butuh butuh orang yang ini positif ini
negatif sebagai sumber ini positif negatif negatif yang punya kosan positif terhadap
kebijakan yang negatif dan sebagainya nanti bisa Ki kalau yang kayak gitu Jadi kalau
kita juga bisa dianalisis juga sebenarnya yang komentarnya atau yang apa namanya
yang sebenarnya itu bukan sih misalnya kalau kita punya teks Soalnya hari Minggu
jam sekian Valentino Rossi pada laptop sekian terjatuh dan sebagainya di Sirkuit
biasanya mereka udah punya kalau kalau mesin deteksi topiknya itu pasti bisa deteksi
sebenarnya itu akan masuk ke mana Apakah itu politik apakah itu atau Olahraga
apakah itu pendidikan dan sebagainya kan otomatis aplikasi dari mana otomatis tadi
dijelaskan Ya udah belajar belajar dulu dari banyak ini adalah ini ada sport education
ini adalah ekonomi dan sebagainya itu nanti kalau udah jadi mesinnya masukin
mendeteksi ini masuk kita ini hidup aplikasi seperti kalian kenal apa namanya Google
aplikasi ajar yang sering Kalian pakai kalau ada apa-apa konsultasi ke Mbah Google
biasanya kayak gitu Aplikasi memunculkan memunculkan apa namanya urutan-urutan
yang paling tepat akan semakin ada di halaman pertama semakin tidak relevan akan
semakin dalam perutnya Apa namanya karena itu kalau yang suka main ya pasti tahu
itu Kak mainan dan sebagainya berharap bahwa webnya ada di halaman awal Nanti
kalau udah Emang kenapa biasanya nanti ke iklan itu semakin banyak dicari orang
semakin relevan atau semakin banyak dicari orang inginan nya adalah suatu item
suatu informasi atau sistem mempelajari algoritma dan model untuk memperoleh
informasi dari koleksi aplikasi aplikasi sehari-hari ada dalam satu aja udah ada
macam-macam Biasanya kalau kita ngetik salah dia ngasih apa namanya ada maksud
ini udah itu kemudian autocomplete kita ngetiknya belum selesai dia udah komplit Ini
kemungkinan lanjutannya apa kata-katanya kemudian email spam filtering mesin
penerjemah kemudian jelaskan ciri dan sebagainya untuk menghemat biar nggak
terlalu capek aku pakai natural Ya udah kasih prediksi natural language processing
prediksinya cepat-cepat kita dalam melakukan kemudian sangat sangat membantu
ketika kita pakai handphone Asus layarnya batas Jadi kalau ki bantuin Ki bantuin
memprediksi habis ini ngetik apa itu rata-rata mengurangi pengetikan hingga 25%
persen-persen tahun 2000-2018 ya Google estimasi 200 tahun dari tahun banyaknya
pengguna Google misalnya kebayang ketika ketika saya mau ngetik natural language
processing natural langsung kita ketika kita hemat sekitar 3 detik misalnya 3 detik ini
1 orang Bagaimana kalau Bagaimana kalau Bagaimana kalau satu miliar Bagaimana
kalau aku orang mengakses atau mengetik dalam 1 hari atau 1 triliun kali Makanya
kalau misalnya satu juta satu juta orang aja ya kita ngetik aja ya kan 3 detik oke itu
tidak berani berapa menit berapa jam dan seterusnya itu baru berapa kali orang pakai
cincin ini menjadi sangat luar biasa saja sudah 200 hari Bagaimana kalau sekarang
lebih banyak lagi sekolahnya online ya email spam filtering sekarang email
handphone semuanya kering pesan resmi nomor anda terpilih mendapatkan hadiah
Udah otomatis ke email email banyak banget kalau ke sana karena publikasi dosen
banyak banget tentang iklan apa ya apa apa apa Itu otomatis mesin penerjemah Tadi
kan saya sedikit kemarin karena Iya di Jakarta lumayan ini hitam-hitam di Jakarta
juga lumayan sekarang sampai potong rambut untuk suami yang di seberangnya
Akhirnya saya beli mesin potong rambut sendiri kemudian ternyata itu dari Cina
nggak ngerti nggak ada bukunya itu semuanya bahasa China Chinese nggak ada
bahasa Inggrisnya bahasa Indonesianya apa yang saya lakukan ambil handphone pakai
Google langsung jadi apa namanya petunjuk penggunaannya ternyata ini apa ternyata
ini tulisannya menggunakan cara menggunakannya seperti itu yang boleh dilakukan
dan tidak boleh apa aja dulu ke sini itu Lumayanlah jadi kalau kita lagi males nih
biasanya kemudian lagi kondisinya nggak bisa megang keyboard Biasanya kalau saya
suka pakai Google nanti pakai voice typing Ya ngomong aja terus nanti akan bahasa
Indonesia 

Anda mungkin juga menyukai