Anda di halaman 1dari 3

Unlocking The Potential of AI : From Machine Intelligence Perspective

Speaker : Bin Ma
AI (Kecerdasan buatan) sudah menjadi bahan riset dan pengembangan sejak dulu. Sampai
sekarang, AI masih terus dikembangkan untuk membuat aplikasi pintar. Terdapat 5 riset
area yaitu Machine Intelligence, Data Computing, Robotics, Financial Technology, dan X
Laboratory. Setiap riset area memiliki laboratory/sub nya masing masing.
MinD (Machine Intelligence Division)
Vision : Inventing cutting-edge AI Technology and products
MinD tersebut dilakukan oleh 1000+ periset dan teknisi (45% dengan gelar PhD) . Topik
risetnya yaitu Speech interaction, Natural language processing, image & vision, intelligence
decision.
Speech interaction mengembangkan pengolahan suara untuk membuat interaksi manusia
dengan komputer menjadi lebih mudah dan cepat. IoT module untuk speech interaction ini
membutuhkan 3 fitur untuk pengembangannya yaitu; performa yang baik, biaya
produksinya tidak mahal, dan konsumsi daya yang rendah. Pengembangan microphone
polar array dengan kualitas suara yang baik juga mendukung teknologi speech interaction.
Teknologi ASR dalam speech recognition terdiri dari metode DFSMN dan End to end. Natural
language understanding diperlukan untuk mendukung AI dalam berbagai bahasa, untuk itu
digyunakan proses multilingual neural machine translation dan machine reading
comprehension.
Speech Synthesis (TTS) Technology
KAN-TTS : traditional and end-to-end TTS, meningkatkan kualitas TTS secara signifikan.
Kustomisasi voice oleh user dengan batas maksimal rekam 10 menit.
Lite Kan TTS : Kalkulasi acoustic model dikurangi 100 kali lipat, ukuran acoustic model
dikompres 35 kali lebih kecil. Kualitas performa masih tetap baik.
Mix-lingual TTS : Cross lingual voice conversion, Mix-lingual TTS dengan suara speaker
mono.
Pengembangan voice search untuk e-Commerce :
Memberikan interaksi yang natural dan cepat untuk pengguna dalam mencari produk yang
diinginkan. Voice search ini sudah tersedia di aplikasi Lazada di beberapa negara. Lazada
menjadi e-commerce yang pertama kali memiliki fitur voice search.
QC pintar pada call centers : Unstructured data diubah menjadi structured data melalui
beberapa mesin dan tahap. Tujuan penerapan AI ini untuk mempromosikan kualitas
layanan, memantau resiko, dan mengoptimalkan strategi layanan.
Customer service berbasis AI pada event Alibaba 11.11 : Alipay hotline sudah diperlengkapi
teknologi speech dialogue. 98% penelpon customer service telah dilayani dengan baik oleh
teknologi ini, jika dihitung bisa menghemat 85000 orang customer service junior.
Multi modal speech interaction : memadukan suara dan visual yang ditangkap untuk
mengcapture suara user lebih akurat dalam keadaan bising, menggunakan UHD periscopic
camera dan Large-scal Array Mic. Telah diaplikasikan pada mesin tiket di Shanghai Metro.
Audio-Visual Meeting Solutions :untuk meningkatkan kualtias audio dan video saat meeting,
diperlukan :

 Signal processing : pendekatan deep learning untuk algoritma AEC,ANS,AGC.


Peningkatan kualitas sinyal dan bandwith untuk meningkatkan kualtias audio.
 Audio hardware : mikrofon dengan hardware differential directional array
technology untuk kualitas audio, speaker separation, dan voice recognition yang
baik.
 Meeting transcription : speech to text transcription. Multi skenario untuk
mendukung banyak software dan hardware tambahan.
Speech translation : Penerjemah otomatis yang saat ini sedang dikembangkan untuk
menejermahkan speech secara live sehingga dapat dipahami penonton dari berbagai
negara.
Smart Speaker : Tmall Genie merupakan produk speaker berbasis AI dari china yang
mengadopsi beberapa teknologi untuk mendukung speech interaction dan berbagai fitur
pintar lainnya.
Pada 2018, Alibaba membentuk Alibaba-NTU Joint Research Institut. Institut ini berfokus
pada riset AI. (Speech and NLP, City Brain, E-Commerce, Search and reccomendation,
medical and health, safety).
Alibaba Talent programme in Singapore : Alibaba berkolaborasi dengan berbagai universitas
untuk mencari programmer muda dengan acceptance rate <2.5%

Komentar :
Menurut saya, teknologi AI yang disampaikan sudah merujuk pada kebutuhan dan kondisi
saat ini. Pandemi covid 19 menyebabkan peningkatan penggunaan virtual meeting. Signal
processing, audio hardware enhancement tentunya akan bermanfaat dalam meningkatkan
user experiece dan user satisfication saat menggunakan platform virtual meeting.
Materi dari judul “Unlocking The Potential of AI : from Machine Intelligence Perspective”
membuat ekspektasi saya lebih. Seolah olah machine intellegence hanya berfokus pada
speech recognition.
Speech recognition memang potensial untuk mempermudah interaksi. Saat ini sudah
banyak produk produk berbasis AI misalnya produk smart home yang dikontrol lewat suara
(google assistant,siri, etc) .
Penerapan speech recognition di Indonesia menurut saya masih segmented, tidak semua
orang dan semua alat menjadi lebih baik jika menggunakan speech recognition.Banyak
orang lebih memilih mengoperasikan alat secara biasa (menggunakan tombol dsb).
Slide presentasi menurut saya sudah simpel dan mudah dipahami, walaupun ada yang susah
terbaca karena terlalu kecil misalnya pada slide ke-9 dan 10.
Penyampaian dari Bin Ma juga sudah baik walaupun menurut saya terlalu terpaku pada
powerpoint (jika dibandingkan dengan speaker lain di AIS).

Anda mungkin juga menyukai