Siapa yang bakal menjadi bahasa ibu AI

Siapa yang bakal menjadi bahasa ibu AI, bahasa Inggris atau Mandarin. AI atau Kecerdasan buatan saat ini merupakan teknologi paling populer di dunia. Semua negara menginvestasikan banyak modal dan tenaga kerja dalam penelitian teknologi ini. Barang Siapa yang melewatkan kecerdasan buatan akan kehilangan masa depan dan hak berbicara.

Bahasa dan tulisan menempati posisi yang sangat penting dalam kecerdasan buatan. Mereka adalah alat untuk interaksi antara manusia dan kecerdasan buatan. Hanya dengan memahami bahasa dan tulisan secara akurat, kecerdasan buatan baru dapat merespons secara akurat dan menunjukkan IQ yang tinggi. 

Siapa yang bakal menjadi bahasa ibu AI

Apakah bahasa Inggris atau bahasa Mandarin, berhubung saat ini kedua negara Adidaya AS dan Tiongkok merupakan negara dengan kontibusi positif dan terbanyak dalam teknologi AI.

Dari perspektif Pengenalan suara, ucapan bahasa Inggris mungkin lebih akurat dan efisien daripada bahasa Mandarin. Bahasa Inggris terdiri dari 26 huruf. Struktur logikanya sangat sederhana. Pelafalan berdasarkan huruf. Perbedaan antara simbol fonetik dan antara daerah fonetik sangat jelas.

Selama ucapan lisan tidak terlalu cepat, AI dapat mengenali setiap huruf dengan lebih mudah dan akurat. Apalagi kata-kata homofoniknya Relatif sedikit. Jadi efisiensi pengenalan suara bahasa Inggris jauh di depan bahasa Mandarin.

Pelafalan bahasa Mandarin jauh lebih rumit. Pelafalan Pinyin memiliki 23 inisial, 6 vokal tunggal, 18 vokal kompleks, dan 16 suku kata pengenalan keseluruhan. Keseluruhan program memiliki total 63 elemen pengucapan. Selain itu, ada empat nada dalam bahasa Mandarin, ditambah dengan beragam dialek. Jika salah pengucapannya, akan sangat memengaruhi pengenalan suara AI .

Saat AI melakukan pengenalan bahasa Mandarin, AI perlu melakukan pengenalan pengucapan terlebih dahulu. Baru kemudian menilai karakter bahasa Mandarin berdasarkan kata-kata. Efisiensi pengenalan suara lebih rendah daripada bahasa Inggris. Tingkat kesalahan pengenalan juga lebih tinggi daripada bahasa Inggris.

Jadi dalam bidang Pengenalan suara, bahasa Inggris jauh lebih efisien dibanding bahasa Mandarin.

Sebaliknya, Dalam perspektif pengenalan teks bahasa Mandarin jauh lebih efektik daripada bahasa Inggris. Bahasa Mandarin memiliki fitur yang membuat pengenalan teks AI lebih efisien. Seperti Kepadatan informasi karakter bahasa Mandarin sangat tinggi.

Lebih sedikit kata, namun mengandung lebih banyak informasi. Artikel bahasa Mandarin selalu lebih pendek daripada bahasa Inggris. Secara keseluruhan, kepadatan informasi bahasa Mandarin ”37,5%“ lebih tinggi daripada bahasa Inggris.

Di samping itu, Bahasa Mandarin menggunakan karakter China (Hanzi) sebagai unit satuan dan dapat disusun secara fleksibel. Baik secara horizontal maupun vertikal. Sedangkan, Bahasa Inggris adalah teks linier yang hanya dapat disusun secara horizontal. Efisiensi pengenalan susunan vertikal dan tidak beraturan akan menyebabkan banyak error dalam bahasa Inggris.

Kemampuan ekspresi independen yang kuat dari karakter China. Misalnya, ” 他去吃晚餐“, Dia pergi makan malam. Anda dapat memahami arti satu kata dengan hanya membaca satu kata. Sedangkan dalam bahasa Inggris, “He went to have dinner”, jika Anda melihat kata “have”, Anda masih belum jelas apa artinya. Hanya ketika melihat “dinner” kita baru tahu “have” artinya “makan.” Went to artinya pergi, arti seluruh kalimatnya adalah pergi makan malam.

Ideogram bahasa Inggris lebih mengandalkan kata ” frase ” atau bahkan seluruh kalimat. Anda seringkali tidak dapat mengetahui arti sebuah kalimat tanpa membaca kalimat lengkapnya. Hal ini membuat pengenalan teks AI menjadi sulit. Karena kemampuan pengenalan teks yang berlompatan rada kurang efisien.

Sehingga, dalam perspektif Pengenalan teks, bahasa Mandarin jauh lebih akurat dan efisien.

Hambatan terbesar pengembangan kecerdasan buatan dalam bahasa Mandarin adalah fenomena homofon. Misalnya, nama keluarga atau marga seseorang adalah “Zhang”. Jadi, apakah ” 张 ” atau ” 章 ” ini ? Sangat Sulit untuk menghitung secara akurat jumlah homofon dalam bahasa Mandarin. Itulah sebabnya, Homofon juga merupakan alasan terbesar bagi pengguna bahasa Inggris untuk menyerang ambiguitas bahasa Mandarin.

Walaupun ada banyak homophones dalam bahasa Inggris juga, seperti “right, write; meet , meat ; hole , whole; pear, pair; flower, flour dsb. Sebenarnya, jumlah homophones dalam bahasa Inggris jauh lebih banyak daripada bahasa Mandarin. Dalam bahasa Inggris, fenomena homofon sengaja dikurangi dengan menciptakan lebih banyak kata atau kalimat.

Sejauh ini, AI tidak dapat menangani karakter polifonik secara akurat. Sehingga,   kesalahan tidak bisa dihindari. Supaya AI lebih akurat, apakah manusia hanya dapat menghilangkan kata-kata polifonik melalui reformasi bahasa? Ini suatu masalah besar. Sangat sulit bagi manusia untuk beradaptasi dengan reformasi sebesar itu, saya rasa.

Dari segi Homofon, bahasa Inggris mungkin lebih baik dan efisien.

Sedangkan, dari perspektif kata-kata polisem atau Sebuah kata yang mengandung banyak arti tidak bisa dihindari dalam setiap bahasa. Jika setiap kosakata hanya mengungkapkan satu arti yang akurat, maka jutaan kata-kata tidak akan dapat terkandung. Baik dalam bahasa Mandarin atau bahasa Inggris. Sebuah kata tidak hanya mengungkapkan satu arti. Sebaliknya biasanya memiliki banyak arti. Bahkan, terkadang perbedaannya juga sangat besar.

Misalnya, “close” memiliki banyak arti diantaranya tutup, dekat, rapat, erat, akrab, ketat, hampir, akhir, penutupan, intim, tidak jauh, jalan buntu, dan masih banyak lagi. Saat ini kemampuan artificial intelligence dalam mengenali arti kata melalui konteks masih tergolong lemah. AI masih sering membuat kesalahan ketika menemui kata polisem. Hal ini juga menjadi kendala dalam pengembangan artificial intelligence.

Kesimpulannya, dalam segi Kata polisem, baik bahasa Mandarin maupun bahasa Inggris menghadapi masalah yang sama beratnya. Tidak ada yang lebih unggul atau efisien dari yang lain.

Terakhir, dari perspektif pengenalan segmen secara keseluruhan siapa yang bakal menjadi bahasa ibu AI. Bila kita meminta AI menterjemahkan satu katu, atau satu kalimat mungkin tidak memiliki nilai praktis yang tinggi. Hanya dengan pengenalan teks secara keseluruhan baru dapat dianggap memiliki nilai tinggi. Mari kita lihat terjemahan bahasa Mandarin dan Inggris untuk menguji kemampuan AI dalam mengenali kedua bahasa tersebut.

Teks asli bahasa Inggris dan Bahasa Mandarin adalah sebagai berikut:

“Things that trend in these two countries are insanely different. For example: knowledge-based content is extremely popular in China, and less so in the US. Also, this was wild to me: those creators that did the most dance videos in China are users born in the 60s, whereas in the US, it seems that it’s mostly teenagers who are creating the dances,” she wrote.

她写道:“这两个国家的趋势截然不同,比如:知识性内容在中国很流行,但在美国稍差一些。而且,这一点对我来说很疯狂:中国最喜欢拍舞蹈视频的是60后,但在美国,好像是年轻人最喜欢拍舞蹈视频。”

Berikut adalah terjemahan AI dari ” bahasa Inggris semula ” ke dalam bahasa Mandarin:  “这两个国家的趋势截然不同。例如:以知识为基础的内容在中国非常受欢迎,而在美国却很少。此外,这对我来说很疯狂:在中国制作舞蹈视频最多的创作者是 她出生于60年代的用户,而在美国,似乎是大多数年轻人在创作舞蹈。”她写道。

Ada satu kalimat distorsi yang sangat serius: 

有一句失真比较严重:“在中国制作舞蹈视频最多的创作者是 她出生于60年代的用户。”

Teks asli bahasa Inggris dari kalimat ini adalah: 

“those creators that did the most dance videos in China are users born in the 60s ”。

Ini adalah kalimat yang panjang dalam bahasa Inggris. Urutan katanya lebih rumit.  Bercampur dengan preposisi yang berantakan, menyebabkan otak kecerdasan buatan menjadi bingung dan gagal mengenalinya secara akurat.

Kesalahan pengenalan bahasa Inggris ini sangat umum. Hal ini menunjukkan kelemahan tata bahasa Inggris dan urutan kata yang terlalu rumit. Jika ingin menerjemahkan kalimat panjang bahasa Inggris yang lebih kompleks, saat ini tampaknya AI tidak berdaya. Ini juga merupakan kelemahan setiap teks fonetik.

Bagaimana AI mempelajari bahasa manusia

Berikut adalah hasil terjemahan AI dari bahasa Mandarin asli ke dalam bahasa Inggris:

“The trends in these two countries are quite different. For example, intellectual content is very popular in China, but a bit worse in the United States. Moreover, this is crazy to me: China’s favorite dance video is born in the 60s, but in the United States, it seems that young people like to shoot dance videos the most,” she wrote.

Terjemahan bahasa Mandarin tampaknya lebih akurat. Hampir tidak ada perbedaan ideologi dari teks aslinya. Artinya, AI menterjemahkan dan mengembalikan makna teks seperti aslinya. Dapat dilihat dalam hal ini, bahasa Mandarin memiliki keunggulan lebih daripada bahasa Inggris dalam hal pengenalan seluruh paragraf dan artikel.

Siapa yang bakal menjadi bahasa ibu AI
Siapa yang bakal menjadi bahasa ibu AI (Image: USC news)

Bahasa Mandarin terbentuk dari satu karakter China (Hanzi), dengan sedikit kalimat panjang. Tata bahasa sederhana, dan urutan kata yang sederhana juga. Struktur kalimat jauh lebih sederhana daripada bahasa Inggris linier, yang lebih kondusif untuk pengenalan AI.

Just like grandma says, Di bidang kecerdasan buatan, bahasa Inggris lebih efisien dalam bahasa lisan, sedangkan, bahasa Mandarin lebih unggul dan efisien dalam bahasa tertulis. Masing-masing memiliki kelebihannya sendiri. Terlalu dini untuk mengatakan siapa yang bakal menjadi bahasa ibu AI. Namun, dalam hal ekspresi konten yang lebih kompleks, AI lebih mudah mengenali bahasa Mandarin daripada bahasa Inggris.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.