New York | EGINDO.co – Perusahaan induk Facebook, Meta Platforms, pada Selasa (22 Agustus) merilis model AI yang mampu menerjemahkan dan menyalin ucapan dalam puluhan bahasa, sebuah landasan potensial untuk alat yang memungkinkan komunikasi real-time lintas bahasa.
Perusahaan mengatakan dalam posting blog bahwa model SeamlessM4T dapat mendukung terjemahan antara teks dan ucapan dalam hampir 100 bahasa, serta terjemahan ucapan-ke-ucapan penuh untuk 35 bahasa, menggabungkan teknologi yang sebelumnya hanya tersedia dalam model terpisah.
CEO Mark Zuckerberg mengatakan dia membayangkan alat seperti itu memfasilitasi interaksi antara pengguna dari seluruh dunia di metaverse, kumpulan dunia virtual yang saling berhubungan di mana dia mempertaruhkan masa depan perusahaan.
Meta membuat model tersedia untuk umum untuk penggunaan non-komersial, kata posting blog tersebut.
Perusahaan media sosial terbesar di dunia telah merilis banyak model AI gratis tahun ini, termasuk model bahasa besar yang disebut Llama yang menimbulkan tantangan serius bagi model berpemilik yang dijual oleh OpenAI yang didukung Microsoft dan Google Alphabet.
Zuckerberg mengatakan ekosistem AI terbuka bekerja untuk keuntungan Meta, karena perusahaan memiliki lebih banyak keuntungan dengan secara efektif mengumpulkan sumber pembuatan alat yang menghadap konsumen untuk platform sosialnya daripada dengan mengenakan biaya untuk akses ke model.
Meskipun demikian, Meta menghadapi pertanyaan hukum yang serupa dengan industri lainnya seputar data pelatihan yang diserap untuk membuat modelnya.
Pada bulan Juli, komedian Sarah Silverman dan dua penulis lainnya mengajukan tuntutan hukum pelanggaran hak cipta terhadap Meta dan OpenAI, menuduh perusahaan tersebut menggunakan buku mereka sebagai data pelatihan tanpa izin.
Untuk model SeamlessM4T, peneliti Meta mengatakan dalam makalah penelitian bahwa mereka mengumpulkan data pelatihan audio dari 4 juta jam “audio mentah yang berasal dari repositori data web yang dirayapi yang tersedia untuk umum”, tanpa menentukan repositori mana.
Seorang juru bicara Meta tidak menanggapi pertanyaan tentang asal usul data audio tersebut.
Data teks berasal dari kumpulan data yang dibuat tahun lalu yang menarik konten dari Wikipedia dan situs web terkait, kata makalah penelitian itu.
Sumber : CNA/SL