New York | EGINDO.co – Ketika orang-orang bersiap menghadapi dampak disruptif dari kecerdasan buatan terhadap pekerjaan dan kehidupan sehari-hari, mereka yang berkecimpung di dunia buku audio mengatakan bahwa bidang mereka sudah bertransformasi.
AI memiliki kemampuan untuk membuat rekaman yang terdengar seperti suara manusia – dengan kecepatan lini perakitan – sambil melewati setidaknya sebagian layanan dari para profesional manusia yang selama bertahun-tahun mencari nafkah dengan suara mereka.
Banyak dari mereka yang sudah mengalami penurunan tajam dalam bisnis.
Tanya Eby telah menjadi pengisi suara dan narator profesional selama 20 tahun. Dia memiliki studio rekaman di rumahnya.
Namun dalam enam bulan terakhir, ia telah melihat beban kerjanya berkurang setengahnya. Pemesanannya sekarang hanya berlangsung hingga bulan Juni, sementara pada tahun-tahun normal biasanya berlangsung hingga bulan Agustus.
Banyak rekan-rekannya melaporkan penurunan serupa.
Meskipun ada faktor lain yang mungkin berperan, ia mengatakan kepada AFP, “Tampaknya masuk akal jika AI memengaruhi kita semua.”
Tidak ada label yang mengidentifikasi rekaman yang dibantu oleh AI, tetapi para profesional mengatakan bahwa ribuan buku audio yang saat ini beredar menggunakan “suara” yang dihasilkan dari bank data.
Di antara yang paling mutakhir, DeepZen menawarkan harga yang dapat memangkas biaya produksi buku audio hingga seperempat, atau kurang, dari proyek tradisional.
Perusahaan kecil yang berbasis di London ini menggunakan basis data yang dibuatnya dengan merekam suara beberapa aktor yang diminta untuk berbicara dalam berbagai macam register emosional.
“Setiap suara yang kami gunakan, kami menandatangani perjanjian lisensi, dan kami membayar untuk rekamannya,” kata CEO DeepZen, Kamis Taylan.
Untuk setiap proyek, ia menambahkan, “kami membayar royalti berdasarkan pekerjaan yang kami lakukan.”
Tidak semua orang menghormati standar tersebut, kata Eby.
“Banyak perusahaan baru bermunculan yang tidak beretika,” ujarnya, dan beberapa di antaranya menggunakan suara yang ada di database tanpa membayar.
“Ada area abu-abu” yang dieksploitasi oleh beberapa platform, Taylan mengakui.
“Mereka mengambil suara Anda, suara saya, lima suara orang lain yang digabungkan sehingga menciptakan suara yang terpisah… Mereka mengatakan bahwa itu bukan milik siapa-siapa.”
Semua perusahaan rekaman yang dihubungi oleh AFP membantah melakukan praktik semacam itu.
Speechki, perusahaan rintisan yang berbasis di Texas, menggunakan rekamannya sendiri dan suara-suara dari bank data yang ada, kata CEO Dima Abramov.
Namun hal itu dilakukan hanya setelah kontrak ditandatangani yang mencakup hak penggunaan, katanya.
Masa Depan Koeksistensi?
Lima penerbit terbesar di AS tidak menanggapi permintaan komentar.
Namun para profesional yang dihubungi oleh AFP mengatakan bahwa beberapa penerbit tradisional sudah menggunakan apa yang disebut dengan AI generatif, yang dapat membuat teks, gambar, video, dan suara dari konten yang sudah ada – tanpa campur tangan manusia.
“Narasi profesional selalu dan akan tetap menjadi inti dari pengalaman mendengarkan Audible,” kata juru bicara anak perusahaan Amazon, raksasa di sektor buku audio di Amerika.
“Namun, seiring dengan meningkatnya teknologi text-to-speech, kami melihat masa depan di mana penampilan manusia dan konten yang dihasilkan text-to-speech dapat hidup berdampingan.”
Raksasa teknologi AS, yang sangat terlibat dalam bidang AI yang berkembang pesat, semuanya mengejar bisnis yang menjanjikan dari buku audio yang dinarasikan secara digital.
“Dapat Diakses Oleh Semua Orang”
Pada awal tahun ini, Apple mengumumkan bahwa mereka akan beralih ke buku audio yang dinarasikan oleh AI, sebuah langkah yang dikatakannya akan membuat “pembuatan buku audio lebih mudah diakses oleh semua orang”, terutama penulis independen dan penerbit kecil.
Google menawarkan layanan serupa, yang disebutnya sebagai “narasi otomatis”.
“Kita harus mendemokratisasi industri penerbitan, karena hanya nama-nama terkenal dan besar yang diubah menjadi audio,” kata Taylan.
“Narasi sintetis baru saja membuka pintu bagi buku-buku lama yang belum pernah direkam, dan semua buku dari masa depan yang tidak akan pernah direkam karena alasan ekonomi,” tambah Abramov dari Speechki.
Mengingat biaya perekaman berbasis manusia, ia menambahkan, hanya sekitar lima persen dari semua buku yang diubah menjadi buku audio.
Namun Abramov bersikeras bahwa pasar yang terus berkembang juga akan menguntungkan para pengisi suara.
“Mereka akan menghasilkan lebih banyak uang, mereka akan membuat lebih banyak rekaman,” katanya.
Elemen Manusia
“Inti dari mendongeng adalah mengajarkan manusia bagaimana menjadi manusia. Dan kami merasa sangat yakin bahwa hal itu tidak boleh diberikan kepada mesin untuk mengajari kita tentang bagaimana menjadi manusia,” ujar Emily Ellet, seorang aktor dan narator buku audio yang mendirikan Asosiasi Narator Buku Audio Profesional (PANA).
“Mendongeng,” tambahnya, “harus tetap menjadi manusia sepenuhnya.”
Eby menggarisbawahi kritik yang sering dilontarkan terhadap rekaman yang dibuat secara digital.
Jika dibandingkan dengan rekaman manusia, katanya, produk AI “tidak memiliki konektivitas emosional”.
Eby mengatakan bahwa dia khawatir, bagaimanapun juga, bahwa orang-orang akan menjadi terbiasa dengan versi yang dihasilkan oleh mesin, “dan saya pikir itulah yang terjadi secara diam-diam”.
Harapannya hanyalah “agar perusahaan-perusahaan memberi tahu para pendengar bahwa mereka mendengarkan karya yang dihasilkan oleh AI… Saya hanya ingin orang-orang jujur tentang hal itu”.
Sumber : CNA/SL