Người đọc sách nói lo lắng trước sự trỗi dậy của giọng đọc AI 
Người đọc sách nói lo lắng trước sự trỗi dậy của giọng đọc AI 
Khi nhu cầu nội dung âm thanh tăng cao, các công ty đang tìm kiếm cách sản xuất nhanh hơn – và rẻ hơn.

Khi nghĩ về điều khiến một cuốn sách nói trở nên đáng nhớ, ta thường nghĩ đến những khoảnh khắc rất con người: một tiếng nghẹn nơi cổ họng khi nước mắt sắp rơi, hay những lời được thốt ra trong một nụ cười thật sự.

Annabelle Tudor, một diễn viên kiêm người đọc sách nói tại Melbourne, chia sẻ rằng chính bản năng kể chuyện là điều khiến việc đọc sách trở thành một kỹ năng vừa nguyên thủy vừa quý giá. “Giọng nói là phương tiện biểu lộ cảm xúc của chúng ta,” cô nói.

Thế nhưng, nghệ thuật này có thể đang bị đe dọa.

Vào tháng 5, Audible – nhà cung cấp sách nói thuộc sở hữu của Amazon – thông báo rằng họ sẽ cho phép tác giả và nhà xuất bản lựa chọn từ hơn 100 giọng nói được tạo ra bằng trí tuệ nhân tạo (AI) để đọc sách nói bằng các ngôn ngữ Anh, Tây Ban Nha, Pháp và Ý. Dự kiến cuối năm nay, sách nói sẽ còn được dịch tự động bằng AI – thông tin này đã tạo nên làn sóng tò mò và phản ứng trái chiều trong ngành xuất bản.

Tại Úc, nơi có các diễn viên mới như Tudor phải dựa vào công việc này để kiếm thêm thu nhập đang lo lắng về việc mất việc, thiếu minh bạch và giảm chất lượng ngày càng gia tăng.

Tudor, người đã đọc 48 cuốn sách, vẫn chưa tin rằng AI có thể làm được những gì cô làm, nhưng cô lo ngại rằng chất lượng kém có thể khiến khán giả quay lưng với định dạng này.

 

Bùng nổ sách nói

 

Theo báo cáo năm 2024 của NielsenIQ Bookdata, hơn một nửa người dùng sách nói tại Úc cho biết họ đã tăng thời lượng nghe trong vòng 5 năm qua. Trên toàn cầu, doanh số sách nói tại Mỹ tăng 13% từ năm 2023 đến 2024; tại Anh, doanh thu từ sách nói đạt mức cao kỷ lục 268 triệu bảng – tăng 31% so với năm 2023, theo Hiệp hội Nhà xuất bản.

Khi nhu cầu tăng, các công ty đang tìm cách sản xuất nội dung âm thanh nhanh hơn và rẻ hơn. Vào tháng 1 năm 2023, Apple tung ra danh mục sách nói mới được đọc bằng AI. Cuối năm đó, Amazon thông báo rằng các tác giả tự xuất bản tại Mỹ có sách trên Kindle có thể chuyển sách điện tử thành sách nói nhờ công nghệ “giọng đọc ảo” – và hiện có hàng chục ngàn sách nói do máy tính đọc đã xuất hiện trên Audible. 

Đến tháng 2 năm nay, Spotify – trong bước đi mở rộng vào lĩnh vực sách nói – cho biết họ sẽ chấp nhận sách nói sử dụng AI nhằm “giảm rào cản tiếp cận” cho các tác giả muốn tiếp cận thêm độc giả.

Audible nói rằng mục tiêu của họ tương tự: hỗ trợ, chứ không thay thế, giọng đọc con người, giúp nhiều tác giả và đầu sách tiếp cận được khán giả rộng hơn. Tại Mỹ, Audible cũng đang thử nghiệm công nghệ tạo bản sao giọng nói của các diễn viên đọc sách, giúp họ mở rộng khả năng sản xuất sách nói chất lượng cao.

“Trong năm 2023 và 2024, Audible Studios đã thuê nhiều diễn viên đọc sách hơn bao giờ hết,” một người phát ngôn của Audible nói với tờ Guardian. “Chúng tôi tiếp tục nhận được mong muốn từ các tác giả muốn chia sẻ tác phẩm của mình qua âm thanh để tiếp cận khán giả đa ngôn ngữ.”

Tuy nhiên, giọng đọc robot sẽ luôn rẻ hơn giọng người – và giới làm nghề lo rằng sự chuyển dịch sang AI có thể đe dọa sinh kế của họ.

 

Số lượng hay chất lượng?

 

Sự nghiệp đọc sách nói của diễn viên Dorje Swallow khởi sắc sau khi anh bắt đầu đọc các tiểu thuyết của tác giả trinh thám nổi tiếng Chris Hammer – đến nay anh đã thu âm khoảng 70 cuốn. Swallow tin rằng AI là công cụ được tạo ra bởi những người “không hiểu giá trị, kỹ thuật và kỹ năng” cần thiết để làm ra một cuốn sách nói chất lượng.

“Chúng tôi đã cày ải và bỏ rất nhiều công sức để có được vị trí hiện tại, và việc nghĩ rằng bạn chỉ cần bấm một nút là có thể tạo ra sản phẩm tương đương, hay thậm chí đủ tốt, thì thật buồn cười,” anh nói.

Simon Kennedy – Chủ tịch Hiệp hội Diễn viên Lồng tiếng Úc – cho biết luôn có cuộc tranh cãi xoay quanh mức thù lao xứng đáng cho diễn viên đọc sách tại Úc. Để hoàn tất một giờ sách nói, diễn viên có thể phải mất gấp đôi, thậm chí gấp ba thời gian để thu âm – chưa kể phải đọc kỹ toàn bộ sách trước để hiểu nhân vật và câu chuyện.

“Theo ý kiến cá nhân của tôi, việc đưa AI vào làm người kể chuyện là theo đuổi số lượng thay vì chất lượng – và đang làm rẻ đi cả quá trình,” Kennedy nói.

Kennedy đã thành lập Hiệp hội Diễn viên Lồng tiếng Úc (Australian Association of Voice Actors) vào năm 2024 nhằm ứng phó với mối đe dọa từ AI. Trong một kiến nghị gửi đến ủy ban quốc hội năm ngoái, tổ chức này cho biết có tới 5.000 việc làm trong ngành lồng tiếng tại Úc đang bị đe dọa.

Anh không hề bất ngờ trước thông báo của Audible, nhưng cho rằng đây là một “nước đi khá ngu ngốc”.

“Người đọc sách nói có mối quan hệ đặc biệt và thân mật với người nghe – nên bất kỳ điều gì làm giảm sự kết nối ấy đều là một bước đi dại dột,” anh nói.

Về việc có thể sao chép giọng nói của chính mình, Kennedy cho rằng các diễn viên lồng tiếng nên có quyền tham gia – nhưng họ không nên mong đợi mức thù lao tương xứng, và thậm chí có nguy cơ biến chất giọng độc đáo – thương hiệu giọng nói của mình – thành giọng robot sản xuất hàng loạt mà người nghe rất nhanh sẽ cảm thấy chán.

“Nếu bạn chỉ cần một giọng đọc vô cảm, đều đều về âm lượng mà cũng được gọi là 'chất lượng cao' thì được thôi,” anh nói. “Nhưng nếu ‘chất lượng cao’ trong mắt bạn là một cách kể chuyện lôi cuốn, khiến người nghe phải hồi hộp đến mức ‘ngồi không yên trên ghế’, thì đừng hy vọng AI có thể mang lại điều đó.”

Một mối lo lớn khác là việc Úc chưa có bất kỳ quy định nào về AI. Trong khi Liên minh châu Âu (EU) đã có Đạo luật AI, còn Trung Quốc và Tây Ban Nha đã ban hành các quy định về dán nhãn nội dung do AI tạo ra, thì Úc đang tụt lại phía sau.

“Không có luật nào ngăn việc quét dữ liệu (data scraping) hay sao chép giọng nói mà không có sự đồng ý, hay tạo deepfake của ai đó,” Kennedy nói. “Không có luật nào yêu cầu dán nhãn hay đánh dấu nguồn gốc nội dung do AI tạo ra; không có luật bắt buộc minh bạch về dữ liệu dùng để huấn luyện AI; và cũng không có quy định nào về việc sử dụng deepfake, giọng nói nhân bản hay văn bản do AI tạo ra một cách phù hợp.”

 

“Chân đang đạp ga lao thẳng vào một thế giới đen tối”

 

Năm nay, Hannah Kent – tác giả của Burial Rites và Devotion – là một trong nhiều nhà văn Úc nổi tiếng bàng hoàng khi phát hiện tác phẩm của mình bị vi phạm bản quyền và bị sử dụng để huấn luyện hệ thống AI của Meta. Cô cho biết phản ứng đầu tiên của mình trước sự xâm nhập của AI vào lĩnh vực sáng tạo thường là “phản đối và phẫn nộ”, nhưng cô cũng cảm thấy tò mò trước thông báo mới từ Audible – đặc biệt là kế hoạch thử nghiệm AI để dịch văn bản sang nhiều ngôn ngữ khác nhau.

“Tôi nghĩ điều khá rõ ràng là lý do chính để sử dụng AI là vì chi phí,” Kent nói. “Và điều đó sẽ làm mọi thứ rẻ đi – theo cả nghĩa đen lẫn nghĩa bóng – làm mất đi giá trị sáng tạo, sự trân trọng dành cho bản năng kể chuyện và nghệ thuật.”

Tudor và Swallow tin rằng các tập đoàn lớn sẽ khó lòng thay thế hoàn toàn giọng đọc con người, một phần vì nhiều tác giả Úc sẽ phản đối điều đó.

Tuy nhiên, việc người nghe có nhận ra sự khác biệt hay không thì vẫn còn là dấu hỏi.

“Chân đang đạp ga lao thẳng vào một thế giới đen tối,” Tudor nói. “Liệu chúng ta có thể nghe người thật thay vì robot được không?”

- Theo The Guardian

 

Tags: