Trong bối cảnh tiêu thụ nội dung toàn cầu tăng cao và nhu cầu về nội dung không phải tiếng Anh vượt qua cả phim ảnh và chương trình tiếng Anh, IMAX đang tận dụng AI để mở rộng quy mô bản địa hóa nội dung gốc của mình.

Theo báo cáo của PwC, ngành công nghiệp giải trí và truyền thông đã tăng trưởng 5% lên 2,8 nghìn tỷ USD vào năm 2023. Ngành này dự kiến sẽ tiếp tục mở rộng, mặc dù với tốc độ tăng trưởng kép hàng năm khiêm tốn gần 4% lên 3,4 nghìn tỷ USD trong vòng 5 năm tới. Nội dung ngôn ngữ không phải tiếng Anh đang phát triển nhanh chóng ngay cả ở các thị trường tiếng Anh, bao gồm Mỹ, Anh, Úc và Canada. Năm ngoái, Netflix đã báo cáo lượng người xem nội dung không phải tiếng Anh ở Anh tăng 90% trong ba năm qua.
IMAX đã nhận thấy xu hướng này và hiện đang khám phá khả năng bản địa hóa bằng AI để thu hút thêm người xem.
Vào thứ Hai, công ty sản xuất rạp chiếu phim của Canada, được biết đến với các rạp chiếu phim khổng lồ và trải nghiệm phim nhập vai, đã thông báo hợp tác với startup Camb.ai có trụ sở tại Dubai để sử dụng các mô hình giọng nói AI của mình để dịch nội dung gốc, bao gồm phim tài liệu.
Camb.ai, công ty đã triển khai lồng tiếng AI và dịch thuật giọng nói cho các sự kiện và giải đấu thể thao trực tiếp, bao gồm Australian Open, Eurovision Sport và Major League Soccer, cung cấp mô hình Boli cho dịch thuật lời nói thành văn bản và Mars cho mô phỏng giọng nói. Các mô hình này có sẵn thông qua nền tảng DubStudio của startup, hỗ trợ 140 ngôn ngữ, bao gồm nhiều ngôn ngữ ít tài nguyên không có nhiều dữ liệu trên internet.
Akshat Prakash, đồng sáng lập và CTO của Camb.ai, cho biết trong một cuộc phỏng vấn độc quyền: “Các công ty như OpenAI và Anthropic có tầm nhìn khác về xã hội. Họ đang cố gắng xây dựng các mô hình rất ‘ngang’ và có thể bao quát một lượng lớn nhiệm vụ… Chúng tôi hoàn toàn không phải làm điều đó. Một số mô hình của chúng tôi có ít hơn 100 triệu tham số và siêu chuyên biệt”.
Prakash, cựu kỹ sư của Apple, người đã làm việc với nhóm phát triển các mô hình AI và ML cho Siri, đã đồng sáng lập Camb.ai với cha mình là Avneesh Prakash vào năm ngoái.
“Chúng tôi cách nhau một thế hệ, và lớn lên ở Ấn Độ. Cách nhau ba mươi năm, chúng tôi gặp phải những thách thức ngôn ngữ giống nhau”, CTO chia sẻ.
Ông cho biết Camb.ai đã đào tạo trước 70% mô hình của mình bằng cách sử dụng các bộ dữ liệu được cấp phép học thuật, có thể sử dụng cho mục đích thương mại. 30% còn lại liên quan đến việc tinh chỉnh dữ liệu mà công ty nhận được thông qua các đối tác ban đầu triển khai mô hình của mình để lồng tiếng và dịch thuật dựa trên AI.
“Những gì chúng tôi không làm, và chúng tôi đã rất cẩn thận và hoàn toàn tránh điều đó, là khả năng ‘cạo’ dữ liệu trên internet”, Prakash khẳng định. “Một số công ty cảm thấy rằng họ có thể thoát khỏi việc đó vì họ đang xây dựng một ứng dụng hoặc công cụ hướng đến người tiêu dùng và họ tin rằng việc ‘cạo’ dữ liệu, chẳng hạn như 10 petabyte dữ liệu trên internet là ổn”.
Camb.ai sử dụng phương pháp “ba lớp” để cung cấp dịch thuật dựa trên AI, bao gồm lớp nền tảng là các mô hình Boli và Mars, lớp cơ sở hạ tầng lưu trữ các mô hình AI này và sau đó là nền tảng DubStudio cho giao diện người dùng.
Không giống như các mô hình dựa trên AI khác, Boli của Camb.ai lấy các mã thông báo giọng nói đầu vào, tạo ra các mã thông báo văn bản đầu ra bằng ngôn ngữ được dịch và giữ lại các sắc thái, Prakash tuyên bố. Khi Boli tạo ra văn bản, Mars sẽ dịch văn bản thành giọng nói bằng cách sử dụng cùng một tín hiệu âm thanh đầu vào để ghi lại hiệu suất của âm thanh thực tế, bao gồm cả âm thanh xung quanh, chẳng hạn như nhạc nền của khán giả cổ vũ trong trường hợp sự kiện thể thao, ông nói.
Prakash nói rằng công nghệ của Camb.ai cung cấp dịch thuật giọng nói đồng thời lên đến 10 ngôn ngữ với độ trễ từ 20 đến 30 giây, có thể được bao phủ bởi độ trễ phát trực tuyến và phát sóng từ 30 đến 40 giây.
IMAX sẽ triển khai dịch thuật AI theo từng giai đoạn, bắt đầu với các ngôn ngữ có nhiều tài nguyên. Việc triển khai diễn ra sau khi thử nghiệm nội bộ công nghệ của Camb.ai trên nội dung gốc của mình.
“Mặc dù chúng tôi mới chỉ ở giai đoạn đầu của quan hệ đối tác, nhưng chúng tôi sẽ tiếp tục hợp tác để khám phá tốt hơn tiềm năng của nó và cách nó có thể giúp chúng tôi tiến lên tốt nhất”, Mark Welton, chủ tịch của IMAX Global cho biết.
Welton chỉ ra rằng việc triển khai AI sẽ giúp tiết kiệm chi phí dịch thuật mà không tiết lộ thông tin cụ thể.
Camb.ai hiện có đội ngũ 50 người. Vào tháng 2, công ty đã huy động được 4 triệu USD trong vòng hạt giống do Courtside Ventures dẫn đầu. Prakash chia sẻ rằng startup đang chốt một vòng gọi vốn pre-Series A lớn hơn để mở rộng phạm vi tiếp cận và số lượng nhân viên.
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)