Microsoft ứng dụng AI để tạo bản sao giọng nói chân thực cho cuộc gọi Teams
17:18 28/11/2024
[rt_reading_time postfix="phút đọc" postfix_singular="phút đọc"]
Người dùng Microsoft Teams sắp có thể sử dụng phiên bản giọng nói nhân bản của chính mình để nói và dịch cuộc trò chuyện thời gian thực, nhờ công cụ mới của Microsoft, Interpreter, được hỗ trợ bởi trí tuệ nhân tạo.
Được công bố tại hội nghị Microsoft Ignite hàng năm, tính năng mới này cho phép người dùng tạo ra bản sao kỹ thuật số của giọng nói của họ, sau đó có thể được sử dụng để dịch lời nói của họ sang nhiều ngôn ngữ khác nhau. “Hãy tưởng tượng bạn có thể nghe giống hệt như mình bằng một ngôn ngữ khác. Interpreter trong Teams cung cấp dịch thuật giọng nói-giọng nói thời gian thực trong các cuộc họp, và bạn có thể chọn để nó mô phỏng giọng nói của bạn để có trải nghiệm cá nhân và hấp dẫn hơn,” Giám đốc Marketing của Microsoft, Jared Spataro, viết trong một bài đăng trên blog chia sẻ với ấn phẩm này.
Tính năng này chỉ dành cho người đăng ký Microsoft365 và ban đầu sẽ được ra mắt cho tiếng Anh, Pháp, Đức, Ý, Nhật Bản, Hàn Quốc, Bồ Đào Nha, Trung Quốc giản thể, và Tây Ban Nha.
Interpreter của Microsoft có tiềm năng giúp công việc từ xa và giao tiếp kỹ thuật số trở nên dễ tiếp cận hơn với nhiều người nói ngôn ngữ không phải tiếng Anh, mặc dù nó chưa linh hoạt như một người phiên dịch trực tiếp. Và ngoài ứng dụng trực tiếp của nó, công cụ này còn đặt ra nhiều câu hỏi hơn về bảo mật và thiên vị công nghệ.
Một nghiên cứu gần đây cho thấy công cụ phiên âm được hỗ trợ bởi AI phổ biến, Whisper – cũng được sử dụng trong các chương trình điện toán đám mây của Microsoft – dễ bị ảo giác, bao gồm cả việc phát minh nội dung hoặc cụm từ khi dịch thông tin bệnh nhân trong lĩnh vực y tế. Điều này đặc biệt đúng đối với những bệnh nhân mắc chứng rối loạn ngôn ngữ như chứng mất ngôn ngữ. Trước đây, AI Humane được quảng cáo nhiều, được quảng cáo vì khả năng dịch thuật trực tiếp của nó, hóa ra lại là một lựa chọn kỹ thuật số không nhất quán so với dịch thuật của con người. Giải quyết những lo ngại tương tự đối với Interpreter của Teams, Microsoft nói với: “Interpreter được thiết kế để tái tạo thông điệp của người nói một cách trung thực nhất có thể mà không thêm giả định hoặc thông tin ngoại lai. Mô phỏng giọng nói chỉ có thể được kích hoạt khi người dùng cung cấp sự đồng ý thông qua một thông báo trong cuộc họp hoặc bằng cách kích hoạt “Đồng ý mô phỏng giọng nói’ trong cài đặt”.
Công nghệ này có thể có những tác động to lớn trong lĩnh vực tiếp cận, với những nhân vật đáng chú ý như đại diện Quốc hội Mỹ Jennifer Wexton khuếch đại việc sử dụng nhân bản giọng nói công nghệ cao cá nhân hóa cho những người nói năng bất thường. Nhưng nó cũng đã dấy lên những lo ngại về việc sử dụng deepfake phi đồng ý và khả năng công nghệ này trở thành một công cụ trong kho vũ khí của những kẻ lừa đảo. Công nghệ nhân bản giọng nói AI mạnh mẽ – của Microsoft được cho là giống người một cách ấn tượng – đã gợi ra những lo ngại về đạo đức, với CEO của chính Microsoft kêu gọi các biện pháp bảo vệ mạnh mẽ hơn và quản trị AI trước sự gia tăng của deepfake người nổi tiếng.
Tuy nhiên, sự cường điệu xung quanh việc nhân bản giọng nói, được thúc đẩy bởi cơn sốt AI, chỉ tăng lên trong số các nhà đổi mới trong ngành, bổ sung vào các khoản đầu tư trước đây vào dịch thuật giọng nói thành văn bản AI. Năm ngoái, Apple đã công bố tính năng giọng nói cá nhân của mình, một công cụ học máy tạo ra phiên bản tổng hợp giọng nói của người dùng có thể được sử dụng trong các tình huống chuyển văn bản thành giọng nói trực tiếp, như FaceTime, và được quảng cáo là một tính năng trợ năng. Microsoft cũng đã tiết lộ tính năng Giọng nói cá nhân của riêng mình cùng thời điểm đó, được hỗ trợ bởi Azure AI của mình và có sẵn trong 90 ngôn ngữ.
Từ khoá:
Bài viết liên quan
Chuyến bay VN1941 của Vietnam Airlines từ Cam Ranh đi Đà Nẵng bị hoãn do sự cố kỹ thuật
Casio ra mắt bộ đôi piano điện Celviano: Sang trọng, hiện đại
Kidwants KN1: Mini PC “biến hình” thành chuột, tiện lợi bất ngờ
Pixy Mini Pro: Nâng tầm trải nghiệm sạc pin với thiết kế siêu tiện lợi
CapacMouse Pro: Chuột không dây nhỏ như chìa khóa xe hơi
Microplastic trong não người: Phát hiện chấn động về tác động của ô nhiễm nhựa
Thiết bị đo đường huyết không xâm lấn: Bước đột phá mới cho bệnh nhân tiểu đường
BYD: Pin thể rắn sẽ được trình làng vào năm 2027, “phổ cập” sau năm 2030
Xiaomi SU7 Ultra: Sedan điện 1.526 mã lực đánh bại Tesla Model S Plaid
TL-WR3002X: Router Wi-Fi 6 di động, tốc độ ‘khủng’ từ TP-Link
Xpeng G6 2025: SUV điện nâng cấp mạnh mẽ, sạc siêu nhanh chỉ 12 phút
Ngân hàng Trung ương Hàn Quốc bác bỏ khả năng đưa Bitcoin vào dự trữ ngoại hối
Điện thoại gập Huawei Pura: Thiết kế đột phá với tỷ lệ màn hình 16:10 độc lạ
LG Display sản xuất hàng loạt tấm nền OLED 5K2K cho game thủ, chế độ 330Hz siêu mượt
MyMini: Máy chơi game cầm tay hoài cổ giá rẻ, hỗ trợ giả lập N64
ViewSonic ColorPro VP2788-5K: Màn hình 5K giá mềm cạnh tranh Apple Studio Display
Teac ra mắt mâm đĩa than TN-180BT với kết nối Bluetooth: Trải nghiệm hoài cổ nhưng tiện lợi hơn
iRobot ra mắt loạt Roomba mới: Nỗ lực giành lại ngôi vương giữa cạnh tranh khốc liệt
Seagate x Genshin Impact: Ra mắt SSD di động phiên bản đặc biệt 1TB

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
Nhận xét (0)