Công nghệ đột phá từ MIT: Giao diện não-máy tính giúp người liệt “nói lại” bằng chính giọng của mình

08:26 25/06/2025

3 phút đọc

Các nhà nghiên cứu tại Đại học California, Davis, vừa phát triển một giao diện não-máy tính (BCI) có khả năng gần như tức thời dịch tín hiệu thần kinh của một người bị liệt thành lời nói tổng hợp. Hệ thống này cho phép người bệnh giao tiếp bằng chính giọng nói và ngữ điệu của mình, mở ra hy vọng mới cho hàng triệu người mất khả năng nói.

Công nghệ đột phá từ MIT: Giao diện não-máy tính giúp người liệt "nói lại" bằng chính giọng của mình - Techlade

“Não thành giọng nói”: Phục hồi khả năng giao tiếp tưởng chừng không thể

Nghiên cứu được UC Davis Health công bố vào ngày 11 tháng 6, đánh dấu một bước tiến đáng kể so với các công nghệ trước đây vốn chủ yếu giới hạn ở việc dịch tín hiệu não thành văn bản. Hệ thống mới này đã phục hồi mức độ giao tiếp từng được cho là không thể đối với một tình nguyện viên 45 tuổi mắc bệnh xơ cứng teo cơ một bên (ALS) – căn bệnh thoái hóa thần kinh đã cướp đi giọng nói của ông.

Hệ thống “bộ phận giả thần kinh từ não sang giọng nói” hoạt động bằng cách giải mã ý định nói của não. Các nhà nghiên cứu đã cấy 256 vi điện cực vào vùng não của bệnh nhân chịu trách nhiệm điều khiển các cơ nói. Khi người đàn ông cố gắng nói, BCI sẽ chặn các tín hiệu này và, với sự trợ giúp của một mô hình AI tiên tiến, chuyển đổi chúng thành lời nói có thể nghe được chỉ trong 25 mili giây.

AI “học” giọng nói và cảm xúc từ não bộ

Các nhà nghiên cứu đã sử dụng các thuật toán AI tiên tiến để dịch hoạt động não thành lời nói tổng hợp theo thời gian thực. Hệ thống được đào tạo bằng cách ghi lại hoạt động thần kinh khi người tham gia cố gắng đọc các câu được hiển thị trên màn hình. Bằng cách điều chỉnh các mẫu hoạt động của hàng trăm neuron với các âm thanh dự định, thuật toán đã học cách tái tạo chính xác giọng nói của người tham gia trực tiếp từ tín hiệu não của ông.

Đặc biệt, BCI không chỉ tạo ra các từ đơn điệu; nó còn thành công trong việc thu nhận và tái tạo ngữ điệu giọng nói – những thay đổi tinh tế về cao độ và âm sắc, vốn là yếu tố cơ bản trong cách con người truyền đạt ý nghĩa và cảm xúc. Trong một loạt các minh chứng mạnh mẽ, bệnh nhân đã có thể:

  • Đặt câu hỏi bằng cách tạo ra cao độ tăng lên ở cuối câu.
  • Nhấn mạnh các từ cụ thể để thay đổi hoàn toàn ý nghĩa câu, ví dụ như nhấn mạnh các từ khác nhau trong câu: Tôi chưa bao giờ nói cô ấy ăn cắp tiền của tôi.
  • Hát các giai điệu đơn giản ba nốt, thể hiện mức độ kiểm soát thần kinh tinh vi đối với giọng nói tổng hợp.

Để bước đột phá này trở nên ấn tượng hơn nữa, các nhà nghiên cứu đã sử dụng một AI nhân bản giọng nói được đào tạo dựa trên các bản ghi âm cũ của bệnh nhân trước khi ông mắc bệnh. Kết quả là một giọng nói tổng hợp nghe giống hệt giọng của chính ông, một tính năng mà bệnh nhân báo cáo rằng “khiến tôi cảm thấy hạnh phúc, và nó giống như giọng thật của mình”.

Mặc dù công nghệ này đại diện cho một bước đột phá lớn, các nhà nghiên cứu cảnh báo rằng nó vẫn đang trong giai đoạn chứng minh khái niệm. Trong các thử nghiệm nơi người nghe đánh giá đầu ra của BCI, họ hiểu đúng những gì bệnh nhân nói khoảng 56% thời gian. Cần nhiều nghiên cứu và phát triển hơn để tăng cường hiệu quả của hệ thống này trong tương lai.

Chia sẻ bài viết:

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.