Theo báo cáo mới từ The Information, OpenAI đã giới thiệu với một số khách hàng về một trí tuệ nhân tạo (AI) đa phương thức mới, có khả năng vừa trò chuyện vừa nhận dạng vật thể. Nguồn tin giấu tên cho biết đây có thể là một phần trong sự kiện ra mắt sản phẩm mới của OpenAI vào thứ Hai tới.
Được biết, model AI mới này có khả năng xử lý hình ảnh và âm thanh nhanh hơn, chính xác hơn so với các model phiên âm và chuyển văn bản thành giọng nói riêng biệt hiện có của OpenAI. Nó có thể hỗ trợ nhân viên chăm sóc khách hàng “hiểu tốt hơn ngữ điệu trong giọng nói của người gọi hoặc họ có đang nói mỉa mai hay không”. Bên cạnh đó, về mặt lý thuyết, model này còn có thể giúp học sinh giải toán hoặc dịch các biển báo ngoài đời thực.
Các nguồn tin của The Information cho biết model này có thể vượt qua GPT-4 Turbo trong việc “trả lời một số loại câu hỏi” nhưng vẫn có khả năng đưa ra những câu trả lời sai một cách chắc chắn.
OpenAI seems to be working on having phone calls inside of chatGPT. This is probably going to be a small part of the event announced on Monday.
(1/n) pic.twitter.com/KT8Hb54DwA— Ananay (@ananayarora) May 11, 2024
Theo nhà phát triển Ananay Arora, OpenAI có thể cũng đang chuẩn bị bổ sung tính năng gọi điện thoại cho ChatGPT. Arora đã đăng tải ảnh chụp màn hình của đoạn mã liên quan đến tính năng gọi điện. Ngoài ra, ông còn tìm thấy bằng chứng cho thấy OpenAI đã cung cấp các máy chủ dành cho giao tiếp âm thanh và video thời gian thực.
OpenAI now has webRTC servers in place to make this happen as well that were recently provisioned. (2/n) pic.twitter.com/Djh6I2V4tc
— Ananay (@ananayarora) May 11, 2024
Nếu được công bố vào tuần tới, sản phẩm này sẽ không phải là GPT-5. Giám đốc điều hành Sam Altman đã phủ nhận rõ ràng rằng thông báo sắp tới của công ty không liên quan đến model được cho là “cải tiến đáng kể” so với GPT-4. The Information viết rằng GPT-5 có thể được phát hành công khai vào cuối năm nay.
Altman cũng cho biết công ty không thông báo về một công cụ tìm kiếm mới được hỗ trợ bởi AI. Nhưng nếu những gì The Information báo cáo là chính xác, thì nó vẫn có thể ảnh hưởng đến hội nghị dành cho nhà phát triển I/O của Google. Google đã thử nghiệm sử dụng AI để thực hiện cuộc gọi điện thoại. Và một trong những dự án được đồn đoán của họ là “Pixie”, một trợ lý ảo đa phương thức thay thế Google Assistant, có thể nhìn vào các vật thể thông qua camera của thiết bị và thực hiện các tác vụ như cung cấp chỉ đường đến các địa điểm để mua chúng hoặc hướng dẫn cách sử dụng chúng.
Bất kể OpenAI dự định ra mắt gì, họ cũng sẽ thực hiện thông qua livestream trên trang web của mình vào thứ Hai tới lúc 10 giờ sáng Giờ Thái Bình Dương / 1 giờ chiều Giờ miền Đông.
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)