Chức năng “mắt thần” được mong đợi từ lâu của ChatGPT có thể sớm xuất hiện trong chế độ giọng nói nâng cao, cho phép bạn thực hiện cuộc gọi video với AI.
OpenAI lần đầu tiên giới thiệu tính năng này vào tháng 5, trình diễn cách chế độ giọng nói nâng cao có thể nhìn thấy những gì bạn cho nó xem và trò chuyện với bạn về chủ đề đó.
Trong bản demo, chế độ giọng nói nâng cao đã được cho xem một chú chó và có thể xác định chủ thể cũng như mọi thứ liên quan đến nó, bao gồm cả tên của con vật. Kể từ bản demo và bản phát hành Alpha đó, OpenAI đã không đề cập đến tính năng này và chúng ta cũng không nghe thấy gì về sự phát triển của nó. Cho đến bây giờ.
Mã trong bản dựng beta ChatGPT v1.2024.317 mới nhất, ban đầu được Android Authority phát hiện, gợi ý rằng “đôi mắt” của ChatGPT sẽ sớm ra mắt. OpenAI vẫn chưa chính thức xác nhận tên cho tính năng gọi video khoa học viễn tưởng này, nhưng theo các chuỗi mã, nó sẽ được gọi là “Live Camera” (Camera Trực tiếp).
Đối với những người dùng đang chờ đợi thêm thông tin về trí tuệ hình ảnh của ChatGPT và đối thủ cạnh tranh với Google Lens, đây là một dấu hiệu tốt cho thấy Live Camera có thể sớm bước vào giai đoạn thử nghiệm beta và sau đó là phát hành chính thức rộng rãi hơn.
Bạn có muốn gọi video với AI không?
Tùy chọn gọi video nghe có vẻ như là sự phát triển tự nhiên của chế độ giọng nói nâng cao của ChatGPT, cho phép bạn thực hiện cuộc gọi video hiệu quả với AI. Mặc dù điều đó nghe có vẻ khó tin, nhưng nó có thể trở thành một bổ sung tuyệt vời cho cách chúng ta tương tác với các mô hình AI.
Chế độ giọng nói nâng cao của ChatGPT và các trợ lý giọng nói AI khác như Gemini Live, đã chứng minh rằng việc tương tác với AI không chỉ dừng lại ở chatbot. Việc cung cấp càng nhiều cách tương tác với AI càng tốt cho phép người dùng quyết định cách phù hợp nhất với nhu cầu của họ và mở ra những cách mới để triển khai phần mềm vào cuộc sống hàng ngày. Tôi hy vọng chức năng “Live Camera” này sẽ là một bước đột phá cho nhu cầu tiếp cận, đặc biệt là đối với những người khiếm thị.
Hy vọng rằng chúng ta sẽ sớm được nghe thêm về “Live Camera”, nhưng ít nhất thật tốt khi biết rằng OpenAI vẫn chưa quên sự tồn tại của tính năng này.
Từ khoá:
Tin tài trợ
-
Tài trợQuảng cáo
Noise ra mắt Power Series với sạc GaN hiện đại
Noise vừa chính thức bước vào thị trường phụ kiện cao cấp với dòng sản phẩm Power Series. Các sản phẩm mới trong bộ sưu tập này bao gồm bộ sạc GaN (Gallium Nitride) và cáp từ tính Type-C to C, được thiết kế dành riêng cho người dùng yêu cầu cao về hiệu suất, […] -
Tài trợQuảng cáo
Khám phá HiBy R1: Máy nghe nhạc bỏ túi với âm thanh cao cấp
Mix Wave vừa giới thiệu mẫu máy nghe nhạc kỹ thuật số HiBy R1, một sản phẩm hướng đến những người yêu thích âm nhạc chất lượng cao. Với thiết kế nhỏ gọn và nhiều màu sắc trẻ trung, HiBy R1 không chỉ là thiết bị phát nhạc mà còn là một phụ kiện phong […] -
Tài trợQuảng cáo
Loa Xiaomi Mini: Đổi mới với phiên bản đỏ rượu vang đầy cuốn hút
Xiaomi vừa giới thiệu phiên bản mới cho dòng loa Bluetooth Speaker Mini với sự bổ sung màu sắc đặc biệt đỏ rượu vang (burgundy red). Đây là dòng sản phẩm nổi bật nhờ thiết kế nhỏ gọn, khả năng chống chịu thời tiết khắc nghiệt, thời lượng pin dài và âm thanh ổn định. […] -
Tài trợQuảng cáo
Petbrick 65: Khi bàn phím cơ biến thành thú cưng của bạn
Angry Miao, hãng sản xuất bàn phím nổi tiếng với thiết kế sáng tạo, tiếp tục gây chú ý khi ra mắt sản phẩm mới mang tên Petbrick 65. Đây là bàn phím cơ có vỏ ngoài lông xù, mang đến cảm giác có thể vuốt ve như một chú mèo. Thiết kế lấy cảm […]
Bài viết liên quan
NUC 14 Pro AI của ASUS: Sức mạnh AI trong một chiếc mini PC
OpenAI “khuấy đảo” giới công nghệ với mô hình o3 mới
Huấn luyện robot nhanh gấp 430,000 lần với Genesis
Google Gemini Deep Research: Tìm kiếm thông tin dễ dàng và nhanh chóng hơn bao giờ hết
Trường học không giáo viên: Khi AI thay đổi cách chúng ta học tập
Android 16 cho phép người dùng kiểm soát nội dung do AI tạo ra
Gmail tăng cường bảo mật với AI để chặn thư rác hiệu quả hơn
Apple và Nvidia ‘bắt tay’ tạo ra bước đột phá trong AI
Google Gemini: Đánh giá AI có chính xác khi thiếu chuyên môn?
Khi trí tuệ nhân tạo học cách “đóng kịch” để sinh tồn
ChatGPT giờ đây có thể gọi điện và nhắn tin qua WhatsApp
Mondelez sử dụng AI để phát triển snack mới nhanh hơn
AI tham gia vào quá trình sản xuất bánh Oreo, hứa hẹn nhiều điều thú vị
Người dùng Google được trải nghiệm Gemini 2.0 Experimental Advanced
Insta360 Connect: Tối ưu họp trực tuyến với camera 4K và AI
o1 của OpenAI: Mở ra kỷ nguyên mới cho phát triển ứng dụng AI?
Kính thông minh Meta “lột xác” với AI và Shazam, nhận diện bài hát tức thì
Romi Lacatan: Robot AI hỗ trợ giao tiếp, giúp đỡ người cô đơn
Whisk: Công cụ AI mới của Google sử dụng hình ảnh làm gợi ý, thay vì văn bản
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)