Sự phát triển của trợ lý AI đã chứng kiến một bước tiến vượt bậc trong những năm gần đây, đặc biệt là khả năng tương tác linh hoạt, cho phép người dùng dễ dàng chuyển đổi giữa các chủ đề và tận dụng khả năng tổng hợp, xử lý dữ liệu khổng lồ của các mô hình ngôn ngữ lớn (LLM). Tuy nhiên, tương tác bằng giọng nói với AI vẫn còn nhiều hạn chế, đặc biệt là thiếu khả năng tóm tắt nội dung trừ khi người dùng chủ động yêu cầu. Google dường như đang tìm cách giải quyết vấn đề này với Gemini Live.
Gemini Live, được tích hợp trong ứng dụng Gemini cho Android, mang đến trải nghiệm tương tác bằng giọng nói trực tiếp với chatbot AI. Đây là một trong những tính năng mới nhất của Google, giúp tiết kiệm thời gian và công sức cho người dùng. So với tương tác bằng văn bản, Gemini Live tạo cảm giác trò chuyện tự nhiên hơn.
Mặc dù Gemini Live cung cấp bản ghi đầy đủ cuộc trò chuyện sau khi kết thúc, tính năng tóm tắt vẫn chưa có sẵn trừ khi người dùng yêu cầu. Điều thú vị là, có vẻ như đây là một yêu cầu phổ biến, và phiên bản beta gần đây của ứng dụng Google (16.6.23) cho thấy những nỗ lực phát triển tính năng này thông qua một prompt được thiết kế riêng.
Theo AssembleDebug, một nhà nghiên cứu và người chuyên cung cấp thông tin về ứng dụng Google trên X, ứng dụng sẽ tự động gửi một prompt mới khi người dùng kết thúc cuộc trò chuyện. Prompt này hướng dẫn AI tạo ra một bản tóm tắt ngắn gọn, sử dụng tiêu đề in đậm cho các chủ đề, kết hợp chi tiết thành các mô tả ngắn gọn, và nhấn mạnh vào “tình cảm” chung của cuộc trò chuyện. Điều quan trọng là Google dường như không muốn Gemini thêm “những thông tin thừa thãi” vào bản tóm tắt này.
Prompt chi tiết này hiện chưa hiển thị trong quá trình sử dụng Gemini thông thường, nhưng nó cũng chưa được triển khai chính thức. Các giải pháp hiện tại để tạo bản tóm tắt hiệu quả cho cuộc trò chuyện trên Gemini Live khá phức tạp, vì ứng dụng chỉ cho phép sao chép từng phản hồi để tóm tắt. Prompt mới này có thể được ẩn sau nút tóm tắt chuyên dụng hoặc một tính năng tự động nào đó.
Google cũng đang phát triển cài đặt phụ đề cho Gemini Live, cho phép người dùng xem các phản hồi trước đó mà không cần đợi đến khi kết thúc cuộc trò chuyện. Điều này cũng sẽ cải thiện đáng kể khả năng tiếp cận của tính năng. Cũng theo nguồn tin trên, bản ghi văn bản đầy đủ sẽ có sau các cuộc trò chuyện không có phụ đề, giúp các bản tóm tắt TLDR (Too Long; Didn’t Read – Quá dài; Không đọc) trở nên hữu ích hơn.
Hiện chưa rõ khi nào Google sẽ triển khai những thay đổi này cho Gemini, nhưng người dùng hy vọng thời gian chờ đợi sẽ không quá lâu, vì thị trường AI cạnh tranh rất khốc liệt, và Google luôn cố gắng bắt kịp xu hướng.
Từ khoá:
Bài viết liên quan
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng Bluesky tranh luận về dữ liệu cá nhân và huấn luyện AI
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Người dùng ‘phù phép’ ảnh, xóa bỏ watermark bằng AI mới của Google
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Google sẽ loại bỏ trợ lý ảo khỏi phần lớn điện thoại trong năm nay
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Notepad sắp được tích hợp tính năng tóm tắt bằng AI
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Dự án Kaito: AI phân tích dữ liệu crypto, “bão táp” sau airdrop
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Google ra mắt Gemini tùy chỉnh: AI giờ đây ‘hiểu’ bạn hơn
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Sam Altman khoe khả năng viết của ChatGPT: AI có thể thay thế nhà văn hay chỉ là bản sao vô hồn?
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Teledyne FLIR ra mắt camera nhiệt phóng xạ: “Mắt thần” cho drone, AI và công nghiệp
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Manus AI ra mắt AI Agent “siêu năng lực”: Giải quyết vấn đề phức tạp, vượt trội chatbot thông thường
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
Meta thành công ‘tape-out’ chip AI đầu tiên, sử dụng công nghệ TSMC
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
OpenAI ra mắt công cụ mới giúp doanh nghiệp tạo chatbot AI “thông minh” hơn
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Google Gemini: Cuộc cách mạng AI tại nơi làm việc
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
Tự động hóa lịch trình với nút AI mới của Google trong Gmail
PlayStation: Sony đang phát triển nhân vật game thông minh AI
PlayStation: Sony đang phát triển nhân vật game thông minh AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Sony mạnh tay gỡ bỏ hơn 75.000 bài hát deepfake AI
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
Mistral OCR: API nhận dạng ký tự quang học với độ chính xác “vượt trội”
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
AI “phát điên” sau khi được tinh chỉnh bằng mã lỗi, đưa ra lời khuyên bạo lực và ủng hộ phát xít
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Maserati MC20 lập kỷ lục tốc độ mới với “tài xế robot” AI
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”
Google “mạnh tay” với tìm kiếm AI bất chấp lỗi “ảo giác”

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)