Sự phát triển của trợ lý AI đã chứng kiến một bước tiến vượt bậc trong những năm gần đây, đặc biệt là khả năng tương tác linh hoạt, cho phép người dùng dễ dàng chuyển đổi giữa các chủ đề và tận dụng khả năng tổng hợp, xử lý dữ liệu khổng lồ của các mô hình ngôn ngữ lớn (LLM). Tuy nhiên, tương tác bằng giọng nói với AI vẫn còn nhiều hạn chế, đặc biệt là thiếu khả năng tóm tắt nội dung trừ khi người dùng chủ động yêu cầu. Google dường như đang tìm cách giải quyết vấn đề này với Gemini Live.

Gemini Live, được tích hợp trong ứng dụng Gemini cho Android, mang đến trải nghiệm tương tác bằng giọng nói trực tiếp với chatbot AI. Đây là một trong những tính năng mới nhất của Google, giúp tiết kiệm thời gian và công sức cho người dùng. So với tương tác bằng văn bản, Gemini Live tạo cảm giác trò chuyện tự nhiên hơn.
Mặc dù Gemini Live cung cấp bản ghi đầy đủ cuộc trò chuyện sau khi kết thúc, tính năng tóm tắt vẫn chưa có sẵn trừ khi người dùng yêu cầu. Điều thú vị là, có vẻ như đây là một yêu cầu phổ biến, và phiên bản beta gần đây của ứng dụng Google (16.6.23) cho thấy những nỗ lực phát triển tính năng này thông qua một prompt được thiết kế riêng.
Theo AssembleDebug, một nhà nghiên cứu và người chuyên cung cấp thông tin về ứng dụng Google trên X, ứng dụng sẽ tự động gửi một prompt mới khi người dùng kết thúc cuộc trò chuyện. Prompt này hướng dẫn AI tạo ra một bản tóm tắt ngắn gọn, sử dụng tiêu đề in đậm cho các chủ đề, kết hợp chi tiết thành các mô tả ngắn gọn, và nhấn mạnh vào “tình cảm” chung của cuộc trò chuyện. Điều quan trọng là Google dường như không muốn Gemini thêm “những thông tin thừa thãi” vào bản tóm tắt này.
Prompt chi tiết này hiện chưa hiển thị trong quá trình sử dụng Gemini thông thường, nhưng nó cũng chưa được triển khai chính thức. Các giải pháp hiện tại để tạo bản tóm tắt hiệu quả cho cuộc trò chuyện trên Gemini Live khá phức tạp, vì ứng dụng chỉ cho phép sao chép từng phản hồi để tóm tắt. Prompt mới này có thể được ẩn sau nút tóm tắt chuyên dụng hoặc một tính năng tự động nào đó.
Google cũng đang phát triển cài đặt phụ đề cho Gemini Live, cho phép người dùng xem các phản hồi trước đó mà không cần đợi đến khi kết thúc cuộc trò chuyện. Điều này cũng sẽ cải thiện đáng kể khả năng tiếp cận của tính năng. Cũng theo nguồn tin trên, bản ghi văn bản đầy đủ sẽ có sau các cuộc trò chuyện không có phụ đề, giúp các bản tóm tắt TLDR (Too Long; Didn’t Read – Quá dài; Không đọc) trở nên hữu ích hơn.
Hiện chưa rõ khi nào Google sẽ triển khai những thay đổi này cho Gemini, nhưng người dùng hy vọng thời gian chờ đợi sẽ không quá lâu, vì thị trường AI cạnh tranh rất khốc liệt, và Google luôn cố gắng bắt kịp xu hướng.
Từ khoá:
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)