Các nhà thầu đang làm việc để cải thiện AI Gemini của Google đang so sánh câu trả lời của nó với kết quả do mô hình Claude của Anthropic tạo ra. Google đã không trả lời khi được hỏi về việc liệu họ có được sự cho phép của Anthropic để sử dụng Claude trong việc thử nghiệm Gemini hay không.

Cuộc đua AI và việc đánh giá hiệu suất
Trong cuộc đua phát triển mô hình AI, các công ty thường đánh giá hiệu suất của mô hình của họ so với đối thủ cạnh tranh. Thông thường, họ sẽ chạy mô hình của mình thông qua các tiêu chuẩn ngành thay vì để các nhà thầu tỉ mỉ đánh giá phản hồi AI của đối thủ.
Tuy nhiên, trong trường hợp này, các nhà thầu làm việc trên Gemini được giao nhiệm vụ đánh giá độ chính xác của kết quả đầu ra của mô hình phải chấm điểm từng phản hồi mà họ thấy theo nhiều tiêu chí, chẳng hạn như tính trung thực và độ dài dòng. Theo thông tin, các nhà thầu có tối đa 30 phút cho mỗi lời nhắc để xác định câu trả lời của Gemini hay Claude tốt hơn.
Claude xuất hiện trong nền tảng nội bộ của Google
Gần đây, các nhà thầu bắt đầu nhận thấy các tham chiếu đến Claude của Anthropic xuất hiện trong nền tảng nội bộ của Google mà họ sử dụng để so sánh Gemini với các mô hình AI khác. Ít nhất một trong những kết quả đầu ra được trình bày cho các nhà thầu Gemini đã tuyên bố rõ ràng: “Tôi là Claude, được tạo ra bởi Anthropic.”
Một cuộc trò chuyện nội bộ cho thấy các nhà thầu nhận thấy phản hồi của Claude dường như nhấn mạnh vào sự an toàn hơn Gemini. “Cài đặt an toàn của Claude là nghiêm ngặt nhất” trong số các mô hình AI, một nhà thầu viết. Trong một số trường hợp nhất định, Claude sẽ không phản hồi các lời nhắc mà nó coi là không an toàn, chẳng hạn như nhập vai một trợ lý AI khác. Trong một trường hợp khác, Claude tránh trả lời một lời nhắc, trong khi phản hồi của Gemini bị gắn cờ là “vi phạm an toàn nghiêm trọng” vì bao gồm “ảnh khoả thân và nô lệ”.
Điều khoản dịch vụ của Anthropic và phản hồi từ Google
Điều khoản dịch vụ thương mại của Anthropic cấm khách hàng truy cập Claude “để xây dựng sản phẩm hoặc dịch vụ cạnh tranh” hoặc “đào tạo mô hình AI cạnh tranh” mà không có sự chấp thuận của Anthropic. Google là một nhà đầu tư lớn vào Anthropic. Shira McNamara, người phát ngôn của Google DeepMind, đơn vị điều hành Gemini, đã không trả lời khi được hỏi liệu Google có được sự chấp thuận của Anthropic để truy cập Claude hay không. Phía Anthropic cũng không đưa ra bình luận nào.
McNamara cho biết DeepMind “so sánh kết quả đầu ra của mô hình” để đánh giá nhưng họ không đào tạo Gemini trên các mô hình của Anthropic.
“Tất nhiên, phù hợp với thông lệ tiêu chuẩn của ngành, trong một số trường hợp, chúng tôi so sánh kết quả đầu ra của mô hình như một phần của quy trình đánh giá của mình”, McNamara nói. “Tuy nhiên, bất kỳ gợi ý nào rằng chúng tôi đã sử dụng mô hình Anthropic để đào tạo Gemini là không chính xác.”
Tuần trước, các nhà thầu của Google đang làm việc trên các sản phẩm AI của công ty hiện đang được yêu cầu đánh giá phản hồi AI của Gemini trong các lĩnh vực ngoài chuyên môn của họ. Thông tin liên lạc nội bộ bày tỏ lo ngại của các nhà thầu rằng Gemini có thể tạo ra thông tin không chính xác về các chủ đề nhạy cảm cao như chăm sóc sức khỏe.
Tin tài trợ
- Vũ trụ
Premium
Hubble của NASA và ESA công bố hình ảnh ngoạn mục về lõi thiên hà Xì gà
Bức ảnh mới nhất từ Kính viễn vọng không gian Hubble của NASA và ESA vừa hé lộ những chi tiết chưa từng thấy về thiên hà Messier 82 (M82), nơi hàng triệu ngôi sao rực rỡ đang ẩn mình sau những đám mây bụi và khí với hình thù độc đáo. Bức ảnh mang […] - Thủ thuật
Premium
Lý do màn hình nhấp nháy khi chơi game và cách khắc phục
Hiện tượng màn hình nhấp nháy khi chơi game đã trở thành một nỗi ám ảnh đối với nhiều game thủ, gây khó chịu và ảnh hưởng đáng kể đến trải nghiệm. Theo các chuyên gia công nghệ, nguyên nhân chính của vấn đề này có thể nằm ở chính công nghệ đồng bộ hóa […] - Mobile
Premium
iPhone 17 Pro và iPhone Air vừa ra mắt đã dính lỗi trầy xước
Ngay khi vừa được bày bán tại các Apple Store trên toàn cầu, bộ đôi iPhone 17 Pro và iPhone Air – hai mẫu máy đang nhận được sự quan tâm đặc biệt của cộng đồng công nghệ – đã bắt đầu ghi nhận những phản ánh đầu tiên về hiện tượng trầy xước. Điều […] - Khám phá
Premium
Jimmy Kimmel bị đình chỉ: ‘Văn hóa tẩy chay’ hay áp lực chính trị?
Mới đây, đài truyền hình ABC, thuộc sở hữu của Disney, đã đột ngột đình chỉ chương trình nổi tiếng Jimmy Kimmel Live. Quyết định này được đưa ra ngay sau khi nam MC có một bình luận gây tranh cãi về vụ án mạng liên quan đến Charlie Kirk. Sự việc nhanh chóng trở […]
Bài viết liên quan
Thiết bị ‘siêu máy tính AI’ cá nhân của Nvidia sẵn sàng ra mắt thị trường vào 15/10
California thiết lập khung pháp lý cho các ứng dụng chatbot AI
Fan hâm mộ Taylor Swift phản ứng trước nghi vấn cô dùng hình ảnh tạo bởi AI trong chiến dịch quảng bá
Nền tảng ChatGPT của OpenAI chính thức trình làng tính năng tích hợp đa ứng dụng
Nội bộ OpenAI đang đối mặt với những thách thức từ chiến lược truyền thông xã hội mới của công ty
Toyota bổ sung khoản vốn 1,5 tỷ USD, khẳng định niềm tin vào các dự án startup công nghệ
OpenAI công bố mô hình Sora 2 và ứng dụng chia sẻ video, mục tiêu cạnh tranh với Tiktok
Thông tin sai lệch của nền tảng Deepseek AI về chủ quyền biển đảo Việt Nam gây tranh cãi
DeepSeek: Từ A đến Z về ứng dụng trò chuyện AI được giới công nghệ quan tâm
Robot siêu nhỏ “đi bộ trên nước” lấy cảm hứng từ côn trùng nước
Microsoft ra động thái hạn chế quân đội Israel sử dụng dịch vụ đám mây và AI
Insta360 Wave ra mắt: Loa hội nghị AI có 8 micro, tự động tóm tắt cuộc họp và pin 12 giờ
Elon Musk ‘hạ giá’ Grok, mời chào Chính phủ Liên bang Mỹ với giá ‘rẻ như cho’
Databricks chi 100 triệu USD, tích hợp mô hình OpenAI vào sản phẩm để thúc đẩy doanh nghiệp ứng dụng
Spotify ban hành quy định mới về dán nhãn âm nhạc do AI sáng tác
Google Cloud đẩy mạnh chiến lược, không ngừng mở rộng phạm vi hoạt động
Gemini 2.5 Deep Think giành huy chương vàng tại ICPC 2025
Việt Nam đứng trước thách thức và cơ hội lớn trong làn sóng phát triển AI
Tham vọng của Thượng nghị sĩ Scott Wiener: Buộc Big Tech tiết lộ rủi ro từ trí tuệ nhân tạo

ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.


Nhận xét (0)