Các nhà thầu đang làm việc để cải thiện AI Gemini của Google đang so sánh câu trả lời của nó với kết quả do mô hình Claude của Anthropic tạo ra. Google đã không trả lời khi được hỏi về việc liệu họ có được sự cho phép của Anthropic để sử dụng Claude trong việc thử nghiệm Gemini hay không.
Cuộc đua AI và việc đánh giá hiệu suất
Trong cuộc đua phát triển mô hình AI, các công ty thường đánh giá hiệu suất của mô hình của họ so với đối thủ cạnh tranh. Thông thường, họ sẽ chạy mô hình của mình thông qua các tiêu chuẩn ngành thay vì để các nhà thầu tỉ mỉ đánh giá phản hồi AI của đối thủ.
Tuy nhiên, trong trường hợp này, các nhà thầu làm việc trên Gemini được giao nhiệm vụ đánh giá độ chính xác của kết quả đầu ra của mô hình phải chấm điểm từng phản hồi mà họ thấy theo nhiều tiêu chí, chẳng hạn như tính trung thực và độ dài dòng. Theo thông tin, các nhà thầu có tối đa 30 phút cho mỗi lời nhắc để xác định câu trả lời của Gemini hay Claude tốt hơn.
Claude xuất hiện trong nền tảng nội bộ của Google
Gần đây, các nhà thầu bắt đầu nhận thấy các tham chiếu đến Claude của Anthropic xuất hiện trong nền tảng nội bộ của Google mà họ sử dụng để so sánh Gemini với các mô hình AI khác. Ít nhất một trong những kết quả đầu ra được trình bày cho các nhà thầu Gemini đã tuyên bố rõ ràng: “Tôi là Claude, được tạo ra bởi Anthropic.”
Một cuộc trò chuyện nội bộ cho thấy các nhà thầu nhận thấy phản hồi của Claude dường như nhấn mạnh vào sự an toàn hơn Gemini. “Cài đặt an toàn của Claude là nghiêm ngặt nhất” trong số các mô hình AI, một nhà thầu viết. Trong một số trường hợp nhất định, Claude sẽ không phản hồi các lời nhắc mà nó coi là không an toàn, chẳng hạn như nhập vai một trợ lý AI khác. Trong một trường hợp khác, Claude tránh trả lời một lời nhắc, trong khi phản hồi của Gemini bị gắn cờ là “vi phạm an toàn nghiêm trọng” vì bao gồm “ảnh khoả thân và nô lệ”.
Điều khoản dịch vụ của Anthropic và phản hồi từ Google
Điều khoản dịch vụ thương mại của Anthropic cấm khách hàng truy cập Claude “để xây dựng sản phẩm hoặc dịch vụ cạnh tranh” hoặc “đào tạo mô hình AI cạnh tranh” mà không có sự chấp thuận của Anthropic. Google là một nhà đầu tư lớn vào Anthropic. Shira McNamara, người phát ngôn của Google DeepMind, đơn vị điều hành Gemini, đã không trả lời khi được hỏi liệu Google có được sự chấp thuận của Anthropic để truy cập Claude hay không. Phía Anthropic cũng không đưa ra bình luận nào.
McNamara cho biết DeepMind “so sánh kết quả đầu ra của mô hình” để đánh giá nhưng họ không đào tạo Gemini trên các mô hình của Anthropic.
“Tất nhiên, phù hợp với thông lệ tiêu chuẩn của ngành, trong một số trường hợp, chúng tôi so sánh kết quả đầu ra của mô hình như một phần của quy trình đánh giá của mình”, McNamara nói. “Tuy nhiên, bất kỳ gợi ý nào rằng chúng tôi đã sử dụng mô hình Anthropic để đào tạo Gemini là không chính xác.”
Tuần trước, các nhà thầu của Google đang làm việc trên các sản phẩm AI của công ty hiện đang được yêu cầu đánh giá phản hồi AI của Gemini trong các lĩnh vực ngoài chuyên môn của họ. Thông tin liên lạc nội bộ bày tỏ lo ngại của các nhà thầu rằng Gemini có thể tạo ra thông tin không chính xác về các chủ đề nhạy cảm cao như chăm sóc sức khỏe.
Tin tài trợ
-
Tài trợQuảng cáo
Công nghệ mới từ Xiaomi: Máy lọc nước cho thú cưng
Xiaomi vừa bổ sung một sản phẩm mới vào dòng thiết bị Mijia nổi tiếng – máy lọc nước thông minh cho thú cưng Mijia Smart Pet Water Dispenser 2. Sản phẩm có giá 199 nhân dân tệ (khoảng 650.000 VNĐ) cho máy chính, trong khi bộ lọc đi kèm được bán riêng với giá […] -
Tài trợMobile
Honor ra mắt bộ phụ kiện nhiếp ảnh độc quyền cho Magic 7 Pro
Trong sự kiện ra mắt Magic 7 RSR Porsche Design, Honor đã giới thiệu hai bộ sản phẩm nhiếp ảnh chuyên nghiệp dành riêng cho Magic 7 Pro, bao gồm “Bộ dụng cụ chụp ảnh” và “Bộ kính lọc”, nhằm nâng cao trải nghiệm chụp ảnh trên di động. Bộ dụng cụ chụp ảnh: Bộ […] -
Tài trợKhám phá
MDSA156: Giải pháp màn hình phụ cho công việc di động
Màn hình di động là một phân khúc khá đặc biệt trong ngành công nghệ, nhưng với những người cần màn hình phụ khi di chuyển, những sản phẩm này chắc chắn mang lại sự tiện ích. Mới đây, Minisforum đã ra mắt mẫu màn hình di động MDSA156, hứa hẹn sẽ là sự lựa […] -
Tài trợMobile
Redmi Turbo 4: Smartphone tiên phong công nghệ gì?
Redmi vừa công bố Turbo 4, chiếc điện thoại đầu tiên của hãng ra mắt trong năm 2025. Điểm đặc biệt nhất của Turbo 4 là việc nó sẽ là smartphone đầu tiên trên thế giới được trang bị chip Dimensity 8400 với CPU lõi lớn mới của MediaTek. Dimensity 8400: Chip tầm trung cao […]
Bài viết liên quan
xAI của Elon Musk gọi vốn thành công 6 tỷ USD
OpenAI ra mắt mô hình o3, mạnh mẽ hơn GPT, bỏ qua GPT-5?
ASUS trình làng laptop Copilot+ nhẹ nhất thế giới tại CES 2025
Công nghệ làm mát lai AI: Tương lai của tủ lạnh hiện đại
Google hợp tác với Anthropic, sử dụng Claude để cải thiện Gemini AI
Bách khoa toàn thư Britannica hồi sinh với trí tuệ nhân tạo
Drone AI trong chiến lược quân sự hiện đại
Ứng dụng iOS độc lập cho chatbot Grok của xAI sắp ra mắt
AI mới trong Chrome sẽ bảo vệ dữ liệu người dùng
Gemini “hô biến” ứng dụng Files by Google thành “siêu ứng dụng” đọc PDF
Face ID trên chuông cửa: Apple nâng tầm an ninh cho ngôi nhà?
NUC 14 Pro AI của ASUS: Sức mạnh AI trong một chiếc mini PC
Huấn luyện robot nhanh gấp 430,000 lần với Genesis
Google Gemini Deep Research: Tìm kiếm thông tin dễ dàng và nhanh chóng hơn bao giờ hết
Trường học không giáo viên: Khi AI thay đổi cách chúng ta học tập
Android 16 cho phép người dùng kiểm soát nội dung do AI tạo ra
Gmail tăng cường bảo mật với AI để chặn thư rác hiệu quả hơn
Apple và Nvidia ‘bắt tay’ tạo ra bước đột phá trong AI
Google Gemini: Đánh giá AI có chính xác khi thiếu chuyên môn?
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)