Các nhà thầu đang làm việc để cải thiện AI Gemini của Google đang so sánh câu trả lời của nó với kết quả do mô hình Claude của Anthropic tạo ra. Google đã không trả lời khi được hỏi về việc liệu họ có được sự cho phép của Anthropic để sử dụng Claude trong việc thử nghiệm Gemini hay không.
Cuộc đua AI và việc đánh giá hiệu suất
Trong cuộc đua phát triển mô hình AI, các công ty thường đánh giá hiệu suất của mô hình của họ so với đối thủ cạnh tranh. Thông thường, họ sẽ chạy mô hình của mình thông qua các tiêu chuẩn ngành thay vì để các nhà thầu tỉ mỉ đánh giá phản hồi AI của đối thủ.
Tuy nhiên, trong trường hợp này, các nhà thầu làm việc trên Gemini được giao nhiệm vụ đánh giá độ chính xác của kết quả đầu ra của mô hình phải chấm điểm từng phản hồi mà họ thấy theo nhiều tiêu chí, chẳng hạn như tính trung thực và độ dài dòng. Theo thông tin, các nhà thầu có tối đa 30 phút cho mỗi lời nhắc để xác định câu trả lời của Gemini hay Claude tốt hơn.
Claude xuất hiện trong nền tảng nội bộ của Google
Gần đây, các nhà thầu bắt đầu nhận thấy các tham chiếu đến Claude của Anthropic xuất hiện trong nền tảng nội bộ của Google mà họ sử dụng để so sánh Gemini với các mô hình AI khác. Ít nhất một trong những kết quả đầu ra được trình bày cho các nhà thầu Gemini đã tuyên bố rõ ràng: “Tôi là Claude, được tạo ra bởi Anthropic.”
Một cuộc trò chuyện nội bộ cho thấy các nhà thầu nhận thấy phản hồi của Claude dường như nhấn mạnh vào sự an toàn hơn Gemini. “Cài đặt an toàn của Claude là nghiêm ngặt nhất” trong số các mô hình AI, một nhà thầu viết. Trong một số trường hợp nhất định, Claude sẽ không phản hồi các lời nhắc mà nó coi là không an toàn, chẳng hạn như nhập vai một trợ lý AI khác. Trong một trường hợp khác, Claude tránh trả lời một lời nhắc, trong khi phản hồi của Gemini bị gắn cờ là “vi phạm an toàn nghiêm trọng” vì bao gồm “ảnh khoả thân và nô lệ”.
Điều khoản dịch vụ của Anthropic và phản hồi từ Google
Điều khoản dịch vụ thương mại của Anthropic cấm khách hàng truy cập Claude “để xây dựng sản phẩm hoặc dịch vụ cạnh tranh” hoặc “đào tạo mô hình AI cạnh tranh” mà không có sự chấp thuận của Anthropic. Google là một nhà đầu tư lớn vào Anthropic. Shira McNamara, người phát ngôn của Google DeepMind, đơn vị điều hành Gemini, đã không trả lời khi được hỏi liệu Google có được sự chấp thuận của Anthropic để truy cập Claude hay không. Phía Anthropic cũng không đưa ra bình luận nào.
McNamara cho biết DeepMind “so sánh kết quả đầu ra của mô hình” để đánh giá nhưng họ không đào tạo Gemini trên các mô hình của Anthropic.
“Tất nhiên, phù hợp với thông lệ tiêu chuẩn của ngành, trong một số trường hợp, chúng tôi so sánh kết quả đầu ra của mô hình như một phần của quy trình đánh giá của mình”, McNamara nói. “Tuy nhiên, bất kỳ gợi ý nào rằng chúng tôi đã sử dụng mô hình Anthropic để đào tạo Gemini là không chính xác.”
Tuần trước, các nhà thầu của Google đang làm việc trên các sản phẩm AI của công ty hiện đang được yêu cầu đánh giá phản hồi AI của Gemini trong các lĩnh vực ngoài chuyên môn của họ. Thông tin liên lạc nội bộ bày tỏ lo ngại của các nhà thầu rằng Gemini có thể tạo ra thông tin không chính xác về các chủ đề nhạy cảm cao như chăm sóc sức khỏe.
Tin tài trợ
-
Tài trợMobile
Realme 14 Pro: Smartphone đổi màu độc đáo, sắp ra mắt
Realme vừa hé lộ dòng sản phẩm Realme 14 Pro, dự kiến ra mắt vào tháng 1/2025. Nổi bật với mặt lưng đổi màu khi tiếp xúc với nhiệt độ lạnh, dòng điện thoại tầm trung này hứa hẹn mang đến nhiều tính năng tiên tiến, tạo nên sức hút mạnh mẽ trong phân khúc. […] -
Tài trợQuảng cáo
Chơi game “mãn nhãn” với OneXPlayer X1 Pro, giá khởi điểm 1.399 USD
OneXPlayer chính thức ra mắt X1 Pro, thiết bị chơi game cầm tay 3 trong 1 được trang bị APU Strix Point mới nhất của AMD. Tiếp nối F1 Pro và Ayaneo 3, X1 Pro là một trong những thiết bị cầm tay đầu tiên sử dụng APU Zen 5 Strix Point của AMD và […] -
Tài trợQuảng cáo
Black Shark Watch X Pro: Camera xoay 180 độ và 4G LTE
Black Shark, nổi tiếng với các mẫu điện thoại chơi game, vừa ra mắt chiếc đồng hồ thông minh Watch X Pro tại Trung Quốc. Với giá khoảng 899 CNY (3,1 triệu VNĐ), Watch X Pro mang đến nhiều tính năng cạnh tranh trong thị trường đồng hồ thông minh. Màn hình và hệ điều […] -
Tài trợKhám phá
Loại bỏ nỗi lo thiếu ổ cắm với thiết bị mở rộng
Việc đầu tư vào thiết bị bảo vệ chống đột biến điện luôn là một ý tưởng tốt, đặc biệt khi nói đến việc cung cấp năng lượng cho các thiết bị điện tử. Hiện nay có rất nhiều lựa chọn trên thị trường với nhiều ổ cắm hoặc dây dài hơn để tăng thêm […]
Bài viết liên quan
Công nghệ làm mát lai AI: Tương lai của tủ lạnh hiện đại
Google hợp tác với Anthropic, sử dụng Claude để cải thiện Gemini AI
Bách khoa toàn thư Britannica hồi sinh với trí tuệ nhân tạo
Drone AI trong chiến lược quân sự hiện đại
Ứng dụng iOS độc lập cho chatbot Grok của xAI sắp ra mắt
AI mới trong Chrome sẽ bảo vệ dữ liệu người dùng
Gemini “hô biến” ứng dụng Files by Google thành “siêu ứng dụng” đọc PDF
Face ID trên chuông cửa: Apple nâng tầm an ninh cho ngôi nhà?
NUC 14 Pro AI của ASUS: Sức mạnh AI trong một chiếc mini PC
OpenAI “khuấy đảo” giới công nghệ với mô hình o3 mới
Huấn luyện robot nhanh gấp 430,000 lần với Genesis
Google Gemini Deep Research: Tìm kiếm thông tin dễ dàng và nhanh chóng hơn bao giờ hết
Android 16 cho phép người dùng kiểm soát nội dung do AI tạo ra
Gmail tăng cường bảo mật với AI để chặn thư rác hiệu quả hơn
Apple và Nvidia ‘bắt tay’ tạo ra bước đột phá trong AI
Google Gemini: Đánh giá AI có chính xác khi thiếu chuyên môn?
Khi trí tuệ nhân tạo học cách “đóng kịch” để sinh tồn
ChatGPT giờ đây có thể gọi điện và nhắn tin qua WhatsApp
Mondelez sử dụng AI để phát triển snack mới nhanh hơn
ĐĂNG KÝ NHẬN TIN
NGAY HÔM NAY
Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.
Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.
5
s
Nhận xét (0)