Một diễn biến mới bất ngờ trong vụ kiện giữa OpenAI và NY Times

15:19 21/11/2024

3 phút đọc

Luật sư của The New York Times và Daily News, những đơn vị đang kiện OpenAI vì cáo buộc công ty này sử dụng trái phép các tác phẩm của họ để huấn luyện mô hình AI, cho biết các kỹ sư của OpenAI đã vô tình xóa dữ liệu quan trọng liên quan đến vụ kiện.

Một diễn biến mới bất ngờ trong vụ kiện giữa OpenAI và NY Times - techlade

Trước đó, OpenAI đã đồng ý cung cấp hai máy ảo chuyên dụng để luật sư của The Times và Daily News có thể tìm kiếm nội dung có bản quyền trong bộ dữ liệu huấn luyện của mình. Trong một lá thư, luật sư của các nhà xuất bản cho biết họ và các chuyên gia đã dành hơn 150 giờ kể từ ngày 1 tháng 11 để tìm kiếm dữ liệu huấn luyện của OpenAI.

Tuy nhiên, vào ngày 14 tháng 11, các kỹ sư của OpenAI đã xóa tất cả dữ liệu tìm kiếm của các nhà xuất bản được lưu trữ trên một trong các máy ảo, theo lá thư được đệ trình lên tòa án Hoa Kỳ cho phía Nam của New York vào cuối ngày thứ năm.

OpenAI đã cố gắng khôi phục dữ liệu và đạt được một số thành công nhất định. Tuy nhiên, do cấu trúc thư mục và tên tệp đã bị mất không thể phục hồi, nên dữ liệu được khôi phục “không thể được sử dụng để xác định nơi các bài báo sao chép của nguyên đơn tin tức đã được sử dụng để xây dựng các mô hình của OpenAI”, theo lá thư.

Luật sư của The Times và Daily News viết: “Các nguyên đơn tin tức đã buộc phải tạo lại công việc của họ từ đầu bằng cách sử dụng một lượng lớn thời gian làm việc của con người và thời gian xử lý máy tính. Các nguyên đơn tin tức chỉ biết được vào ngày hôm qua rằng dữ liệu được khôi phục là không sử dụng được và toàn bộ công việc của các chuyên gia và luật sư trong cả tuần phải được làm lại, đó là lý do tại sao lá thư bổ sung này được đệ trình hôm nay.”

Luật sư của nguyên đơn nói rõ rằng họ không có lý do gì để tin rằng việc xóa dữ liệu là cố ý. Nhưng họ nói rằng sự cố này nhấn mạnh rằng OpenAI “ở vị trí tốt nhất để tự tìm kiếm các bộ dữ liệu của mình” để tìm nội dung có khả năng vi phạm bằng cách sử dụng các công cụ của chính họ.

Chúng tôi đã liên hệ với OpenAI để xin bình luận và sẽ cập nhật bài viết này nếu nhận được phản hồi.

Trong vụ việc này và các vụ việc khác, OpenAI vẫn khẳng định rằng việc huấn luyện mô hình AI bằng cách sử dụng dữ liệu có sẵn công khai – bao gồm các bài báo từ The Times và Daily News – là sử dụng hợp pháp. Nói cách khác, khi tạo ra các mô hình như GPT-4, “học hỏi” từ hàng tỷ ví dụ về sách điện tử, tiểu luận và nhiều thứ khác để tạo ra văn bản giống con người, OpenAI tin rằng họ không bắt buộc phải cấp phép hoặc trả tiền cho các ví dụ đó – ngay cả khi họ kiếm tiền từ những mô hình đó.

Tuy nhiên, OpenAI đã ký kết các thỏa thuận cấp phép với một số lượng ngày càng tăng các nhà xuất bản tin tức, bao gồm The Associated Press, chủ sở hữu Business Insider Axel Springer, Financial Times, công ty mẹ của People là Dotdash Meredith và News Corp. OpenAI đã từ chối công khai các điều khoản của các thỏa thuận này, nhưng một đối tác nội dung, Dotdash, được cho là đang được trả ít nhất 16 triệu đô la mỗi năm.

Chia sẻ bài viết:

Từ khoá:

Tin tài trợ

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.