Reddit khóa dữ liệu công khai, yêu cầu hợp đồng mới cho phép truy cập

01:04 10/05/2024

4 phút đọc

Reddit vừa công bố chính sách mới “Public Content Policy” nhằm cân bằng giữa việc cấp phép nội dung cho các công ty công nghệ lớn như Google và bảo vệ quyền riêng tư của người dùng. Chính sách này bổ sung cho các chính sách hiện có về quyền riêng tư và nội dung của Reddit, hướng dẫn cách thức các tổ chức thương mại và đối tác khác truy cập và sử dụng dữ liệu của Reddit. Cùng với đó, Reddit cũng giới thiệu một subreddit dành riêng cho các nhà nghiên cứu làm việc với dữ liệu của họ.

Reddit khóa dữ liệu công khai, yêu cầu hợp đồng mới cho phép truy cập

Thông báo này được đưa ra ngay sau khi Reddit lên sàn chứng khoán, cho thấy công ty đang định hướng tăng doanh thu không chỉ từ quảng cáo trên nền tảng và phí sử dụng API của các nhà phát triển mà còn từ kho dữ liệu khổng lồ. Trong hồ sơ IPO, Reddit cho biết họ đã kiếm được 203 triệu USD thông qua các thỏa thuận cấp phép dữ liệu và dự kiến con số này sẽ tăng theo thời gian.

Trước đây, Reddit không chặn truy cập dữ liệu để đào tạo AI, nhưng điều này đã thay đổi vào năm ngoái. CEO Steve Huffman nói với The New York Times rằng việc Reddit tiếp tục cung cấp “miễn phí tất cả giá trị đó cho một số công ty lớn nhất thế giới” là không hợp lý. Điều này báo hiệu kế hoạch của Reddit bước vào thị trường cấp phép dữ liệu.

Chính sách Public Content Policy mới sẽ siết chặt quyền truy cập dữ liệu của Reddit nếu không có thỏa thuận. Reddit viết trên blog rằng “ngày càng nhiều tổ chức thương mại truy cập trái phép hoặc sử dụng sai mục đích quyền truy cập được ủy quyền để thu thập dữ liệu công khai với số lượng lớn, bao gồm cả nội dung công khai của Reddit.” “Tồi tệ hơn, các tổ chức này cho rằng họ không bị hạn chế trong việc sử dụng dữ liệu đó và họ làm như vậy mà không quan tâm đến quyền của người dùng hoặc quyền riêng tư, bỏ qua các yêu cầu hợp pháp, an toàn và xóa bỏ hợp lý. Mặc dù chúng tôi sẽ tiếp tục nỗ lực để chặn các kẻ xấu đã biết, chúng tôi cần làm nhiều hơn nữa để hạn chế quyền truy cập vào nội dung công khai của Reddit ở quy mô lớn đối với các đối tác đáng tin cậy đã đồng ý tuân theo chính sách của chúng tôi. Nhưng chúng tôi cũng cần tiếp tục đảm bảo rằng người dùng, điều hành viên, nhà nghiên cứu và các bên phi thương mại khác có thiện chí có quyền truy cập.”

Nói cách khác, quyền truy cập dữ liệu của Reddit cho nghiên cứu và các hoạt động phi thương mại khác sẽ tiếp tục, nhưng các tổ chức muốn sử dụng dữ liệu của Reddit cho các mục đích khác – bao gồm đào tạo AI – sẽ phải trả phí. Trong biểu đồ trên blog, Reddit nói rõ rằng các doanh nghiệp quan tâm đến việc sử dụng dữ liệu của Reddit để “cung cấp năng lượng, tăng cường hoặc cải thiện sản phẩm của bạn cho bất kỳ mục đích thương mại nào” cần phải có hợp đồng.

Reddit khóa dữ liệu công khai, yêu cầu hợp đồng mới cho phép truy cập

Trong khi đó, nhà quảng cáo được hướng dẫn đến API quảng cáo để quản lý chiến dịch và theo dõi hiệu suất.

Vì bản chất Reddit chỉ là một trang web lớn, có thể lập chỉ mục bởi các công cụ tìm kiếm, chính sách mới này nhằm mục đích khóa nội dung Reddit khỏi bất kỳ bộ sưu tập trái phép nào đồng thời tôn trọng quyền của người dùng.

Ví dụ, Reddit yêu cầu các đối tác của họ phải tôn trọng quyết định xóa nội dung của người dùng. Vì vậy, nếu người dùng không muốn các bài đăng cá nhân của họ trở thành dữ liệu cho các công cụ AI trong tương lai, họ có thể chọn không tham gia. Chính sách mới cũng hạn chế các đối tác sử dụng nội dung của Reddit để xác định danh tính cá nhân hoặc thông tin cá nhân, bao gồm cả mục tiêu quảng cáo. Các đối tác cũng không thể sử dụng nội dung của Reddit để spam hoặc quấy rối người dùng của họ hoặc để thực hiện “kiểm tra lý lịch, nhận dạng khuôn mặt, giám sát của chính phủ hoặc giúp thực thi pháp luật thực hiện bất kỳ điều nào ở trên.”

Chính sách này cũng hạn chế quyền truy cập vào nội dung người lớn và khẳng định rằng Reddit sẽ không bán thông tin cá nhân của người dùng. Công ty cũng lưu ý rằng họ sẽ không bao giờ cấp phép cho nội dung không công khai như tin nhắn riêng tư hoặc thông tin tài khoản không công khai, chẳng hạn như email của người dùng hoặc lịch sử duyệt web.

Để giúp các nhà nghiên cứu muốn sử dụng dữ liệu của Reddit cho các mục đích phi thương mại, công ty đã thành lập một subreddit mới, r/reddit4researchers. Reddit cho biết họ đang hợp tác với OpenMined để phát triển một chương trình hướng dẫn và thúc đẩy sự hợp tác của các nhà nghiên cứu với Reddit.

Chia sẻ bài viết:

Từ khoá:

Tin tài trợ

Nhận xét (0)

Bài viết liên quan

ĐĂNG KÝ NHẬN TIN

NGAY HÔM NAY

Đăng ký để nhận thông tin sớm nhất về những câu chuyện nóng hổi hiện nay trên thị trường, công nghệ được cung cấp hàng ngày.

    Bằng cách nhấp vào “Đăng ký”, bạn chấp nhận Điều khoản dịch vụ và Chính sách quyền riêng tư của chúng tôi. Bạn có thể chọn không tham gia bất cứ lúc nào.