Meta và OpenAI bị kiện vì vi phạm bản quyền
Được biết, Sarah Silverman, Richard Kadrey, Christopher Golden đã đệ trình đơn kiện lên tòa án liên bang San Francisco (Mỹ), cáo buộc công ty mẹ Facebook và nhà sản xuất ChatGPT sử dụng tài liệu có bản quyền để huấn luyện chatbot AI. Cụ thể, họ cáo buộc Meta Platforms và OpenAI đã sử dụng sách của họ mà không được phép để phát triển mô hình ngôn ngữ lớn, công cụ mạnh mẽ để tự động hóa các tác vụ bằng cách tái tạo cuộc trò chuyện giống con người.
Vụ kiện tập thể nhấn mạnh những rủi ro pháp lý mà nhà phát triển chatbot AI gặp phải khi sử dụng kho tài liệu có bản quyền để tạo ứng dụng mang lại phản hồi thực tế cho truy vấn của người dùng.
Trong vụ kiện chống lại Meta Platforms, các nguyên đơn cáo buộc rằng thông tin rò rỉ về hoạt động kinh doanh AI của công ty cho thấy tác phẩm của họ đã bị sử dụng trái phép.
Vụ kiện chống lại OpenAI cáo buộc rằng bản tóm tắt công việc của nguyên đơn do ChatGPT tạo ra cho thấy chatbot AI này đã được huấn luyện bằng nội dung có bản quyền của họ.
Hiện tại, cả Meta Platforms và OpenAI (công ty khởi nghiệp được Microsoft đầu tư hàng tỉ USD) không trả lời ngay lập tức khi được đề nghị bình luận về chuyện này.
Có thể thấy, các chương trình AI sáng tạo như chatbot ChatGPT của OpenAI và trình tạo hình ảnh DALL-E 2, cũng như các trình tạo hình ảnh khác như: Stable Diffusion và Midjourney của Stability AI đều không ngừng phát triển. Tất cả thể hiện khả năng sáng tạo vô tận và sản xuất nội dung ngày càng tinh vi, phức tạp hơn của AI. Để làm được điều đó, trí tuệ nhân tạo AI cần thu thập lượng lớn dữ liệu bao gồm: văn bản, hình ảnh, video,…
Mặt khác, thật không dễ để kiểm soát data đầu vào mà AI tổng hợp thu thập và học tập, bởi hầu hết mọi thứ mô hình này có được đều là dữ liệu trên Internet. Vì thế, sẽ rất khó phân biệt đúng sai nếu những AI “lấy nhầm” nội dung lậu.
Trước đó, trong đơn kiện kéo dài 157 trang gửi lên tòa án liên bang ở quận phía bắc California hôm 28/6, Công ty Clarkson tại bang California, Mỹ cũng đã đại diện tập thể cáo buộc OpenAI vi phạm các luật về bản quyền và quyền riêng tư bằng cách thu thập bí mật 300 tỉ từ trên internet, bao gồm "sách, bài viết, trang web, bài đăng, thông tin cá nhân mà không có sự cho phép", để huấn luyện mô hình ngôn ngữ lớn của mình.
Vụ kiện cũng nhằm mục đích 'kiểm tra lý thuyết' pháp lý mới bằng việc đề cập tới vấn đề OpenAI đã vi phạm quyền của hàng triệu người dùng internet khi sử dụng các bình luận trên mạng xã hội, bài đăng trên blog, bài viết trên Wikipedia và công thức nấu ăn gia đình của họ...
Vụ kiện cũng tập trung khai thác vấn đề chưa được giải quyết liên quan đến sự gia tăng các công cụ generative AI như chatbot và trình tạo hình ảnh. Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu hoặc học máy trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn nhờ vào việc học tập từ những dữ liệu đã có sẵn trước đó.
Thanh Hải