ChatGPT-5.2 bị phát hiện sử dụng dữ liệu từ Grokipedia
Trong loạt bài kiểm tra thực nghiệm do The Guardian tiến hành, ChatGPT phiên bản GPT-5.2 đã trích dẫn nguồn từ Grokipedia tới chín lần trong hơn 10 câu hỏi khác nhau. Điều đáng chú ý là các trích dẫn này thường xuất hiện khi người dùng truy vấn về những chủ đề ít phổ biến hoặc mang tính chuyên sâu, thay vì các kiến thức đại chúng.
Cụ thể, chatbot này đã dựa vào Grokipedia để trả lời các câu hỏi phức tạp về cấu trúc chính trị tại Iran, bao gồm mức lương của lực lượng bán quân sự Basij hay quyền sở hữu của quỹ Mostazafan. Ngoài ra, tiểu sử của nhà sử học người Anh Richard Evans cũng là một nội dung được lấy từ nguồn này.Ngược lại, khi được hỏi về các sự kiện hoặc nhân vật nổi tiếng mà dữ liệu đã được xác lập rộng rãi, ChatGPT lại không sử dụng Grokipedia. Điều này cho thấy thuật toán của OpenAI dường như đang tìm đến nền tảng của Elon Musk như một giải pháp lấp đầy khoảng trống dữ liệu đối với các thông tin ngách (long-tail information), nơi mà các nguồn thống tin truyền thống có thể chưa cập nhật hoặc thiếu chi tiết.
Việc ChatGPT sử dụng dữ liệu từ Grokipedia khiến các chuyên gia về an toàn thông tin đặc biệt lo ngại.
Theo các chuyên gia, việc “nuôi” AI bằng dữ liệu do AI tạo ra sẽ không giúp chất lượng thông tin tốt hơn, mà còn có nguy cơ suy giảm nghiêm trọng chất lượng mô hình theo thời gian. Kịch bản xấu nhất có thể khiến mô hình sụp đổ khi AI ngày càng nghèo nàn về thông tin, dễ sai lệch và dần tách khỏi thực tế. Hệ quả cuối cùng vẫn là rủi ro gia tăng cho những người dùng AI như một công cụ nghiên cứu hoặc tham khảo tri thức.
Căn nguyên của vấn đề nằm ở điểm yếu cố hữu: AI có xu hướng “ảo giác”, nghĩa là bịa ra những thông tin có vẻ hợp lý nhưng hoàn toàn sai.
Trước các bằng chứng từ The Guardian, OpenAI đã đưa ra phản hồi chính thức. Công ty cho biết ChatGPT thu thập thông tin từ nhiều nguồn dữ liệu và quan điểm công khai khác nhau, đồng thời khẳng định hệ thống luôn áp dụng các bộ lọc an toàn để giảm thiểu nội dung gây hại hoặc có độ tin cậy thấp. Tuy nhiên, đại diện OpenAI không giải thích cụ thể lý do tại sao thuật toán của họ lại đánh giá Grokipedia là một nguồn tin đủ uy tín để trích dẫn.
TH