Các công ty tìm hướng đi mới cho ngành AI nhằm vượt qua những hạn chế hiện nay
Các công ty trí tuệ nhân tạo hàng đầu, bao gồm OpenAI, đang đối mặt với nhiều thách thức và hạn chế trong quá trình phát triển các mô hình ngôn ngữ lớn. Hàng chục nhà khoa học, nhà nghiên cứu, và nhà đầu tư AI đã chia sẻ rằng những kỹ thuật mới, đặc biệt là các phương pháp tiếp cận giống con người hơn trong quá trình đào tạo AI, có thể thay đổi hoàn toàn cuộc chạy đua vũ trang trong ngành AI. Điều này không chỉ ảnh hưởng đến các mô hình AI mà còn tác động lớn đến nhu cầu tài nguyên, từ năng lượng cho đến chip máy tính.
Sau khi phát hành thành công ChatGPT cách đây hai năm, các công ty công nghệ đã hưởng lợi rất nhiều từ sự bùng nổ của AI. Họ khẳng định rằng việc mở rộng quy mô các mô hình ngôn ngữ thông qua việc sử dụng nhiều dữ liệu và sức mạnh tính toán sẽ tiếp tục cải thiện AI. Tuy nhiên, nhiều nhà khoa học nổi tiếng trong lĩnh vực này, bao gồm Ilya Sutskever, một trong những người sáng lập OpenAI, đã lên tiếng về những giới hạn của triết lý “càng lớn càng tốt”.
Sutskever, hiện là đồng sáng lập phòng thí nghiệm AI Safe Superintelligence (SSI), thừa nhận rằng kết quả từ việc mở rộng quy mô mô hình đã bắt đầu ổn định. Mặc dù từng là người ủng hộ mạnh mẽ cho việc sử dụng nhiều dữ liệu và sức mạnh tính toán, ông nhận thấy rằng kỷ nguyên “mở rộng quy mô” trong thập niên 2010 đã đạt đến giới hạn. Theo Sutskever, giờ đây là thời điểm để quay lại với sự khám phá và tìm kiếm những điều mới mẻ hơn. Ông cho biết SSI đang nghiên cứu một phương pháp thay thế để cải thiện quá trình đào tạo trước, nhưng không cung cấp chi tiết cụ thể.
Các nhà nghiên cứu tại các phòng thí nghiệm AI lớn khác cũng đang gặp phải khó khăn khi cố gắng vượt qua mô hình GPT-4 của OpenAI, ra mắt gần hai năm trước. Việc đào tạo các mô hình AI lớn rất tốn kém, đòi hỏi hàng chục triệu đô la để vận hành hàng trăm chip đồng thời. Quá trình này không chỉ dễ gặp lỗi do phần cứng phức tạp mà còn tiêu thụ lượng dữ liệu khổng lồ, dẫn đến việc cạn kiệt nguồn dữ liệu dễ truy cập trên thế giới.
Để giải quyết những thách thức này, các nhà nghiên cứu đang chuyển sang sử dụng “tính toán thời gian thử nghiệm”, một kỹ thuật mới giúp mô hình AI suy luận theo thời gian thực. Thay vì chọn ngay lập tức một câu trả lời duy nhất, mô hình có thể tạo và đánh giá nhiều khả năng, cuối cùng chọn ra phương án tốt nhất. Điều này cải thiện hiệu suất của mô hình AI mà không cần phải gia tăng kích thước mô hình theo cách truyền thống.
Mô hình o1, được OpenAI phát hành trong thời gian gần đây, là một ví dụ điển hình về việc áp dụng kỹ thuật này. Noam Brown, một nhà nghiên cứu tại OpenAI, đã nhấn mạnh rằng để mô hình “suy nghĩ” trong một khoảng thời gian ngắn có thể mang lại hiệu suất tăng cường tương tự như việc mở rộng quy mô mô hình lên nhiều lần. Mô hình o1 có khả năng suy nghĩ đa bước và được huấn luyện thêm bằng cách sử dụng phản hồi từ các chuyên gia.
Ngoài OpenAI, các phòng thí nghiệm AI hàng đầu như Anthropic, xAI, và Google DeepMind cũng đang nghiên cứu các phương pháp tiếp cận tương tự. Sự chuyển hướng này có thể thay đổi bối cảnh cạnh tranh về phần cứng AI. Các nhà đầu tư mạo hiểm đã đầu tư hàng tỷ đô la vào sự phát triển của các mô hình AI đang cân nhắc tác động của những thay đổi này đến các khoản đầu tư của họ. Theo Sonya Huang, đối tác tại Sequoia Capital, sự chuyển dịch từ đào tạo khổng lồ sang suy luận sẽ tạo ra cơ hội mới cho các nhà sản xuất chip.
Nvidia, công ty dẫn đầu trong lĩnh vực chip AI, hiện đang đối mặt với những thách thức mới khi các công nghệ suy luận AI trở nên phổ biến. Tuy nhiên, Giám đốc điều hành Jensen Huang của Nvidia khẳng định rằng nhu cầu về chip suy luận AI vẫn rất cao, đặc biệt là với các sản phẩm mới như chip Blackwell.
Tương lai của AI đang hướng tới một giai đoạn mới, nơi các kỹ thuật đào tạo tập trung vào sự suy luận giống con người và khả năng tự "suy nghĩ" của các mô hình. Những phát triển này không chỉ thúc đẩy sự tiến bộ của AI mà còn định hình lại toàn bộ ngành công nghiệp, từ tài nguyên phần cứng đến cách thức các công ty tiếp cận cuộc đua AI toàn cầu.
Hoàng Kim