Mỹ ra mắt AI s1 cạnh tranh trực tiếp với DeepSeek
Theo thông tin giới thiệu, mặc dù có chi phí hoạt động chỉ 50 USD, AI s1 lại được trang bị khả năng lập luận tương đương với mô hình o1 của OpenAI.
Theo thông tin được chia sẻ với truyền thông, nhóm nghiên cứu đã công khai mã nguồn của s1 trên GitHub, kèm theo mã và dữ liệu sử dụng để xây dựng mô hình.
Một bài báo được công bố vào tuần trước đã giải thích quy trình phát triển mô hình này, nhấn mạnh vào các kỹ thuật thông minh mà họ áp dụng.
Theo đó, thay vì bắt đầu từ đầu với một mô hình lý luận mới, nhóm đã sử dụng một mô hình ngôn ngữ có sẵn và thực hiện quá trình “tinh chỉnh” bằng cách chưng cất các khả năng lý luận từ mô hình Gemini 2.0 Flash Thinking Experimental của Google.

Quá trình đào tạo mô hình s1 chỉ mất 30 phút, sử dụng 16 GPU Nvidia H100. Mặc dù mỗi GPU này có giá khoảng 25.000 USD nhưng chi phí thuê cho quá trình này chỉ dưới 50 USD nhờ vào dịch vụ điện toán đám mây.
Đặc biệt, nhóm nghiên cứu đã đưa ra hướng dẫn mô hình “chờ” trước khi đưa ra câu trả lời cuối cùng giúp cải thiện khả năng lý luận và đưa ra kết quả tốt hơn cho người sử dụng.
Sự xuất hiện của s1 tiếp nối thành công của DeepSeek đã gây chấn động tại Thung lũng Silicon những ngày gần đây.
Tuy nhiên, giới chuyên gia nhận định việc sử dụng mô hình của Google làm “giáo viên” đặt ra câu hỏi về khả năng cạnh tranh của s1 với các mô hình AI hàng đầu hiện nay. Google có thể sẽ theo dõi sát sao tình hình, đặc biệt là trong bối cảnh vụ kiện giữa OpenAI và DeepSeek đang diễn ra.
Khánh An
TIN LIÊN QUAN
Tin khác
