SO HUU TRI TUE
Thứ sáu, 14/06/2024
  • Click để copy

Các công ty lớn 'quay xe' tìm kiếm lợi ích từ các mô hình ngôn ngữ nhỏ

15:48, 23/05/2024
(SHTT) - Trước thực tiễn thị trường mô hình trí tuệ nhân tạo ngôn ngữ lớn (LLM) trở nên bão hòa, thời gian gần đây, nhiều công ty công nghệ lớn như: Microsoft, Meta và Google, đã chuyển hướng đầu tư cho các mô hình ngôn ngữ nhỏ (SLM) để tối ưu lợi nhuận

Theo Financial Times, các công ty trí tuệ nhân tạo đã chi hàng tỷ đô la để xây dựng cái gọi là mô hình ngôn ngữ lớn để cung cấp năng lượng cho các sản phẩm AI có tính tổng hợp hiện đang nghiên cứu một cách mới để tăng doanh thu: mô hình ngôn ngữ nhỏ.

Apple, Microsoft, Meta và Google gần đây đều đã phát hành các mô hình AI mới với ít yêu cầu về số lượng biến được sử dụng để huấn luyện hệ thống AI và định hình đầu ra của nó, nhưng vẫn đảm bảo khả năng hoạt động mạnh mẽ.

Động thái này là nỗ lực của các nhóm công nghệ nhằm khuyến khích các doanh nghiệp áp dụng AI vào mô hình kinh doanh trước những lo ngại về chi phí và nguồn lực cần thiết để vận hành các mô hình ngôn ngữ lớn, loại công nghệ làm nền tảng cho các chatbot phổ biến như ChatGPT của OpenAI.

Nói chung, số lượng tham số càng cao thì hiệu suất của phần mềm AI càng tốt và các nhiệm vụ của nó càng phức tạp và nhiều sắc thái hơn. Mẫu GPT-4o mới nhất của OpenAI, được công bố trong tuần này và Gemini 1.5 Pro của Google, được ước tính có hơn 1 nghìn tỷ thông số. Meta đang đào tạo phiên bản tham số 400 tỷ của mô hình Llama nguồn mở.

ai2

Bảng định giá các mô hình AI hiện nay - Nguồn: FT. 

Ngoài việc đấu tranh để thuyết phục một số khách hàng doanh nghiệp trả số tiền lớn cần thiết để chạy các sản phẩm AI tổng hợp, cũng có những lo ngại về dữ liệu và trách nhiệm bản quyền đang cản trở việc áp dụng.

Điều này dẫn đến việc nhóm các công ty công nghệ lớn như Meta và Google đưa ra các mô hình ngôn ngữ nhỏ chỉ với vài tỷ tham số với chi phí rẻ hơn, tiết kiệm năng lượng, có thể tùy chỉnh, cần ít năng lượng hơn để đào tạo và chạy, vừa có thể ngăn chặn dữ liệu nhạy cảm.

Google, Meta, Microsoft và công ty khởi nghiệp Mistral của Pháp cũng đã phát hành các mô hình ngôn ngữ nhỏ thể hiện khả năng tiến bộ và có thể tập trung tốt hơn vào các ứng dụng cụ thể.

Nick Clegg, chủ tịch phụ trách các vấn đề toàn cầu của Meta, cho biết mô hình 8 tỷ tham số mới của Llama 3 có thể so sánh với GPT-4. Microsoft cho biết mô hình Phi-3 nhỏ của họ với 7 tỷ tham số đang hoạt động tốt hơn GPT-3.5, phiên bản trước đó của mô hình OpenAI.

Các mô hình nhỏ có thể xử lý các tác vụ cục bộ trên thiết bị thay vì gửi thông tin lên đám mây, điều này có thể thu hút những khách hàng quan tâm đến quyền riêng tư muốn đảm bảo thông tin được lưu giữ trong mạng nội bộ.

Charlotte Marshall, quản lý tại Addleshaw Goddard - Công ty luật tư vấn cho các ngân hàng cho biết: “một trong những thách thức mà nhiều khách hàng của chúng tôi đã gặp phải khi áp dụng các sản phẩm AI sáng tạo là tuân thủ các yêu cầu pháp lý về xử lý và truyền dữ liệu”. Bà cho biết các mô hình nhỏ hơn mang lại cơ hội cho các doanh nghiệp vượt qua những lo ngại về pháp lý và chi phí.

Các mẫu mô hình ngôn ngữ nhỏ  hơn cũng cho phép các tính năng AI chạy trên các thiết bị như điện thoại di động. Mẫu “Gemini Nano” của Google được trang bị bên trong điện thoại Pixel mới nhất và điện thoại thông minh S24 mới nhất của Samsung.

mo hinh ngon ngu nho

 

Apple cho biết, họ cũng đang phát triển các mô hình AI để chạy trên chiếc iPhone bán chạy nhất của mình. Tháng trước, gã khổng lồ Thung lũng Silicon đã phát hành mô hình OpenELM, một mô hình nhỏ được thiết kế để thực hiện các tác vụ dựa trên văn bản.

Boyd của Microsoft cho biết các mẫu máy nhỏ hơn sẽ mang đến các ứng dụng thú vị, cho đến điện thoại và máy tính xách tay.

Giám đốc OpenAI Sam Altman cho biết vào tháng 11 rằng công ty khởi nghiệp có trụ sở tại San Francisco này đã cung cấp các mô hình AI có quy mô khác nhau cho khách hàng và phục vụ các mục đích riêng biệt. Họ sẽ tiếp tục xây dựng và bán các tùy chọn này.

“Có một số điều mà các mô hình nhỏ hơn sẽ hoạt động thực sự tốt. Tôi rất vui mừng vì điều đó”, ông nói thêm.

Tuy nhiên, Altman cho biết thêm OpenAI sẽ vẫn tập trung vào việc xây dựng các mô hình AI lớn hơn với khả năng mở rộng quy mô, bao gồm khả năng suy luận, lập kế hoạch và thực hiện các nhiệm vụ và cuối cùng đạt được trí thông minh ở cấp độ con người.

Khánh An

Tin khác

Kinh tế 1 giờ trước
(SHTT) - Ngày 13/6, Thủ tướng Phạm Minh Chính chủ trì phiên họp Chính phủ chuyên đề về xây dựng pháp luật tháng 6/2024. Kết thúc các nội dung làm việc, Thủ tướng Phạm Minh Chính nhấn mạnh yêu cầu tiếp tục tập trung tháo gỡ vướng mắc pháp lý để huy động nguồn lực, ưu tiên tăng trưởng.
Kinh tế 1 giờ trước
(SHTT) - Thống kê sơ bộ từ Tổng cục Hải quan, tính đến hết tháng 5/2024, nước ta xuất khẩu gần 4,03 triệu tấn gạo, thu về 2,56 tỷ USD. Trong đó hai khách hàng lớn là Philippines và Indonesia chi hơn 1,56 tỷ USD gom mua gạo Việt.
Kinh tế 21 giờ trước
(SHTT) - Hoạt động xúc tiến thương mại, đặc biệt là xúc tiến thương mại các sản phẩm OCOP, đặc sản địa phương gắn với lợi thế du lịch đang được các địa phương trong tỉnh tích cực triển khai. Đây là cơ hội để các cơ sở sản xuất quảng bá sản phẩm, kết nối cung cầu, khai thác, mở rộng thị trường.
Kinh tế 21 giờ trước
(SHTT) - Theo khảo sát các doanh nghiệp thuộc Top 50 doanh nghiệp Đổi mới Sáng tạo và Kinh doanh hiệu quả Việt Nam năm 2024 (VIE50) của Viet Research cho thấy có đến 86% doanh nghiệp cho rằng đổi mới, sáng tạo là động lực tăng trưởng quan trọng nhất của doanh nghiệp trong giai đoạn 3-5 năm tới.
Kinh tế 22 giờ trước
(SHTT) - Từ ngày 2/7/2024, sản phẩm mì ăn liền của Việt Nam sẽ được đưa ra khỏi diện sản phẩm chịu kiểm soát an toàn thực phẩm của Liên minh châu Âu (EU). Tuy nhiên, tần suất kiểm tra tại cửa khẩu đối với mì ăn liền Việt Nam vẫn được duy trì ở mức 20%.