SO HUU TRI TUE
Thứ sáu, 03/05/2024
  • Click để copy

Stability AI tung mô hình ngôn ngữ mới cạnh tranh trực tiếp với ChatGPT

07:35, 23/04/2023
(SHTT) - Stability AI, công ty khởi nghiệp đứng sau công cụ nghệ thuật sử dụng trí tuệ nhân tạo Stable Diffusion, vừa công bố mã nguồn mở một bộ mô hình trí tuệ nhân tạo tạo văn bản với mục đích cạnh tranh trực tiếp với GPT-4 của OpenAI.

Stability AI phát triển bộ mã nguồn mở StableLM, hiện đã có sẵn phiên bản "Alpha" trên GitHub và Hugging Face - một nền tảng cho phép lưu trữ các mô hình và mã nguồn trí tuệ nhân tạo.

Theo công ty, bộ mô hình này có thể tạo ra cả mã lập trình và văn bản, và chứng minh được rằng các mô hình nhỏ và hiệu quả có thể cung cấp hiệu suất cao với việc đào tạo phù hợp.

Empty

Nguồn: Stability AI

"Những mô hình ngôn ngữ như thế này sẽ là trụ cột của nền kinh tế số của chúng ta, và chúng tôi muốn mọi người đều đóng vai trò quan trọng trong việc tạo lập nên chúng", trích dẫn từ đội ngũ của Stability AI trong một bài đăng trên blog của công ty.

Các mô hình đã được đào tạo trên một bộ dữ liệu được gọi là The Pile, bao gồm một hỗn hợp các mẫu văn bản được thu thập trên internet từ các trang web bao gồm PubMed, StackExchange và Wikipedia. Tuy nhiên, Stability AI cho biết họ đã tạo ra một bộ dữ liệu huấn luyện có thể tùy chỉnh mở rộng kích thước của The Pile gấp 3 lần.

Stability AI không đề cập trong bài đăng trên blog liệu các mô hình StableLM có gặp những hạn chế tương tự như những mô hình khác hay không, cụ thể là có khả năng sẽ tạo ra các phản hồi độc hại đối với một số câu hỏi và phát sinh ra những thông tin sai lệch (tức là tạo ra thông tin không có thật). Tuy nhiên, vì The Pile cũng chứa đựng những từ ngữ tục tĩu và khá cứng nhắc khác, nên không có gì ngạc nhiên nếu trường hợp đó xảy ra.

Phóng viên đã thử nghiệm các mô hình trên Hugging Face, một nền tảng cung cấp giao diện để chạy chúng mà không cần phải cấu hình mã lập trình từ đầu. Tuy nhiên, trong mỗi lần thử, phóng viên đã gặp phải lỗi không thể xử lý vì "quá tải", nguyên nhân có thể do kích thước của các mô hình - hoặc do có quá nhiều lượt truy cập cùng lúc.

Stability AI chia sẻ: "Giống như bất kỳ mô hình ngôn ngữ lớn nào được đào tạo trước mà không cần bổ sung thêm các bài tập tinh chỉnh, các phản hồi mà người dùng nhận được có chất lượng khác nhau và có thể bao gồm những câu trả lời phản cảm và cả quan điểm cá nhân. Dự kiến các mô hình ngôn ngữ mới này sẽ được cải tiến bằng cách sử dụng quy mô lớn hơn, dữ liệu tốt hơn, và sự phản hồi từ cộng đồng để tối ưu hóa chúng.

Empty

Nguồn: Stability AI

Tuy nhiên, các mô hình StableLM có khả năng khá tốt trong việc thực hiện các nhiệm vụ - đặc biệt là phiên bản Alpha.

Các mô hình StableLM được điều chỉnh bằng kỹ thuật Alpaca do Stanford phát triển trên các bộ dữ liệu nguồn mở, bao gồm cả dữ liệu từ công ty khởi nghiệp trí tuệ nhân tạo Anthropic. Các mô hình StableLM đã nâng cấp có thể hoạt động và có khả năng tạo ra các văn bản tương tự như ChatGPT.Trên cùng của Biểu mẫu

Trong ngành trí tuệ nhân tạo, nhu cầu sử dụng các mô hình tạo văn bản ngày càng tăng lên. Ngày càng có nhiều công ty lớn và nhỏ cạnh tranh để nổi bật trong không gian trí tuệ nhân tạo đầy tiềm năng này.

Trong năm qua, Meta, Nvidia và các nhóm độc lập như dự án BigScience được Hugging Face hỗ trợ đã phát hành các mô hình gần như tương đương với các mô hình "riêng tư", có sẵn thông qua giao diện lập trình ứng dụng như GPT-4 và Claude của Anthropic.

Một số nhà nghiên cứu đã phản đối việc phát hành các mô hình nguồn mở giống như StableLM trong quá khứ, vì cho rằng chúng có thể được sử dụng cho các mục đích không chuẩn mực như tạo ra các email lừa đảo hoặc hỗ trợ cho các cuộc tấn công phần mềm độc hại. Tuy nhiên, Stability AI lại cho rằng việc công bố mã nguồn mở là một hành động đúng đắn.Trên cùng của Biểu mẫu

Stability AI đã chọn mở mã nguồn cho các mô hình của mình để thúc đẩy tính minh bạch và tạo niềm tin. Việc này cho phép các nhà nghiên cứu có thể xác minh hiệu suất, phát triển các kỹ thuật giải thích và giúp phát hiện các rủi ro tiềm ẩn, đồng thời giúp phát triển các biện pháp bảo vệ.

Việc mở mã nguồn cho các mô hình giúp cộng đồng nghiên cứu và học thuật phát triển các kỹ thuật giải thích và an toàn một cách rộng lớn. Tuy nhiên, dù có kiểm soát cẩn thận và có đội ngũ kiểm duyệt, các mô hình thương mại hóa như GPT-4 cũng vẫn được chứng minh là có thể sản xuất ra các thông tin độc hại. Ngoài ra, các mô hình nguồn mở đòi hỏi nhiều nỗ lực hơn để điều chỉnh và cải tiến, đặc biệt là các nhà phát triển luôn cần phải theo kịp cập nhật mới nhất.

Dù thế nào, Stability AI vẫn không chùn bước trước những tranh cãi. Công ty này đang nằm trong tầm ngắm của các vụ kiện cáo buộc vi phạm quyền sở hữu trí tuệ của hàng triệu nghệ sĩ bởi phát triển các công cụ nghệ thuật AI sử dụng các hình ảnh bản quyền được lấy từ web. Và một vài cộng đồng trên web đã lợi dụng các công cụ của Stability để tạo ra deepfake nghệ sĩ nổi tiếng với hình ảnh đồi trụy hoặc bạo lực.

Thêm vào đó, Stability AI đang cố gắng biến những nỗ lực phát triển của mình thành mục đích thương mại - bao gồm cả nghệ thuật, hoạt hình, y học và âm thanh sinh sản.

Giám đốc điều hành của Stability AI, Emad Mostaque, đã đề cập đến kế hoạch trở thành công ty niêm yết trên sàn giao dịch chứng khoán (IPO), nhưng trang tin tức Semafor mới đây đưa tin rằng Stability AI đã thu hút hơn 100 triệu đô la vốn đầu tư vào tháng 10/2022 với giá trị ước tính trên 1 tỷ đô la.

Khánh Linh

Tin khác

Thương hiệu 7 giờ trước
(SHTT) - Ngày 27/4/2024, tại Hà Nội, Ngân hàng TMCP Đầu tư và Phát triển Việt Nam (BIDV) tổ chức Đại hội đồng cổ đông (ĐHĐCĐ) thường niên năm 2024. Tham dự Đại hội có 184 đại biểu, đại diện cho hơn 5,5 tỷ cổ phần có quyền biểu quyết, chiếm 96,95% số cổ phần có quyền biểu quyết.
Thương hiệu 9 giờ trước
Xuất phát từ tình yêu với nông sản Việt, CEO Nguyễn Văn Bi cùng đội ngũ Nonglamfood tìm con đường nâng cao giá trị nông sản qua các sản phẩm trái cây sấy dẻo.
Thương hiệu 9 giờ trước
(SHTT) - Trên con đường chinh phục vẻ đẹp tóc, Chastar Academy đã đi qua những thử thách và thăng trầm, nhưng với tinh thần kiên định và sự tận tụy, chúng tôi đã vươn lên trở thành một trong những điểm đến lý tưởng nhất cho sự đẳng cấp và chất lượng trong dịch vụ làm đẹp tóc.
Thương hiệu 9 giờ trước
(SHTT) - Vừa qua, Công đoàn Ngân hàng Việt Nam đã phát động ủng hộ, đóng góp trong các cấp công đoàn ngành chương trình Hoạt động tôn vinh, tri ân các anh hùng liệt sĩ, chiến sĩ Điện Biên, thanh niên xung phong, dân công hỏa tuyến trực tiếp tham gia chiến dịch Điện Biên Phủ trong phạm vi toàn quốc.
Thương hiệu 9 giờ trước
(SHTT) - Ngày 21/04 vừa qua, công ty TNHH Mỹ phẩm cao cấp Quốc tế YOBY đã vinh dự nhận đồng thời cả hai giải thưởng “Top 10 Thương hiệu mạnh Quốc gia 2024 và hạng mục Sản phẩm dịch vụ tin dùng 2024”