AWS mở rộng các dịch vụ không máy chủ

(SHTT) - Mới đây, một chi nhánh của Amazon đã công bố hai sản phẩm tập trung vào danh mục sản phẩm không máy chủ. Đây hứa hẹn sẽ là giải pháp mang tính đổi mới trong lĩnh vực công nghệ, mang đến nhiều lợi ích cho người dùng.

Vào ngày 21/04/2022, tại Hội nghị AWS Summit San Francisco, chi nhánh điện toán đám mây của Amazon đã cho ra mắt một số sản phẩm, trong đó có hai sản phẩm đáng chú ý.

Đầu tiên là sự ra mắt GA của Amazon Aurora Serverless V2, dịch vụ cơ sở dữ liệu không máy chủ, hiện có thể tăng và giảm nhanh hơn đáng kể so với phiên bản trước và có thể mở rộng theo mức độ chi tiết hơn. Sản phẩm tiếp theo là sự ra mắt GA của SageMaker Serverless Inference. Cả hai dịch vụ này lần đầu tiên được đưa ra bản xem trước tại AWS re: Invent vào tháng 12/2021.

Ông Swami Sivasubramanian, Phó chủ tịch phụ trách cơ sở dữ liệu, phân tích và ML (quản lý chính) tại AWS, cho biết, hơn 100.000 khách hàng AWS ngày nay chạy khối lượng công việc cơ sở dữ liệu của họ trên Aurora và dịch vụ này tiếp tục là dịch vụ AWS phát triển nhanh nhất. Trước đây, trong phiên bản 1, việc mở rộng dung lượng cơ sở dữ liệu sẽ mất từ 5 đến 40 giây và khách hàng phải tăng gấp đôi dung lượng.

Ông Sivasubramanian giải thích: “Nhờ việc không có máy chủ, khách hàng không phải lo lắng về việc quản lý dung lượng cơ sở dữ liệu. Tuy nhiên, để chạy nhiều khối lượng công việc sản xuất với [Aurora] Serverless V1, khi chúng tôi giao tiếp với khách hàng ngày càng nhiều hơn, họ cần khả năng mở rộng quy mô với tốc độ một phần giây và nhiều thông tin chi tiết hơn chứ không chỉ tăng gấp đôi về mặt công suất ”.

Ông Sivasubramanian lập luận rằng hệ thống mới này có thể tiết kiệm cho người dùng tới 90% chi phí cơ sở dữ liệu của họ khi so sánh với chi phí cung cấp dung lượng trước.

Ông lưu ý rằng không có "sự đánh đổi" nào khi chuyển sang phiên bản v2 và tất cả các tính năng trong phiên bản v1 vẫn khả dụng. Tuy nhiên, nhóm đã thay đổi nền tảng máy tính cơ bản và công cụ lưu trữ để giờ đây có thể mở rộng quy mô theo từng bước nhỏ này và làm nhanh hơn rất nhiều.

Ông nhận xét rằng: “Đó là một kỹ thuật đáng chú ý do nhóm đã thực hiện”.

 

Hiện tại, các khách hàng AWS như Venmo, Pagely và Zendesk đang sử dụng hệ thống mới này, đã được đưa vào bản xem trước vào tháng 12 năm 2021. AWS lập luận rằng việc chuyển đổi khối lượng công việc hiện đang chạy trên Amazon Aurora Serverless v1 sang v2 không phải là một việc quá nặng nề.

Đối với SageMaker Serverless Inference, hiện cũng đã có sẵn, ông Sivasubramanian lưu ý rằng dịch vụ này cung cấp cho các doanh nghiệp dịch vụ trả tiền trong quá trình sử dụng để triển khai các mô hình học máy của họ, đặc biệt là những mô hình thường không hoạt động, vào sản xuất.

Với điều này, AWS hiện cung cấp bốn lựa chọn cho hội nghị: Suy luận không máy chủ (Serverless Inference), Suy luận theo thời gian thực (Real-Time Inference) cho khối lượng công việc có độ trễ thấp là tối quan trọng, Bộ Chuyển đổi hàng loạt SageMaker (SageMaker Batch Transform) để làm việc với nhiều lô dữ liệu và Suy luận không đồng bộ SageMaker (SageMaker Asynchronous Inference) cho khối lượng công việc có kích thước trọng tải lớn có thể yêu cầu xử lý nhiều lần.

Với nhiều sự lựa chọn như vậy, có lẽ không có gì ngạc nhiên khi AWS cũng cung cấp Đề xuất suy luận SageMaker (SageMaker Inference Recommender) để giúp người dùng tìm ra cách triển khai tốt nhất các mô hình của họ.

Như Ý