Meta, AWS và hợp đồng đám mây trị giá hàng tỷ đô la… Đầu tư ‘Graviton5’ vào AI Agent

Meta Platforms và Amazon Web Services(AWS) đã ký một hợp đồng nhiều năm trị giá hàng tỷ đô la. Nội dung chính của hợp đồng là dòng CPU “Graviton” tự phát triển của AWS, Meta sẽ nhận được hạ tầng đám mây cần thiết để vận hành các đại lý AI quy mô lớn từ AWS.

Theo Bloomberg đưa tin, thông qua hợp đồng này, Meta có thể nhận được hàng chục triệu lõi Graviton và còn có quyền chọn để tăng số lượng theo nhu cầu trong tương lai. Meta dự định sử dụng các nguồn lực này để thúc đẩy “AI đại lý”. AI đại lý đề cập đến dạng trí tuệ nhân tạo vượt ra ngoài chatbot đơn giản, có thể kết nối với các ứng dụng bên ngoài và tự động thực hiện các nhiệm vụ.

Đặc điểm và hiệu suất của Graviton5

Trong hợp đồng này, chip được chú ý nhất là CPU “Graviton5” mới nhất do AWS ra mắt vào tháng 12 năm ngoái. Chip này được sản xuất theo quy trình 3 nanomet, trang bị 192 lõi, dựa trên kiến trúc tập lệnh của Arm Holdings. Kiến trúc tập lệnh này tương đương như một “ngôn ngữ” xác định cách thức bán dẫn thực hiện các phép tính. Kiến trúc Arm có lợi thế trong các phép tính vector và ma trận, được xem là có lợi cho các nhiệm vụ AI.

AWS cho biết, Graviton5 có hiệu suất cao hơn tối đa 25% so với CPU thế hệ trước của riêng họ. Sự nâng cao hiệu suất này đến từ bộ nhớ đệm L3 mở rộng quy mô lớn. Bộ nhớ đệm L3 là bộ nhớ nằm gần các lõi xử lý, giúp tăng tốc độ xử lý bằng cách rút ngắn khoảng cách truyền dữ liệu. Theo AWS, bộ nhớ đệm L3 của Graviton5 lớn gấp 5 lần so với thế hệ trước.

Vai trò của CPU trong hạ tầng AI

CPU vẫn đóng vai trò quan trọng trong các máy chủ AI. Mặc dù các phép tính mạng neural quy mô lớn chủ yếu do GPU đảm nhiệm, nhưng CPU chịu trách nhiệm phối hợp các GPU này và thực hiện các nhiệm vụ phụ trợ khác. Đặc biệt, các đại lý AI do Meta thúc đẩy thường cần kết nối với các công cụ và dịch vụ bên ngoài, do đó nhu cầu xử lý xung quanh CPU không thể xem nhẹ. Hợp đồng này được xem như một tín hiệu cho thấy Meta không chỉ tập trung vào GPU, mà còn đang trở nên tinh vi hơn trong thiết kế hạ tầng AI tổng thể.

Graviton5 được thiết kế để hoạt động cùng hệ thống “Nitro” của AWS. Hệ thống Nitro là một kiến trúc chuyển một phần công việc quản lý hạ tầng sang các bộ tăng tốc độc lập, giúp CPU dành nhiều tài nguyên hơn để xử lý các ứng dụng của khách hàng. AWS cũng giải thích rằng, “bộ tách biệt Nitro” có thể xác minh xem các tải công việc của các khách hàng khác nhau có bị phân tách rõ ràng hay không. Đây là một thiết kế đảm bảo an toàn và hiệu quả trong môi trường đa thuê bao.

Chiến lược AI dài hạn của Meta

Trưởng bộ phận hạ tầng của Meta, Santosh Janardan, cho biết: “AWS là đối tác đám mây lâu dài mà chúng tôi tin tưởng, thông qua việc mở rộng sử dụng Graviton, chúng tôi có thể vận hành các tải công việc AI đòi hỏi CPU với hiệu suất và hiệu quả phù hợp quy mô của Meta.”

Việc ra mắt này còn thu hút sự chú ý vì đây là hợp đồng CPU lớn thứ hai mà Meta công bố trong vòng một tháng qua. Trước đó, Meta đã quyết định giới thiệu CPU AGI mới của Arm và công bố kế hoạch hợp tác trong thiết kế các thế hệ chip tiếp theo trong tương lai. Các nhà phân tích thị trường cho rằng, Meta đang giúp chiến lược hạ tầng AI của mình thoát khỏi phụ thuộc duy nhất vào GPU, mở rộng sang CPU, chip tùy chỉnh và nguồn lực đám mây, nhằm chuẩn bị cho cạnh tranh lâu dài.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim