Nvidia забезпечить Amazon Web Services величезною кількістю GPU до 2027 року, оскільки хмарний провайдер розширює свою інфраструктуру ШІ та прагне задовольнити зростаючий попит. AWS оголосила раніше цього тижня, що планує розгорнути близько 1 мільйона Nvidia GPU у рамках розширення своєї інфраструктури ШІ. Представник Nvidia підтвердив у четвер для Reuters, що розгортання триватиме до кінця 2027 року. Починаючи з цього року, у глобальних хмарних регіонах AWS, воно буде впроваджено разом із розширеною співпрацею з Nvidia щодо мереж та інших інфраструктурних систем для створення систем, здатних до автономного мислення, планування та дій у складних робочих процесах, повідомила AWS, посилаючись на свою роботу над агентними системами ШІ.
AWS продовжує розробляти чипи для ШІ як для тренування, так і для інференції. Співпраця свідчить про те, що попит може змінюватися по всьому стеку ШІ, тоді як все більша частка активності, здається, пов’язана з запуском моделей у реальних сервісах. Ця угода відбувається на тлі того, що прокурори США ведуть справу про те, що чипи Nvidia були контрабандою доставлені до Китаю, що знову піддає увазі глобальні поставки та контроль компанії. З 2022 року найсучасніші чипи Nvidia суворо контролюються як частина ширшої стратегії США щодо обмеження прогресу Китаю у передових обчисленнях та ШІ.
Розвиток у четвер, ближче до дому, може майже розширити цю різницю. Зміни у темпі Спостерігачі кажуть, що структура угоди дає підказки щодо того, де зростає попит і як змінюється інфраструктура з все більшою швидкістю. «Nvidia стає інфраструктурним шаром під хмарними провайдерами, а не просто постачальником чипів», — сказав Decrypt Дермот МакГрат, співзасновник студії стратегій і зростання ZenGen Labs. Чипи у цій угоді орієнтовані на масштабне запускання моделей ШІ з акцентом на зниження вартості використання, зазначив МакГрат, підкреслюючи, що інференція тепер становить приблизно дві третини обчислень ШІ, тоді як у 2023 році це було близько третини. Очікується, що ринок чипів для інференції перевищить 50 мільярдів доларів до 2026 року, додав він, посилаючись на оцінки Deloitte. AWS може використовувати як Nvidia, так і власні чипи у тих самих системах, що дає клієнтам більше вибору, ніж у конкурентів, які тримають свої рішення закритими, пояснив МакГрат, додавши, що ця гнучкість «є відмінністю». «Зараз Nvidia робить те саме на рівні мереж та архітектури стійок замість моделі програмування», — сказав він. Чипи для інференції — це процесори, створені для запуску навчених моделей ШІ в реальному часі, а не для повторного навчання.
Попит на інференцію «спонукає довгострокові зобов’язання» щодо більшої обчислювальної потужності і створює тісніші зв’язки між хмарними провайдерами та виробниками чипів, сказав Decrypt Пічапен Пратіпаваніч, стратег з політики та засновник інфраструктурної компанії Gather Beyond. «Хмарні провайдери хочуть незалежності в довгостроковій перспективі, але в короткостроковій їм потрібно, щоб Nvidia залишалася конкурентоспроможною», — додала вона, зазначаючи, що це створює динаміку, де співпраця і конкуренція відбуваються одночасно. Однак контроль над інфраструктурою ШІ також змінюється. Що відбувається — це «інфраструктурний переворот», — сказала Берна Миса, партнер з угод у Boardy Ventures, інвестиційному фонді, орієнтованому на ШІ. Nvidia «інтегрує свій повний стек у обчислювальні ресурси, мережі та інференцію всередині дата-центрів AWS, які роками використовували власне обладнання», — сказала вона. Але хоча AWS розробляє власні чипи для ШІ, це «не змінює математику», — пояснила вона, зазначаючи, що інференція залежить від кількох компонентів у всьому стеку, більшість з яких постачає Nvidia. «Коли ти так глибоко занурений у стек клієнта, вартість переключення та контекстний шар, що з цього випливає, стає захистом», — сказала вона.