У нещодавньому блозі Nvidia йдеться, що GPU Blackwell коштують майже вдвічі дорожче за годину порівняно з поколінням Hopper, але забезпечують у 35 разів нижчі витрати на інференс на токен. Як тестову модель використали DeepSeek-R1: оренда Blackwell (GB300 NVL72) становить $2,65 за GPU на годину проти $1,41 для Hopper, однак пропускна здатність одного GPU зростає з 90 до 6 000 токенів за секунду. Такий приріст пропускної здатності у 65 разів знижує витрати на мільйон токенів з $4,20 до $0,12.
Показник $0,12 передбачає повну оптимізацію програмного забезпечення, включно з інференсом у низькій точності FP4 та багатотокенним прогнозуванням (MTP). Якщо MTP не ввімкнено, витрати на мільйон токенів досягають приблизно $2,35, а з увімкненим MTP падають до $0,11, демонструючи, що лише ця функція дає ефект оптимізації у 21 раз.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
66,3% працівників США з високими доходами використовують інструменти ШІ на роботі, показує опитування Федеральної резервної системи
Згідно з опитуванням Федеральної резервної системи, 66,3% працівників у США з доходом понад $200 000 на рік використовували інструменти ШІ на роботі протягом останніх 12 місяців станом на 1 травня. Серед груп із нижчими доходами рівень використання істотно знижується: 51,6% для тих, хто заробляє $100 000–$200 000, 40,2% для тих, хто заробляє $50 000–$100
GateNews20хв. тому
xAI запускає API Grok 4.3 із контекстним вікном на 1 млн токенів за $1,25 за мільйон вхідних токенів
За даними BlockBeats, xAI запустила API Grok 4.3 1 травня. Нова модель підтримує контекстне вікно на 1 мільйон токенів і пропонує текстові введення/виведення, мультимодальні можливості та функції виклику інструментів. API Grok 4.3 коштує 1,25 долара за мільйон вхідних токенів
GateNews32хв. тому
Американські техгіганти планують витратити $700B на інфраструктуру для ШІ у 2026 році, що суттєво перевищить $105 млрд Китаю
За даними South China Morning Post, американські технологічні гіганти мають витратити понад $700 мільярдів на інфраструктуру ШІ цього року, що значно перевищує китайських конкурентів. Google, Microsoft, Meta та Amazon формують більшу частину цієї суми, тоді як Morgan Stanley оцінив, що китайські хмарні провайдери витратять приблизно $105 мільярдів
GateNews38хв. тому
Huawei очікує, що виручка від AI-чипів у 2026 році сягне 12 мільярдів доларів, що на 60% більше, ніж у 2025 році
За даними Reuters, Huawei очікує, що виручка від її AI-чипів у 2026 році досягне приблизно $12 мільярдів, що становить щонайменше 60% зростання порівняно з $7,5 мільярда у 2025 році. Більшість замовлень цього року стосуються процесора Ascend 950PR, який вийшов на масове виробництво в березні. Компанія планує запустити
GateNews1год тому
Nvidia інвестує в шведську AI-юридичну tech-стартап-компанію Legora, а Джуд Лоу став глобальним амбасадором бренду
NVIDIA здійснила розширювальну інвестицію в рамках Series D у Legora на 50 млн доларів США, внаслідок чого загальне залучення коштів Legora досягло 600 млн доларів США, а оцінка — 5,6 млрд доларів США. Участь взяли Atlassian, Adams Street Partners та Insight Partners. Legora спеціалізується на AI-юридичних технологіях, надаючи інструменти для автоматизованої перевірки, аналізу контрактів і правових досліджень тощо; ARR перевищує 100 млн доларів США, а кількість співробітників зросла з 40 до 400. Jude Law став глобальним амбасадором бренду, а рекламний слоган звучить: Law just got more attractive.
ChainNewsAbmedia1год тому