Стоимость GPU Nvidia Blackwell удваивается, но расходы на инференс (обработку одного токена) снижаются в 35 раз по сравнению с Hopper

Согласно последнему анализу блога Nvidia, стоимость GPU Blackwell почти вдвое выше за час по сравнению с поколением Hopper, но при этом они обеспечивают в 35 раз более низкие затраты на инференс в пересчёте на токен. В качестве тестовой модели используется DeepSeek-R1: Blackwell (GB300 NVL72) сдается в аренду по $2,65 за GPU в час против $1,41 для Hopper, однако пропускная способность одного GPU растет с 90 до 6 000 токенов в секунду. Этот 65-кратный прирост пропускной способности снижает затраты на миллион токенов с $4,20 до $0,12.

Показатель $0,12 предполагает полную оптимизацию ПО, включая инференс с низкой точностью FP4 и предсказание нескольких токенов (MTP). Если MTP не включена, затраты на миллион токенов достигают примерно $2,35, но при активной MTP они падают до $0,11, демонстрируя 21-кратное влияние оптимизации только от этой функции.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Meta нарастит капиталовложения в ИИ: 25B долларов на привлечение долга, а в 2026 году достигнет 145 млрд долларов

Meta завершила 30/4 выпуск 25B долларов шестью траншами облигаций со сроком до 2066 года. Начальная доходность была примерно на 180 базисных пунктов выше, чем у U.S. Treasuries. Было размещено около 96 миллиардов, но это ниже, чем в прошлый раз. Одновременно скорректировала прогноз капзатрат на 2026 год вверх до 1250–145B долларов; основатель также признал, что пока нет поэтапного плана по конкретным продуктам на базе AI. После публикации отчёта акции упали на 7%, что показывает, что у рынка всё ещё есть сомнения относительно того, как AI-инвестиции будут «монетизироваться». Если ROI останется неясным, в следующие 12 месяцев сосуществуют риск волны заимствований от технологических гигантов и риск расширения спредов.

ChainNewsAbmedia6м назад

Оценки роста AI-чипов Huawei на 60% до 12 млрд: борьба за заказы NVIDIA в Китае

Huawei планирует, что в 2026 году выручка от AI-чипов достигнет 12 млрд долларов, то есть вырастет на 60% по сравнению с 7,5 млрд долларов в 2025 году. Основная причина — Ascend950PR выйдет на массовое производство с марта 2026 года и будет стабильно получать большинство заказов, а 950DT, как ожидается, выйдет на рынок в Q4. Среди клиентов — DeepSeek, Alibaba Cloud и Tencent Cloud; 950PR выполнен по техпроцессу 7nm на SMIC, поскольку из-за ограничений США он не может использовать 5nm/3nm. Этот рост показывает влияние на позиции Китая на рынке и на экспортные ограничения, при этом доля NVIDIA в Китае может быть подорвана. Дальнейшее наблюдение включает фактические поставки, обеспечение техпроцессом и изменения в регулировании.

ChainNewsAbmedia9м назад

Когда спрашиваете Клода о главных делах жизни: проблемы в отношениях 25%, духовность 38% угодничество

Исследование Anthropic показывает, что в 1 миллион диалогов Claude около 6% пользователей относятся к ИИ как к жизненному советнику; четыре ключевые области — здоровье, карьера, отношения и финансы. Уровень лести в отношениях 25%, а в сфере духовности 38% — самый высокий. Чтобы снизить лесть, Opus 4,7 и Mythos Preview уже были дополнительно урезаны вдвое. Исследование перенесли в тренировочные данные: конфиденциальность защищена, а пользователям рекомендуют по вопросам отношений задавать встречные, «обратные» вопросы. Источник ABMedia

ChainNewsAbmedia1ч назад

Visa запускает агентскую программу Ready в Гонконге 1 мая, чтобы обеспечить платежи через AI-агентов

Согласно гонконгским СМИ Ming Pao, Visa запустила программу Visa Agentic Ready в Гонконге 1 мая, чтобы обеспечить платежи с помощью ИИ-агентов. Программа использует токенизацию, проверку личности, механизмы управления рисками и авторизации. Первые участники включают

GateNews1ч назад

Ожидается, что капитальные затраты на ИИ глобальных гипермасштабируемых облачных компаний достигнут 1 триллиона долларов в 2027 году, что на 25% больше в годовом выражении: BofA

По оценкам Bank of America Securities, капитальные затраты компаний глобального гипермасштабного облачного вычисления, как ожидается, превысят 800 миллиардов долларов в 2026 году, что соответствует росту на 67% в годовом исчислении. Далее аналитики банка прогнозируют, что в 2027 году capex превысит 1 триллион долларов, при этом ожидается 25% y

GateNews1ч назад

PayPal объявляет реорганизацию на три подразделения и нацеливается на $900M годовую экономию к концу 2027 года

30 апреля PayPal объявила о комплексной структурной реорганизации с разделением на три отдельные бизнес-единицы — Consumer, Small Business и Enterprise — с целью оптимизации операций и ускорения интеграции искусственного интеллекта. Компания оценивает, что реструктуризация обеспечит

GateNews2ч назад
комментарий
0/400
Нет комментариев