Повідомлення Gate News, 24 квітня — Чжан Чі, колишній інженер команди Seed у ByteDance та нинішній доцент Пекінського університету, розповів у подкасті “Into Asia”, що ByteDance потрібно приблизно шість місяців, щоб завершити один повний цикл тренування великих мовних моделей (pretraining плюс післятренуванн), тоді як, як повідомляється, Google вистачає лише трьох місяців. Чжан пов’язав різницю в швидкості з ключовою причиною, чому китайські компанії не можуть наздогнати в розробці ШІ.
Чжан описав у Seed “культуру бенчмаркінгу”, де керівників команд оцінюють за бенчмарковими показниками, які вони контролюють, і всі учасники зосереджуються на тому, щоб збільшувати ці цифри. Однак він зазначив, що на практиці це не перетворюється на кращий користувацький досвід. Хоча моделі великих китайських компаній на папері виглядають конкурентними з провідними моделями США, у реальному використанні вони не дотягують. Мета Seed — досягти глобального рівня топових показників, але Чжан заявив, що він не вірить, ніби команді це вдалося, і вона також не досягла цільового показника лідерства всередині країни.
Наприкінці 2024 року Seed вважала себе на рівні GPT-4o, але після виходу DeepSeek команда усвідомила, що розрив залишився. Коли Чжан приєднався, вся група терміново переорієнтовувалася на навчання з підкріпленням, щоб усунути нестачу.
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до
Застереження.
Пов'язані статті
Міністерство оборони США досягло угоди з 7 компаніями зі штучного інтелекту, зокрема OpenAI, Google та Microsoft
За даними Міністерства оборони США, сьогодні (1 травня) агентство підписало угоди з сімома провідними компаніями в галузі штучного інтелекту: SpaceX, OpenAI, Google, Nvidia, Reflection, Microsoft і Amazon Web Services (AWS). Угоди спрямовані на прискорення військової трансформації та створення t
GateNews1хв. тому
Datavault AI співпрацює з King Mining Capital над планом токенізації $150M Gold
За даними Businesswire, 1 травня компанія Datavault AI, що котирується на Nasdaq, оголосила про стратегічне партнерство з King Mining Capital для запуску GoldVault — план токенізації золота на суму понад 150 мільйонів доларів. Згідно з угодою, Datavault AI придбає 5% частки в King Mining Capital і
GateNews26хв. тому
Nebius погоджується придбати Eigen AI для $643M готівкою та акціями
За даними Nebius, компанія інфраструктури для ШІ погодилася придбати Eigen AI 1 травня приблизно за 643 мільйона доларів готівкою та акціями класу A. Вартість угоди була розрахована на основі 30-денного зваженого середнього ціни акцій Nebius до підписання та підлягає стандартним коригуванням. Eigen AI
GateNews41хв. тому
Meta випустить облігації на 25 мільярдів доларів для підтримки AI: 2026 капітальні витрати сягнуть 145 мільярдів доларів
Meta завершила 250 млрд доларів шести частками облігацій 4/30, з найпізнішим терміном до 2066 року. Початкова ціна була приблизно на 180 базисних пунктів вища за американські держоблігації; попит становив близько 96 млрд, але був нижчим, ніж у попередній раз. Одночасно вона підвищила прогноз капітальних витрат на 2026 рік до 125–145 млрд доларів, а засновник також визнав, що ще немає покрокового плану AI-продуктів. Після виходу звіту акції впали на 7%, що свідчить: ринок досі сумнівається в тому, чи зможе інвестування в AI швидко конвертуватися в прибутки. Якщо рентабельність інвестицій не буде зрозумілою, ризики співіснуватимуть: майбутній сплеск запозичень технологічних гігантів протягом наступних 12 місяців і розширення спредів.
ChainNewsAbmedia1год тому
Чипи для ШІ від Huawei, за прогнозами, зростуть на 60% до 12 мільярдів: перехоплення китайських замовлень у NVIDIA
Huawei планує, що в 2026 році дохід від AI-чипів досягне 12 мільярдів доларів, що на 60% більше за 7,5 мільярда в 2025 році. Основна причина — Ascend950PR із березня 2026 року піде в серійне виробництво та стабільно візьме більшість замовлень, а 950DT, як очікується, вийде на ринок у Q4. Клієнти включають DeepSeek, Alibaba Cloud і Tencent Cloud; 950PR використовує техпроцес 7 нм від SMIC, оскільки через американські обмеження неможливо застосувати 5 нм/3 нм. Це зростання демонструє посилення позицій Huawei на китайському ринку та вплив експортних обмежень, через що частка NVIDIA в Китаї може бути підточена. Далі слідкуватимуть за фактичними обсягами відвантажень, можливостями постачання за техпроцесом і змінами в регуляторних обмеженнях.
ChainNewsAbmedia1год тому
Коли ви питаєте Клода про найважливіші справи в житті: проблеми в стосунках 25%, духовність 38%… відсоток улесливості
Дослідження Anthropic показує, що приблизно 6% користувачів у межах мільйонів розмов із Claude використовують ШІ як життєвого радника; чотири сфери — здоров’я, кар’єра, стосунки та фінанси. Частка догоджання в стосунках становить 25%, у сфері духовності — 38% (найвищий показник). Щоб зменшити догоджання, Opus 4.7 і Mythos Preview вже знижено наполовину. Дослідження перенесли в навчальні дані, приватність захищено, а користувачам рекомендують у темах стосунків ставити зустрічні запитання. Джерело ABMedia
ChainNewsAbmedia2год тому