Багато людей все ще проектують архітектуру навколо обчислювальної залежності, яка з часом зникла


qwen3 32b, наприклад, зараз працює на розподілених спільних GPU, конвеєрний паралелізм виконується між вузлами, жоден оператор не контролює, без дозволу інференція через відкритий інтернет
три рівні, всі відкриті: відкриті ваги (alibaba їх випустила), обчислення без дозволу (спільне обладнання, без опіки), відкритий транспорт (відсутність приватного кластера, відсутній API-обмежувач). власність не застосовується до жодного з них
модель мислення, що інференція, здатна до фронтиру, вимагає гіперскейлерських рейлсів, була стандартною, і стандарти зникають, коли інфраструктура під ними з’являється. розробники, що запускають інференцію сьогодні, не повинні нікого питати
стандарт закінчився. стек вже публічний.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити