DeepSeek V4 é lançado com janela de contexto de 1M; chips Huawei Ascend e Cambricon alcançam compatibilidade total

Mensagem do Gate News, 24 de abril — DeepSeek V4-Pro e DeepSeek V4-Flash foram oficialmente lançados e tiveram seu código aberto em 24 de abril, com o comprimento de processamento de contexto sendo expandido significativamente de 128K para 1M, representando um aumento de capacidade de quase 10 vezes. A Huawei Computing anunciou que seus produtos de supernó Ascend suportam totalmente os modelos da série DeepSeek V4 por meio de estreita colaboração entre tecnologias de chip e de modelo.

O Ascend 950 da Huawei atinge implantação de inferência do modelo DeepSeek V4 com alta taxa de transferência e baixa latência por meio de técnicas de kernel fundido e paralelismo de múltiplos streams para reduzir a sobrecarga de computação de Attention e de acesso à memória. Para o DeepSeek V4-Pro com entrada de 8K, o Ascend 950 atinge aproximadamente 20ms de TPOT com 4.700 TPS de throughput de Decode de cartão único; para o DeepSeek V4-Flash com entrada abaixo de 8K, ele alcança aproximadamente 10ms de TPOT com throughput de 1.600 TPS. A série de supernós Ascend A3 também alcança compatibilidade total, com implementações de referência de treinamento fornecidas para ajuste fino rápido. Com base no supernó Ascend A3 de 64 cartões com modo EP grande, o DeepSeek V4-Flash atinge mais de 2.000 TPS de throughput de Decode de cartão único em cenários de entrada/saída de 8K/1K usando o mecanismo de inferência vLLM. As linhas completas de produtos Ascend A2, A3 e 950 da Huawei suportam tanto o DeepSeek V4-Flash quanto o V4-Pro.

A Huawei Cloud anunciou compatibilidade de primeira-mover com o DeepSeek V4, fornecendo aos desenvolvedores serviços de token de API com um clique por meio de sua plataforma MaaS. A Huawei Cloud otimizou as capacidades de camada do sistema, camada de operadores e camada de cluster para garantir adaptação rápida do modelo e implantação com alto desempenho. Empresas incluindo Kingsoft WPS e 360 já integraram o novo modelo da DeepSeek via a Huawei Cloud.

A Cambricon também anunciou compatibilidade Day 0 com o DeepSeek V4-Flash e V4-Pro com base na estrutura de inferência vLLM, com código de adaptação em código aberto para a comunidade do GitHub. A Cambricon anteriormente alcançou adaptação de primeira-mover quando o DeepSeek V3.2 foi lançado no ano passado, tendo realizado profunda otimização de desempenho colaborativa software-hardware nos modelos da série DeepSeek.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

NTT anuncia iniciativa de IA x OWN e planeja triplicar a capacidade de energia do Japão para 1 GW até 2033

Em 27 de abril, o presidente da NTT, Akira Shimada, anunciou a iniciativa AI x OWN, o esforço da empresa para redesenhar a infraestrutura da internet para uso de IA em tempo real. A NTT planeja triplicar sua capacidade de energia doméstica de aproximadamente 300 MW hoje para cerca de 1 gigawatt até o ano fiscal de 2033, à medida que a gigante de telecomunicações

GateNews1h atrás

A plataforma de IA Certifyde conclui uma rodada seed de US$ 2 milhões em 1º de maio, com apoio do CEO da Ripple, Brad Garlinghouse

De acordo com a TechfundingNews, a plataforma de aplicação de IA Certifyde concluiu uma rodada de seed funding de US$ 2 milhões em 1º de maio. Os investidores incluem a K5 Global, a Flamingo Capital e investidores-anjo, incluindo o cofundador da Honey George Ruan, o CEO da Ripple Brad Garlinghouse e o cofundador da Nutra Roland

GateNews2h atrás

Diretor de tecnologia do Pentágono: a Anthropic ainda está na lista negra, tratamento de exceção para a Mythos

O chefe de tecnologia do Departamento de Defesa dos EUA (Pentagon technology chief) declarou no dia 1º de maio ao Congresso que “a Anthropic ainda está na lista negra, mas o Mythos Preview é outra questão”, reconhecendo formalmente que o Departamento de Defesa trata de forma diferente a marca principal da Anthropic e seu novo modelo, Mythos. Essa fala se alinha com a revelação da Axios em 19 de abril de que a NSA (Agência de Segurança Nacional) já passou a usar o Mythos para estabelecer ressonância — e também consolida oficialmente a tendência de política em torno de um “canal de exceção para o Mythos”. Ao mesmo tempo, isso significa que o Departamento de Defesa já havia sustentado em tribunal que o uso de ferramentas da Anthropic colocaria a segurança nacional em risco, criando uma contradição interna nos argumentos legais em relação à prática atual. Anthropic vs Pentagon

ChainNewsAbmedia2h atrás

137 Ventures encerra $700M em novos fundos, AUM atinge US$ 15 bilhões

De acordo com a ChainCatcher, a 137 Ventures, investidora inicial na SpaceX, concluiu recentemente a captação de recursos para dois novos fundos, somando mais de US$ 700 milhões, elevando seus ativos sob gestão para mais de US$ 15 bilhões. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial

GateNews2h atrás

Reddit dispara 16% com forte perspectiva para o 2º tri; Apple enfrenta escassez de Macs à medida que a demanda por IA supera a oferta

As ações da Reddit subiram 16% antes do pregão na sexta-feira, após a empresa divulgar uma previsão de receita para o próximo trimestre acima do esperado. Os visitantes ativos diários cresceram 17%, para 126,8 milhões, enquanto a receita média por usuário no mundo todo disparou 44%, impulsionada por IA que

GateNews2h atrás

O Departamento de Defesa dos EUA chega a um acordo com 7 empresas de IA, incluindo OpenAI, Google e Microsoft

De acordo com o Departamento de Defesa dos EUA, a agência assinou acordos hoje (1º de maio) com sete das principais empresas de inteligência artificial: SpaceX, OpenAI, Google, Nvidia, Reflection, Microsoft e Amazon Web Services (AWS). Os acordos têm como objetivo acelerar a transformação militar e estabelecer t

GateNews3h atrás
Comentário
0/400
Sem comentários