DeepSeek Lança os Modelos V4-Pro e V4-Flash com Custo 98% Menor do que o GPT-5.5 Pro da OpenAI

Mensagem do Gate News, 25 de abril — O DeepSeek lançou versões de prévia de V4-Pro e V4-Flash em 24 de abril, ambos modelos de pesos abertos com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 trilhão de parâmetros no total, mas ativa apenas 49 bilhões por passagem de inferência usando uma arquitetura de Mixture-of-Experts. O V4-Flash tem 284 bilhões de parâmetros no total com 13 bilhões ativos.

Os preços são significativamente mais baixos do que os concorrentes: o V4-Pro custa US$ 1,74 por milhão de tokens de entrada e US$ 3,48 por milhão de tokens de saída—aproximadamente 98% menos do que o GPT-5.5 Pro da OpenAI ($30 input, $180 output) e cerca de um-vigésimo do custo do Claude Opus 4.7. O V4-Flash é precificado em US$ 0,14 de entrada e US$ 0,28 de saída por milhão de tokens. Ambos os modelos são open-source sob licença MIT e podem ser executados localmente gratuitamente.

O DeepSeek obteve ganhos de eficiência por meio de dois novos mecanismos de atenção: Compressed Sparse Attention e Heavily Compressed Attention, que reduzem os custos de computação para 27% do predecessor V4-Pro (V3.2) e 10% para o V4-Flash. A empresa treinou o V4 parcialmente em chips Huawei Ascend, contornando as restrições de exportação dos EUA a processadores Nvidia avançados. O DeepSeek afirmou que, uma vez que 950 novos supernós entrem em operação mais tarde em 2026, o preço cairá ainda mais.

Em benchmarks de desempenho, o V4-Pro-Max fica em primeiro lugar no Codeforces competitive programming (3.206 score, ficando em torno de 23º entre os competidores humanos) e obtendo 90,2% em problemas de matemática do Apex Shortlist versus 85,9% do Claude Opus 4.6. No entanto, fica para trás em benchmarks de multitarefa: MMLU-Pro (87,5% vs 91,0% do Gemini-3.1-Pro) e Humanity’s Last Exam (37,7% vs 44,4%). Em tarefas de longo contexto, o V4-Pro lidera modelos open-source, mas perde para o Claude Opus 4.6 em testes de recuperação MRCR.

O V4-Pro introduz o “interleaved thinking,” permitindo que fluxos de trabalho de agentes retenham contexto de raciocínio entre múltiplas chamadas de ferramentas sem descarregar entre as etapas. Ambos os modelos oferecem integrações de codificação com Claude Code e OpenCode. De acordo com a pesquisa com desenvolvedores do DeepSeek com 85 usuários, 52% disseram que o V4-Pro estava pronto como seu agente padrão de codificação, com 39% inclinados a adotar. Os endpoints antigos deepseek-chat e deepseek-reasoner serão descontinuados em 24 de julho de 2026.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Claw Intelligence faz parceria com a Block Sec Arena para fortalecer a segurança da BNB Chain

De acordo com o anúncio oficial da Block Sec Arena em 30 de abril, a Claw Intelligence, uma plataforma Web3 orientada por IA construída na BNB Chain, anunciou uma parceria estratégica com a Block Sec Arena para integrar infraestrutura avançada de cibersegurança ao seu ecossistema. A colaboração tem como objetivo fortalecer o p

GateNews8h atrás

NTT anuncia iniciativa de IA x OWN e planeja triplicar a capacidade de energia do Japão para 1 GW até 2033

Em 27 de abril, o presidente da NTT, Akira Shimada, anunciou a iniciativa AI x OWN, o esforço da empresa para redesenhar a infraestrutura da internet para uso de IA em tempo real. A NTT planeja triplicar sua capacidade de energia doméstica de aproximadamente 300 MW hoje para cerca de 1 gigawatt até o ano fiscal de 2033, à medida que a gigante de telecomunicações

GateNews10h atrás

A plataforma de IA Certifyde conclui uma rodada seed de US$ 2 milhões em 1º de maio, com apoio do CEO da Ripple, Brad Garlinghouse

De acordo com a TechfundingNews, a plataforma de aplicação de IA Certifyde concluiu uma rodada de seed funding de US$ 2 milhões em 1º de maio. Os investidores incluem a K5 Global, a Flamingo Capital e investidores-anjo, incluindo o cofundador da Honey George Ruan, o CEO da Ripple Brad Garlinghouse e o cofundador da Nutra Roland

GateNews10h atrás

Diretor de tecnologia do Pentágono: a Anthropic ainda está na lista negra, tratamento de exceção para a Mythos

O chefe de tecnologia do Departamento de Defesa dos EUA (Pentagon technology chief) declarou no dia 1º de maio ao Congresso que “a Anthropic ainda está na lista negra, mas o Mythos Preview é outra questão”, reconhecendo formalmente que o Departamento de Defesa trata de forma diferente a marca principal da Anthropic e seu novo modelo, Mythos. Essa fala se alinha com a revelação da Axios em 19 de abril de que a NSA (Agência de Segurança Nacional) já passou a usar o Mythos para estabelecer ressonância — e também consolida oficialmente a tendência de política em torno de um “canal de exceção para o Mythos”. Ao mesmo tempo, isso significa que o Departamento de Defesa já havia sustentado em tribunal que o uso de ferramentas da Anthropic colocaria a segurança nacional em risco, criando uma contradição interna nos argumentos legais em relação à prática atual. Anthropic vs Pentagon

ChainNewsAbmedia11h atrás

137 Ventures encerra $700M em novos fundos, AUM atinge US$ 15 bilhões

De acordo com a ChainCatcher, a 137 Ventures, investidora inicial na SpaceX, concluiu recentemente a captação de recursos para dois novos fundos, somando mais de US$ 700 milhões, elevando seus ativos sob gestão para mais de US$ 15 bilhões. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial

GateNews11h atrás

Reddit dispara 16% com forte perspectiva para o 2º tri; Apple enfrenta escassez de Macs à medida que a demanda por IA supera a oferta

As ações da Reddit subiram 16% antes do pregão na sexta-feira, após a empresa divulgar uma previsão de receita para o próximo trimestre acima do esperado. Os visitantes ativos diários cresceram 17%, para 126,8 milhões, enquanto a receita média por usuário no mundo todo disparou 44%, impulsionada por IA que

GateNews11h atrás
Comentário
0/400
Sem comentários