Notícias Gate, 25 de abril — A DeepSeek lançou versões de pré-visualização de V4-Pro e V4-Flash a 24 de abril, ambos modelos open-weight com janelas de contexto de um milhão de tokens. O V4-Pro tem 1,6 triliões de parâmetros no total, mas activa apenas 49 mil milhões por passagem de inferência utilizando uma arquitectura Mixture-of-Experts. O V4-Flash tem 284 mil milhões de parâmetros no total, com 13 mil milhões activos.
Os preços são significativamente mais baixos do que os dos concorrentes: o V4-Pro custa $1,74 por um milhão de tokens de entrada e $3,48 por um milhão de tokens de saída — aproximadamente 98% menos do que o GPT-5.5 Pro da OpenAI ($30 input, $180 output) e cerca de um-vigésimo do custo do Claude Opus 4.7. O V4-Flash é tarifado em $0,14 para entrada e $0,28 para saída por um milhão de tokens. Ambos os modelos são open-source sob licença MIT e podem ser executados localmente de forma gratuita.
A DeepSeek alcançou ganhos de eficiência através de dois novos mecanismos de atenção: Compressed Sparse Attention e Heavily Compressed Attention, que reduzem os custos de computação para 27% do predecessor V4-Pro (V3.2) e para 10% no caso do V4-Flash. A empresa treinou parcialmente o V4 com chips Huawei Ascend, contornando as restrições de exportação dos EUA sobre processadores Nvidia avançados. A DeepSeek afirmou que, quando 950 novos supernós entrarem em funcionamento mais tarde em 2026, os preços cairão ainda mais.
Em benchmarks de desempenho, o V4-Pro-Max ocupa o primeiro lugar no Codeforces competitive programming (3.206, ficando em torno do 23.º lugar entre os concorrentes humanos) e com uma pontuação de 90,2% em problemas de matemática do Apex Shortlist, face aos 85,9% do Claude Opus 4.6. No entanto, fica atrás em benchmarks de multitarefa: MMLU-Pro (87,5% vs 91,0% do Gemini-3.1-Pro) e 37,7% do Humanity’s Last Exam ( vs 44,4%). Em tarefas de longo contexto, o V4-Pro lidera modelos open-source, mas perde para o Claude Opus 4.6 em testes de recuperação MRCR.
O V4-Pro introduz o “interleaved thinking”, permitindo que fluxos de trabalho de agentes retenham o contexto de raciocínio através de múltiplas chamadas de ferramentas, sem descarregar entre passos. Ambos os modelos suportam integrações de codificação com Claude Code e OpenCode. De acordo com o inquérito aos programadores da DeepSeek com 85 utilizadores, 52% disseram que o V4-Pro estava pronto como o seu agente de codificação por defeito, e 39% inclinavam-se para a adopção. Os endpoints antigos deepseek-chat e deepseek-reasoner serão descontinuados a 24 de julho de 2026.
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a
Isenção de responsabilidade.
Related Articles
Claw Intelligence faz parceria com a Block Sec Arena para reforçar a segurança da BNB Chain
De acordo com o anúncio oficial da Block Sec Arena a 30 de abril, a Claw Intelligence, uma plataforma Web3 orientada por IA construída na BNB Chain, anunciou uma parceria estratégica com a Block Sec Arena para integrar infraestruturas avançadas de cibersegurança no seu ecossistema. A colaboração tem como objetivo reforçar p
GateNews4h atrás
A NTT Anuncia a Iniciativa AI x OWN e Planos para Triplicar a Capacidade de Energia do Japão para 1 GW até 2033
Em 27 de abril, o presidente da NTT, Akira Shimada, anunciou a iniciativa AI x OWN, o esforço da empresa para redesenhar a infraestrutura da internet para um uso de IA em tempo real. A NTT planeia triplicar a sua capacidade doméstica de energia de cerca de 300 MW hoje para cerca de 1 gigawatt até ao ano fiscal de 2033, à medida que a gigante das telecomunicações
GateNews6h atrás
A plataforma de IA Certifyde conclui uma ronda de investimento semente de 2 milhões de dólares a 1 de maio, apoiada pelo CEO da Ripple, Brad Garlinghouse
De acordo com a TechfundingNews, a plataforma de aplicações de IA Certifyde concluiu uma ronda de seed no valor de 2 milhões de dólares a 1 de maio. Os investidores incluem a K5 Global, a Flamingo Capital e investidores-anjo, incluindo o cofundador da Honey George Ruan, o CEO da Ripple Brad Garlinghouse e o cofundador da Nutra Roland
GateNews6h atrás
Chefe de tecnologia do Pentágono: a Anthropic continua na lista negra, tratamento de excepções para a Mythos
O responsável pela tecnologia do Pentágono (Pentagon technology chief) dos EUA, em 1 de maio, disse ao Congresso que «a Anthropic continua na lista negra, mas o Mythos Preview é outra questão», reconhecendo formalmente que o Departamento de Defesa distingue o principal produto da Anthropic e o seu novo modelo, Mythos, no modo como os trata. Esta declaração coincide com a revelação da Axios, a 19 de abril, de que a NSA (Agência de Segurança Nacional) já tinha usado o Mythos para criar uma resposta correspondente, e formaliza a orientação de política que estabelece «um canal de exceção para o Mythos» — o que também significa que o Pentágono, anteriormente, defendeu em tribunal que o uso de ferramentas da Anthropic ameaçaria a segurança nacional, criando uma contradição interna ao nível do argumento jurídico face às práticas atuais.
Anthropic vs Pentagon
ChainNewsAbmedia7h atrás
A 137 Ventures fecha $700M em novos fundos, AUM atinge 15 mil milhões de dólares
De acordo com o ChainCatcher, a 137 Ventures, um dos primeiros investidores na SpaceX, concluiu recentemente a recolha de fundos para dois novos fundos, num total superior a 700 milhões de dólares, elevando os seus activos sob gestão para mais de 15 mil milhões de dólares. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial
GateNews7h atrás
O Reddit regista um aumento de 16% com fortes perspetivas para o 2.º trimestre; a Apple enfrenta falta de Macs à medida que a procura por IA supera a oferta
As acções da Reddit subiram 16% antes da abertura do mercado na sexta-feira, depois de a empresa ter divulgado uma previsão de receitas para o próximo trimestre superior ao esperado. Os visitantes diários ativos cresceram 17% para 126,8 milhões, enquanto a receita média por utilizador a nível mundial disparou 44%, impulsionada por IA alimentada por
GateNews7h atrás