DeepSeek V4 lança-se com NVIDIA Blackwell, permitindo IA com contexto de 1M de tokens

Iris Coleman 25 de Abr de 2026 00:10

O DeepSeek V4, impulsionado pela NVIDIA Blackwell, oferece IA com contexto de 1M de tokens, com menor sobrecarga de memória e inferência mais rápida, direcionado para fluxos de trabalho de contexto longo.

DeepSeek V4 lança-se com NVIDIA Blackwell, permitindo IA com contexto de 1M de tokens

A DeepSeek revelou os seus modelos de IA de quarta geração, DeepSeek-V4-Pro e DeepSeek-V4-Flash, ultrapassando os limites da inferência de contexto longo. Estes modelos, já disponíveis através dos endpoints acelerados por GPU Blackwell da NVIDIA, foram concebidos para suportar uma janela de contexto de até 1 milhão de tokens, um passo significativo para aplicações como programação avançada, análise de documentos e fluxos de trabalho de IA agêntica.

O modelo principal DeepSeek-V4-Pro conta com 1,6 biliões de parâmetros totais e 49 mil milhões de parâmetros ativos, enquanto o DeepSeek-V4-Flash, mais orientado para a eficiência, apresenta 284 mil milhões de parâmetros totais e 13 mil milhões de parâmetros ativos. Ambos os modelos estão licenciados sob MIT e atendem a casos de uso distintos — Pro para raciocínio avançado e Flash para tarefas de alta velocidade como sumarização e encaminhamento.

Avanços arquiteturais para IA de contexto longo

O DeepSeek V4 baseia-se na arquitetura Mixture-of-Experts (MoE) da empresa, introduzindo inovações destinadas a superar os desafios da inferência de contexto longo. O novo mecanismo de atenção híbrida combina Compressed Sparse Attention (CSA) e Heavily Compressed Attention (HCA), permitindo uma redução de 73% nos FLOPs de inferência por token e uma redução de 90% no uso de memória de cache KV em comparação com o seu predecessor, o DeepSeek V3.2.

Porque é que isto é importante? À medida que as janelas de contexto se expandem, gerir a eficiência de memória e de computação torna-se crucial. As aplicações de IA de contexto longo, como o raciocínio de múltiplas etapas, a integração de ferramentas e fluxos de trabalho extensos, requerem modelos capazes de reter e processar grandes quantidades de dados contextuais sem estrangulamentos. As melhorias do DeepSeek V4 resolvem estes pontos críticos, tornando-o um forte candidato para empresas que pretendem expandir sistemas impulsionados por IA.

Integração com NVIDIA Blackwell

O DeepSeek V4 está fortemente integrado com a plataforma Blackwell da NVIDIA, tirando partido da sua infraestrutura acelerada por GPU para um desempenho escalável. Os testes iniciais no hardware NVIDIA GB200 NVL72 mostram que o DeepSeek-V4-Pro atinge mais de 150 tokens por segundo por utilizador, com otimizações em curso esperadas para melhorar ainda mais o débito.

A arquitetura da Blackwell foi concebida para modelos de inteligência com biliões de parâmetros, tornando-a uma escolha natural para as exigências computacionais do DeepSeek V4. Os programadores podem criar protótipos com estes modelos através dos endpoints alojados da NVIDIA em build.nvidia.com ou implementá-los diretamente utilizando o NVIDIA NIM para configurações de infraestrutura personalizadas.

Casos de uso alvo e flexibilidade de implementação

A capacidade do DeepSeek V4 de processar contextos de 1M de tokens abre novas oportunidades para programação de contexto longo, fluxos de trabalho baseados em recuperação e IA agêntica. A sua flexibilidade é ainda reforçada por ferramentas de implementação como SGLang e vLLM, que oferecem configurações adaptadas a diferentes necessidades de latência e débito, desde configurações de baixa latência a configurações multi-GPU para operações de grande escala.

Este foco na flexibilidade de implementação sublinha uma tendência mais ampla: à medida que os modelos de IA abertos se aproximam da fronteira da inteligência, as empresas estão a deslocar a sua atenção da seleção de modelos para a otimização de infraestruturas. O objetivo final é reduzir o custo por token mantendo o desempenho, e o DeepSeek V4 alinha-se precisamente com esta prioridade.

Como começar

Os programadores podem aceder ao DeepSeek V4 através de múltiplos canais, incluindo o Hugging Face e os endpoints de API da NVIDIA. Para empresas e programadores que pretendam integrar IA de contexto longo nos seus fluxos de trabalho, o DeepSeek V4 oferece uma combinação convincente de escalabilidade, eficiência e capacidades de raciocínio avançado.

Com os seus avanços arquiteturais e a integração perfeita com a NVIDIA Blackwell, o DeepSeek V4 estabelece um novo referencial para a IA de contexto longo. À medida que a procura por sistemas agênticos e janelas de contexto mais amplas cresce, modelos como estes desempenharão um papel fundamental na definição da próxima geração de aplicações de IA.

Fonte da imagem: Shutterstock

deepseek v4
nvidia blackwell
modelos de ia
inferência de contexto longo

DeepSeek V4 lança-se com NVIDIA Blackwell, permitindo IA com contexto de 1M de tokens

DeepSeek V4 lança-se com NVIDIA Blackwell, permitindo IA com contexto de 1M de tokens

Avanços arquiteturais para IA de contexto longo

Integração com NVIDIA Blackwell

Casos de uso alvo e flexibilidade de implementação

Como começar

Você também pode gostar

GRASS giảm 15% dù khối lượng tăng: Nhà đầu tư đang bán hay mua?

Ações da Tesla (TSLA): Vendas de VE na China Sobem pelo Segundo Trimestre Consecutivo

Previsão de preço do ApeCoin: Ruptura à vista ou subida de curto prazo?

Notícias em alta

Tổng thống Iran: Hy vọng thất bại lịch sử sẽ là lời cảnh tỉnh cho bá quyền

Por Que Alguns Analistas Acreditam Que o Potencial de ROI da Ozak AI Pode Superar as Valorizações Típicas de Altcoins em Mais de 10×

Previsão de preço da Binance Coin 2026, 2027 – 2030: O preço do BNB pode subir para $2000? Uma análise aprofundada

GRASS cai 15% apesar do aumento de volume: os traders estão a sair ou a comprar na baixa?

CFTC Mỹ kiện bang New York vì áp luật cờ bạc lên dự đoán thị trường

Notícias ao vivo 24/7

Preços das criptomoedas