Kimi K2 Thinking 突袭发布！1万亿参数开源巨兽超越GPT-5

"A capacidade de chamar a ferramenta 300 vezes seguidas sem intervenção humana é um verdadeiro poder de raciocínio."

Ontem à noite houve um terramoto no campo dos grandes modelos nacionais - Dark Side of the Moon foi oficialmente lançado Kimi K2 PensamentoUm novo produto com um 1 trilião de parâmetros O modelo de código aberto Think Agent.

Duas horas após a entrada em funcionamento, os servidores estavam cheios; o cofundador da Hugging Face, Thomas Wolf, estava entusiasmado:"Estamos a assistir a outro momento DeepSeek."; Sebastian Raschka, um importante académico em matéria de IA, analisa que "Mais peritos, menos CABEÇA, mais pensamento"; Comentário do Tópico Quente do Reddit:"O mais próximo que o modelo de código aberto esteve de uma fronteira de código fechado.“

O que é que este modelo tem de especial para a comunidade global de IA? Hoje, vamos descobrir.

Não apenas grande, mas pensante

O Kimi K2 Thinking não é uma atualização vulgar, mas sim um agente de pensamento completamente reestruturado com apenas um avanço fundamental:

Efectua 200-300 chamadas consecutivas de ferramentas para tarefas complexas em várias etapas sem intervenção humana.

Ao contrário dos grandes modelos tradicionais que só podem ser respondidos de forma passiva, o K2 Thinking pensa, questiona, verifica e ajusta ativamente, pensando e agindo como um ser humano.

norma	K2 Thinking	modelo tradicional
Chamada de ferramenta	200-300 chamadas consecutivas	Normalmente 1-3 vezes
processo de pensamento	Demonstrar explicitamente a cadeia de raciocínio	Ocultar o processo de raciocínio
modo interativo	Pesquisa ativa + Pensar + Executar	resposta passiva
Tipo de missão	Tarefas complexas em várias etapas	tarefa simples e única

Ficha técnica: o segredo por detrás do parâmetro 1T

1️⃣ Avanço quantitativo: a INT4 não é um compromisso, mas uma estratégia

Em comparação com o PQ8 adotado pelos concorrentes, a K2 Thinking optou por quantificar a INT4, o que constitui não só um avanço tecnológico, mas também uma consideração estratégica:

Duplicar a velocidadeAumento da velocidade de geração em cerca de 2 vezes
compatibilidade de hardwareMais favorável aos chips domésticos de computação acelerada
Sem perda de desempenhoManutenção do desempenho sem degradação através da Formação de Sensibilização Quantitativa (QAT)

"Dois Macs com chips M3 Ultra podem executar o INT4 Compressed sem problemas, com pouca ou nenhuma perda de desempenho." --Awni Hannun, Apple Bully, Test Share

2️⃣ Inovação arquitetónica: mais peritos, menos cabeças

Comparado com o DeepSeek R1, o K2 Thinking utiliza uma arquitetura mais simplificada:

Mais especialistasMelhorar a amplitude dos conhecimentos sobre modelos
Menos cabeçaReduzir a redundância computacional
pensamento alternativoCiclo entre "pensar" e "fazer" para melhorar a coerência do raciocínio

3️⃣ Custo da formação: 4,6 milhões de dólares Investimento de precisão

De acordo com a CNBC, o K2 Thinking custa 4,6 milhões de dólares para ser treinado. Em comparação com as dezenas de milhões de dólares gastos na formação de modelos, Dark Side of the Moon maximiza o desempenho com uma estratégia de formação precisa e eficiente. Cada cêntimo é gasto no fio da navalha.

Desempenho em ação: ultrapassar as pontuações do GPT-5 SOTA

O K2 Thinking demonstrou uma força espantosa numa série de testes de referência autorizados:

Capacidades do corpo inteligente: pensamento verdadeiramente autónomo

𝜏²-Bench Telecom:: 93% de precisão em relação ao GPT-5 (89%) e ao Claude Sonnet 4.5 (91%)
SEAL-0Teste de Raciocínio para Recolha de Informação Complexa, Atualizar SOTA
NavegarComp:: 60,21 pontuação TP3T, média humana apenas 29,21 TP3T

Raciocínio integrado: resolver puzzles a nível de doutoramento

HLE (Humanity's Ultimate Examination - Exame Final da Humanidade):: 44,91 TP3T, superando o GPT-5 (43,71 TP3T), Claude Sonnet 4.5 (42,81 TP3T), Grok4 (41,51 TP3T)
GPQA-DiamanteTeste de Raciocínio Avançado: supera a maioria dos produtos concorrentes

💻 Programação em ação: não só escrever código, mas também resolver problemas

SWE-Multilingue61,11 Pontuação TP3T
SWE-Bench Verificado:: 71,31 pontuação TP3T, próxima do nível de perito humano
Banco de terminais47.11 Pontuações TP3T, capaz de realizar tarefas complexas no ambiente terminal

Demonstração prática: este é o verdadeiro assistente de IA

Caso 1: Gestor de viagens privadas

mandatos: Tenho um orçamento de 1000 dólares para planear a minha digressão de concertos

Desempenho do K2 Thinking::

17 chamadas de ferramentas para completar o processo completo
Perguntar sobre as preferências dos utilizadores, horários de trabalho
Procurar bilhetes, locais de espetáculo, restaurantes na vizinhança
Gerar um itinerário personalizado com detalhes de hora, local e custo

"Mais pormenorizado do que um verdadeiro mordomo pessoal, até as especialidades do restaurante foram tidas em conta."

✅ Caso 2: Visualização de Física Matemática

mandatosExplicação da descida de gradiente bidimensional

Desempenho do K2 Thinking::

Invocação de ferramentas de visualização
Gerar um mapa em movimento: linhas de contorno azuis, caminhos amarelos, setas de gradiente vermelhas
Com explicações textuais, num relance
Os parâmetros podem ser ajustados interactivamente pelo utilizador

Caso 3: Simulação de transmissão viral

mandatos: Criar um programa de simulação de vírus com parâmetros imunitários ajustáveis

Desempenho do K2 Thinking::

23 chamadas de ferramentas
Gerar um programa totalmente interativo
As partículas vermelhas e azuis perseguem-se, colidem e devoram-se umas às outras
Deslizadores para ajustar a taxa de replicação viral, o número de células imunitárias
Estatísticas e feedback de parâmetros em tempo real

Caso 4: Análise e visualização de dados

mandatos:: "Analise o ficheiro CSV que lhe enviei e gere gráficos para apoiar a análise"

Desempenho do K2 Thinking::

Primeira etapa de planeamento: carregar dados → rastreio → análise → mapeamento
14 Chamadas Python
Gerar páginas Web interactivas com análises estatísticas, gráficos de visualização e explicações pormenorizadas
Correção automática de erros sem intervenção humana

🚀 Livre e de código aberto: uma revolução da IA ao alcance de todos

O mais interessante é que a K2 ThinkingTotalmente de código abertoAdoçãoLicença MIT modificada::

✅ Comercial LivrePode ser utilizado diretamente em produtos comerciais
✅ peso do modelo: Aberto na íntegra sobre o Hugging Face
✅ Interface APIServiços prestados pela Kimi Open Platform
✅ uso pessoalDisponível instantaneamente em kimi.com e nas aplicações móveis!

A única restrição: o Kimi K2 tem de ser destacado na IU quando houver mais de 100 milhões de utilizadores activos mensais ou mais de 20 milhões de dólares de receitas mensais.

"Não se trata de uma vitória de uma empresa, mas de um salto coletivo no ecossistema de IA da China." -- CTO de uma empresa líder em IA

Escrever ao fim do dia.

O aparecimento do Kimi K2 Thinking veio quebrar a nossa perceção inerente da IA. Já não se trata de um "chatbot" passivo, mas de um "colega digital" que pode pensar ativamente, resolver problemas e evoluir continuamente.

À medida que os modelos de código aberto começam a ultrapassar os modelos de código fechado e que a tecnologia chinesa começa a liderar a inovação global em matéria de IA, temos de admitir:A China está na vanguarda da viagem da AGI.

"Não se trata de substituir os humanos, mas sim de os libertar. Deixemos a IA tratar dos cálculos e da execução entediantes e os humanos concentram-se na criação e na tomada de decisões." -Equipa de engenheiros do Lado Negro da Lua

Experimente agora::
🔗 https://kimi.com
🔗 https://huggingface.co/moonshotai/Kimi-K2-Thinking

Blogue sobre tecnologia::
🔗 https://moonshotai.github.io/Kimi-K2/thinking.html

Para mais produtos, consultar	Ver mais em
ShirtAI - Inteligência penetrante	O Grande Modelo do AIGC: inaugurando uma era de dupla revolução na engenharia e na ciência - Penetrating Intelligence
1:1 Restauração de Claude e GPT Site oficial - AI Cloud Native	Aplicação de jogos em direto Leitor de visualização de desporto HD global (recomendado) - Blueshirt Technology
Serviço de trânsito baseado na API oficial - API GPTMeta	Ajuda, alguém pode dar algumas dicas sobre como fazer perguntas no GPT? - Conhecimento
Loja digital de bens virtuais globais - Global SmarTone (Feng Ling Ge)	Quão poderosa é a funcionalidade Claude airtfacts que o GPT instantaneamente não cheira bem? -BeepBeep