"A capacidade de chamar a ferramenta 300 vezes seguidas sem intervenção humana é um verdadeiro poder de raciocínio."
Ontem à noite houve um terramoto no campo dos grandes modelos nacionais - Dark Side of the Moon foi oficialmente lançado Kimi K2 PensamentoUm novo produto com um 1 trilião de parâmetros O modelo de código aberto Think Agent.
Duas horas após a entrada em funcionamento, os servidores estavam cheios; o cofundador da Hugging Face, Thomas Wolf, estava entusiasmado:"Estamos a assistir a outro momento DeepSeek."; Sebastian Raschka, um importante académico em matéria de IA, analisa que "Mais peritos, menos CABEÇA, mais pensamento"; Comentário do Tópico Quente do Reddit:"O mais próximo que o modelo de código aberto esteve de uma fronteira de código fechado.“
O que é que este modelo tem de especial para a comunidade global de IA? Hoje, vamos descobrir.
Não apenas grande, mas pensante
O Kimi K2 Thinking não é uma atualização vulgar, mas sim um agente de pensamento completamente reestruturado com apenas um avanço fundamental:
Efectua 200-300 chamadas consecutivas de ferramentas para tarefas complexas em várias etapas sem intervenção humana.
Ao contrário dos grandes modelos tradicionais que só podem ser respondidos de forma passiva, o K2 Thinking pensa, questiona, verifica e ajusta ativamente, pensando e agindo como um ser humano.
| norma | K2 Thinking | modelo tradicional |
|---|---|---|
| Chamada de ferramenta | 200-300 chamadas consecutivas | Normalmente 1-3 vezes |
| processo de pensamento | Demonstrar explicitamente a cadeia de raciocínio | Ocultar o processo de raciocínio |
| modo interativo | Pesquisa ativa + Pensar + Executar | resposta passiva |
| Tipo de missão | Tarefas complexas em várias etapas | tarefa simples e única |
Ficha técnica: o segredo por detrás do parâmetro 1T
1️⃣ Avanço quantitativo: a INT4 não é um compromisso, mas uma estratégia
Em comparação com o PQ8 adotado pelos concorrentes, a K2 Thinking optou por quantificar a INT4, o que constitui não só um avanço tecnológico, mas também uma consideração estratégica:
- Duplicar a velocidadeAumento da velocidade de geração em cerca de 2 vezes
- compatibilidade de hardwareMais favorável aos chips domésticos de computação acelerada
- Sem perda de desempenhoManutenção do desempenho sem degradação através da Formação de Sensibilização Quantitativa (QAT)
"Dois Macs com chips M3 Ultra podem executar o INT4 Compressed sem problemas, com pouca ou nenhuma perda de desempenho." --Awni Hannun, Apple Bully, Test Share
2️⃣ Inovação arquitetónica: mais peritos, menos cabeças
Comparado com o DeepSeek R1, o K2 Thinking utiliza uma arquitetura mais simplificada:
- Mais especialistasMelhorar a amplitude dos conhecimentos sobre modelos
- Menos cabeçaReduzir a redundância computacional
- pensamento alternativoCiclo entre "pensar" e "fazer" para melhorar a coerência do raciocínio
3️⃣ Custo da formação: 4,6 milhões de dólares Investimento de precisão
De acordo com a CNBC, o K2 Thinking custa 4,6 milhões de dólares para ser treinado. Em comparação com as dezenas de milhões de dólares gastos na formação de modelos, Dark Side of the Moon maximiza o desempenho com uma estratégia de formação precisa e eficiente. Cada cêntimo é gasto no fio da navalha.

Desempenho em ação: ultrapassar as pontuações do GPT-5 SOTA
O K2 Thinking demonstrou uma força espantosa numa série de testes de referência autorizados:
Capacidades do corpo inteligente: pensamento verdadeiramente autónomo
- 𝜏²-Bench Telecom:: 93% de precisão em relação ao GPT-5 (89%) e ao Claude Sonnet 4.5 (91%)
- SEAL-0Teste de Raciocínio para Recolha de Informação Complexa, Atualizar SOTA
- NavegarComp:: 60,21 pontuação TP3T, média humana apenas 29,21 TP3T

Raciocínio integrado: resolver puzzles a nível de doutoramento
- HLE (Humanity's Ultimate Examination - Exame Final da Humanidade):: 44,91 TP3T, superando o GPT-5 (43,71 TP3T), Claude Sonnet 4.5 (42,81 TP3T), Grok4 (41,51 TP3T)
- GPQA-DiamanteTeste de Raciocínio Avançado: supera a maioria dos produtos concorrentes

💻 Programação em ação: não só escrever código, mas também resolver problemas
- SWE-Multilingue61,11 Pontuação TP3T
- SWE-Bench Verificado:: 71,31 pontuação TP3T, próxima do nível de perito humano
- Banco de terminais47.11 Pontuações TP3T, capaz de realizar tarefas complexas no ambiente terminal

Demonstração prática: este é o verdadeiro assistente de IA
Caso 1: Gestor de viagens privadas
mandatos: Tenho um orçamento de 1000 dólares para planear a minha digressão de concertos
Desempenho do K2 Thinking::
- 17 chamadas de ferramentas para completar o processo completo
- Perguntar sobre as preferências dos utilizadores, horários de trabalho
- Procurar bilhetes, locais de espetáculo, restaurantes na vizinhança
- Gerar um itinerário personalizado com detalhes de hora, local e custo
"Mais pormenorizado do que um verdadeiro mordomo pessoal, até as especialidades do restaurante foram tidas em conta."

✅ Caso 2: Visualização de Física Matemática
mandatosExplicação da descida de gradiente bidimensional
Desempenho do K2 Thinking::
- Invocação de ferramentas de visualização
- Gerar um mapa em movimento: linhas de contorno azuis, caminhos amarelos, setas de gradiente vermelhas
- Com explicações textuais, num relance
- Os parâmetros podem ser ajustados interactivamente pelo utilizador

Caso 3: Simulação de transmissão viral
mandatos: Criar um programa de simulação de vírus com parâmetros imunitários ajustáveis
Desempenho do K2 Thinking::
- 23 chamadas de ferramentas
- Gerar um programa totalmente interativo
- As partículas vermelhas e azuis perseguem-se, colidem e devoram-se umas às outras
- Deslizadores para ajustar a taxa de replicação viral, o número de células imunitárias
- Estatísticas e feedback de parâmetros em tempo real

Caso 4: Análise e visualização de dados
mandatos:: "Analise o ficheiro CSV que lhe enviei e gere gráficos para apoiar a análise"
Desempenho do K2 Thinking::
- Primeira etapa de planeamento: carregar dados → rastreio → análise → mapeamento
- 14 Chamadas Python
- Gerar páginas Web interactivas com análises estatísticas, gráficos de visualização e explicações pormenorizadas
- Correção automática de erros sem intervenção humana




🚀 Livre e de código aberto: uma revolução da IA ao alcance de todos
O mais interessante é que a K2 ThinkingTotalmente de código abertoAdoçãoLicença MIT modificada::
- ✅ Comercial LivrePode ser utilizado diretamente em produtos comerciais
- ✅ peso do modelo: Aberto na íntegra sobre o Hugging Face
- ✅ Interface APIServiços prestados pela Kimi Open Platform
- ✅ uso pessoalDisponível instantaneamente em kimi.com e nas aplicações móveis!
A única restrição: o Kimi K2 tem de ser destacado na IU quando houver mais de 100 milhões de utilizadores activos mensais ou mais de 20 milhões de dólares de receitas mensais.
"Não se trata de uma vitória de uma empresa, mas de um salto coletivo no ecossistema de IA da China." -- CTO de uma empresa líder em IA
Escrever ao fim do dia.
O aparecimento do Kimi K2 Thinking veio quebrar a nossa perceção inerente da IA. Já não se trata de um "chatbot" passivo, mas de um "colega digital" que pode pensar ativamente, resolver problemas e evoluir continuamente.
À medida que os modelos de código aberto começam a ultrapassar os modelos de código fechado e que a tecnologia chinesa começa a liderar a inovação global em matéria de IA, temos de admitir:A China está na vanguarda da viagem da AGI.
"Não se trata de substituir os humanos, mas sim de os libertar. Deixemos a IA tratar dos cálculos e da execução entediantes e os humanos concentram-se na criação e na tomada de decisões." -Equipa de engenheiros do Lado Negro da Lua
Experimente agora::
🔗 https://kimi.com
🔗 https://huggingface.co/moonshotai/Kimi-K2-Thinking
Blogue sobre tecnologia::
🔗 https://moonshotai.github.io/Kimi-K2/thinking.html