blogue (palavra emprestada)

Blogue sobre a IA: uma visão das fronteiras da inteligência artificial, partilha de tecnologia e tendências!

Gemini 3深夜突袭!力压GPT-5.1,谷歌的AI王座终于坐稳了

谷歌于凌晨三点悄然上线Gemini 3 Pro大模型,未举行发布会。该模型在LMArena以1501分Elo登顶,人类最后考试(HLE)获45.8%、MMMU-Pro达81%、Video-MMMU达87.6%,性能超越GPT-5.1。其100万token上下文窗口支持长内容处理,深度思考能力在ARC-AGI-2测试中创45.1%新高,并推出Google Antigravity智能体平台。用户可通过Gemini应用或Google AI Studio体验。

Gemini 3深夜突袭!力压GPT-5.1,谷歌的AI王座终于坐稳了 Ler mais "

Grok 4.1低调发布!通用能力全面碾压,情感智能登顶第一

马斯克旗下xAI公司低调发布Grok 4.1,在LMArena排行榜以1483分登顶,并在EQ-Bench3情感智能测试包揽前两名。新模型在创造力、情感互动和协作交互方面实现质的飞跃,用户偏好选择率达64.78%,幻觉率显著降低,已通过、X平台及移动应用全面开放。

Grok 4.1低调发布!通用能力全面碾压,情感智能登顶第一 Ler mais "

Gemini 3提前亮相!巴菲特305亿重仓背后的AI革命

谷歌Gemini 3虽未正式发布,已通过APP超前点映及第三方平台提前亮相,展示SVG绘制和游戏开发等强大能力。巴菲特体验后重仓Alphabet 43亿美元(约305亿人民币),使其成为伯克希尔·哈撒韦第十大持股。Alphabet股价年内飙升46%,谷歌从AI追赶者加速转向领跑者,AI技术革命获资本强力认可。

Gemini 3提前亮相!巴菲特305亿重仓背后的AI革命 Ler mais "

GPT-5.1悄然上线,OpenAI终于听懂了用户的心声

OpenAI于11月12日悄然发布GPT-5.1,此次更新摒弃传统性能数据宣传,聚焦用户情感需求。核心升级包括GPT-5.1 Instant(更温暖健谈,支持自适应推理)和GPT-5.1 Thinking(优化思考时间分配),提供八种聊天风格预设(新增Professional、Candid、Quirky),允许微调热情度、简洁度等特征。安全评估新增心理健康与情感依赖维度,部分指标略有回退。付费用户可逐步使用,3个月内支持回退至旧模型,强调AI从工具向懂用户伙伴的转变。

GPT-5.1悄然上线,OpenAI终于听懂了用户的心声 Ler mais "

Kimi K2 Thinking Suddenly Released! 1 Trilhão de Parâmetros Open Source Beast Beyond GPT-5

月之暗面发布开源思考型Agent模型Kimi K2 Thinking,具备1万亿参数。其核心突破在于无需人工干预即可连续执行200-300次工具调用,完成复杂多步骤任务。该模型采用INT4量化技术提升生成速度,通过精简架构降低计算冗余,训练成本为460万美元。在多项基准测试中表现超越GPT-5,包括智能体能力(τ²-Bench Telecom达93%)、综合推理(HLE达44.9%)及编程实战(SWE-Bench Verified达71.3%)。模型完全开源且商用免费,采用修改版MIT许可证。

Kimi K2 Thinking Suddenly Released! 1 Trilhão de Parâmetros Open Source Beast Beyond GPT-5 Ler mais "

O LTX-2 explodiu! O primeiro modelo de geração de vídeo 4K sincronizado com áudio e vídeo do mundo, suportado pela ComfyUI!

LTX-2是Lightricks发布的全球首个音画同步4K视频生成模型,可生成20秒、50fps高清视频,支持文本/图像输入。它实现了角色口型与语音同步,能在ComfyUI运行并本地部署,将于5年11月下旬开源。作为专业级创作工具,LTX-2让"文字变电影级短片"成为现实。

O LTX-2 explodiu! O primeiro modelo de geração de vídeo 4K sincronizado com áudio e vídeo do mundo, suportado pela ComfyUI! Ler mais "

O LTX-2 explodiu! O primeiro modelo de geração de vídeo 4K sincronizado com áudio e vídeo do mundo, suportado pela ComfyUI!

LTX-2是Lightricks发布的全球首个音画同步4K视频生成模型,可生成20秒、50fps高清视频,支持文本/图像输入。它实现了角色口型与语音同步,能在ComfyUI运行并本地部署,将于5年11月下旬开源。作为专业级创作工具,LTX-2让"文字变电影级短片"成为现实。

O LTX-2 explodiu! O primeiro modelo de geração de vídeo 4K sincronizado com áudio e vídeo do mundo, suportado pela ComfyUI! Ler mais "

KAT-Coder: Um novo avanço na programação de IA para pilotos

快手推出AI编程产品矩阵KAT-Coder,涵盖自研模型、工具与平台,支持20多种编程语言及多类开发任务。其开源版本KAT-Dev-72B-Exp在SWE-bench榜单以74.6%成绩超越GPT与Claude。该模型具备代码生成、调试、优化等能力,兼容主流开发工具,并在网页生成、电商网站、3D特效等领域展现强大应用潜力,标志着快手正式进军AI编程赛道。

KAT-Coder: Um novo avanço na programação de IA para pilotos Ler mais "

Manus e a bolha de agentes de IA: do ideal à desilusão

Manus作为2025年AI Agent热潮的代表,虽依托大模型、工具链与记忆技术实现任务执行,但因缺乏专业场景深耕与闭环交付,暴露“通用Agent”泡沫。其问题根源在于工程积累不足、资本驱动短视,导致功能堆砌却智能有限。行业正转向垂直领域,如医学Agent OpenEvidence,强调确定性流程与数据驱动,揭示未来属于专注、可评估、落地扎实的“笨智能”路径。

Manus e a bolha de agentes de IA: do ideal à desilusão Ler mais "

ChatGPT Atlas: uma revolução nos navegadores de IA

OpenAI发布首款AI原生浏览器ChatGPT Atlas,深度融合ChatGPT智能能力。其核心功能包括:实时AI辅助网页内容总结与互动、智能写作优化、自然语言控制浏览器操作、个性化记忆推荐、智能体模式自动执行购物及预订任务、光标聊天实时文本处理。该浏览器通过AI技术提升浏览效率,实现任务自动化,重塑人机交互体验。

ChatGPT Atlas: uma revolução nos navegadores de IA Ler mais "

Veo 3.1 vs Sora2: Quem é o verdadeiro rei da geração de vídeo?

谷歌的Veo3.1与OpenAI的Sora2在AI视频生成领域展开竞争。Veo3.1以精准控制、高质量音画同步见长,适合专业长视频创作。Sora2则胜在流畅自然的动态效果和娱乐性,更适合创意短视频。两者各有优势,选择取决于具体应用场景。

Veo 3.1 vs Sora2: Quem é o verdadeiro rei da geração de vídeo? Ler mais "

Análise aprofundada dos seis principais agentes de IA: Explorar o valor do produto e a direção do desenvolvimento

O artigo analisa seis produtos de agentes de IA tradicionais, Manus, Buckle Space, Lovart, Flowith Neo, Skywork e Super Magee, e analisa a sua competitividade no mercado em termos de três dimensões: capacidade de execução, fiabilidade e frequência de utilização. Os generalistas enfrentam desafios de entrada e integração. O artigo salienta que a coexistência de especialização e generalização, a capacidade de entrega, o mecanismo de confiança e a integração de portais se tornarão direcções importantes para o desenvolvimento dos agentes.

Análise aprofundada dos seis principais agentes de IA: Explorar o valor do produto e a direção do desenvolvimento Ler mais "

Guia de Configuração dos Servidores Cursor MCP e Recomendações Práticas do Cursor MCP

O MCP (Protocolo de contexto de modelo) é um protocolo que permite que modelos grandes interajam com ferramentas e serviços externos. O Cursor IDE suporta assistentes de IA para invocar ferramentas para realizar pesquisas, navegar na Web e operações de código através do recurso Servidores MCP. Os servidores MCP podem ser adicionados por meio da interface Configurações e configurados nos níveis global e de projeto. O MCP é escrito em vários idiomas e permite que a IA execute ferramentas automática ou manualmente e retorne resultados, incluindo imagens. Os recursos recomendados incluem Awesome-MCP-ZH, AIbase e várias ferramentas de cliente MCP. Os serviços MCP habitualmente utilizados, como o Sequential Thinking, o Brave Search, o Magic MCP, etc., melhoram a capacidade da IA para pensar, pesquisar, a eficiência do desenvolvimento front-end e outras caraterísticas, respetivamente.

Guia de Configuração dos Servidores Cursor MCP e Recomendações Práticas do Cursor MCP Ler mais "

Análise aprofundada do Veo 3: um avanço histórico na geração de vídeo com IA da Google

Em maio de 2025, a Google lançou o Veo 3, a primeira vez que se consegue uma geração síncrona de áudio e vídeo de IA, para que os personagens de vídeo de IA possam "falar". Os avanços do modelo incluem imagem 4K, consistência física e sincronização de som, etc., utilizando a tecnologia V2A para codificar imagens de vídeo como sinais semânticos, gerando faixas de áudio correspondentes e aplicando-as a programas de entrevistas, jogos ao vivo, concertos e outras cenas. Embora existam deficiências na geração de acções complexas, as perspectivas de comercialização são significativas, com preços diferenciados, com impacto nas indústrias tradicionais da publicidade e da produção cinematográfica.

Análise aprofundada do Veo 3: um avanço histórico na geração de vídeo com IA da Google Ler mais "

Análise aprofundada das variantes do modelo Gemma: avanços tecnológicos e aplicações práticas da IA no domínio vertical

Os três modelos especializados Gemma recentemente lançados pela Google - MedGemma, SignGemma e DolphinGemma - representam uma mudança importante nos modelos de IA, da generalidade para a adaptação vertical profunda ao domínio. O SignGemma apoia a tradução multilingue de linguagem gestual para ajudar os grupos de deficientes auditivos a comunicar; e o DolphinGemma explora a síntese do discurso dos golfinhos para promover a investigação da comunicação entre espécies. Estes modelos melhoram o desempenho profissional, tendo em conta a eficiência computacional e a conveniência da utilização, proporcionando uma nova via para a industrialização da IA.

Análise aprofundada das variantes do modelo Gemma: avanços tecnológicos e aplicações práticas da IA no domínio vertical Ler mais "

Conclusão 4: A redefinição dos assistentes de programação de IA atinge a maioridade

A Anthropic lança a série Claude 4, abrangendo as versões Opus 4 e Sonnet 4, com foco em tarefas de programação e raciocínio avançado. Na conferência para desenvolvedores, o CEO Dario Amodei anunciou que a série supera a concorrência em todos os aspectos, liderando o desempenho em vários benchmarks, bem como o lançamento do Claude Code e de novos recursos de API que impulsionarão uma mudança de paradigma na forma como a IA e o desenvolvimento são feitos. mudança de paradigma.

Conclusão 4: A redefinição dos assistentes de programação de IA atinge a maioridade Ler mais "

Novas funcionalidades do Manus totalmente reveladas: capacidade de geração de gráficos de IA oficialmente operacional

A Manus entra em funcionamento com a geração de imagens, os novos utilizadores recebem 1000 pontos de bónus e 300 recargas diárias. A plataforma utiliza um processo de pensamento profundo que apoia a colaboração multi-ferramentas e a afinação da interação entre tarefas. Os casos de teste mostram que pode completar a criação de imagens complexas, a conceção de marcas, a implantação na Web e outras tarefas. O consumo de pontos é elevado, a quantidade gratuita de funções básicas é limitada e a subscrição paga está dividida em três níveis. As vantagens da Manus residem na compreensão das intenções e na execução de todo o processo, mas existem problemas de velocidade lenta, qualidade flutuante e custo elevado, pelo que ainda há espaço para melhorias no futuro.

Novas funcionalidades do Manus totalmente reveladas: capacidade de geração de gráficos de IA oficialmente operacional Ler mais "

OpenAI Nova geração de revolução na programação: Codex Intelligence Body Analysis

A OpenAI lança a inteligência de programação Codex em maio de 2025, integrada com o ChatGPT e baseada no modelo codex-1, que executa tarefas como escrever código, corrigir bugs, executar testes e muito mais, na nuvem. O codex suporta integrações do GitHub, fornece evidências verificáveis de execução e obteve 72.1% nos testes SWE-Bench. está atualmente disponível para usuários Pro, Enterprise e Team. O Codex está atualmente disponível para utilizadores Pro, Enterprise e Team e, no futuro, irá melhorar ainda mais a interatividade e a integração de ferramentas de desenvolvimento para ajudar a melhorar a eficiência do desenvolvimento de software.

OpenAI Nova geração de revolução na programação: Codex Intelligence Body Analysis Ler mais "

Google DeepMind AlphaEvolve: A ascensão de uma inteligência revolucionária codificada por IA

A Google DeepMind lançou o AlphaEvolve, uma inteligência de codificação de IA capaz de escrever e otimizar código e de fazer descobertas científicas por si própria. O sistema, que incorpora grandes modelos de linguagem, algoritmos evolutivos e avaliadores automáticos, já fez várias descobertas no domínio da matemática, como a melhoria dos algoritmos de multiplicação de matrizes e a resolução de puzzles geométricos. Entretanto, conseguiu ganhos de eficiência significativos na otimização dos centros de dados da Google, na conceção de chips e na formação em IA, assinalando um novo marco na transformação da IA de uma ferramenta para um parceiro de inovação algorítmica.

Google DeepMind AlphaEvolve: A ascensão de uma inteligência revolucionária codificada por IA Ler mais "

10 segundos de Figma Magic: Criar uma página de cartão de fluxo contínuo da Apple para melhorar rapidamente a textura do design

As grelhas Bento (estilo Apple) são um estilo de design visual minimalista, claro e altamente organizado, normalmente utilizado em interfaces modernas da Web e de aplicações móveis. O estilo cria uma experiência de leitura limpa ao apresentar o conteúdo através de módulos de grelha que realçam o espaço em branco, o alinhamento e a consistência. O artigo também fornece passos específicos para implementar este esquema utilizando o Figma e recomenda plug-ins e ferramentas relacionados.

10 segundos de Figma Magic: Criar uma página de cartão de fluxo contínuo da Apple para melhorar rapidamente a textura do design Ler mais "

NVIDIA Llama-Nemotron: O novo rei do código aberto para além do DeepSeek-R1

A NVIDIA lança modelos Llama-NemotronAI de código aberto nas versões 8B, 49B e 253B. O emblemático LN-Ultra supera o DeepSeek-R1 de 671 mil milhões em vários parâmetros de referência com apenas 253 mil milhões de parâmetros, ao mesmo tempo que permite um funcionamento mais eficiente num único nó xH100. O processo de formação em cinco fases da série, com técnicas inovadoras, inclui comutação de inferência, otimização com reconhecimento de hardware e formação de dados sintéticos. A relação positiva entre a escala e o desempenho dos parâmetros de desempenho do modelo marca a era da eficiência da IA em primeiro lugar, e o seu licenciamento de código aberto irá acelerar a adoção da tecnologia.

NVIDIA Llama-Nemotron: O novo rei do código aberto para além do DeepSeek-R1 Ler mais "

Google Gemini 2.5 Pro: uma evolução multimodal do vídeo para aplicações interactivas

A Google lança a versão 2.5 Pro do Gemini, uma grande conquista no domínio da compreensão multimodal e da geração de código. O modelo supera o concorrente Cl 3.7 Sonnet em termos de capacidades de programação e é particularmente hábil na transformação de conteúdos de vídeo e esboços desenhados à mão em redes totalmente funcionais, melhorando significativamente a eficiência do desenvolvimento. Demonstra uma revolução em áreas como o desenvolvimento Web, a otimização de revisões e a tecnologia educativa, criando um novo paradigma para o desenvolvimento assistido por IA.

Google Gemini 2.5 Pro: uma evolução multimodal do vídeo para aplicações interactivas Ler mais "

Bolt.new: um guia tutorial para criar um sítio web profissional através de descrições simples

A Bolt.new é uma plataforma de desenvolvimento orientada para a IA em que os utilizadores escrevem código gerando sítios Web completos diretamente a partir de descrições naturais. Suporta a geração de aplicações em várias estruturas, a instalação de pacotes de software e permite a otimização dinâmica do código e transformações desenhadas à mão. Os utilizadores iniciam sessão e introduzem os requisitos do sítio Web para automatizar o código, suportam várias rondas de otimização do diálogo e pré-visualizações em tempo real, e podem implementar ou descarregar o código. A chave é escrever instruções detalhadas que especifiquem o tipo de sítio, o estilo e o público-alvo, incorporando ao mesmo tempo editores para melhorar a precisão. bolt.new é particularmente adequado para a criação de protótipos e pode ser utilizado em conjunto com ferramentas especializadas como o Cursor para projectos mais complexos. A plataforma é inicialmente gratuita, mas será cobrada no futuro, tornando-a adequada para empresários, criadores de conteúdos e programadores.

Bolt.new: um guia tutorial para criar um sítio web profissional através de descrições simples Ler mais "

DeepSeek lança modelo Prover-V2: Parâmetros 671B impulsionam a prova de teoremas matemáticos

A DeepSeek lançou o modelo DeepSeek-Prover2, concebido para provas matemáticas, a 1 de maio, com 671 mil milhões de parâmetros e uma versão com 7 mil milhões de parâmetros. O modelo usa uma combinação de recursão e aprendizagem por reforço para se destacar em vários testes de matemática, como o teste MiniFF com uma taxa de aprovação de 88,9%. O conjunto de dados ProBench lançado ao mesmo tempo contém 325 perguntas para avaliar as capacidades do modelo. As experiências revelaram que o modelo Chain of Thought melhora significativamente a precisão, com o mini-modelo a superar mesmo o modelo em problemas específicos. O modelo já se encontra na Hugging Face, apoiando um novo paradigma na investigação matemática.

DeepSeek lança modelo Prover-V2: Parâmetros 671B impulsionam a prova de teoremas matemáticos Ler mais "

Lançamento do Qwen 3: o modelo 235B tem um desempenho superior ao do R1, Grok e o1 com licença Apache 2.0

A equipa de Ali Tongyi Qianqian lançou uma nova geração de modelos de grande dimensão de fonte aberta Qwen3, que encabeçou a lista global de modelos de fonte aberta, a série contém modelos, o desempenho do modelo principal excede muitos modelos de topo, a implantação é significativamente menor. A série contém modelos, o desempenho do modelo principal excede uma série de modelos de topo, a implantação é significativamente reduzida. qwen 3 em uma série de benchmarks para estabelecer um novo recorde, e a introdução inovadora do modo de "raciocínio híbrido" o modelo suporta 119 idiomas, dados de pré-treinamento até 36 token, a resposta da comunidade é entusiástica, dentro de três horas para obter a estrela k GitHub. O modelo suporta 119 idiomas com 36 tokens de dados de pré-treinamento e recebeu uma estrela do GitHub em três horas.

Lançamento do Qwen 3: o modelo 235B tem um desempenho superior ao do R1, Grok e o1 com licença Apache 2.0 Ler mais "

Lovable 2.0: Como uma plataforma colaborativa de "Ambient Coding" está a mudar o desenvolvimento de software

A empresa europeia de IA Lovable lança a plataforma 2.0 para o desenvolvimento de software sem código através da interação em linguagem natural. O novo suporte para colaboração multijogador, agentes de conversação inteligentes e controlo de segurança reduz significativamente o limiar de desenvolvimento. Disponibiliza programas gratuitos e pagos para as equipas de arranque criarem rapidamente protótipos de produtos e tem 500 000 utilizadores activos mensais. A plataforma comercializa o conceito de "codificação ambiente" gerada por IA para facilitar a transformação digital.

Lovable 2.0: Como uma plataforma colaborativa de "Ambient Coding" está a mudar o desenvolvimento de software Ler mais "

A OpenAI lança o modelo de geração de imagens multimodais gpt-image-1 para proporcionar a criação de imagens de alta qualidade

A OpenAI lançou oficialmente o seu mais recente modelo de geração de imagens multimodais, o gpt-image-1, e disponibilizou-o aos programadores de todo o mundo através de uma API. Este

A OpenAI lança o modelo de geração de imagens multimodais gpt-image-1 para proporcionar a criação de imagens de alta qualidade Ler mais "