博客归档 - 渗透智能

LTX-2 炸场了！全球首个音画同步 4K 视频生成模型，ComfyUI 已支持

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

LTX-2是Lightricks发布的全球首个音画同步4K视频生成模型，可生成20秒、50fps高清视频，支持文本/图像输入。它实现了角色口型与语音同步，能在ComfyUI运行并本地部署，将于5年11月下旬开源。作为专业级创作工具，LTX-2让"文字变电影级短片"成为现实。

LTX-2 炸场了！全球首个音画同步 4K 视频生成模型，ComfyUI 已支持 Ler mais "

LTX-2 炸场了！全球首个音画同步 4K 视频生成模型，ComfyUI 已支持

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

LTX-2 炸场了！全球首个音画同步 4K 视频生成模型，ComfyUI 已支持 Ler mais "

KAT-Coder: Um novo avanço na programação de IA para pilotos

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

快手推出AI编程产品矩阵KAT-Coder，涵盖自研模型、工具与平台，支持20多种编程语言及多类开发任务。其开源版本KAT-Dev-72B-Exp在SWE-bench榜单以74.6%成绩超越GPT与Claude。该模型具备代码生成、调试、优化等能力，兼容主流开发工具，并在网页生成、电商网站、3D特效等领域展现强大应用潜力，标志着快手正式进军AI编程赛道。

KAT-Coder: Um novo avanço na programação de IA para pilotos Ler mais "

Manus e a bolha de agentes de IA: do ideal à desilusão

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

Manus作为2025年AI Agent热潮的代表，虽依托大模型、工具链与记忆技术实现任务执行，但因缺乏专业场景深耕与闭环交付，暴露“通用Agent”泡沫。其问题根源在于工程积累不足、资本驱动短视，导致功能堆砌却智能有限。行业正转向垂直领域，如医学Agent OpenEvidence，强调确定性流程与数据驱动，揭示未来属于专注、可评估、落地扎实的“笨智能”路径。

Manus e a bolha de agentes de IA: do ideal à desilusão Ler mais "

ChatGPT Atlas: uma revolução nos navegadores de IA

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

OpenAI发布首款AI原生浏览器ChatGPT Atlas，深度融合ChatGPT智能能力。其核心功能包括：实时AI辅助网页内容总结与互动、智能写作优化、自然语言控制浏览器操作、个性化记忆推荐、智能体模式自动执行购物及预订任务、光标聊天实时文本处理。该浏览器通过AI技术提升浏览效率，实现任务自动化，重塑人机交互体验。

ChatGPT Atlas: uma revolução nos navegadores de IA Ler mais "

Veo 3.1 vs Sora2: Quem é o verdadeiro rei da geração de vídeo?

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

谷歌的Veo3.1与OpenAI的Sora2在AI视频生成领域展开竞争。Veo3.1以精准控制、高质量音画同步见长，适合专业长视频创作。Sora2则胜在流畅自然的动态效果和娱乐性，更适合创意短视频。两者各有优势，选择取决于具体应用场景。

Veo 3.1 vs Sora2: Quem é o verdadeiro rei da geração de vídeo? Ler mais "

Google Gemini 3.0: geração inovadora de SO baseado na Web

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

近年来，人工智能技术的进步让我们惊叹不已，尤其是在生成式AI的领域。谷歌的最新AI模型——Gemini 3.0

Google Gemini 3.0: geração inovadora de SO baseado na Web Ler mais "

Análise aprofundada dos seis principais agentes de IA: Explorar o valor do produto e a direção do desenvolvimento

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

O artigo analisa seis produtos de agentes de IA tradicionais, Manus, Buckle Space, Lovart, Flowith Neo, Skywork e Super Magee, e analisa a sua competitividade no mercado em termos de três dimensões: capacidade de execução, fiabilidade e frequência de utilização. Os generalistas enfrentam desafios de entrada e integração. O artigo salienta que a coexistência de especialização e generalização, a capacidade de entrega, o mecanismo de confiança e a integração de portais se tornarão direcções importantes para o desenvolvimento dos agentes.

Análise aprofundada dos seis principais agentes de IA: Explorar o valor do produto e a direção do desenvolvimento Ler mais "

Guia de Configuração dos Servidores Cursor MCP e Recomendações Práticas do Cursor MCP

Deixar um comentário / blogue (palavra emprestada), conteúdo aprofundado, Programa de estudos / Por IvesFeng666

O MCP (Protocolo de contexto de modelo) é um protocolo que permite que modelos grandes interajam com ferramentas e serviços externos. O Cursor IDE suporta assistentes de IA para invocar ferramentas para realizar pesquisas, navegar na Web e operações de código através do recurso Servidores MCP. Os servidores MCP podem ser adicionados por meio da interface Configurações e configurados nos níveis global e de projeto. O MCP é escrito em vários idiomas e permite que a IA execute ferramentas automática ou manualmente e retorne resultados, incluindo imagens. Os recursos recomendados incluem Awesome-MCP-ZH, AIbase e várias ferramentas de cliente MCP. Os serviços MCP habitualmente utilizados, como o Sequential Thinking, o Brave Search, o Magic MCP, etc., melhoram a capacidade da IA para pensar, pesquisar, a eficiência do desenvolvimento front-end e outras caraterísticas, respetivamente.

Guia de Configuração dos Servidores Cursor MCP e Recomendações Práticas do Cursor MCP Ler mais "

Análise aprofundada do Veo 3: um avanço histórico na geração de vídeo com IA da Google

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

Em maio de 2025, a Google lançou o Veo 3, a primeira vez que se consegue uma geração síncrona de áudio e vídeo de IA, para que os personagens de vídeo de IA possam "falar". Os avanços do modelo incluem imagem 4K, consistência física e sincronização de som, etc., utilizando a tecnologia V2A para codificar imagens de vídeo como sinais semânticos, gerando faixas de áudio correspondentes e aplicando-as a programas de entrevistas, jogos ao vivo, concertos e outras cenas. Embora existam deficiências na geração de acções complexas, as perspectivas de comercialização são significativas, com preços diferenciados, com impacto nas indústrias tradicionais da publicidade e da produção cinematográfica.

Análise aprofundada do Veo 3: um avanço histórico na geração de vídeo com IA da Google Ler mais "

Análise aprofundada das variantes do modelo Gemma: avanços tecnológicos e aplicações práticas da IA no domínio vertical

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

Os três modelos especializados Gemma recentemente lançados pela Google - MedGemma, SignGemma e DolphinGemma - representam uma mudança importante nos modelos de IA, da generalidade para a adaptação vertical profunda ao domínio. O SignGemma apoia a tradução multilingue de linguagem gestual para ajudar os grupos de deficientes auditivos a comunicar; e o DolphinGemma explora a síntese do discurso dos golfinhos para promover a investigação da comunicação entre espécies. Estes modelos melhoram o desempenho profissional, tendo em conta a eficiência computacional e a conveniência da utilização, proporcionando uma nova via para a industrialização da IA.

Análise aprofundada das variantes do modelo Gemma: avanços tecnológicos e aplicações práticas da IA no domínio vertical Ler mais "

Conclusão 4: A redefinição dos assistentes de programação de IA atinge a maioridade

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A Anthropic lança a série Claude 4, abrangendo as versões Opus 4 e Sonnet 4, com foco em tarefas de programação e raciocínio avançado. Na conferência para desenvolvedores, o CEO Dario Amodei anunciou que a série supera a concorrência em todos os aspectos, liderando o desempenho em vários benchmarks, bem como o lançamento do Claude Code e de novos recursos de API que impulsionarão uma mudança de paradigma na forma como a IA e o desenvolvimento são feitos. mudança de paradigma.

Conclusão 4: A redefinição dos assistentes de programação de IA atinge a maioridade Ler mais "

Novas funcionalidades do Manus totalmente reveladas: capacidade de geração de gráficos de IA oficialmente operacional

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A Manus entra em funcionamento com a geração de imagens, os novos utilizadores recebem 1000 pontos de bónus e 300 recargas diárias. A plataforma utiliza um processo de pensamento profundo que apoia a colaboração multi-ferramentas e a afinação da interação entre tarefas. Os casos de teste mostram que pode completar a criação de imagens complexas, a conceção de marcas, a implantação na Web e outras tarefas. O consumo de pontos é elevado, a quantidade gratuita de funções básicas é limitada e a subscrição paga está dividida em três níveis. As vantagens da Manus residem na compreensão das intenções e na execução de todo o processo, mas existem problemas de velocidade lenta, qualidade flutuante e custo elevado, pelo que ainda há espaço para melhorias no futuro.

Novas funcionalidades do Manus totalmente reveladas: capacidade de geração de gráficos de IA oficialmente operacional Ler mais "

OpenAI Nova geração de revolução na programação: Codex Intelligence Body Analysis

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A OpenAI lança a inteligência de programação Codex em maio de 2025, integrada com o ChatGPT e baseada no modelo codex-1, que executa tarefas como escrever código, corrigir bugs, executar testes e muito mais, na nuvem. O codex suporta integrações do GitHub, fornece evidências verificáveis de execução e obteve 72.1% nos testes SWE-Bench. está atualmente disponível para usuários Pro, Enterprise e Team. O Codex está atualmente disponível para utilizadores Pro, Enterprise e Team e, no futuro, irá melhorar ainda mais a interatividade e a integração de ferramentas de desenvolvimento para ajudar a melhorar a eficiência do desenvolvimento de software.

OpenAI Nova geração de revolução na programação: Codex Intelligence Body Analysis Ler mais "

Google DeepMind AlphaEvolve: A ascensão de uma inteligência revolucionária codificada por IA

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A Google DeepMind lançou o AlphaEvolve, uma inteligência de codificação de IA capaz de escrever e otimizar código e de fazer descobertas científicas por si própria. O sistema, que incorpora grandes modelos de linguagem, algoritmos evolutivos e avaliadores automáticos, já fez várias descobertas no domínio da matemática, como a melhoria dos algoritmos de multiplicação de matrizes e a resolução de puzzles geométricos. Entretanto, conseguiu ganhos de eficiência significativos na otimização dos centros de dados da Google, na conceção de chips e na formação em IA, assinalando um novo marco na transformação da IA de uma ferramenta para um parceiro de inovação algorítmica.

Google DeepMind AlphaEvolve: A ascensão de uma inteligência revolucionária codificada por IA Ler mais "

10 segundos de Figma Magic: Criar uma página de cartão de fluxo contínuo da Apple para melhorar rapidamente a textura do design

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

As grelhas Bento (estilo Apple) são um estilo de design visual minimalista, claro e altamente organizado, normalmente utilizado em interfaces modernas da Web e de aplicações móveis. O estilo cria uma experiência de leitura limpa ao apresentar o conteúdo através de módulos de grelha que realçam o espaço em branco, o alinhamento e a consistência. O artigo também fornece passos específicos para implementar este esquema utilizando o Figma e recomenda plug-ins e ferramentas relacionados.

10 segundos de Figma Magic: Criar uma página de cartão de fluxo contínuo da Apple para melhorar rapidamente a textura do design Ler mais "

NVIDIA Llama-Nemotron: O novo rei do código aberto para além do DeepSeek-R1

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A NVIDIA lança modelos Llama-NemotronAI de código aberto nas versões 8B, 49B e 253B. O emblemático LN-Ultra supera o DeepSeek-R1 de 671 mil milhões em vários parâmetros de referência com apenas 253 mil milhões de parâmetros, ao mesmo tempo que permite um funcionamento mais eficiente num único nó xH100. O processo de formação em cinco fases da série, com técnicas inovadoras, inclui comutação de inferência, otimização com reconhecimento de hardware e formação de dados sintéticos. A relação positiva entre a escala e o desempenho dos parâmetros de desempenho do modelo marca a era da eficiência da IA em primeiro lugar, e o seu licenciamento de código aberto irá acelerar a adoção da tecnologia.

NVIDIA Llama-Nemotron: O novo rei do código aberto para além do DeepSeek-R1 Ler mais "

Google Gemini 2.5 Pro: uma evolução multimodal do vídeo para aplicações interactivas

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A Google lança a versão 2.5 Pro do Gemini, uma grande conquista no domínio da compreensão multimodal e da geração de código. O modelo supera o concorrente Cl 3.7 Sonnet em termos de capacidades de programação e é particularmente hábil na transformação de conteúdos de vídeo e esboços desenhados à mão em redes totalmente funcionais, melhorando significativamente a eficiência do desenvolvimento. Demonstra uma revolução em áreas como o desenvolvimento Web, a otimização de revisões e a tecnologia educativa, criando um novo paradigma para o desenvolvimento assistido por IA.

Google Gemini 2.5 Pro: uma evolução multimodal do vídeo para aplicações interactivas Ler mais "

Bolt.new: um guia tutorial para criar um sítio web profissional através de descrições simples

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A Bolt.new é uma plataforma de desenvolvimento orientada para a IA em que os utilizadores escrevem código gerando sítios Web completos diretamente a partir de descrições naturais. Suporta a geração de aplicações em várias estruturas, a instalação de pacotes de software e permite a otimização dinâmica do código e transformações desenhadas à mão. Os utilizadores iniciam sessão e introduzem os requisitos do sítio Web para automatizar o código, suportam várias rondas de otimização do diálogo e pré-visualizações em tempo real, e podem implementar ou descarregar o código. A chave é escrever instruções detalhadas que especifiquem o tipo de sítio, o estilo e o público-alvo, incorporando ao mesmo tempo editores para melhorar a precisão. bolt.new é particularmente adequado para a criação de protótipos e pode ser utilizado em conjunto com ferramentas especializadas como o Cursor para projectos mais complexos. A plataforma é inicialmente gratuita, mas será cobrada no futuro, tornando-a adequada para empresários, criadores de conteúdos e programadores.

Bolt.new: um guia tutorial para criar um sítio web profissional através de descrições simples Ler mais "

DeepSeek lança modelo Prover-V2: Parâmetros 671B impulsionam a prova de teoremas matemáticos

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A DeepSeek lançou o modelo DeepSeek-Prover2, concebido para provas matemáticas, a 1 de maio, com 671 mil milhões de parâmetros e uma versão com 7 mil milhões de parâmetros. O modelo usa uma combinação de recursão e aprendizagem por reforço para se destacar em vários testes de matemática, como o teste MiniFF com uma taxa de aprovação de 88,9%. O conjunto de dados ProBench lançado ao mesmo tempo contém 325 perguntas para avaliar as capacidades do modelo. As experiências revelaram que o modelo Chain of Thought melhora significativamente a precisão, com o mini-modelo a superar mesmo o modelo em problemas específicos. O modelo já se encontra na Hugging Face, apoiando um novo paradigma na investigação matemática.

DeepSeek lança modelo Prover-V2: Parâmetros 671B impulsionam a prova de teoremas matemáticos Ler mais "

Lançamento do Qwen 3: o modelo 235B tem um desempenho superior ao do R1, Grok e o1 com licença Apache 2.0

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A equipa de Ali Tongyi Qianqian lançou uma nova geração de modelos de grande dimensão de fonte aberta Qwen3, que encabeçou a lista global de modelos de fonte aberta, a série contém modelos, o desempenho do modelo principal excede muitos modelos de topo, a implantação é significativamente menor. A série contém modelos, o desempenho do modelo principal excede uma série de modelos de topo, a implantação é significativamente reduzida. qwen 3 em uma série de benchmarks para estabelecer um novo recorde, e a introdução inovadora do modo de "raciocínio híbrido" o modelo suporta 119 idiomas, dados de pré-treinamento até 36 token, a resposta da comunidade é entusiástica, dentro de três horas para obter a estrela k GitHub. O modelo suporta 119 idiomas com 36 tokens de dados de pré-treinamento e recebeu uma estrela do GitHub em três horas.

Lançamento do Qwen 3: o modelo 235B tem um desempenho superior ao do R1, Grok e o1 com licença Apache 2.0 Ler mais "

Lovable 2.0: Como uma plataforma colaborativa de "Ambient Coding" está a mudar o desenvolvimento de software

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A empresa europeia de IA Lovable lança a plataforma 2.0 para o desenvolvimento de software sem código através da interação em linguagem natural. O novo suporte para colaboração multijogador, agentes de conversação inteligentes e controlo de segurança reduz significativamente o limiar de desenvolvimento. Disponibiliza programas gratuitos e pagos para as equipas de arranque criarem rapidamente protótipos de produtos e tem 500 000 utilizadores activos mensais. A plataforma comercializa o conceito de "codificação ambiente" gerada por IA para facilitar a transformação digital.

Lovable 2.0: Como uma plataforma colaborativa de "Ambient Coding" está a mudar o desenvolvimento de software Ler mais "

A OpenAI lança o modelo de geração de imagens multimodais gpt-image-1 para proporcionar a criação de imagens de alta qualidade

Deixar um comentário / blogue (palavra emprestada) / Por IvesFeng666

A OpenAI lançou oficialmente o seu mais recente modelo de geração de imagens multimodais, o gpt-image-1, e disponibilizou-o aos programadores de todo o mundo através de uma API. Este

A OpenAI lança o modelo de geração de imagens multimodais gpt-image-1 para proporcionar a criação de imagens de alta qualidade Ler mais "