AI Daily.

O Penetrating Intelligence AI Daily centra-se no resumo diário de informações sobre desenvolvimentos de ponta no domínio da Inteligência Artificial, com o objetivo de fornecer aos profissionais, investigadores e entusiastas da IA informações oportunas, precisas e de elevado valor sobre o sector.

A geração de vídeo em tempo real ao nível do minuto está aqui! A Tencent e a Universidade Tecnológica de Nanyang, em conjunto, eliminam o estrangulamento da produção de vídeos longos

理工大学与腾讯ARC实验室联合研发的Rolling Forcing方法,解决了AI长视频生成的质量、一致性与实时性难以兼顾的问题。该方法采用滚动窗口联合降噪、Attention Sink机制及高效训练算法,在单张GPU上实现了16 fps的分钟级高质量视频流生成,有效抑制了误差累积和画面其支持交互式动态引导内容创作,相关代码与模型已开源。

A geração de vídeo em tempo real ao nível do minuto está aqui! A Tencent e a Universidade Tecnológica de Nanyang, em conjunto, eliminam o estrangulamento da produção de vídeos longos Ler mais "

O Cursor 2.0 explodiu! O Compositor de modelos auto-desenvolvido estreia-se, a geração de código é ridiculamente rápida!

Cursor 2.0正式发布,推出自研大模型Composer。其代码生成速度高达250 tokens/秒,比GPT-5和Claude Sonnet 4.5快2倍。该模型专为真实开发场景训练,能自主完成编码、测试和修复Bug的全流程,目前仅集成于Cursor编辑器内部使用。

O Cursor 2.0 explodiu! O Compositor de modelos auto-desenvolvido estreia-se, a geração de código é ridiculamente rápida! Ler mais "

O Cursor 2.0 explodiu! O Compositor de modelos auto-desenvolvido estreia-se, a geração de código é ridiculamente rápida!

Cursor 2.0正式发布,推出自研大模型Composer。其代码生成速度高达250 tokens/秒,比GPT-5和Claude Sonnet 4.5快2倍。该模型专为真实开发场景训练,能自主完成编码、测试和修复Bug的全流程,目前仅集成于Cursor编辑器内部使用。

O Cursor 2.0 explodiu! O Compositor de modelos auto-desenvolvido estreia-se, a geração de código é ridiculamente rápida! Ler mais "

FlowithOS está online! O primeiro "Sistema Operativo Corporal Inteligente com IA" do mundo, poderá ser realmente o seu empregado digital?

FlowithOS是全球首个为AI智能体设计的原生操作系统,能够执行复杂任务而非仅限聊天。该系统基于Chromium浏览器,支持跨平台多任务并行,具备无限上下文记忆和Skills技能库,可自动完成淘宝购物、微博运营及数据采集等实际工作。目前处于早期测试阶段,支持Windows与macOS,需邀请码体验。

FlowithOS está online! O primeiro "Sistema Operativo Corporal Inteligente com IA" do mundo, poderá ser realmente o seu empregado digital? Ler mais "

FlowithOS está online! O primeiro "Sistema Operativo Corporal Inteligente com IA" do mundo, poderá ser realmente o seu empregado digital?

FlowithOS是全球首个为AI智能体设计的原生操作系统,能够执行复杂任务而非仅限聊天。该系统基于Chromium浏览器,支持跨平台多任务并行,具备无限上下文记忆和Skills技能库,可自动完成淘宝购物、微博运营及数据采集等实际工作。目前处于早期测试阶段,支持Windows与macOS,需邀请码体验。

FlowithOS está online! O primeiro "Sistema Operativo Corporal Inteligente com IA" do mundo, poderá ser realmente o seu empregado digital? Ler mais "

Grok 4: O modelo de IA "mais inteligente" de Musk construído com 200.000 GPUs

Musk revelou o mais recente modelo de IA da xAI, o Grok 4, em 10 de julho, treinado com 200.000 GPUs H100/A100 e com uma precisão de 50% nos testes HLE. O modelo tem um bom desempenho em vários testes de referência e é particularmente adequado para tarefas de raciocínio complexas. A versão comercial do SuperGrok tem um preço de 30 a 300 dólares por mês e destina-se a utilizadores profissionais de topo de gama. O Grok 4 será integrado em produtos ecológicos como o Tesla e o Optimus Robotics.

Grok 4: O modelo de IA "mais inteligente" de Musk construído com 200.000 GPUs Ler mais "

OmniGen2: um avanço na IA multimodal da próxima geração

O OmniGen2 é um modelo generativo multimodal baseado na arquitetura Qwen-VL-2.5 com 7 mil milhões de parâmetros, dos quais 3 mil milhões são utilizados para o processamento de texto e 4 mil milhões para a geração de difusão de imagens. As suas principais capacidades incluem a conversão inteligente de texto em imagem, a edição consciente do contexto e a compreensão multimodal. Foi adicionado um novo mecanismo de autorreflexão para otimizar de forma autónoma a qualidade do resultado. Com a integração baseada em nós da ComfyUI, os utilizadores podem operá-la intuitivamente e reduzir o limiar de utilização. A geração de imagens profissionais e os efeitos de edição foram demonstrados em vários cenários.

OmniGen2: um avanço na IA multimodal da próxima geração Ler mais "

O GPT-5 chegou! Uma análise completa do super modelo da próxima geração da OpenAI!

O GPT-5 integrará várias ferramentas de IA, como o Codex e o Operator, para integrar funções de programação, investigação, operação e memória. É totalmente multimodal e pode lidar com entradas de voz, imagem, código e vídeo, e pode alternar inteligentemente entre os modos de inferência e diálogo. De acordo com os testes, a sua eficiência de programação pode ser aumentada em 3 vezes, posicionando-o como um avanço fundamental na terceira fase do desenvolvimento da AGI. Prevê-se que seja lançado este ano, o que suscitará preocupações no sector e discussões sobre segurança.

O GPT-5 chegou! Uma análise completa do super modelo da próxima geração da OpenAI! Ler mais "