AI Daily.

Penetrating Intelligence AI Daily se centra en el resumen informativo diario de los últimos avances en el campo de la Inteligencia Artificial, con el objetivo de proporcionar a los profesionales, investigadores y entusiastas de la IA información oportuna, precisa y de gran valor sobre el sector.

¡Ya está aquí la generación de vídeo en tiempo real a nivel de minutos! Tencent y la Universidad Tecnológica de Nanyang rompen conjuntamente el cuello de botella de la generación de vídeos largos.

理工大学与腾讯ARC实验室联合研发的Rolling Forcing方法,解决了AI长视频生成的质量、一致性与实时性难以兼顾的问题。该方法采用滚动窗口联合降噪、Attention Sink机制及高效训练算法,在单张GPU上实现了16 fps的分钟级高质量视频流生成,有效抑制了误差累积和画面其支持交互式动态引导内容创作,相关代码与模型已开源。

¡Ya está aquí la generación de vídeo en tiempo real a nivel de minutos! Tencent y la Universidad Tecnológica de Nanyang rompen conjuntamente el cuello de botella de la generación de vídeos largos. Leer más "

¡Cursor 2.0 vuela por los aires! Debuta el compositor de modelos de desarrollo propio, ¡la generación de código es ridículamente rápida!

Cursor 2.0正式发布,推出自研大模型Composer。其代码生成速度高达250 tokens/秒,比GPT-5和Claude Sonnet 4.5快2倍。该模型专为真实开发场景训练,能自主完成编码、测试和修复Bug的全流程,目前仅集成于Cursor编辑器内部使用。

¡Cursor 2.0 vuela por los aires! Debuta el compositor de modelos de desarrollo propio, ¡la generación de código es ridículamente rápida! Leer más "

¡Cursor 2.0 vuela por los aires! Debuta el compositor de modelos de desarrollo propio, ¡la generación de código es ridículamente rápida!

Cursor 2.0正式发布,推出自研大模型Composer。其代码生成速度高达250 tokens/秒,比GPT-5和Claude Sonnet 4.5快2倍。该模型专为真实开发场景训练,能自主完成编码、测试和修复Bug的全流程,目前仅集成于Cursor编辑器内部使用。

¡Cursor 2.0 vuela por los aires! Debuta el compositor de modelos de desarrollo propio, ¡la generación de código es ridículamente rápida! Leer más "

¡FlowithOS está en línea! El primer "AI Intelligent Body Operating System" del mundo, ¿puede realmente ser tu empleado digital?

FlowithOS是全球首个为AI智能体设计的原生操作系统,能够执行复杂任务而非仅限聊天。该系统基于Chromium浏览器,支持跨平台多任务并行,具备无限上下文记忆和Skills技能库,可自动完成淘宝购物、微博运营及数据采集等实际工作。目前处于早期测试阶段,支持Windows与macOS,需邀请码体验。

¡FlowithOS está en línea! El primer "AI Intelligent Body Operating System" del mundo, ¿puede realmente ser tu empleado digital? Leer más "

¡FlowithOS está en línea! El primer "AI Intelligent Body Operating System" del mundo, ¿puede realmente ser tu empleado digital?

FlowithOS是全球首个为AI智能体设计的原生操作系统,能够执行复杂任务而非仅限聊天。该系统基于Chromium浏览器,支持跨平台多任务并行,具备无限上下文记忆和Skills技能库,可自动完成淘宝购物、微博运营及数据采集等实际工作。目前处于早期测试阶段,支持Windows与macOS,需邀请码体验。

¡FlowithOS está en línea! El primer "AI Intelligent Body Operating System" del mundo, ¿puede realmente ser tu empleado digital? Leer más "

Grok 4: el modelo de IA "más inteligente" de Musk, construido con 200.000 GPUs

Musk presentó el 10 de julio el último modelo de IA de xAI, Grok 4, entrenado con 200.000 GPUs H100/A100 y que supera los 50% de precisión en las pruebas HLE. El modelo obtiene buenos resultados en varias pruebas comparativas y es especialmente adecuado para tareas de razonamiento complejas. La versión comercializada de SuperGrok tiene un precio de entre 30 y 300 dólares al mes y está dirigida a usuarios profesionales de gama alta.Grok 4 se integrará en productos ecológicos como Tesla y Optimus Robotics.

Grok 4: el modelo de IA "más inteligente" de Musk, construido con 200.000 GPUs Leer más "

OmniGen2: un gran avance en la IA multimodal de nueva generación

OmniGen2 es un modelo generativo multimodal basado en la arquitectura Qwen-VL-2.5 con 7.000 millones de parámetros, de los cuales 3.000 millones se utilizan para el procesamiento de texto y 4.000 millones para la generación de difusión de imágenes. Sus principales funciones son la conversión inteligente de texto en imagen, la edición en función del contexto y la comprensión multimodal. Se añade un nuevo mecanismo de autorreflexión para optimizar de forma autónoma la calidad del resultado. Gracias a la integración basada en nodos de ComfyUI, los usuarios pueden manejarlo de forma intuitiva y reducir el umbral de uso. Se han demostrado efectos profesionales de generación y edición de imágenes en múltiples escenarios.

OmniGen2: un gran avance en la IA multimodal de nueva generación Leer más "

¡GPT-5 ya está aquí! ¡Un análisis completo del supermodelo de próxima generación de OpenAI!

GPT-5 integrará varias herramientas de IA, como Codex y Operator, para integrar funciones de programación, investigación, operación y memoria. Es totalmente multimodal y puede manejar entradas de voz, imagen, código y vídeo, además de alternar de forma inteligente entre los modos de inferencia y diálogo. Según las pruebas realizadas, su eficacia de programación puede multiplicarse por 3, lo que lo sitúa como un avance clave en la tercera fase del desarrollo de la AGI. Se espera que salga a la venta este año, lo que suscitará inquietudes en el sector y debates sobre seguridad.

¡GPT-5 ya está aquí! ¡Un análisis completo del supermodelo de próxima generación de OpenAI! Leer más "