分钟级实时视频生成来了!腾讯与南洋理工联合突破长视频生成瓶颈
理工大学与腾讯ARC实验室联合研发的Rolling Forcing方法,解决了AI长视频生成的质量、一致性与实时性难以兼顾的问题。该方法采用滚动窗口联合降噪、Attention Sink机制及高效训练算法,在单张GPU上实现了16 fps的分钟级高质量视频流生成,有效抑制了误差累积和画面其支持交互式动态引导内容创作,相关代码与模型已开源。
分钟级实时视频生成来了!腾讯与南洋理工联合突破长视频生成瓶颈 Read More »
渗透智能AI日报专注于人工智能领域前沿动态的每日资讯汇总,旨在为AI从业者、研究者和爱好者提供及时、精准、高价值的行业信息。
理工大学与腾讯ARC实验室联合研发的Rolling Forcing方法,解决了AI长视频生成的质量、一致性与实时性难以兼顾的问题。该方法采用滚动窗口联合降噪、Attention Sink机制及高效训练算法,在单张GPU上实现了16 fps的分钟级高质量视频流生成,有效抑制了误差累积和画面其支持交互式动态引导内容创作,相关代码与模型已开源。
分钟级实时视频生成来了!腾讯与南洋理工联合突破长视频生成瓶颈 Read More »
Cursor 2.0正式发布,推出自研大模型Composer。其代码生成速度高达250 tokens/秒,比GPT-5和Claude Sonnet 4.5快2倍。该模型专为真实开发场景训练,能自主完成编码、测试和修复Bug的全流程,目前仅集成于Cursor编辑器内部使用。
Cursor 2.0 炸场了!自研模型 Composer 登场,代码生成快到离谱 Read More »
Cursor 2.0正式发布,推出自研大模型Composer。其代码生成速度高达250 tokens/秒,比GPT-5和Claude Sonnet 4.5快2倍。该模型专为真实开发场景训练,能自主完成编码、测试和修复Bug的全流程,目前仅集成于Cursor编辑器内部使用。
Cursor 2.0 炸场了!自研模型 Composer 登场,代码生成快到离谱 Read More »
FlowithOS是全球首个为AI智能体设计的原生操作系统,能够执行复杂任务而非仅限聊天。该系统基于Chromium浏览器,支持跨平台多任务并行,具备无限上下文记忆和Skills技能库,可自动完成淘宝购物、微博运营及数据采集等实际工作。目前处于早期测试阶段,支持Windows与macOS,需邀请码体验。
FlowithOS 上线了!全球首个“AI 智能体操作系统”,真能当你的数字员工? Read More »
FlowithOS是全球首个为AI智能体设计的原生操作系统,能够执行复杂任务而非仅限聊天。该系统基于Chromium浏览器,支持跨平台多任务并行,具备无限上下文记忆和Skills技能库,可自动完成淘宝购物、微博运营及数据采集等实际工作。目前处于早期测试阶段,支持Windows与macOS,需邀请码体验。
FlowithOS 上线了!全球首个“AI 智能体操作系统”,真能当你的数字员工? Read More »
马斯克在7月10日推出xAI最新AI模型Grok 4,采用20万张H100/A100 GPU训练,在HLE测试中突破50%准确率。该模型在多项基准测试中表现优异,尤其适用于复杂推理任务。商业化版本SuperGrok定价30至300美元/月,主要面向高端专业用户。Grok 4将整合至特斯拉与Optimus机器人等生态产品中。
Grok 4:马斯克20万GPU打造的”最聪明”AI模型 Read More »
OmniGen2是一款基于Qwen-VL-2.5架构的多模态生成模型,拥有70亿参数,其中30亿用于文本处理,40亿用于图像扩散生成。其核心能力包括智能文本转图像、上下文感知编辑和多模态理解。新增的自我反思机制可自主优化输出质量。通过ComfyUI的节点式集成,用户可直观操作,降低使用门槛。已在多个场景中展示专业级图像生成与编辑效果。
OmniGen2:新一代多模态AI的突破性进展 Read More »
GPT-5将集成Codex、Operator等多个AI工具,实现编程、研究、操作与记忆功能一体化。具备完全多模态能力,可处理语音、图像、代码与视频输入,并能智能切换推理与对话模式。据测试,其编程效率可提升3倍,定位为AGI发展第三阶段的关键突破。预计今年内发布,引发行业关注与安全讨论。
GPT-5来了!OpenAI下一代超级模型的全方位解析 Read More »