今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!
欢迎来到【AI日报】栏目!在这里,您将每天探索人工智能的最新动态。我们会为您呈现AI行业的热门话题,特别关注开发者,帮助您把握技术趋势,了解创新的AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、低于250毫秒的延迟!MiniMax Speech 2.6发布,Fluent LoRA让音色复刻触手可及,语音合成进入实时交互新纪元
MiniMax Speech 2.6的推出,凭借其低延迟及音色复刻技术,推动语音合成迈向实时交互的新时代。
【AiBase提要:】
🎙️ 借助Fluent LoRA技术,仅需30秒的音频就能实现音色克隆。
⏱️ 端到端的延迟已低于250毫秒,接近人与人之间的对话节奏。
🌐 该技术支持教育、客服和智能硬件等多个场景的应用。
2、蚂蚁数科Agentar推出“金融AI大脑”,被评选为国际标准卓越案例
本文介绍了蚂蚁数科与宁波银行共同开发的Agentar知识工程KBase案例,该案例被成功选为国际标准金融应用的卓越案例。此方案运用知识工程技术解决了金融机构的知识孤岛问题,构建了智能决策系统,显著提高了服务效率和准确性,并具备良好的可解释性,为金融行业的智能化转型树立了新的标杆。
【AiBase提要:】
🧠 Agentar知识工程平台实现对多源异构数据的全生命周期管理。
💡 该系统通过“规划-检索-推理”机制提升了知识质量和人工智能的逻辑推理能力。
🔒 强有力的可解释性确保了生成式AI在金融领域的安全合规应用。
3、智源推出Emu3.5大模型:以“下一状态预测”重塑多模态智能,具身操作能力令人惊艳
智源发布的Emu3.5大模型,通过“下一状态预测”技术重新定义了多模态智能,展现出强大的具身操作能力,标志着AI的感知理解已迈向智能操作的重要一步。
【AiBase提要:】
🧠 Emu3.5引入自回归式“下一状态预测”(NSP)框架,实现了多模态序列建模的突破。
🖼️ 支持文图协同生成、智能图像编辑以及时空动态推理,提升了跨模态操作能力。
🔄 打破信息孤岛,实现文本、视觉和动作等模态的统一编码,支持跨模态的自由切换与协同推理。
4、Cursor 2.0重磅发布!自研模型Composer速度提升4倍,8个AI Agent并行编码,开发者效率迎来“爆炸性”升级
Cursor 2.0的推出,标志着其从智能补全插件向多智能体协作开发平台的转型,通过自研模型Composer和多Agent界面,显著提升了开发效率和质量。
【AiBase提要:】
🧠 Composer模型专为代理式编码而设计,采用强化学习与混合专家架构,响应速度提升了4倍。
ParallelGroup多个AI Agent同时工作,支持独立处理任务,显著提高复杂项目的开发效率。
🔄 全流程自动化功能整合了代码审查、测试及执行,减少了上下文切换,增强了开发者的专注度。
5、xAI升级Grok Imagine iOS版:新增视频生成与提示重混功能
xAI宣布,他们的Grok Imagine工具iOS版本将推出视频生成功能,用户可以通过文本或图像提示生成高清动态视频,并且可以直接从内容提要中重混提示。该功能基于Aurora/Grok核心模型进行了优化,提升了操作的流畅性,非常适合短片、广告以及创意内容的制作。
【AiBase提要:】
🎥 新增的视频生成功能允许通过文本或图像提示生成高清动态视频。
🔄 提示重混机制降低了创作的门槛,使得创作过程更为便捷。
📱 iOS版本优先更新,Android及网页版也将在后续推出,进一步增强移动端的AI创作能力。
6、OpenAI发布创新安全模型gpt-oss-safeguard,增强AI领域的风险应对能力
OpenAI推出的gpt-oss-safeguard系列模型在人工智能安全方面提供了更大的灵活性与个性化选项。这些模型能够依据开发人员设定的安全策略进行消息分类,并提供相应的推理解释。不过,值得注意的是,这些新模型在处理速度及资源使用上存在一定的限制,因此在某些情况下,其表现可能不及传统的分类器。
【AiBase提要:】
🛡️ OpenAI发布了gpt-oss-safeguard-120b与gpt-oss-safeguard-20b两款新型安全模型,支持灵活定制安全政策。
⚙️ 新模型可以依据输入的安全政策对用户的消息和对话进行分类,同时提供推理依据。
📊 尽管新模型具备一定优势,但在某些场合下,传统分类器的效果可能更为显著,并且新模型资源消耗较为庞大。
详情链接
:https://huggingface.co/collections/openai/gpt-oss-safeguard7、TikTok推出AI剪辑工具“Smart Split”,助力创作者轻松制作与策划内容
在美国创作者峰会上,TikTok发布了三项全新功能,其中包括由人工智能驱动的视频剪辑工具“Smart Split”、内容规划工具“AI Outline”,以及更新的创作者收益分成政策,旨在提高创作者的工作效率和盈利能力。
【AiBase提要:】
🎥 TikTok推出的AI剪辑工具“Smart Split”,可自动生成短视频和字幕。
📝 新的内容规划工具“AI Outline”帮助创作者轻松制定视频大纲。
💰 优化后的分成政策允许优秀创作者获取高达90%的收益分成。
8、微软发布Agent Lightning:全新AI框架助力大规模语言模型的强化学习训练
微软推出的Agent Lightning是一个开源框架,旨在通过强化学习提升多代理系统的性能,而无需对现有架构进行重构。
【AiBase提要:】
🧠 Agent Lightning将代理建模为部分可观测的马尔可夫决策过程,从而提升决策策略的性能。
🚀 此框架支持在不重构现有系统的情况下优化多代理系统,实现训练过程的解耦。
📈 实验结果显示,在文本转SQL、增强生成检索和数学问答任务上均表现出显著的性能提升。
详情链接
:https://arxiv.org/abs/2508.03680v1
Please specify source if reproduced今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线! | AI工具导航



