今日AI动态：MiniMax Speech 2.6音色复刻新发布，TikTok推出“Smart Split”AI剪辑工具，Cursor 2.0震撼上线！

AI快讯 8months ago AICAT

0 0 9

欢迎来到【AI日报】栏目！在这里，您将每天探索人工智能的最新动态。我们会为您呈现AI行业的热门话题，特别关注开发者，帮助您把握技术趋势，了解创新的AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、低于250毫秒的延迟！MiniMax Speech 2.6发布，Fluent LoRA让音色复刻触手可及，语音合成进入实时交互新纪元

MiniMax Speech 2.6的推出，凭借其低延迟及音色复刻技术，推动语音合成迈向实时交互的新时代。

【AiBase提要:】

🎙️ 借助Fluent LoRA技术，仅需30秒的音频就能实现音色克隆。

⏱️ 端到端的延迟已低于250毫秒，接近人与人之间的对话节奏。

🌐 该技术支持教育、客服和智能硬件等多个场景的应用。

2、蚂蚁数科Agentar推出“金融AI大脑”，被评选为国际标准卓越案例

本文介绍了蚂蚁数科与宁波银行共同开发的Agentar知识工程KBase案例，该案例被成功选为国际标准金融应用的卓越案例。此方案运用知识工程技术解决了金融机构的知识孤岛问题，构建了智能决策系统，显著提高了服务效率和准确性，并具备良好的可解释性，为金融行业的智能化转型树立了新的标杆。

【AiBase提要:】

🧠 Agentar知识工程平台实现对多源异构数据的全生命周期管理。

💡 该系统通过“规划-检索-推理”机制提升了知识质量和人工智能的逻辑推理能力。

🔒 强有力的可解释性确保了生成式AI在金融领域的安全合规应用。

3、智源推出Emu3.5大模型：以“下一状态预测”重塑多模态智能，具身操作能力令人惊艳

智源发布的Emu3.5大模型，通过“下一状态预测”技术重新定义了多模态智能，展现出强大的具身操作能力，标志着AI的感知理解已迈向智能操作的重要一步。

【AiBase提要:】

🧠 Emu3.5引入自回归式“下一状态预测”（NSP）框架，实现了多模态序列建模的突破。

🖼️ 支持文图协同生成、智能图像编辑以及时空动态推理，提升了跨模态操作能力。

🔄 打破信息孤岛，实现文本、视觉和动作等模态的统一编码，支持跨模态的自由切换与协同推理。

4、Cursor 2.0重磅发布！自研模型Composer速度提升4倍，8个AI Agent并行编码，开发者效率迎来“爆炸性”升级

Cursor 2.0的推出，标志着其从智能补全插件向多智能体协作开发平台的转型，通过自研模型Composer和多Agent界面，显著提升了开发效率和质量。

【AiBase提要:】

🧠 Composer模型专为代理式编码而设计，采用强化学习与混合专家架构，响应速度提升了4倍。

ParallelGroup多个AI Agent同时工作，支持独立处理任务，显著提高复杂项目的开发效率。

🔄 全流程自动化功能整合了代码审查、测试及执行，减少了上下文切换，增强了开发者的专注度。

5、xAI升级Grok Imagine iOS版：新增视频生成与提示重混功能

xAI宣布，他们的Grok Imagine工具iOS版本将推出视频生成功能，用户可以通过文本或图像提示生成高清动态视频，并且可以直接从内容提要中重混提示。该功能基于Aurora/Grok核心模型进行了优化，提升了操作的流畅性，非常适合短片、广告以及创意内容的制作。

【AiBase提要:】

🎥 新增的视频生成功能允许通过文本或图像提示生成高清动态视频。

🔄 提示重混机制降低了创作的门槛，使得创作过程更为便捷。

📱 iOS版本优先更新，Android及网页版也将在后续推出，进一步增强移动端的AI创作能力。

6、OpenAI发布创新安全模型gpt-oss-safeguard，增强AI领域的风险应对能力

OpenAI推出的gpt-oss-safeguard系列模型在人工智能安全方面提供了更大的灵活性与个性化选项。这些模型能够依据开发人员设定的安全策略进行消息分类，并提供相应的推理解释。不过，值得注意的是，这些新模型在处理速度及资源使用上存在一定的限制，因此在某些情况下，其表现可能不及传统的分类器。

【AiBase提要:】

🛡️ OpenAI发布了gpt-oss-safeguard-120b与gpt-oss-safeguard-20b两款新型安全模型，支持灵活定制安全政策。

⚙️ 新模型可以依据输入的安全政策对用户的消息和对话进行分类，同时提供推理依据。

📊 尽管新模型具备一定优势，但在某些场合下，传统分类器的效果可能更为显著，并且新模型资源消耗较为庞大。

详情链接
:https://huggingface.co/collections/openai/gpt-oss-safeguard

7、TikTok推出AI剪辑工具“Smart Split”，助力创作者轻松制作与策划内容

在美国创作者峰会上，TikTok发布了三项全新功能，其中包括由人工智能驱动的视频剪辑工具“Smart Split”、内容规划工具“AI Outline”，以及更新的创作者收益分成政策，旨在提高创作者的工作效率和盈利能力。

【AiBase提要:】

🎥 TikTok推出的AI剪辑工具“Smart Split”，可自动生成短视频和字幕。

📝 新的内容规划工具“AI Outline”帮助创作者轻松制定视频大纲。

💰 优化后的分成政策允许优秀创作者获取高达90%的收益分成。

8、微软发布Agent Lightning：全新AI框架助力大规模语言模型的强化学习训练

微软推出的Agent Lightning是一个开源框架，旨在通过强化学习提升多代理系统的性能，而无需对现有架构进行重构。

【AiBase提要:】

🧠 Agent Lightning将代理建模为部分可观测的马尔可夫决策过程，从而提升决策策略的性能。

🚀 此框架支持在不重构现有系统的情况下优化多代理系统，实现训练过程的解耦。

📈 实验结果显示，在文本转SQL、增强生成检索和数学问答任务上均表现出显著的性能提升。

详情链接
:https://arxiv.org/abs/2508.03680v1