今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!

AI快讯 3hours ago AICAT
0 0

欢迎来到【AI日报】栏目!在这里,您将每天探索人工智能的最新动态。我们会为您呈现AI行业的热门话题,特别关注开发者,帮助您把握技术趋势,了解创新的AI产品应用。

新鲜AI产品点击了解:https://app.aibase.com/zh

1、低于250毫秒的延迟!MiniMax Speech 2.6发布,Fluent LoRA让音色复刻触手可及,语音合成进入实时交互新纪元

MiniMax Speech 2.6的推出,凭借其低延迟及音色复刻技术,推动语音合成迈向实时交互的新时代。

今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!

【AiBase提要:】

🎙️ 借助Fluent LoRA技术,仅需30秒的音频就能实现音色克隆。

⏱️ 端到端的延迟已低于250毫秒,接近人与人之间的对话节奏。

🌐 该技术支持教育、客服和智能硬件等多个场景的应用。

2、蚂蚁数科Agentar推出“金融AI大脑”,被评选为国际标准卓越案例

本文介绍了蚂蚁数科与宁波银行共同开发的Agentar知识工程KBase案例,该案例被成功选为国际标准金融应用的卓越案例。此方案运用知识工程技术解决了金融机构的知识孤岛问题,构建了智能决策系统,显著提高了服务效率和准确性,并具备良好的可解释性,为金融行业的智能化转型树立了新的标杆。

【AiBase提要:】

🧠 Agentar知识工程平台实现对多源异构数据的全生命周期管理。

💡 该系统通过“规划-检索-推理”机制提升了知识质量和人工智能的逻辑推理能力。

🔒 强有力的可解释性确保了生成式AI在金融领域的安全合规应用。

3、智源推出Emu3.5大模型:以“下一状态预测”重塑多模态智能,具身操作能力令人惊艳

智源发布的Emu3.5大模型,通过“下一状态预测”技术重新定义了多模态智能,展现出强大的具身操作能力,标志着AI的感知理解已迈向智能操作的重要一步。

【AiBase提要:】

🧠 Emu3.5引入自回归式“下一状态预测”(NSP)框架,实现了多模态序列建模的突破。

🖼️ 支持文图协同生成、智能图像编辑以及时空动态推理,提升了跨模态操作能力。

🔄 打破信息孤岛,实现文本、视觉和动作等模态的统一编码,支持跨模态的自由切换与协同推理。

4、Cursor 2.0重磅发布!自研模型Composer速度提升4倍,8个AI Agent并行编码,开发者效率迎来“爆炸性”升级

Cursor 2.0的推出,标志着其从智能补全插件向多智能体协作开发平台的转型,通过自研模型Composer和多Agent界面,显著提升了开发效率和质量。

今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!

【AiBase提要:】

🧠 Composer模型专为代理式编码而设计,采用强化学习与混合专家架构,响应速度提升了4倍。

ParallelGroup多个AI Agent同时工作,支持独立处理任务,显著提高复杂项目的开发效率。

🔄 全流程自动化功能整合了代码审查、测试及执行,减少了上下文切换,增强了开发者的专注度。

5、xAI升级Grok Imagine iOS版:新增视频生成与提示重混功能

xAI宣布,他们的Grok Imagine工具iOS版本将推出视频生成功能,用户可以通过文本或图像提示生成高清动态视频,并且可以直接从内容提要中重混提示。该功能基于Aurora/Grok核心模型进行了优化,提升了操作的流畅性,非常适合短片、广告以及创意内容的制作。

今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!

【AiBase提要:】

🎥 新增的视频生成功能允许通过文本或图像提示生成高清动态视频。

🔄 提示重混机制降低了创作的门槛,使得创作过程更为便捷。

📱 iOS版本优先更新,Android及网页版也将在后续推出,进一步增强移动端的AI创作能力。

6、OpenAI发布创新安全模型gpt-oss-safeguard,增强AI领域的风险应对能力

OpenAI推出的gpt-oss-safeguard系列模型在人工智能安全方面提供了更大的灵活性与个性化选项。这些模型能够依据开发人员设定的安全策略进行消息分类,并提供相应的推理解释。不过,值得注意的是,这些新模型在处理速度及资源使用上存在一定的限制,因此在某些情况下,其表现可能不及传统的分类器。

【AiBase提要:】

🛡️ OpenAI发布了gpt-oss-safeguard-120b与gpt-oss-safeguard-20b两款新型安全模型,支持灵活定制安全政策。

⚙️ 新模型可以依据输入的安全政策对用户的消息和对话进行分类,同时提供推理依据。

📊 尽管新模型具备一定优势,但在某些场合下,传统分类器的效果可能更为显著,并且新模型资源消耗较为庞大。

详情链接
:https://huggingface.co/collections/openai/gpt-oss-safeguard

7、TikTok推出AI剪辑工具“Smart Split”,助力创作者轻松制作与策划内容

在美国创作者峰会上,TikTok发布了三项全新功能,其中包括由人工智能驱动的视频剪辑工具“Smart Split”、内容规划工具“AI Outline”,以及更新的创作者收益分成政策,旨在提高创作者的工作效率和盈利能力。

今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!

【AiBase提要:】

🎥 TikTok推出的AI剪辑工具“Smart Split”,可自动生成短视频和字幕。

📝 新的内容规划工具“AI Outline”帮助创作者轻松制定视频大纲。

💰 优化后的分成政策允许优秀创作者获取高达90%的收益分成。

8、微软发布Agent Lightning:全新AI框架助力大规模语言模型的强化学习训练

微软推出的Agent Lightning是一个开源框架,旨在通过强化学习提升多代理系统的性能,而无需对现有架构进行重构。

今日AI动态:MiniMax Speech 2.6音色复刻新发布,TikTok推出“Smart Split”AI剪辑工具,Cursor 2.0震撼上线!

【AiBase提要:】

🧠 Agent Lightning将代理建模为部分可观测的马尔可夫决策过程,从而提升决策策略的性能。

🚀 此框架支持在不重构现有系统的情况下优化多代理系统,实现训练过程的解耦。

📈 实验结果显示,在文本转SQL、增强生成检索和数学问答任务上均表现出显著的性能提升。

详情链接
:https://arxiv.org/abs/2508.03680v1

来源:今日头条
原文标题:AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布 - 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!
广告也精彩

No comments

No comments...