Tags:推理模型
DeepSeek-V3的3个隐藏功能,90%的人不知道
一、多轮对话的"记忆保鲜"模式在官方文档的多轮对话指南中,DeepSeek-V3其实藏着一个智能记忆管理机制。当用户连续发起5轮以上对话时,系统会自动启用「上下文压缩」技术,将历史对……
DeepSeek-V3来了,这三个功能太惊艳!
「这次更新,连程序员都直呼内行」DeepSeek-V3的发布在开发者圈掀起热议。作为国内领先的AI大模型平台,这次升级不仅延续了前代产品的技术优势,更在功能实用性上实现突破。本文将……
DeepSeek-V3的3个隐藏技巧,90%的人不知道
技巧一:参数调优让模型表现更精准许多开发者直接调用DeepSeek-V3的默认参数设置,却不知道通过微调temperature和max_tokens参数能显著提升输出质量。当处理需要严谨逻辑的编程任务……
DeepSeek-V3上线,这3个功能必知
一、多轮对话支持:让AI更懂上下文DeepSeek-V3最显著的变化是增强了多轮对话处理能力。通过API的`create-chat-completion`接口,开发者可以轻松实现连续对话功能。系统会自动保留最……
DeepSeek-V3上线,这三个新功能亮了
DeepSeek-V3上线,这三个新功能亮了AI大模型领域再添重磅选手!DeepSeek最新发布的V3版本以"更快、更准、更智能"为核心升级方向,在开发者社区引发热议。本文将带你深入解析这一版……
DeepSeek-V3的3个隐藏技巧,99%的人不知道
隐藏技巧一:参数调优让模型更"听话"DeepSeek-V3的默认参数设置能满足基础需求,但通过调整`temperature`和`top_p`参数,你会发现模型表现有质的飞跃。当处理需要稳定输出的场景(……
DeepSeek-R1推理模型实战教程:高效API调用与参数设置技巧
随着人工智能技术的快速发展,DeepSeek推出的DeepSeek-R1推理模型凭借其高效的逻辑推理能力和多场景适配性,迅速成为开发者关注的焦点。本文将从零开始,手把手教你如何快速接入这……
开源推理 AI 模型 Sky-T1,训练成本不到450美元
加州大学伯克利分校SkyComputing实验室的研究团队NovaSky发布了一款名为Sky-T1-32B-Preview的推理模型。并表示在多项推理和编码基准测试中,该模型性能与o1-preview相当。“值得注意……