今天分享的是:2025年DeepSeek完全实用手册V1.0-从技术原理到使用技巧-至顶AI实验室
报告共计:117页
《2025年DeepSeek完全实用手册V1.0-从技术原理到使用技巧》由至顶科技至顶AI实验室发布,全面介绍了DeepSeek相关内容。DeepSeek是幻方量化旗下专注通用人工智能的公司,其V3和R1模型备受关注,V3在多任务处理表现出色,R1专注代码生成和复杂数学问题解决 。该模型火爆的原因在于性能比肩OpenAI o1模型且对中文支持更好,训练和推理成本低,并且完全开源,得到业界认可 。在技术路线上,DeepSeek采用混合专家MoE、多头潜在注意力MLA等技术降低成本,通过强化学习中的群体相对策略优化(GRPO)提升性能 。关于热点话题,其V3成本不止550万美元,且无证据表明R1蒸馏数据来自OpenAI,同时它也未绕过CUDA 。在调用与部署方面,DeepSeek R1可通过云端和本地两种方式使用,云端调用便捷,本地部署适合对数据安全要求高的场景,众多厂商还推出了相关一体机 。在使用方法上,DeepSeek可独立使用,用于文本创作等场景,官方提供多种提示词示例;也可与多种工具组合使用,如在办公增效、创意设计、AI音视频、编程辅助等领域,提升工作效率 。此外,报告指出开源模型将推动AI应用生态繁荣,推理模型有望成为主流,各行业都将加速接入AI技术 。同时需注意,DeepSeek R1模型幻觉率相对较高,使用时应甄别结果 。在最新动向中,DeepSeek于2025年2月24日起启动开源周,开源多个代码库,为AI发展提供助力 。
以下为报告节选内容