今天分享的是:中国银河-科技行业专题报告:DeepSeek:技术颠覆or创新共赢
报告共计:44页
该文档聚焦科技行业,以DeepSeek为核心展开多方面探讨,涵盖大模型发展、应用场景、硬件布局等内容。
1. DeepSeek大模型进展:DeepSeek发展迅速,2024年发布首个大模型DeepSeek LLM ,并不断迭代。2025年1月发布的R1模型在大模型排名中升至全类别大模型第三。其推理模型也已上线,不同版本如DeepSeek - R1 - Distill - owen - 1.5B等在多项基准测试中表现各异,在AIME 2024、MATH - 500等测试任务上,部分模型成绩突出,与GPT - 4o、Claude - 3.5 - Sonnet - 1022等模型形成竞争态势。
2. 技术架构与数据处理:DeepSeek V3采用MLA和DeepSeekMoE架构,实现高效推理和经济化训练。在数据处理方面,通过反事实数据增强等方式提升数据质量,利用多样化数据集训练模型,语言建模性能随模型规模、数据集大小和计算量的增加而提升。
3. AI原生App与硬件布局:2024年AI原生App整体月活跃用户规模增长,月人均使用时长和次数呈上升趋势。互联网企业和AI企业积极布局智能硬件,如百度的小度耳机、阿里巴巴的爱富耳机等。智能硬件成为LLM的重要载体,涵盖智能穿戴、智能家居、教育硬件等领域,实现了LLM从网页应用到移动端应用再到与硬件深度结合的发展,拓展了LLM的应用场景。
4. LLM的广泛应用:LLM在多领域应用广泛。游戏领域,可助力创作和运营,缩短开发周期、精准分析用户;电商领域,通过分析用户数据提升转化、优化库存;营销领域,实现精准广告投放和个性化内容生成。同时,在教育、医疗、机器人等领域也有潜在应用价值,推动各行业的智能化发展。
5. 未来展望:随着技术发展,LLM在资源效率、可扩展性、与硬件融合等方面将持续创新,为更多行业带来变革,其应用场景也将进一步拓展,推动科技行业不断向前发展 。
以下为报告节选内容