行业首批!腾讯云TI平台支持DeepSeek全系模型精调与推理
创始人
2025-02-21 04:21:18
0

近日,DeepSeek全系列模型在腾讯云TI平台上第一时间上架,并在业内率先实现企业级精调与推理全链路功能

此次支持精调的模型涵盖了满血版DeepSeek V3、R1以及六款蒸馏版模型,为金融、医疗、制造、零售等多个行业提供了更高效、便捷的AI模型构建及应用方案,进一步降低企业在大模型应用中的技术门槛和研发成本。

随着DeepSeek引发行业广泛关注,开发者在精调与部署过程中可能面临数据预处理难、模型训练门槛高、在线部署及运维复杂等多重挑战。

腾讯云TI平台凭借全流程AI开发工具,实现了从数据准备到模型部署上线的一站式解决方案。平台内置的数据构建模块不仅支持快速清洗、去重与格式转换,还能根据具体任务进行Prompt优化。同时,通过灵活的训练调度策略和自研的大模型计算与并行优化技术,TI平台可以有效加速训练与推理过程,大幅提升资源利用率。

支持DeepSeek的两种精调方式

满足多样化需求

为适应不同行业的个性化模型构建需求,腾讯云TI平台面向DeepSeek提供了两种精调模式。

一、直接精调满血版DeepSeek。针对希望直接对原始DeepSeek模型进行微调的用户,平台内置DeepSeek满血版等全系模型,并预置训练镜像和训练代码,用户只需按平台规范准备好训练数据,并设置学习率、迭代步数等参数,即可一键启动精调任务。

在训练阶段,平台支持全参和LoRA两种精调方式,为用户提供兼顾训练成本和模型效果的灵活选择,确保模型在金融、医疗等垂直领域满足业务要求。在数据准备阶段,平台内置了可高度自定义的数据标注和构建工具,显著提升数据质量,并有效降低数据处理成本。

直接精调满血版 DeepSeek 的步骤如下:

步骤一:训练数据准备。根据原始数据的实际情况,综合使用数据标注和数据构建工具来准备高质量训练数据。其中,数据标注可基于灵活Schema配置得到高度自定义的人工标注工作台,适配绝大多数标注场景;数据构建内置数据分析、清洗、去重、Prompt优化、格式转换等环节的代码脚本,支持用户灵活处理各类文本数据。

步骤二:一键发起模型精调。在“大模型广场”或者“任务式建模”模块选择DeepSeek模型;选择步骤一中准备的数据路径,设置学习率、迭代步数等参数,即可发起训练任务。支持全参和LoRA两种策略,供用户按需选择精调场景。

二、基于DeepSeek R1蒸馏其他较小尺寸模型。DeepSeek R1虽具备卓越的长思维链(Long CoT)能力,但模型尺寸大(参数量671B),实际推理成本较高。针对希望以更低成本、更高响应速度应用R1的用户,TI平台也支持基于R1蒸馏其他较小尺寸模型,可将R1的能力迁移至较小尺寸的“学生”模型中。

用户首先在TI平台部署DeepSeek R1推理服务,然后调用R1生成包含长思维链的高质量蒸馏数据,紧接着进行数据清洗,最后利用这些数据对较小尺寸的“学生模型”(如Llama 3.2-3B)进行精调,从而实现知识迁移。在保留优秀推理性能的同时,大幅降低推理成本或提升模型推理速度,有效满足高推理性能或成本敏感的场景。

基于DeepSeek R1蒸馏其他较小尺寸模型的步骤如下:

步骤一:部署DeepSeek-R1推理服务。在腾讯云TI平台的在线服务模块部署 DeepSeek R1推理服务,体验对话效果。

步骤二:基于DeepSeek-R1 蒸馏数据。在数据构建模块中将原始训练数据集进行解析、清洗,然后调用DeepSeek R1生成高质量带长思维链的蒸馏数据,并对蒸馏数据再次进行分析、清洗、去重、Prompt优化、格式转换等环节,得到可用于训练的数据集。

步骤三:精调较小尺寸的“学生模型”。在“大模型广场”或者“任务式建模”模块选择Llama等其他较小尺寸的“学生模型”;选择步骤二中准备的数据路径,设置学习率、迭代步数等参数,即可发起训练任务。

提供模型评测及部署完整工具链

助推行业智能转型

腾讯云TI平台还提供了全面的模型评测与部署功能。模型评测包括轻量体验、客观评测和主观评测三阶段能力,帮助企业多维度验证模型性能。模型部署支持多种模型框架和格式,支持异构算力和资源弹性伸缩,可将模型快速发布为生产级API接口,接入企业应用。

自 DeepSeek 模型发布以来,TI 平台已成功助力多个行业客户部署专属 DeepSeek 服务并开展验证工作,部分已接入企业应用。未来,腾讯云将持续优化TI平台功能,依托领先的大模型训练推理技术,为客户提供更安全、稳定、高效的AI解决方案,助推各行业加速数字化转型。

相关内容

热门资讯

看不见的守护者:空气洁净度检测... 一粒0.5微米的尘埃落在芯片上,可能引发电子设备故障;手术室中每立方米大于0.5微米的尘埃超过352...
萤石推出蓝海大模型2.0,感知... 日前,视觉物联网云平台萤石正式推出萤石蓝海大模型2.0、 EZVIZ HomePlay OS 全栈开...
二七区建新街小学锦旗无言谢师恩 二七区建新街小学锦旗无言谢师恩 大象新闻记者 李书恒 通讯员 徐淑敏/文图 6月30日清晨,二七区建...
Windows留不住人:3年痛... 快科技6月30日消息,微软在近期的一篇关于Windows 10将停止支持的博客文章中指出“今天,Wi...
金马游乐获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示金马游乐(300756)新获得一项发明专利授权,专利名为“一种...
从黑板调度到算法协同,网络货运... 编者按 | 为进一步深化数据要素在各领域的创新应用,促进数据要素价值释放,持续挖掘数据要素应用赋能优...
望变电气获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示望变电气(603191)新获得一项实用新型专利授权,专利名为“...
阳城县玉米播种迈向智能化 本报讯 连日来,在阳城县润城镇屯城村的高标准农田里,搭载北斗导航系统的三角定苗水肥一体化精播机格外引...
AI技术革新心脏诊疗:量子与人... 谈论AI在医疗保健领域的应用是一码事,但描述这种变革如何发生——身体系统如何与技术相互作用,产生令人...
长春市开展中小学“科普专家进校... 近日,长春市中小学“科普专家进校园”航空航天专题科普活动开展。活动邀请中国人民解放军空军航空大学教员...
马斯克确认:人形机器人Opti... 6月27日消息,据外媒报道,特斯拉首席执行官埃隆·马斯克确认,人形机器人擎天柱V3已经启用了Grok...
从实验室到万亿赛道,这位院士要... 近日,民航局发布《民用无人驾驶航空器系统分布式操作自动化等级测试》,中航无人机、亿航、迅蚁、美团、拓...
DeepSeek在德国面临苹果... 通信世界网消息(CWW)近日,据外媒报道,德国一家数据保护监管机构要求苹果公司和谷歌考虑在该国应用商...
打破国外长期垄断局面 【深圳商报讯】(记者 张妍)近日,我国高性能硅光电倍增器(SiPM)国产化取得重大突破。记者从中广核...
“空中运输”解公路边坡隐患处置... 一架双轴四旋翼无人机在235国道溪南镇后溪段腾空而起,仅用两三分钟,便将100公斤施工材料精准运抵4...
北斗共享电动自行车落地株洲,首... IT之家 6 月 30 日消息,今天,“智联时空,全域示范”千寻时空落地揭牌暨北斗电动自行车投放仪式...
原创 小... 世界就是个巨大的草台班子。 这两天,有关小米YU7赛道测试,刹车起火的热搜再一次印证了这句话。 6...
华为申请一种通信方法及装置专利... 金融界2025年6月30日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“一种通信方法及...
三点更新|爱与陪伴是最好的“防... 文案|周泽中 出镜|张英 后期|曹婉蓉(实习) 现如今,在公交车上、公园里,常常能看到不少老年人通过...
《吞食者》XR首映西安,虚拟现... 在西安骡马市民生购物中心的奥斯卡XR未来影院,一场前所未有的电影体验正在紧锣密鼓地筹备中。6月25日...