基于PaddleNLP实现DeepSeek-R1模型蒸馏

·基于PaddleNLP三步实现DeepSeek-R1模型蒸馏:基于飞桨框架3.0,支持DeepSeek V3/R1满血版及蒸馏版的FP8推理,性能较FlashMLA提升23%,每秒输出Token数达2000以上,高效满足大规模推理需求;开源数据蒸馏、训练、评测全流程,训练效率相较LLama-Factory提升1.8倍;支持动态图部署(简单易用)与服务化部署(高效稳定),全面适配多样化应用场景。

·3月25日(周二)19:00直播为您深度解析基于飞桨框架3.0实现DeepSeek-R1模型蒸馏全流程,熟练掌握模型产线部署技巧。
·3月31日(周一)实战营将带您以DeepSeek-R1模型蒸馏为示范项目开展PaddleNLP实战营,手把手带您体验完整开发流程,体验飞桨框架3.0在推理和部署方面的强大能力。
您的姓名:
*
您的身份是:
数据科学家
机器学习工程师
软件开发工程师
嵌入式系统工程师
产品经理
企业负责人
项目负责人
研究员/学者
老师
学生
其他
*
请输入您的手机号码:
*
单位名称(如:百度在线网络技术有限公司):
*
您/您所在单位的AI技术方向:
【多选题】
信息抽取
中文分词
命名实体识别
情感分析
文本纠错
交互式闲聊对话
生成式问答
大模型训练及应用
大模型精调
大模型强化学习
大模型服务化部署
其他
*
您使用的训练硬件主要为:
【多选题】
NVIDIA
昇腾
昆仑芯
海光
寒武纪
燧原
天数智芯
其他
*
您使用的推理硬件主要为:【多选题】
NVIDIA
Intel
昇腾
昆仑芯
寒武纪
燧原
天数智芯
登临
其他
*
您基于什么需求使用/计划使用PaddleNLP?【多选题】
企业有AI业务转型、AI业务落地需求,主要服务客户项目交付
希望快速提升企业内部业务开发效率、降低生产成本
希望快速提升个人算法能力
*
您计划将PaddleNLP应用于哪些领域:【多选题】
政企服务
工业制造
能源电力
交通
智慧城市
金融
教育
医疗
文化传媒
电商
运营商
仓储物流
建筑工程
其他
(可不填写)为了高效定位到您的诉求,您可在此详述您的业务需求或补充改问卷选项未能涵盖的事项,如您需要,我们将尽快与您取得联系。
包括但不限于:业务支持需求或飞桨技术支持需求,如技术文档、企业培训、线上课程、线下闭门交流等。
问卷星提供技术支持
举报