·基于PaddleNLP三步实现DeepSeek-R1模型蒸馏:基于飞桨框架3.0,支持DeepSeek V3/R1满血版及蒸馏版的FP8推理,性能较FlashMLA提升23%,每秒输出Token数达2000以上,高效满足大规模推理需求;开源数据蒸馏、训练、评测全流程,训练效率相较LLama-Factory提升1.8倍;支持动态图部署(简单易用)与服务化部署(高效稳定),全面适配多样化应用场景。
评价对象得分