飞桨(PaddlePaddle)以
百度集团多年的
深度学习技术研究和业务应用为基础,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台。
飞桨在业内率先实现了动静统一的框架设计,兼顾科研和产业需求,在开发便捷的深度学习框架、大规模分布式训练、高性能推理引擎、产业级模型库等技术上处于国际领先水平。飞桨是百度“芯片-框架-模型-应用”全栈技术布局的重要组成部分。
国际权威数据调研机构IDC发布的《中国深度学习框架和平台市场份额,2022H2》报告显示,
百度集团稳居中国深度学习平台市场综合份额第一。中国信息通信研究院联合深度学习技术及应用
国家工程研究中心发布了《深度学习平台发展报告(2022)》,指出百度飞桨是中国市场应用规模第一的深度学习框架和赋能平台。
飞桨还推动建设了软硬件适配的国家标准。由
中国电子技术标准化研究院牵头,百度、曙光、飞腾、浪潮一起联合起草了国家标准《人工智能 深度学习框架多硬件平台适配技术规范》。
截至2023年8月飞桨已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型,广泛服务于金融、能源、制造、交通等领域。
简介
官方公布的结果来看,百度飞桨(PaddlePaddle)指出,兆芯科技的ZX-C、ZX-C+、KX-5000、KX-6000、KH-2000、KH-3000系列处理器和
centos操作系统软件V7平台上,功能、性能、
兼容性、可靠性、稳定性可满足用户需求。
拥有自主
知识产权、完全独立生产,关键可堪一用的CPU,一直被中国科技产业的所期盼。虽然我们目前离这个目标还有一些距离,但是梦想也正在一步一步被拉进。日前上海兆芯宣布通过了
百度集团飞浆AI框架的认证,可满足一般应用的需求,完全可堪一用。
发展历程
训练框架:增加自动混合精度训练AMP接口和新控制流接口;优化Tensor使用方式和
显卡内存分配策略;新增支持
英伟达 DALI GPU数据预处理库;持续优化基础OP的功能和性能;动态图的功能进一步完善,性能大幅提升,对
数据 Independent的动态图模型提供转为静态图可预测部署模型的功能;框架调试分析功能和
易用性全面提升。
预测部署:服务器端预测库的
Python API大幅优化,新增R语言、Go语言的预测API,并增加相关的使用方法和示例,强化了量化支持能力;Paddle Lite支持无校准数据的训练后量化方法生成的模型,加强对OpenCL的支持,支持昆仑XPU的预测;模型压缩库PaddleSlim重构裁剪、量化、
蒸馏、搜索接口,与模型库充分打通,新增大规模可扩展知识蒸馏框架Pantheon。
分布式训练:参数服务器模式下统一了Transpiler半异步、全异步和GEO的实现模式,后端实现上统一到Communicator中,前端接口统一到fleet中,通过fleet strategy灵活选择不同模式;发布大规模分类库PLSC,通过模型并行支持超多类别的分类任务。
基础模型库:发布
语音合成库Parakeet,包括多个前沿合成算法;PaddleCV新增14个图像分类预训练模型,3D和跟踪方向模型持续丰富;PaddleNLP的
分词和词性标注模型支持jieba分词;PaddleRec增加多任务模型MMoE;模型库整体增加了广泛的动态图模型实现。模型库整体层次结构做了调整优化。
端到端开发套件:PaddleDetection和PaddleSeg新增大量模型实现及预训练模型,提升了典型模型的训练速度和精度,大幅提高模型压缩和部署能力,使用体验得到了全面优化;发布ElasticRec推荐排序系统,通过
kubernetes进行部署,支持流式训练和在线预测服务。
工具组件:PaddleHub新增52个预训练模型,总数超过100,功能和体验持续优化;多任务学习框架
Palm升级内核,开放API调用,支持更多的任务类型;联邦学习PaddleFL新增了公开
数据集;
深度强化学习框架PARL和飞桨图学习框架PGL也对应版本升级,支持更多功能,开放更多算法和基线。
训练框架:深度优化了命令式编程(动态图)功能、性能和体验,特别是增强了动静转换的能力,能支持依赖数据的控制流的动态图实现进行静态存储部署,也可以转为静态图模式训练;
数据 Loader的功能和
梯度裁剪的使用方式进一步优化;声明式编程模式下多卡运行时fetch不定长Tensor等问题得到解决,混合精度配合重计算显示出支持大Batch训练很好的成效。新增了大量API,并新增 ComplexVariable,支持
复数张量的表示和常见的复数运算。
预测部署:Paddle Inference 新增CUDA下
多线程多流支持、TRT子图对动态shape输入的支持,强化量化推理,性能显著优化;Paddle Serving 全面升级,功能完善,
易用性显著提升;Paddle Lite进一步优化编译安装体验,全面提升对支持芯片的覆盖度(包括RK、
联发科技、
百度集团昆仑、
寒武纪、比特大陆、
华为NPU等等)以及对应的模型数量和性能;PaddleSlim量化、裁剪和NAS功能持续强化;发布国内首个开源
ECMAScript深度学习前端推理引擎Paddle.js,可以帮助用户实现网页端深度学习模型部署。
开发套件:全新发布PaddleClas,包含23个图像
分类网络实现,117个图像预训练模型,并添加了数据增广、SSLD蒸馏等辅助策略,以及特色应用案例;PaddleSeg人像分割系列模型全面升级,新增多种
遥感相关的策略方案;PaddleDetection、PaddleOCR和
语音合成套件Parakeet算法覆盖更全面,速度显著提升。
工具组件:PaddleHub新增包括一系列视觉预训练模型在内更多的模型,模型总数120+; PaddleFL发布1.0版本,开源基于Mulit-party Computation (MPC)的联邦学习,支持横向、纵向等多个联邦学习场景;PGL发布业界首个结合
语义信息与结构信息的图神经网络模型ERNIESage;PARL开源工业界首个进化学习应用框架Evokit;全新发布量子
机器学习框架量桨Paddle Quantum。
编程范式:默认开启动态图模式开发和训练模型,通过动转静的方式部署和加速模型训练。如果需要使用静态图编程范式,可以通过paddle.enable_static()来切换到静态图模式。
API体系:对API进行了补充,对
目录结构进行了调整,更加易用,详情请参见API文档,同时提供高层API简化使用流程;详情请参见飞桨高层API使用指南。
框架功能:对数据加载、动态图执行、OP性能、混合精度训练、分布式训练、动静转换等进行了功能增强和性能优化。
环境适配:提供了对ARM架构CPU的支持,增加了对
Python 3.8、CUDA 10.1/10.2的支持,发布支持CUDA 11的安装包(experimental),发布支持
百度集团昆仑芯片的安装包(experimental),详情请参见官网的开始使用部分。
模型库及开发套件:飞桨的官方模型库和套件的绝大部分模型已经升级至飞桨框架2.0.0版本。
PaddleHub:支持2.0动态图,全面迁移动态图编程范式,模型开发调试更加方便,Finetune接口更加灵活易用。
PaddleDetection: 支持2.0动态图,覆盖检测方向主流算法(PP-YOLO、Faster-RCNN、SOLOv2),支持动静转换,打通预测部署,提供了更加模块化的组网方式。
PaddleClas: 支持2.0动态图,提供了29个系列的分类算法和134个预训练模型,提供了基于SSLD知识蒸馏的优化方案,将分类模型的精度普遍提升3%以上。
PaddleSeg: 支持2.0动态图,提供了50+的高质量预训练模型,支持15+主流分割网络,提供了业界的SOTA模型OCRNet,很好的提升了产品
易用性。
PaddleOCR: 支持2.0动态图,PP-OCR系统、文字检测模型(DB、EAST、SAST)与文字识别模型(Rosetta,CRNN,StarNet)完成2.0动态图适配。
PaddleGAN:支持2.0动态图,所有模型,包括风格迁移、视频增强、唇形迁移、人脸动漫化等九种模型均基于动态图开发。
PaddleRec:支持2.0动态图,免安装,动静组网统一,方便用户的调研和上线,同时整理发布了推荐系统经典
数据集。
PaddleNLP:支持2.0动态图,提供25+预训练模型和易用的API方式,提升文本建模效率。
Parakeet:支持2.0动态图,已发布的
声学模型及
声码器均良好支持动态图版本。
PaddleVideo:支持2.0动态图,包含了视频分类和视频动作定位方向模型,包括: TSN、TSM、SlowFast、AttentionLSTM、BMN模型以及特色应用预训练模型VideoTag和FootballAction。
AmazonDJL:易用流畅的Java推理接口,支持各类操作系统平台(
麦金塔/Windows/Linux),支持飞桨预训练模型部署,更多的信息请参考DJL支持Paddle的官方文档。
环境适配: 增加了对
Python 3.9、CUDA 11.2的支持;提供了对ROCm平台的支持(experimental);提供了对昇腾AI处理器的支持(experimental);增加了可在
百度集团昆仑芯片上运行的模型数量;详情请见:开始使用。
分布式训练:在已有静态图的多维混合并行的基础上,新增动态图实现。
框架功能:完成了多项功能增强和性能优化,特别的,新增了以下重要功能:
自定义
映射:提供了在框架外部自定义算子的新方案,简化了自定义算子写法与训练推理部署流程,详情请见:自定义外部算子。
新增inplace操作:新增可降低
显卡内存占用与提升性能的inplace操作,包括View策略,与12个inplace API。
高层API相关:新增支持混合精度训练的高层API;新增通过paddle.hub来查看、共享、加载模型。
自动混合精度训练优化: 优化了混合精度训练中slice、where、range等多个op的计算性能,提升了在MaskRCNN、ERNIE等模型上的加速效果。
oneDNN下BF16训练:新增支持了AMP(AutoMixedPrecision) pure_BF16模式; 新增支持了BF16类型的SGD和initializers初始值设定并减小了
内存;新增支持了大部分word2vec BF16训练需要的前向和反向op。
模型库及开发套件:
PaddleHub: 新增轻量级中文对话模型plato-mini;新增基于VOC
数据集的高精度语义分割模型2个,语音分类模型3个;新增图像语义分割、文本语义匹配、语音分类任务的Fine-Tune能力;新增ONNX和PaddleInference模型格式的导出功能。
PaddleOCR: 开源
百度集团自研端到端文本识别算法PGNet(AAAI 2021发表),多语言模型支持种类提升到80+,英文数字模型效果进一步优化。
PaddleDetection: 新增3个业界最广泛应用的多目标追踪算法:JDE、DeepSort、FairMot,并全面打通预测部署;新发布人体姿态预估算法HRNet和HigherHRNet;旋转框检测算法S2ANet全面打通预测部署;新增PP-YOLO Tiny的移动端部署Demo;支持批量预测。
PaddleX:支持2.0动态图;新增RestFul API,支持用户在本地控制远程服务器构建
深度学习训练任务;新增PaddleX Deployment模块,并与飞桨其他开发套件(PaddleClas,PaddleDetection,PaddleSeg等)打通,支持用户用更少的代码快速完成
C++ Inference部署预测。
PaddleGAN:新增动作驱动模型First Order Motion,支持单人及多人脸部动作迁移;新增视频超
分辨率模型EDVR,发布视频修复的复合解决方案。
PaddleSeg:新增全景分割场景,其中Anchor-Free算法PanopticDeepLab业界SOTA;高精度的人像分割模型humanseg升级为动态图版,并显著优化边缘锯齿问题;新增10中学习率策略;新增Weighted Cross Entropy Loss,针对样本类别不均衡场景优化效果显著;部署能力进一步完善,新增移动端部署和Web部署,并支持添加后处理算子(argmax/softmax)。
PaddleClas: 新增RexNet、MixNet、ViT和DeiT部署模型;增加面向不同能力开发者的中文文档;更新whl安装包。
PaddleNLP: 新增千言等特色中文
数据集,及NLP数据处理通用API;新增XLNET、ERNIE、RoBERTa、ALBERT、GPT、Unified_Transformer等中文预训练模型;新增知识关联WordTag、语义解析
文本to-
SQL、语义匹配SimNet、文本图学习ERNIE-Sage、情感分析SKEP、通用对话PLATO、小样本学习P-Tuning等应用场景;新增
变压器解码模块,支持高性能推理。
PaddleRec: 新增召回模型MIND,升级PLE, FFM等5个模型到2.0API和支持动态图;新增
可视化支持,引入VisualDL;支持开源工具Milvus用于
向量存储和召回服务,并提供教程;新增推荐系统公开
数据集12个;支持单机多卡,多机多卡等多GPU训练环境;支持inference预测库和serving部署能力;支持Perf的DNN、DeepFm、Wide\u0026Deep的Benchmark功能;新增完善动转静,预测部署,可视化等文档。
Parakeet:新增音色
克隆功能;集成VisualDL实现
可视化分析。
PaddleHelix:全面从静态图升级到动态图。新增2个新应用:分子生成和药物联用;新增6个新模型:
蛋白质化合物亲和力预测2个,分子生成3个,药物联用1个;新增多个
数据集和升级基础模块;修复已知bug。
Paddle Quantum:新增量子数据编码模块,支持量子核方法的模拟,并提供相关教程;增加新的噪声模型,模拟真实量子计算环境;新增多个双量子比特门,包括
离子阱量子计算设备原生门;新增打印电路功能,方便查看电路结构及参数;新增变分影子量子学习(AAAI 2021发表)、旅行商问题等多个教程。
Paddle Lite:提升opt和推理库体积压缩的
易用性;支持armv8.2 FP16指令计算;大幅提升OpenCL相关计算性能;新增支持
英特尔 FPGA。
Paddle Serving:集成开源框架2.1 inference;支持FP16和INT8的低精度推理;通过
kubernetes部署Serving服务;新增安全网关与Serving协同部署;X86 + XPU环境部署Serving服务。
Paddle.js: 完善WebGPU/NodeGL后端; 新增Float16模型格式及WebGL Pack加速功能;新增算子OP总数达到43个;封装数据处理API,引入numjs。
技术优势
飞桨深度学习框架基于编程一致的深度学习计算抽象以及对应的前后端设计,拥有易学易用的前端编程界面和统一高效的内部核心架构,对普通开发者而言更容易上手并具备领先的训练性能。飞桨自然完备兼容命令式和声明式两种编程范式,默认采用命令式编程范式,并完美地实现了动静统一,开发者使用飞桨可以实现动态图编程调试,一行代码转静态图训练部署。飞桨框架还提供了低代码开发的高层API,并且高层API和基础API采用了一体化设计,两者可以互相配合使用,做到高低融合,确保用户可以同时享受开发的便捷性和灵活性。
飞桨突破了超大规模深度学习模型训练技术,领先其它框架实现了千亿稀疏特征、万亿参数、数百节点并行训练的能力,解决了超大规模深度学习模型的在线学习和部署难题。此外,飞桨还覆盖支持包括模型并行、
流水线并行在内的广泛并行模式和加速策略,率先推出业内首个通用异构参数服务器架构和4D混合并行策略,引领大规模分布式训练技术的发展趋势。
飞桨对推理部署提供全方位支持,可以将模型便捷地部署到云端服务器、移动端以及边缘端等不同平台设备上,并拥有全面领先的推理速度,同时兼容其它开源框架训练的模型。飞桨推理引擎支持广泛的AI芯片,特别是对国产硬件做到了全面的适配。
飞桨建设了大规模的官方模型库,算法总数达到270多个,包含经过产业实践长期打磨的主流模型以及在国际竞赛中的夺冠模型;提供面向语义理解、图像分类、目标检测、
图像分割、文字识别(OCR)、
语音合成等场景的多个端到端开发套件,满足企业低成本开发和快速集成的需求。飞桨的模型库是围绕国内企业实际研发流程量身定制打造的产业级模型库,服务企业遍布能源、金融、工业、农业等多个领域。
工具组件
AutoDL
飞桨自动化
深度学习工具,旨在自动网络结构设计,开源的AutoDL设计的图像
分类网络在CIFAR10
数据集正确率达到 98%,效果优于目前已公开的10类人类专家设计的网络,居于业内领先位置。(数据来源:内部测试10种网络分别为:vgg_15_BN_64、vgg_16、resnet_32、resnet_56、resnet_110、resnet_v2_bottleneck_164、wide_resnet、densenet_BC_100_12、resnet_29_8x64d、shake_shake_64d_cutout,实际结果可能受测试环境影响而在一定范围内变化,仅供参考)
PARL
飞桨
深度强化学习框架PARL,在2018、2019、2020夺得强化学习挑战赛三连冠。具有高灵活性、
可扩展性和高性能的特点。实现了十余种主流强化学习算法的示例,覆盖了从单智能体到多智能体,离散决策到连续控制不同领域的强化学习算法支持。基于GRPC机制实现数千台CPU和GPU的高性能并行。
飞桨多任务学习框架PALM,一个灵活、通用且易于使用的NLP大规模预训练和多任务学习框架,旨在快速开发高性能NLP模型的上层框架。使用PALM可以非常轻松灵活的探索具有多种任务辅助训练的“高鲁棒性”阅读理解模型,基于PALM训练的模型D-Net在EMNLP2019国际阅读理解评测中夺得冠军。
PaddleFL
飞桨联邦学习框架PaddleFL,研究人员可以很轻松地用PaddleFL复制和比较不同的联邦学习算法,便捷地实现大规模分布式集群部署,并且提供丰富的横向和纵向联邦学习策略及其在
计算机视觉、自然语言处理、推荐算法等领域的应用。此外,依靠着飞桨的大规模分布 式训练和
kubernetes对训练任务的弹性调度能力,PaddleFL可以基于全栈开源软件轻松部署。
PGL
飞桨图学习框架PGL,业界首个提出通用消息并行传递机制,支持百亿规模巨图的工业级图学习框架。PGL基于飞桨动态图全新升级,极大提升了
易用性,原生支持异构图,支持分布式图存储及分布式学习算法,覆盖30+图学习模型,包括图语义理解模型ERNIESage等。历经大量真实工业应用验证,能够灵活、高效地搭建前沿的大规模图学习算法。
Paddle Quantum
量桨Paddle Quantum,飞桨量子
机器学习框架,提供量子优化、
量子化学等前沿应用工具集,常用量子电路模型,以及丰富的量子机器学习案例,帮助开发者便捷地搭建量子神经网络,开发量子
人工智能应用。
PaddleHelix
飞桨螺旋桨生物计算框架PaddleHelix,开放了赋能疫苗设计,新药研发,精准医疗的AI能力。在
新型冠状病毒疫苗设计上,PaddleHelix的LinearRNA系列算法相比传统方法在RNA折叠上提升了几百上千倍的效率;在新药研发上,PaddleHelix提供了基于大规模数据预训练的分子表示,助力分子性质预测,
药物筛选,
药物设计等领域;在精准医疗上,PaddleHelix提供了利用
组学信息精准定位药物,提升治愈率的高性能模型。
PaddleHub
飞桨预训练模型应用工具PaddleHub,覆盖文本、图像、视频、语音四大领域超过200个高质量预训练模型。开发者可以轻松结合实际业务场景,选用高质量预训练模型并配合Fine-tune API快速完成模型验证与应用部署工作。适用于个人开发者学习、企业POC快速验证、参加AI竞赛以及教学科研等多种业务场景。
PaddleX
飞桨全流程开发工具PaddleX,以低代码的形式支持开发者快速实现
深度学习算法开发及产业部署。提供极简Python API和
可视化界面Demo两种开发模式,可一键安装。针对CPU(OpenVINO)、GPU、
树莓派等通用硬件提供完善的部署方案,并可通过RESTful API快速完成集成、再开发,开发者无需分别使用不同套件即可完成全流程模型生产部署。可视化推理界面及丰富的产业案例更为开发者提供飞桨全流程开发的
最佳实践。
VisualDL
飞桨可视化分析工具VisualDL,以丰富的图表呈现训练参数变化趋势、模型结构、数据样本、高维数据分布、精度召回曲线等模型关键信息。帮助用户清晰直观地理解
深度学习模型训练过程及模型结构,进而实现高效的模型调优、并将算法训练过程及结果分享。
PaddleCloud
飞桨云上任务提交工具,能够帮助您一键发起深度学习任务,为您提供快速打通云上计算资源通道,支持您快速发起单机/分布式飞桨核心框架训练任务,致力于推动AI应用更广泛地落地。
开发套件
ERNIE
飞桨语义理解套件, 基于持续学习语义理解预训练框架,使用多任务学习增量式构建预训练任务,支持各类训练任务的Fine-tuning,保证极速推理的Fast-Inference API,兼具灵活部署的ERNIE Service和具备轻量方案的ERNIE Tiny系列工具集。
PaddleClas
飞桨图像分类套件PaddleClas,目的是为工业界和学术界提供便捷易用的图像分类任务预训练模型和工具集,打通模型开发、训练、压缩、部署全流程,辅助其它高层视觉任务组网并提升模型效果,助力开发者训练更好的图像分类模型和应用落地。
PaddleDetection
飞桨目标检测开发套件PaddleDetection,旨在帮助开发者更快更好地完成检测模型的训练、精度速度优化到部署全流程。PaddleDetection以模块化的设计实现了多种主流目标检测算法,并且提供了丰富的数据增强、网络组件、损失函数等模块,集成了模型压缩和跨平台高性能部署能力。目前基于PaddleDetection已经完成落地的项目涉及工业质检、
遥感图像检测、无人巡检等多个领域。
PaddleSeg
飞桨
图像分割套件PaddleSeg,覆盖了DeepLabv3+、OCRNet、BiseNetv2、Fast-SCNN等高精度和轻量级等不同方向的大量高质量分割模型。通过模块化的设计,提供了配置化驱动和API调用等两种应用方式,帮助开发者更便捷地完成从训练到部署的全流程图像分割应用。
PaddleOCR
飞桨文字识别开发套件PaddleOCR,旨在打造一套丰富、领先且实用的OCR工具库,开源了基于PP-OCR实用的超轻量中英文OCR模型、通用中英文OCR模型,以及德法日韩等多语言OCR模型。并提供上述模型训练方法和多种预测部署方式。同时开源文本风格数据合成工具Style-
文本和半自动文本图像标注工具PPOCRLable。
PaddleGAN
飞桨生成对抗网络开发套件PaddleGAN,集成风格迁移、超
分辨率、动漫画生成、图片上色、人脸属性编辑、妆容迁移等SOTA算法,以及预训练模型。并且模块化设计,以便开发者进行二次研发,或是直接使用预训练模型做应用。
PLSC
飞桨海量类别分类套件PLSC,为用户提供了大规模分类任务从训练到部署的全流程解决方案。提供简洁易用的高层API,通过数行代码即可实现千万类别分类神经网络的训练,并提供快速部署模型的能力。
ElasticCTR
飞桨个性化推荐开发套件ElasticCTR,可以实现分布式训练CTR预估任务和基于Paddle Serving的在线个性化推荐服务。Paddle Serving服务化部署框架具有良好的
易用性、灵活性和高性能,可以提供端到端的CTR训练和部署解决方案。ElasticCTR具备产业实践基础、弹性调度能力、高性能和工业级部署等特点。
Parakeet
飞桨
语音合成套件,提供了灵活、高效、先进的文本到语音合成工具,帮助开发者更便捷高效地完成语音合成模型的开发和应用。
企业版
飞桨企业版针对企业级需求增强了相应特性。包括提供更全面和强大的功能、更易用的
可视化界面,预置更丰富的场景模型,提供更强化的安全权限管理等。
相对于同类平台而言,飞桨企业版具有自主可控的底层飞桨开源框架支持,预置
百度集团积累的大规模数据训练而成的高精度预训练模型,全面支持安全高效的公有云和可灵活支持
私有化或本地部署。数据更安全、部署更灵活、训练精度更高、集成更便捷,让各类企业享受高质量的一站式AI开发服务。
飞桨企业版包含EasyDL零门槛AI开发平台和BML全功能AI开发平台:
应用落地
随着国产
大型运输机ARJ21、
C919等型号研制推进,中国商飞北研中心承担的航空复合材料许用值试验和疲劳门槛值试验日趋加重,对试验件的
无损检测和损伤检测需求逐渐增加。但由于无损检测过程中缺陷评定对检测人员的专业知识有依赖性强,设备开放程度低、检测数量大等问题,人工缺陷评定速度已成为制约型号任务进度的瓶颈。
针对项目落地面临的数据量少、应用场景复杂、检测精度要求高,以及AI开发能力薄弱等问题,商飞北研中心利用
百度集团飞桨PaddleSeg开发套件顺利完成了
复合材料检测算法的开发。首先,开发人员使用PaddleSeg集成的数据增强工具,结合航空复合材料超声图像数据的特征,轻松完成了数据大规模扩张;然后,通过对PaddleSeg官方提供的预训练模型U-Net和Deeplabv3进行训练、测试和多维度结果分析,选用了跟业务场景更契合的经典模型U-Net完成语义分割;最后,利用PaddleSeg提供的完善的
配置文件,非常便捷快速地完成了部署上线。
流程完成了智能化改进后,全流程用时仅5.3分钟,检测工时减少71%,准确率提升至95%,单批次试验人工成本减少21.63万元。有效减少了检测人员工作量,极大地缩短了
复合材料超声检测时长,有效加速了型号研制迭代速度,实现了勤俭研制
大型运输机的企业目标。
作为动力电池制造龙头企业,宁德时代新能源科技股份有限公司动力电池产量大、质检严,仅新能源车领域需要检测的参数就超过了3000个。为了保证电池品质,宁德时代要求产品线上的电池达到缺陷漏检率小于1DPPB、单张产品图像缺陷检测平均时长\u003c2ms检测标准。但动力电池缺陷种类复杂且差距小,想要通过传统质检方法达到
安全生产要求,需要耗费大量的人力财力:一条
流水线就需要十几个质检工人,而且不同的生产线标准不一样,需要人工逐个确认。
为了解决产业难点,
宁德时代通过
百度集团飞桨深度优化过的PP-YOLO和ResNet系列算法,提升了算法精度;通过调整预测Batch,采用
多线程数据预处理、优化数据
内存拷贝时间等策略,提升了检测精度及预测效率,使其充分适应实际生产需求。
采用电池质量智能化检测后,部分工序已经运用人工智能算法进行升级,整体产品检测相较于原本的传统检测算法过杀率降低了66.7%,缺陷漏检率小于1DPPB。算法泛化能力和在多产线上进行迁移部署的效率也得到了全面提升。不仅进一步保障了
宁德时代的
动力电池质量,也在一定程度上实现了低成本高效复用经验,大大降低了产线研发成本。
5G智能园区车辆行为识别
随着物联网设备连接和交互能力的大幅提升,园区车辆管理能力再次成为物流行业的主要瓶颈。采用传统的本地化监控系统,不仅监控位置不直观、无法云端观看,还需要配备高频次的人工巡检。异常处理时间长、作业效率低、人工失误不可避免。
京东物流运用飞桨PaddleDetection、PaddleSeg和PaddleSlim等开发套件,设计了一套完备的CV监控方案,实现了车辆智能化管控。通过目标检测和OCR来识别车牌、检测车辆(进入/离开园区),并针对货运车辆车牌形态多样化,采取数据增强方式确保样本覆盖现有业务场景。在用目标跟踪和状态识别来监控车辆状态的任务场景中,针对遇到的问题,研发团队将多路摄像头数据在训练阶段就混入了单模型的训练数据中,提高了目标跟踪过程的精确度;在状态识别过程中,充分考虑时序特征,提高了最终的识别精确度。
升级为可远端高清直播、可自动分析异常的智能化监控系统后,
京东物流的车牌识别率大幅提升,人员、场站、生产、监控、巡检五大领域管理能力实现了全面提升,迎来了从“被动型传统管理”到“主动型智能管控”的巨大转型,降低了人工误差的同时,有效提升了作业效率。
支持海量用户需求的大规模分布式推荐系统
OPPO自2018年起开始大举进军互联网业务,创立了信息流、信息流广告、应用商店、游戏中心、商业中心等诸多业务线,并迅速积累了大量的用户和数据。由于业务规模的急剧扩张, OPPO原来在单机上搭建的训练系统不具备处理大规模数据和训练大型推荐系统的能力,严重制约了互联网的业务发展,急需更好的框架体系来满足业务方对于模型训练速度、效果指标增长的需求。
基于飞桨的能力对应用商店进行了升级:采取高性能数据读取接口Dataset完成大规模数据的读取;采用基于参数服务器的大规模CPU分布式的全异步训练模型,以较低的资源消耗来训练海量的数据以及极大的稀疏参数。
机器人安全巡检
电能从生产到消费要经过发、输、变、配、用五大环节,任何一个环节出问题,都会影响到电能的正常供应。其中,输变电是电能通过电网传输的重要部分。电力巡检的核心工作内容,就是对输变电设备进行运维,以确保其正常工作,保障
电力系统的安全运行和电能的稳定供应。
南方电网电力科技股份有限公司的技术攻关团队引入飞桨开源
深度学习框架,利用飞桨团队实现的高性能目标检测算法YOLOv3及语义分割算法U-Net,使机器人面向表计的深层次
特征提取能力大大提高,突破了环境因素的制约,方法的准确率和鲁棒性显著提升,在表计目标检测、示数读取等方面的效果尤为显著。
在基于飞桨的表盘检测及表盘分割项目中,表盘检测的最高mAP达到了0.9857,总体的读数±2°误差内准确率高达99.01%。借助深度学习赋能的
变电站智能装备(机器人),人工巡检耗时大幅减少。原来需要6小时才能完成的巡检工作现在只需花10分钟进行读数复核即可,实现了基于准实时自动巡检的变电站智能运维。
金融风控建模
互联网金融快速发展,每天在平台上会发生数以万计的借贷、还款等行为。传统人工处理不仅对从业审核人员要求非常高,而且效率、审核标准的统一性也无法保证。传统的风控建模技术是基于小样本的监督学习,依赖于特征挖掘,需要耗费大量人力且依赖个人经验;传统技术对于小样本的文本类数据处理往往缺乏上下文的理解,未能提取其重点,导致对用户的理解出现偏差。
百度集团自研知识增强语义理解框架ERNIE,充分利用
海量数据和飞桨多机多卡高效训练优势,通过深度神经网络与多任务学习等技术,持续学习海量数据和知识,助力各NLP任务效果显著提升。目前,百度对外发布基于该框架的ERNIE 2.0预训练模型,该模型累计学习10亿多知识,刷新16个中英文NLP任务效果。
在
度小满风控场景中,利用ERNIE对业务信息进行语义层面深度建模,结合风控少量训练数据进行精细Fine-tune,在较短的时间内即可完成风控模型的收敛并且具备更好的泛化能力。
度小满金融风控模型KS相对提升约6.35%,AUC相对提升超过1.55%,用户排序优化约 21.5%。
三行科技
自动财报解析系统
对项目标的主体公司的风险评估是金融机构开展业务的起点,而标的公司财务数据分析是量化评估业务风险的基础。三行公司发现采用传统人工的方式进行财务数据分析,不仅会耗费高额的人力成本,而且人工录入效率低、错误率高等特点,更是会给业务带来不可预知的风险和损失。但想通过机器识别代替人工也并非易事,项目面临着开发困难、精度要求高等一系列难题。
三行科技借助飞桨开源
深度学习平台的PaddleOCR工具轻松完成了审计报表(股票、
债券市场公开披露的扫描版)的文字识别。首先,基于U-Net模型对表格线进行检测,划分出可见横竖线和不可见横竖线;然后,基于FastText进行科目标准化,解决报表科目表述不一致的问题;最后,通过CRNN解码过滤无效
字符,进一步提升精度(如有印章可先利用
噪点2Noise去除)。
三行科技借助PaddleOCR开发的文字识别算法,在文字检测召回率上较之前算法提升5%,检测速度提升30%,实现
财务报表科目和金额的高效识别,成功完成了财务数据的结构化存储,为后续多项业务过程提供数据基础。
连心医疗
肿瘤治疗中,医生需要亲自勾画病灶区域(即靶区)来进行精准放疗,这一步骤决定了放疗质量的60%。但这一工作通常需要基于不同部位的50-200张不等的CT或MRI二维影像中勾画出三维立体靶区,不同的医生会因为主管评价标准的差别使得勾画范围的结果差异较大,给这一步骤增加了许多不确定性,导致诊疗效率低下。
连心医疗基于飞桨语义分割套件PaddleSeg中的U-Net语义分割网络开发了基于CT和MRI多模态影像的
鼻咽癌病灶靶区自动勾画系统,基于放疗医生勾画的CT/MRI多通道影像建立
数据集,采用图像裁剪和增强等预处理方法提升数据集的质量,采用假阴假阳的后处理抑制,最后采取
边缘检测得到勾画结果。
项目完成后,系统的精度达到医生勾画水平,并可以快速自动地勾画出三维靶区,提供更精准的放疗规划方案,辅助放疗临床医生高效诊疗。
更多案例
1.智能农业
耕地地块提取
传统对
遥感图像的处理,依赖于大量拥有遥感专业背景的人工使用专业软件进行分析。
卫星遥感影像数据存在画幅巨大、肉眼分辨率低、对识别人员专业要求能力高等问题,且人工标注需要大量重复劳动,非常费时费力,枯燥无味。
中科赛诺(北京)科技有限公司基于飞桨的自动农耕地块提取系统,可快速自动获得农耕用地边境及面积,从而达到进行有效的估产并辅助相关其它农事活动。应用飞桨 Deeplab V3实现地块面积提取准确率达80%以上,对作物长势、作物分类、成熟期预测、灾害监测、估产等工作进行高效辅助,大大减少了传统人力的投入。
桃子分拣机
传统农业生产过程中,桃子采摘后需要人工根据其品质进行筛选,质量无法得到保证的同时还耗费大量的人工和时间成本。
智能桃子分拣机集成了图像分类模型,将桃子智能分类模型训练、机械自动化采集样本数据,完成桃子分拣自动化。提升桃子分拣准确率至90%以上;节省90%人力成本,每年为桃农直接节省近3万元。(数据来源:内部测试结果,实际结果可能受测试环境影响而在一定范围内变化,仅供参考。节省费用估算公式为人工劳务单日费用*工人数-设备成本开销)
2.智能工业
硕橙将飞桨用于机器设备噪声识别,实现了设备生产量的实时统计,并评估设备的运行状态。对于生产量统计,先将噪声分解为多个维度的机械运动特征量,然后截取一定长度的数据,送入一个深度神经网络,特征量
波形识别为机械设备的动作,从而实时判断设备的生产量。
对于运行状态的评估,仍然是先将噪声分解为多个维度的机械运动特征量,然后根据前述生产量统计应用得到的生产周期,将一个生产周期内的全部特征量构建成一个在高维空间中的分布,并根据历史记录寻找绝大部分样本集中的区域包络面,最后使用One class SVM方法对每一次生产周期进行评分,实时给出整体运行状态评价。
3D智能抓取机器人
矩视智能研发的缺陷检测系统在飞桨的AI Studio环境下,将飞桨提供的图像检测模型与自主研发的算法相结合,对键槽轴心外观齿部冷锻伤类型缺陷进行检测,保证缺陷检测系统准确率的同时,大大提升了
图像处理的速度。每
齿轮检测时间\u003c300ms/帧,连续运行100次,误判率≦1%。
瓷器及地板表面质量检测
北京奇想天外科技有限公司,智能硬件解决方案商,应用飞桨目标检测模型,在
松发股份的瓷器生产质检线上,实现了5类缺陷的检测,在15%误识率的基础上,实现了90%检出率,比传统人眼识别,效率提升了20%。
(数据来源:内部测试结果,实际结果可能受测试环境影响而在一定范围内变化,仅供参考)
精诺钢铁熔炼生产工艺优化
在合金熔炼的过程中,合金元素会根据炉内温度、熔炼时间等因素发生无法用机理进行判断和解释变化,传统合金熔炼环节大多由有经验的师傅进行补料,需要多次实验和调整,废料废时。
精诺数据基于
百度集团深度学习平台飞桨,研发了IAPBOA算法,利用历史配料数据建模,实现智能化计算。通过
机器学习优化企业个性化配料方案,最终达到生产质量和生产成本的有效平衡点,从而指导熔炼生产,减少对经验的依赖,达到提升熔炼效率、节省原材料的效果。
3.智能城市
楼宇设备智能管理
楼宇设备工况运行调控依赖人工, 而运维专业水平不齐,运行效率不高,导致能源浪费、无法及时根据外界环境变化来调整系统输出,楼宇内用户体验不好。
百度集团科技园将基础运行积累的
大数据与
深度学习算法结合起来,提高了机电系统运行效率,完善日常保养策略,提供故障预警、保养提醒功能,实现智能运营。目标楼宇日均节电20%+,年节电约100万度,节约电费30%+,有效提升楼宇运营效率。
AI控烟
在2018年
世界无烟日,百度科技园发起AI控烟公益项目,由百度工程师用飞桨的目标检测模型成功识别下沉广场的吸烟者,在广场大屏幕给吸烟者实时发送健康提示。该项目基于百度飞桨开源平台的深度学习能力,对数万张吸烟动作图片进行了43次深度学习模型训练,可实现对吸烟动作的识别,通过视频监控的数据从人群中识别出正在吸烟的人,将其图像提取并标注保存。
4. 智能零售
生鲜进货量智能预测
由于生鲜产品
保质期极短,需要丰富的进货经验才能降低货物过期报损率,然而店长经验参差不齐,无法保证准确预估全部店铺的进货量。
通过利用商超生鲜的历史销售数据,从位置、时段、节假日、天气等维度,提取出多个影响销量的条件,使用DNN神经网络到建立销量预测模型,比店长预测更为准确,整体报损降低30%+、模型进货净利润较店长进货提升约20%。
智慧购物解决方案(以图搜商品)
随着消费互联网流量红利的逐渐尽,移动互联网的主战场转向产业互联网,家居行业3D数字化进程高歌猛进,行业开始沉淀下了大量的与真实商品对应3D模型数据,如何应用真实商品的3D数据的多维度特点,来改善消费者的购物体验具有重要意义。但如今,线下
实体店仍然占据部分销售额,线上流量无法直接转化成消费行为是行业中的一大痛点。如何将线上线下的优势结合,优化资源配置,快速实现线下家居实体业的进化,成为家装企业发展的重中之重。次元
视界应用Faster R-CNN模型实现2D图像的
特征提取,再生成3D模型,达到了模型轮廓识别准确率达到89%,FPR降低了32%,显著的提升了应用效果。
5.智能推荐
智能招聘——简历职位智能匹配系统
云脑科技使用飞桨搭建的Gated Model(GQM),是基于CNN、DSSM、C-DSSM等算法的文本匹配模型。GQM在上述模型架构的基础上,优化了全局语义特征的提取,以及查询文本于候选匹配文本的语义特征交互,进而达到更快速、单文本上下文特征提取范围更广、文本对语义特征交互优化、同时高准确匹配的效果。综合企业需求与求职者的简历数据,实现企业与求职者双方需求的高效率匹配。项目现运用于
云脑的合作伙伴实习僧的项目中,实现面试邀约成功率提升5倍。(数据来源:内部估算结果,计算方式一定时间内使用简历职位智能匹配系统后面试邀约平均成功率除以使用简历职位智能匹配系统之前的面试邀约平均成功率)
智能零件分拣机
零部件的质量,决定了工业装备的整机性能。但是,由于小零件的数量庞大,人工执行质量检测与分拣的效率低、成本高,迫切需要引入智能机器对人力替代。在此背景下,领邦智能面向市场推出了智能零件分拣机。
领邦基于
百度集团深度学习平台飞桨训练CNN
分类网络模型,让分拣机能够自动学习良品和缺陷品的分类特征,并对工件图像实时做出自动判别与分类。智能分拣机能够高效、准确识别零件种类与问题,检测速度可达20ms/件。机器可以在精度上与人工检测持平,同时在质检速度上大幅提升。根据测算,一台检测机器可以代替十多位熟练质检工人,能够帮助企业降低15%的生产成本。另外,分拣机的应用具有较好的拓展性,可支持数十种形状各异、高精密的小零件分拣。
7.智能医疗
甲状腺结节图像智能识别与辅助诊断系统
整合医生专家的诊断逻辑,基于飞桨平台构建
深度学习模型,对标注好的
甲状腺结节图像进行训练,抽取图像特征,从而判定甲状腺结节的良恶性,实现甲状腺图像智能识别系统,辅助医生进行诊断。
智能医疗辅助诊断系统(AIMADS)
AIMADS可用于常见
皮肤病和脑肿瘤的辅助诊断,用户可通过在客户端上传患处图片到服务器,服务器端通过本团队设计的诊断算法在飞桨平台对上传数据进行分析,在 APP 中显示诊断结果。
8.趣味生活
猜拳机
2018年7月,小度猜拳手通过使用深度
卷积神经网络技术训练出能够识别用户出拳结果的模型,该模型可以识别石头、剪刀、布的手势。在用户出拳过程中,系统会不断采集用户的手势图片,通过飞桨实时预判人的出拳概率。
9.社科类
当前学术界意识到了濒危语言问题的重要性,积极倡导各国语言学家对本国语言、尤其是濒危语言加以关注,并采取具体的行动进行口语记录、语言典藏。2003年英国伦敦大学开展了对全球濒危语言进行深度典藏的国际项目,2004年中国开始参与到项目之中,
中国社会科学院民族学与人类学研究所的徐世璇教授作为中国参与国际濒危语言典藏项目的负责人人,负责包括土家语的保存等重要项目。社科院利用飞桨实现了针对土家语预料的标音及意译,算法准确率已经达到了约70%,达到人工标注水平,且效率提高了几个数量级。在当前全球濒危语言保护工作中起到了重要作用。
以上所有数据来源:内部测试结果,实际结果可能受测试环境影响而在一定范围内变化,仅供参考。
社区与生态
开发者社区
PPDE | 飞桨开发者技术专家计划
飞桨开发者技术专家计划(PaddlePaddle Developers Experts)是飞桨社区为开发者提供的荣誉认证体系,支持开发者践行开源理念,引领技术潮流,共建繁荣社区,通过技术成长与社区贡献进阶,开发者可以成长为PPDE、高级PPDE及资深PPDE,并且享受多样顶级权益:
PPDE计划迄今已有100多位成员,此计划面向全球应用飞桨的技术极客、开源项目贡献者、高校教授、技术博主、畅销书作家等发出邀请,只要满足以下3项条件之一,即可提交申请:
技术成果:应用飞桨产出至少2篇优质技术文章或视频教程;或应用飞桨产出并开源至少4个优质项目;或在
GitHub为飞桨至少提交过4次PR
开源实践:乐于为飞桨开源社区的发展贡献力量,成为至少2次线上/线下技术分享的主讲人,积极为其它成员答疑解惑
其它:包括不限于在实际场景中落地飞桨技术并开源项目、应用飞桨参加大赛取得优异成绩并将项目开源、写作飞桨应用实践相关畅销书籍、在高校开设飞桨相关课程等
飞桨领航团 | 已覆盖29个省市,130+高校
飞桨开发者的兴趣社区,为开发者们提供丰富的本地技术沙龙、Meetup及线上交流平台。飞桨领航团已建立150个社群,覆盖29个省级行政区,133个高校。欢迎开发者们加入领航团,结实更多本地技术同好,共建开源社区,共享开源成果与快乐。
PP SIG | 飞桨特别兴趣小组
通过开放的社区形式与全球的开发者共同构建一个开放、多元和架构包容的生态体系。目前已建立的PP SIG包括
计算机视觉、推理部署、工具效率组件等多个技术方向等。
飞桨博士会 | 100+博士已加入
中国
深度学习俱乐部,助力会员交流前沿科技,拓展行业高端人脉
百度AI竞赛 | 以赛引才、以赛促用、以赛兴业
飞桨承办了80余场国内外大型AI赛事。赛题方向覆盖人工智能技术前沿领域,致力于打造全球领先的AI赛事,聚才兴业,推动智能经济发展。
飞桨开放多年办赛先进经验,提供一站式专业办赛服务支持,诚邀各机构、公司、院校等合作伙伴,共同举办具有影响力的AI赛事。
企业服务
AICA-首席AI架构师培养计划 | 闭门小班,为中国产业界培养高端复合型AI人才
专注于
深度学习产业落地应用,与
百度集团最有经验的AI专家闭门学习、研讨,助力企业跨越鸿沟
AI私享会 | 深入行业,定向研讨,产研专家交流碰撞的高端沙
聚合产业精英与AI技术专家,破解行业技术难题,洞察未来发现机遇
AI快车道 | 支持10000家企业智能化升级
详解行业场景AI应用所必需的
深度学习技术方案,助力企业领跑新基建
飞桨技术伙伴计划 | 全方位赋能伙伴企业
深度学习技术能力提升,共享AI未来
以技术赋能为宗旨,产业落地为目标,助力合作伙伴客户规模化落地
教育生态
深度学习7日打卡营
通过7日短平快的在线打卡学习,帮助开发者快速掌握
深度学习技术
飞桨官方深度学习集训营
通过3-4个月的系统学习,助力开发者零基础入行深度学习
丰富在线实战课程
包含5000+小时AI深度学习实战课程,不同开发者轻松找到匹配的学习路径
飞桨启航计划:携手高校、破浪前行
AI人才产教融合培养方案
飞桨在
人工智慧技术以及行业深入探索,力争为高校提供一套涵盖教学体系、教学大纲、教学方案、教材、教学教研产品等完整的、全流程、全体系的AI人才产教融合培养方案。着力为推进高校快速建立人工智能专业及人工智能人才培养和就业提供
生态环境,包括教学、科研、人才拓展、应用场景等多个方面的服务体系,涵盖机器学习、
计算机视觉、自然语言处理、语音识别等多个领域,将项目应用开发和教学科研紧密结合,打造覆盖
人工智能全行业的高质量复合型、创新型、应用型人才。
高校教学支持计划
提供四位一体的课程共建方案,支持200+高校开设人工智能课程
飞桨高校深度学习师资培训班
在教育部指导下,百度飞桨与全国重点高校联合打造的深度学习师资培养计划
企业师资入驻
派驻企业师资,融入企业育人实践,贯穿学生成长全过程。通过开设特色实践课程、提供高质量的实践及前沿指导,将产业理念、技术、资源整合到培养体系、课程及实训中,最大程度共享及优化配置产教资源,培养高素质和具有产业应用视角的创新人才。
高校相关赛事
面向高校,飞桨组织开展了多项“国字头”重要赛事,以下赛事均已被列入
中国高等教育学会“全国普通高校大学生竞赛排行榜”,包含教育部高等学校自动化类专业教学指导委员会主办,
清华大学承办的“全国大学生智能汽车竞赛”,由全国高等学校计算机教育研究会主办,
浙江大学、百度公司联合承办的“中国高校计算机大赛—
人工智慧创意赛”(简称C4), 由工业和信息化部、教育部、
江苏省人民政府共同主办的 “中国软件杯”大学生软件设计大赛,以
北京语言大学为法人单位主办的“
中国大学生计算机设计大赛”(简称4C)等。
此外,还有
西安交通大学国际
大数据竞赛、百度之星开发者大赛等热门赛事,每年均会吸引海内外多所名校学子共同参与!
AI Studio教育版
提供领先的教学管理与实训平台,深入促进实践型AI人才培养
2018年,
百度集团联合深度学习技术及应用国家工程实验室、
中国软件行业协会,共同发布中国深度学习工程师能力评估标准。2019年3月,百度向社会开放“深度学习工程师”认证考试,并提供相应的学习解决方案。
2020年,为了助力深度学习工程师的职业发展,百度飞桨和Linux Foundation开源大学合作推出国内首个深度学习工程师联合认证。本次联合认证全称为 Certified Open Source Officer \u0026 Deep LearningEngineer Associate,从名称上可以看出,本次双认证不仅注重开发者在
深度学习方面的技术能力,也对开发者的开源基本能力提出了一定的要求。现已开通人才招募“绿色通道”,通过认证的开发者将获得认证标签并被纳入AI专项人才库,
百度集团AI技术岗位可以免笔试应聘,相关生态合作企业技术岗位也可优先录用。
国家工程实验室
2017年2月,国家发展和改革委员会正式批复,由百度牵头联合
清华大学、
北京航空航天大学、
中国电子技术标准化研究院、中国信息通信研究院,共同筹建深度学习技术及应用国家工程实验室。飞桨依托
深度学习技术与应用国家工程实验室,与国内多家科研机构及高校合作研发的深度学习技术,为深度学习研究者、企业和开发者提供功能丰富的开源深度学习平台。
WAVE SUMMIT深度学习开发者峰会
WAVE SUMMIT深度学习开发者峰会由深度学习技术及应用国家工程实验室与
百度集团联合主办,会上,来自百度、
英特尔、
华为、
清华大学、
北京航空航天大学等公司及高校的科学家及人工智能专家共同探讨深度学习时代的技术方向及产业前景,同时,深度学习平台飞桨发布多项新特性及服务,为深度学习开发者提供利器。
2019年4月23日,在首届WAVE SUMMIT 2019
深度学习开发者峰会上,百度宣布了AI Studio算力支持计划,开放价值近亿元人民币的免费算力资源,助力开发者成功。免费算力主要以两种模式提供,第一种是一人一卡模式,V100的训练卡包括16G的
显卡内存,可达2T的存储空间。另外一种是远程集群模式,飞桨提供高性能集群,供开发者免费使用,登陆AI Studio即可使用。
所获荣誉
2020年8月15日,
百度集团和
华为共同完成的项目"飞桨产业级深度学习技术与平台"荣获2019年度
中国电子学会科学技术奖科技进步
一等奖。
2020年9月,百度飞桨获2020年服贸会“科技创新服务示范案例”。