文档介绍
PaddleServing技术架构说明整体设计目标?长期使命:PaddleServing是一个PaddlePaddle开源的在线服务框架,长期目标就是围绕着人工智能落地的最后一公里提供越来越专业、可Paddle靠、易用的服务。Paddle?工业级:为了达到工业级深度学习模型在线部署的要求,Serving提供很多大规模场景需要的部署功能:1)分布式稀疏参数索引功能;2)高并发底层通信能力;3)模型管理、在线A/B流量测试、模型热加载。?简单易用:为了让使用Paddle的用户能够以极低的成本部署模型,PaddleServing设计了一套与Paddle训练框架无缝打通的预测部署API,普通模型可以使用一行命令进行服务部署。?功能扩展:当前,PaddleServing支持C++、Python、Golang的客户端,未来也会面向不同类型的客户新增多种语言的客户端。在PaddleServing的框架设计方面,尽管当前PaddleServing以支持Paddle模型的部署为核心功能,用户可以很容易嵌入其他的机器学习库部署在线预测。模块设计与实现2.1PythonAPI接口设计2.1.1训练模型的保存"serving_client_conf.stream.prototxt""serving_client_conf.stream.prototxt"和"serving_client_conf.stream.prototxt""serving_client_conf.stream.prototxt"和Paddle的模型预测需要重点关注的内容:1)模型的输入变量;2)模型的输出变量;3)模型结构和模型参数。练过程中保存模型的接口,并将变量;3)模型结构和模型参数。练过程中保存模型的接口,并将PaddleServing在