计算机 Model Serving

morphling调研

Posted by jabin on October 7, 2021

AI推理服务特性

显卡资源。单个推理服务独占，整张显卡将造成资源的极度浪费性能的资源瓶颈多样。复杂数据前处理和结果后处理，将占用大量cpu资源容器的运行参数

推理服务的配置调优

开发倾向，冗余配置默认配置

配置调优痛点

自动化性能测试、参数调优稳定、非侵入式的服务性能测试流程。不能直接在现网上测试参数组合调优

Morphling是什么

基于k8s的AI推理服务配置框架。将参数组合调优全流程自动化，并结合高效的智能化调优算法，使推理业务的配置调优流程，能够高效地运行在 Kubernetes 之上，解决机器学习在产业实际部署中的性能和成本挑战。

实践

本地基于minikube install morphling，跑mobilenet推理服务模型，发现morphling-ui coredump… 且跑个几小时都没有结果。可能是本地m1的原因？不过因为刚出，没太多的资料，也不是很稳定的，可后续观察，再考虑