前言

技术栈是Fastapi。

FastAPI 是一个现代、快速(基于 Starlette 和 Pydantic)、易于使用的 Python web 框架,主要用于构建 RESTful API。以下是 FastAPI 的一些优势:

  1. 性能卓越: FastAPI 基于 Starlette 框架,并使用 Pydantic 进行数据验证,因此具有出色的性能。它通过异步编程利用 Python 3.7+ 中的 async/await 特性,使其能够处理大量并发请求。

  2. 自动文档生成: FastAPI 自动生成交互式 API 文档(Swagger UI 和 ReDoc),让开发者能够轻松地查看和测试 API 端点,同时提供即时的反馈和文档。

  3. 强类型注解: FastAPI 使用 Python 的类型提示来定义 API,同时利用 Pydantic 模型进行请求和响应的验证,这提供了强大的静态类型检查和自动文档的支持。

  4. 自动验证: 使用 Pydantic 模型,FastAPI 自动验证请求的数据,并在数据不符合预期时返回错误。这有助于提高代码的稳健性和可维护性。

  5. 异步支持: 支持异步处理请求,可以使用异步函数来处理请求,使得 FastAPI 在处理高并发时表现出色。

  6. 便捷的依赖注入系统: FastAPI 提供了一个灵活的依赖注入系统,让你能够方便地注入和管理依赖项,使代码更加清晰和可测试。

  7. WebSocket 支持: FastAPI 提供了对 WebSocket 的原生支持,能够轻松地实现实时通信。

  8. 易于学习: FastAPI 的语法和设计理念使其易于学习和使用,特别是对于熟悉 Python 的开发者。

安装modelscope

conda create -n modelscope python=3.8conda activate modelscopepip install modelscope

激活虚拟环境

conda activate modelscope

server.py代码

import argparseimport uvicornfrom fastapi import FastAPIfrom modelscope.server.api.routers.router import api_routerfrom modelscope.server.core.event_handlers import (start_app_handler, stop_app_handler)def get_app(args) -> FastAPI:app = FastAPI(title='modelscope_server',version='0.1',debug=True,swagger_ui_parameters={'tryItOutEnabled': True})app.state.args = argsapp.include_router(api_router)app.add_event_handler('startup', start_app_handler(app))app.add_event_handler('shutdown', stop_app_handler(app))return appdef add_server_args(parser):parser.add_argument('--model_id', required=True, type=str, help='The target model id')parser.add_argument('--revision', required=True, type=str, help='Model revision')parser.add_argument('--host', default='0.0.0.0', help='Host to listen')parser.add_argument('--port', type=int, default=8000, help='Server port')parser.add_argument('--debug', default='debug', help='Set debug level.')parser.add_argument('--llm_first',type=bool,default=True,help='Use LLMPipeline first for llm models.')if __name__ == '__main__':parser = argparse.ArgumentParser('modelscope_server')add_server_args(parser)args = parser.parse_args()app = get_app(args)uvicorn.run(app, host=args.host, port=args.port)

任务一:人脸检测

命令行中虚拟环境中运行脚本

python server.py --model_id damo/cv_resnet50_face-detection_retinaface --revision v2.0.2

访问http://127.0.0.1:8000/docs打开文档

  • describe方法描述请求参数和输出形式
{"schema": {"task_name": "face-detection","schema": {"input": {"type": "object","properties": {"image": {"type": "string","description": "Base64 encoded image file or url string."}}},"parameters": {},"output": {"type": "object","properties": {"scores": {"type": "array","items": {"type": "number"}},"boxes": {"type": "array","items": {"type": "number"}},"keypoints": {"type": "array","items": {"type": "number"}}}}}},"sample": null}
  • call方法(是模型推理的入口)

    • 两种请求方式(post)

    • curl方式(encode_base64表示图片转换为base64后的形式)

  • 图片转换base64的链接可以使用在线转https://tool.jisuapi.com/pic2base64.html

    curl -X 'POST' \ 'http://127.0.0.1:8000/call' \ -H 'accept: application/json' \ -H 'Content-Type: application/json' \ -d '{ "input":{"image":"encode_base64"}'
  • face-detection_retinaface请求参数体(界面请求)直接使用fastapi界面请求或者使用apifox等

  • {"input":{"image":"encode_base64"}}

    请求结果

返回结果解释

{"scores": [0.9998026490211487],"boxes": [[164.9207000732422,82.86209106445312,353.395263671875,340.145263671875]],"keypoints": [[214.5664520263672,188.255859375,303.5237121582031,190.91671752929688,256.9284362792969,242.95065307617188,223.42758178710938,283.54241943359375,287.28448486328125,286.402587890625]]}

返回图像中人脸的分数,越大表示有人脸的可能性越大,boxes表示人脸的矩形框,左上角x,y坐标和右下角x,y坐标,keypoints返回左眼、右眼、鼻尖、左嘴角、右嘴角的坐标值x,y。

输入图片

根据boxes和keypoints画图

import cv2# 读取图像image = cv2.imread('0.png')# 定义矩形框的坐标和大小x, y, x1, y1 = 164,82,353,340w = 353-164h = 340-82# 画矩形框cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)# 显示结果# cv2.imshow('Rectangle', image)# cv2.waitKey(0)# cv2.destroyAllWindows()cv2.imwrite('0_rectangle.png', image)
import cv2# 读取图像image = cv2.imread('0.png')radius = 5# 点的半径color = (0, 0, 255)# 点的颜色,通常使用BGR格式thickness = -1# 为了画一个实心圆,线条宽度设置为-1keypoints = [214.5664520263672,188.255859375,303.5237121582031,190.91671752929688,256.9284362792969,242.95065307617188,223.42758178710938,283.54241943359375,287.28448486328125,286.402587890625]print(len(keypoints))for i in range(0,len(keypoints),2):cv2.circle(image, (int(keypoints[i]),int(keypoints[i+1])), radius, color, thickness)# 显示结果# cv2.imshow('Point', image)# cv2.waitKey(0)# cv2.destroyAllWindows()cv2.imwrite('0_keypoints.png', image)

需要注意的是不同的任务请求体的内容不一样,需要明确每个任务的请求参数具体有哪些。

任务二:人脸融合

第二种任务,人脸融合,需要重启服务,将model_id和revision替换。

python server.py --model_id damo/cv_unet-image-face-fusion_damo --revision v1.3

此时访问http://127.0.0.1/docs

执行一下describe方法

{"schema": {"task_name": "image-face-fusion","schema": {"input": {"type": "object","properties": {"template": {"type": "string","description": "Base64 encoded image file or url string."},"user": {"type": "string","description": "Base64 encoded image file or url string."}}},"parameters": {"type": "object","properties": {"user": {"type": "object","default": null}}},"output": {"type": "object","properties": {"output_img": {"type": "string","description": "The base64 encoded image."}}}}},"sample": null}

input有两个参数,第一个是template,表示模版;第二个参数是user,表示用户的图片,最终的目的就是将用户的图片的脸替换到模版上

parameters参数一般使用默认的就行,不填,如果有特殊需求可自行尝试

output会返回一个换好脸图像的base64编码

请求体

{"input": {"template": "base64_template","user":"bas64_user"}}

template

User

Ourput

参考链接:

https://github.com/modelscope/modelscope/blob/master/modelscope/server/api_server.py