跳到主要内容

YOLOv5s 人脸检测 640x480 ONNX MQ

专为人脸检测设计的 YOLOv5s 模型,针对 640x480 分辨率优化,采用 ONNX 混合量化。

支持的处理器

  • SL1680
  • SL1640

性能

SyNAP

31.88ms
推理时间
13ms
初始化时间

YOLOv5s Face 640x480 ONNX MQ

模型概述

专为人脸检测设计的 YOLOv5s 模型,使用混合量化 ONNX 格式,针对 640x480 分辨率进行了优化。

YOLOv5s Face 640x480 ONNX MQ 模型专为 Synaptics Astra™ SL1680 processor NPU 和 SL1640 processor NPU 开发和优化。

模型特性

  • 模型类型: 目标检测
  • 输入尺寸: 640x480
  • 输出尺寸: 根据模型配置而定的多种分辨率

ℹ️ 信息: 此模型可直接在 Synaptics Astra Machina 开发板上使用。YOLOv5s Face 640x480 ONNX MQ 的 NPU 优化版本已预装于 Astra SDK 镜像中。

在 Synaptics Astra SL1600 系列上部署

此模型针对 Synaptics Astra SL1680 处理器编译。您可以在搭载 SL1680 处理器的 Machina™ 开发套件上找到已预装的此模型。

您也可以在搭载 SL1640 处理器的 Machina™ 开发套件上找到针对 Synaptics Astra SL1640 处理器编译的同款模型。

Synaptics Astra Machina™ 是面向 Astra SL 系列高性能 IoT 处理器的模块化开发套件,集成了 Synaptics Veros™ 无线连接解决方案。了解更多信息,请点击此处

应用程序二进制文件

synap_cli_od 命令行应用程序可运行 YOLOv5s Face 640x480 ONNX MQ 等目标检测模型。

输入:

  • 转换后的 synap 模型(.synap 扩展名)
  • 可选:检测对象的置信度阈值
  • 一张或多张图像(jpeg 或 png 格式)

输出:

  • 每张输入图像中检测到的对象列表,包括:
    • 边界框
    • 类别索引
    • 置信度分数

在 Astra SL1680 和 SL1640 上的命令行用法:

MODELS=/usr/share/synap/models/

cd $MODELS/object_detection/face/model/yolov5s_face_640x480_onnx/yolov5s_face_640x480_onnx_mq

synap_cli_od -m model.synap input_image.jpg

SL1680 上的示例输出:

Input image: input_image.jpg (w = 640, h = 480, c = 3)
Detection time: 31.88 ms
# Score Class Position Size Description
0 0.95 0 94,193 62,143 person

ℹ️ 信息: JPEG/PNG 输入图像由软件调整为网络输入张量尺寸。

💡注意: 请确保在模型转换期间定义输出格式。缺少格式详情可能会导致 "Failed to initialize detector" 等错误。

NPU 性能

处理器推理时间(ms)
SL168031.88
SL164059.63

优化和自定义模型

高级用户可能希望自定义源模型并为 Synaptics Astra NPU 重新编译。 请参阅自带模型章节以获取更多信息。

供参考,固件镜像中提供的 .synap 格式模型是使用以下 .yaml 设置为 Synaptics Astra NPU 编译的:

data_layout: default
inputs:
- means:
- 0
- 0
- 0
scale: 255
outputs:
- dequantize: true
name: '349'
format: >-
yolov5 landmarks=5 transposed=1
anchors=[[],[],[],[4,5,8,10,13,16],[23,29,43,55,73,105],[146,217,231,300,335,433]]
- dequantize: true
name: '369'
format: yolov5
- dequantize: true
name: '389'
format: yolov5
quantization:
data_type:
'*': uint8
Concat_155...: int16
dataset:
- ../../widerface/WIDER_val/images/[1-2]*/*.jpg

许可证

源模型和用于设备端部署的编译模型均依据 AGPL-3.0 授权。

了解更多