Moonshine Tiny
模型概述
Moonshine 是一款专为实时语音识别设计的高效自动语音识别(ASR)模型。与以固定 30 秒块处理音频的 Whisper 不同,Moonshine 采用可变长度架构,仅对实际接收到的语音时长进行计算。
Moonshine 由 Useful Sensors 开发并以开源形式发布了英语模型。该模型分为两个规格:base 和 tiny。Tiny 版本使用 2700 万参数。
Moonshine Tiny 已针对 Synaptics Astra™ SL2610 系列处理器 Torq NPU 进行优化。
模型特性
- 模型类型: 自动语音识别
- 输入: 原始波形(浮点数一维数组),16kHz 单声道音频,最长 30 秒
- 输出: token ID 序列(整数)
部署
编译后的模型文件可在 Hugging Face 上下载:Synaptics/Moonshine。
使用教程将在未来发布于 Synaptics AI Developer Zone。
许可证
源模型和用于设备端部署的编译模型均依据 MIT License 授权。
了解更多
- Synaptics AI Developer Zone:获取文档、教程和资源,开启您的边缘 AI 之旅。
- Astra Support Portal:与我们的工程团队和社区联系。
