跳到主要内容

Moonshine Tiny BF16

专为实时语音识别设计的高效自动语音识别模型,采用可变长度架构,支持最长 30 秒的 16kHz 单声道音频输入。

支持的处理器

  • SL2619

Moonshine Tiny

模型概述

Moonshine 是一款专为实时语音识别设计的高效自动语音识别(ASR)模型。与以固定 30 秒块处理音频的 Whisper 不同,Moonshine 采用可变长度架构,仅对实际接收到的语音时长进行计算。

Moonshine 由 Useful Sensors 开发并以开源形式发布了英语模型。该模型分为两个规格:base 和 tiny。Tiny 版本使用 2700 万参数。

Moonshine Tiny 已针对 Synaptics Astra™ SL2610 系列处理器 Torq NPU 进行优化。

模型特性

  • 模型类型: 自动语音识别
  • 输入: 原始波形(浮点数一维数组),16kHz 单声道音频,最长 30 秒
  • 输出: token ID 序列(整数)

部署

编译后的模型文件可在 Hugging Face 上下载:Synaptics/Moonshine

使用教程将在未来发布于 Synaptics AI Developer Zone

许可证

源模型和用于设备端部署的编译模型均依据 MIT License 授权。

了解更多