运行实时(流式)Whisper.cpp
本教程将指导您使用 SL1680 在 Synaptics Astra™ Machina™ 开发套件上运行 whisper.cpp 来测试使用麦克风的实时语音识别。
备注
本教程与所有 SL16xx 开发板兼容。虽然推理可能有所不同,但所有处理器的步骤都相同。
Whisper.cpp 是 Whisper 语音转文本模型的 C++ 实现。更多关于 Whisper.cpp 的详细信息,请访问 原始 GitHub 仓库。
Whisper-Astra 是 whisper.cpp 的一个分支,专门针对 Astra SL 系列处理器进行了适配和优化,以支持流式处理。
信息
原始的 whisper.cpp 项目仍在不断发展中。
Whisper-Astra 保证基于 2024 年 6 月 26 日 ggml + fix sync script 提交版本的兼容性与稳定性。
先决条件
Stream 使您能够实时运行 Whisper,它依赖于 SDL 库。为此,您需要进行交叉编译并做两件事:构建自己的镜像并添加 SDL2 包。然后构建自己的工具链,SDL2 包将包含在其中。
注意
由于闭源第三方二进制文件,Astra 工具链目前仅支持 x86 主机。但我们正在努力解决这个问题!
-
构建包含
SDL2包的自己的镜像,您将把它刷写到 Astra 开发板上。