This repository has been archived by the owner on Oct 16, 2023. It is now read-only.

HaomingXR / Vosk-ASR-for-Unity Public archive

Notifications You must be signed in to change notification settings
Fork 2
Star 6

透過 Vosk 在 Unity 中達成語音辨識

6 stars 2 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
Assets		Assets
Packages		Packages
ProjectSettings		ProjectSettings
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md

Repository files navigation

VOSK ASR for Unity

[中文|English]

這是一個透過 Vosk 實作語音轉文字的 Unity 專案，改善自官網上的範例。

VOSK 是什麼

Vosk 是一個語音辨識的套件。它的優點包含:

支援 20+ 語言與方言
可離線使用，甚至在輕型裝置上
有適合行動裝置的 ~50 MB 小型模型；以及適合伺服器的 ~2 GB 大型模型
可以手動設定單字以提升準確度

準備

從官網下載一個模型
- 本專案已包含一個中文模型
把模型解壓縮至專案的 Application.streamingAssetsPath
大的模型較為準確，但需要更長時間進行載入
(推薦) 安裝 Newtonsoft Json Unity Package

如何使用

在需要使用 ASR 的程式中加入 using Vosk.APIs;
呼叫 VoskASR.Init
訂閱 VoskASR.OnTranscriptionResult 以獲取辨識結果
回傳的結果是 Json 格式，故推薦使用 Newtonsoft.Json
可參考 Demo.cs 的範例
可以使用 LoudnessMeter 來視覺化輸入音量
可以使用 ChineseUtil 來進行簡體與繁體的轉換
- 中文模型大多為簡體

參數

caller: 傳入 MonoBehaviour 讓 Unity 呼叫 StartCoroutine
modelName: 傳入模型的資料夾名稱
autoStart: 使否在呼叫 Init 後即開始辨識
maxAlternatives: 該辨識幾組可能結果
microphoneIndex: 麥克風的序號
keyPhrases: 手動輸入特定單字來辨識

About

透過 Vosk 在 Unity 中達成語音辨識

unity speech-recognition speech-to-text asr

Report repository

Languages

C# 100.0%