SOFA_AI: Singing-Oriented Forced Aligner for Automatic Inference

English | 简体中文

aoe范围过大，特此声明，禁止开源组织openvpi之yq之神和KakaruHayate使用本仓库，反正没求着贵组织之提到的人使用哈。

介绍

SOFA_AI（Singing-Oriented Forced Aligner for Automatic Inference）是利用FunASR和SOFA，以达到目标干声在无歌词标注或者无语音转写标注的情况下，直接获取目标干声音素级别标注的任务。此工具能一定程度上优化DiffSinger的音素标注流程，减轻一定的音素标注压力。

注意： 使用sofa_ai推理的音素标注，请务必使用Praat/Vlabeler等工具进行标注检查。如果不进行标注检查，以此带来歌声合成模型（svs model）或者语音合成模型（tts model）出现发音不清等一系列原因，均与本仓库无关！

#请务必看完整个readme文件！

目前的代码由ChatGPT-4辅助提供以及改正，可能会存在潜在的Bug，且会存在潜在的识别错误。如果发现任何问题，欢迎提出issue。

此项目已有缝合openai/whisper项目，以及添加ASR与SOFA结合的置信度的想法，敬请期待。

来点大家想看的东西：

使用方法

环境配置

创建一个python 3.10的环境并进入：

conda create -n SOFA_AI python=3.10 -y
conda activate SOFA_AI

访问Pytorch官网，下载适用于你的设备的torch。
（可选择，以防止下载一堆版本号不同的相同库）单独安装pytorch-lightning：
```
pip install lightning
```

克隆仓库，进入代码目录：

git clone https://github.com/colstone/SOFA_AI.git
cd SOFA_AI

安装剩下的库：
```
pip install -r requirements.txt
```

推理

运行代码：
```
python SOFA_AI.py
```
代码运行后，将会从Modelscope下载FunASR模型。当模型下载完毕，代码将询问：
- WAV文件或者文件夹路径：将WAV文件或者文件夹拖拽进命令行窗口；
- SOFA模型路径：将SOFA模型拖拽进命令行窗口；
- 词典路径：将词典路径拖拽进命令行窗口；
- 音素标注格式（TextGrid或HTK lab）：输入textgrid或者htk。
- 语言: 可以输入中文或英文，以切换所选择的FunASR模型。输入 中文或者英文来切换。英文部分经过测试，存在一定的多字/丢字/丢空格的现象，还请注意。

然后什么都不用管，等代码跑完就行。

如果你需要FunASR推理出来的文字lab或者拼音lab，以修正标注或者给MFA/SOFA进行推理，请到character或者pinyin文件夹，进行操作。

本项目所使用的开源项目

qiuqiao/SOFA: SOFA: Singing-Oriented Forced Aligner

alibaba-damo-academy/FunASR: A Fundamental End-to-End Speech Recognition Toolkit and Open Source SOTA Pretrained Models.

由衷感谢以上项目的开发者/开发团队。

Name		Name	Last commit message	Last commit date
Latest commit History 47 Commits
dictionary		dictionary
modules		modules
some_of_closevpi		some_of_closevpi
LICENSE		LICENSE
README.md		README.md
README_EN.md		README_EN.md
binarize.py		binarize.py
dataset.py		dataset.py
evaluate.py		evaluate.py
infer.py		infer.py
requirements.txt		requirements.txt
sofa_ai.py		sofa_ai.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

SOFA_AI: Singing-Oriented Forced Aligner for Automatic Inference

aoe范围过大，特此声明，禁止开源组织openvpi之yq之神和KakaruHayate使用本仓库，反正没求着贵组织之提到的人使用哈。

介绍

来点大家想看的东西：

使用方法

环境配置

推理

本项目所使用的开源项目

About

Releases 1

Packages

Languages

License

colstone/SOFA_AI

Folders and files

Latest commit

History

Repository files navigation

SOFA_AI: Singing-Oriented Forced Aligner for Automatic Inference

aoe范围过大，特此声明，禁止开源组织openvpi之yq之神和KakaruHayate使用本仓库，反正没求着贵组织之提到的人使用哈。

介绍

来点大家想看的东西：

使用方法

环境配置

推理

本项目所使用的开源项目

About

Resources

License

Stars

Watchers

Forks

Releases 1

Packages 0

Languages

Packages