[vvm] styleIdとsession.runに渡す数値が異なっているVVMでも音声合成できるようにする #548

Hiroshiba · 2023-07-26T00:10:53Z

内容

VVM以前はstyleIdとonnxモデルで推論するのに渡す数値（ややこしいですがspeaker_idと呼んでたりします）が異なる場合もサポートされていました。

voicevox_core/crates/voicevox_core/src/status.rs

Line 53 in f69d15e

pub(crate) speaker_id_map: BTreeMap<u32, (usize, u32)>,

↑のspeaker_id_mapはstyleId -> (modelId, speakerId)のマップです。
VVMではid_relationsと名前が変わり、modelIdへのマップだけになりました。

voicevox_core/crates/voicevox_core/src/status.rs

Line 26 in 8cf307d

id_relations: BTreeMap<StyleId, VoiceModelId>,

ここに新たに、onnxモデルに渡す数値を格納できるようにしたいです。

Pros 良くなる点

以前のモデルで音声合成できるようになる

Cons 悪くなる点

VVMの中にマッピングを書かないといけない

実現方法

データ構造は

id_relations: BTreeMap<StyleId, (VoiceModelId, ModelInnerId)>,

とかにしようかなと思っています。

VVMの中にマッピングを書く必要がありますが、manifest.jsonに書くのが良いだろうと思っています。
VVMには他にもmetas.jsonがありますが、こちらはコア内で使うだけでなく、ユーザーが使うものでもあります。
一方でmanifest.jsonはコアだけが使う情報が書かれているので、書くならこっちかなと思っています。

style_id_map: {styleId: modelInnerId}辺りをオプショナルで持てるようにしようかなと。

その他

ref #545

The text was updated successfully, but these errors were encountered:

Hiroshiba added the 機能向上 label Jul 26, 2023

This was referenced Jul 26, 2023

[2月末リリース予定!] v0.16 #545

Open

styleIdとsession.runに渡す数値が異なっているVVMでも音声合成できるようにする #551

Merged

Hiroshiba closed this as completed in #551 Aug 3, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[vvm] styleIdとsession.runに渡す数値が異なっているVVMでも音声合成できるようにする #548

[vvm] styleIdとsession.runに渡す数値が異なっているVVMでも音声合成できるようにする #548

Hiroshiba commented Jul 26, 2023 •

edited

Loading

[vvm] styleIdとsession.runに渡す数値が異なっているVVMでも音声合成できるようにする #548

[vvm] styleIdとsession.runに渡す数値が異なっているVVMでも音声合成できるようにする #548

Comments

Hiroshiba commented Jul 26, 2023 • edited Loading

内容

Pros 良くなる点

Cons 悪くなる点

実現方法

その他

Hiroshiba commented Jul 26, 2023 •

edited

Loading