Text-to-Speech
ONNX
Japanese
TAR-model / README.md
akikukeo's picture
Update README.md
6f855e2 verified
metadata
language:
  - ja
pipeline_tag: text-to-speech
datasets:
  - Yukiyoke-Lab/Tsukuyomi-chan_datasets
license: other
base_model:
  - Yukiyoke-Lab/Tsukuyomi-chan

⚠️ 必ずお読みください

インストール方法は下に記載しています。ライセンスに同意し、各ドキュメントをよく読んだ上でダウンロード・インストールを行ってください。

重要なご案内

  • 本モデルおよびマージ元モデルは 「つくよみちゃん」公式の合成音声モデルではありません。
  • 利用には以下のライセンスへの同意が必要です
    • 「つくよみちゃんキャラクターライセンス」
    • 「つくよみちゃんコーパスライセンス」
    • 「独自モデルライセンス」
  • ライセンス内容を十分に理解しないまま導入、利用しないでください。

目次


モデルの概要

  • 本モデルは「つくよみちゃん」およびその他音源を学習・マージして作成されています。
  • 「つくよみちゃん」公式が提供する合成音声モデルではありません。
  • つくよみちゃん以外のマージ元モデルは公開していません。
  • ハイパーパラメータ、マージ時のパラメータ、エポック数など、一部情報は非公開としています。
  • 本モデルは「つくよみちゃんキャラクターライセンス」「つくよみちゃんコーパスライセンス」に基づいて制作されています。

マージ元の「つくよみちゃん」モデルについては、こちらのリポジトリをご参照ください。

変更履歴については、変更ログをご覧ください。

目次に戻る


形式と変換について

ONNX形式ファイルは、Safetensors形式ファイルを変換して作成しています。 変換には、litagin02/Style-Bert-VITS2/convert_bert_onnx.pyを利用しています。

目次に戻る

デモ音声

Aivisspeechにて生成した無調整音声です。 音声の調整はパラメータ調整を含め、行っておりません。

クレジット表記
音声合成には、フリー素材キャラクター「つくよみちゃん」(© Rei Yumesaki)が無料公開している音声データを一部使用し、akikukeo氏によって利用規約に基づき作成されたマージモデルを使用しています。
「つくよみちゃん」公式が提供している合成音声モデルではありません。
利用規約に基づき制作されています。

つくよみちゃんの言動は、投稿者の言動が反映されたものであり、公式のつくよみちゃんとは一切関係ありません。

■つくよみちゃんコーパス(CV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
■つくよみちゃんキャラクターライセンス
https://tyc.rei-yumesaki.net/about/terms/
■つくよみちゃん公式サイト
https://tyc.rei-yumesaki.net/

■モデル配布先(マージモデル)
https://huggingface.co/Yukiyoke-Lab/TAR-model
© Rei Yumesaki, YukiyokeLab, Akikukeo

読み上げ台本
やったー!テストで満点取れた!私とっても嬉しいな!
どうして私の意見を無視するの?許せない!ムカつく!あんたなんか死ねばいいのに。
あはははっ!この漫画めっちゃ笑える、見てよこれ、ふふふ、あはは。
あなたがいなくなって、私は一人になっちゃって、泣いちゃいそうなほど悲しい。
音声合成は、機械学習を活用して、テキストから人の声を再現する技術です。
この技術は、言語の構造を解析し、それに基づいて音声を生成します。
この分野の最新の研究成果を使うと、より自然で表現豊かな音声の生成が可能である。
深層学習の応用により、感情やアクセントを含む声質の微妙な変化も再現することが出来る。

Aivisspeechバージョン:Aivisspeech 1.1.0-preview.2 モデルバージョン:1.0.0

目次に戻る


バージョニング・命令規則

セマンティックバージョニングに基づいてバージョニングをし、音声モデルの形式にかかわらず、すべてでバージョンを統一します。

Aivisspeech・Style-Birt-Vits2対応ファイルその他に関わらず、アップデートした場合に、共通して同一バージョンを割り振ります。

バージョンアップの基準は、マージ前モデルの追加学習等で音声の音質が変化した場合、マイナーバージョンをアップします。ただし、大幅に声質の変化が見られた場合、メジャーバージョンをアップします。

メジャーバージョンは、メタデータ編集等により互換性が無くなった場合にアップします。

Aivisspeechでは、ハイパーパラメータ・UUIDを変更すると同一モデル扱いではなくなるため。

モデル等のファイル名は、以下の通りに命名する。
TAR-v1.0.0.aivmx TAR-v1.0.0.aivm
TAR-v1.0.0.safetensors TAR-v1.0.0.onnx
モデル名 -v バージョン 拡張子

目次に戻る


ライセンス・クレジット表記

本リポジトリ・モデルのライセンスについては、LICENSE.mdをご覧ください。 また、インストール・ダウンロード、利用等した時点で、ライセンスに同意したものとみなします。

目次に戻る


インストール方法

インストールした時点で、ライセンスに同意したものとみなします。 Aivisspeech版を推奨しています。

Aivisspeech版の提供は1.0.2を最後に一時的に停止しています。それ以降のバージョンを利用したい場合は、Aivisspeech版でないものをご利用ください。
変更履歴については、変更ログをご覧ください。

目次に戻る

Aivisspeech

Aivisspeech 1.1.0-preview.2にて動作確認しています。 手動でダウンロードしてAivisspeechにインストール頂くか、以下URLを「設定」「音声合成モデルの管理」「URLからインストール」に入力してください。 https://huggingface.co/Yukiyoke-Lab/TAR-model/resolve/main/TAR-v1.0.2.aivmx?download=true

Aivisspeech版の提供は1.0.2を最後に一時的に停止しています。それ以降のバージョンを利用したい場合は、Aivisspeech版でないものをご利用ください。
変更履歴については、変更ログをご覧ください。

目次に戻る

SBV2

必要ファイルをダウンロード頂き、指定ディレクトリへと配置してください。

目次に戻る


連絡先

このモデルは二次創作モデルとなるため、つくよみちゃん公式へのお問い合わせはご遠慮ください。ご意見・ご要望・お問い合わせは、下記までご連絡ください。 また、不審なお問い合わせ(内容が不明、明確ではない)には返信しないことがあります。要件を明確にしてお問い合わせください。

Discord:@akikukeo
DiscordユーザーID:968755981326639104

目次に戻る


謝辞

目次に戻る