Text-to-Speech
ONNX
Japanese
akikukeo commited on
Commit
d9d97d3
·
verified ·
1 Parent(s): 846b7d8

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +122 -106
README.md CHANGED
@@ -21,22 +21,37 @@ license: other
21
  ONNX形式ファイルは、Safetensors形式ファイルを変換して作成しています。<br>
22
  変換には、[litagin02/Style-Bert-VITS2/convert_bert_onnx.py](https://github.com/litagin02/Style-Bert-VITS2/blob/dev/convert_bert_onnx.py)を利用しています。<br>
23
 
24
- ## デモ音声
25
- <audio controls src="https://cdn-uploads.huggingface.co/production/uploads/668a2a06aafa84bf3c3f1797/gttoi1AYXDwC4TGc4h7ZI.wav"></audio>
26
- ```
27
- やったー!テストで満点取れた!私とっても嬉しいな!
28
- どうして私の意見を無視するの?許せない!ムカつく!あんたなんか死ねばいいのに。
29
- あはははっ!この漫画めっちゃ笑える、見てよこれ、ふふふ、あはは。
30
- あなたがいなくなって、私は一人になっちゃって、泣いちゃいそうなほど悲しい。
31
- ```
32
- <audio controls src="https://cdn-uploads.huggingface.co/production/uploads/668a2a06aafa84bf3c3f1797/yEDIC7ppt16svu9tCkTV5.wav"></audio>
33
-
34
- ```
35
- 音声合成は、機械学習を活用して、テキストから人の声を再現する技術です。
36
- この技術は、言語の構造を解析し、それに基づいて音声を生成します。
37
- この分野の最新の研究成果を使うと、より自然で表現豊かな音声の生成が可能である。
38
- 深層学習の応用により、感情やアクセントを含む声質の微妙な変化も再現することが出来る。
39
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
40
 
41
  ## Aivisspeech対応ファイル
42
  Aivisspeech形式ファイルは、拡張子が```.aivm``` ```.aivmx```のものとします。<br>
@@ -116,99 +131,100 @@ https://tyc.rei-yumesaki.net/
116
  Aivis Common Model License (ACML) - Non Commercial 1.0<br>
117
  https://github.com/Aivis-Project/ACML/blob/master/ACML-NC-1.0.md
118
  より引用
 
119
  <details>
120
  <summary>Aivis Common Model License (ACML) - Non Commercial 1.0</summary>
121
 
122
- # Aivis Common Model License (ACML) - Non Commercial 1.0
123
-
124
- このライセンスは、AI 音声合成モデルの利用条件と制限を定めるものです。
125
-
126
- 音声合成技術の発展により、誰もが簡単に高品質な合成音声を作れるようになりました。
127
- この技術は、創作活動はもちろん、AI との対話や新しいサービスの開発など、さまざまな可能性を広げる革新的な手段として注目されています。
128
-
129
- 現在、音声合成モデルのライセンスは制作者ごとにまちまちで、利用条件も曖昧なことが多く、使いづらい状況が続いています。
130
- Aivis Project が策定する ACML は、音声合成モデルの自由な利用を促進しながら、制作者と利用者の双方にとって安心して活用できる環境を実現することを目指しています。
131
-
132
- また、多くの制作者に共通のライセンスとして採用していただくことで、モデルごとの規約に気を遣うことなく、誰もが安心して音声合成モデルを利用できる環境づくりを目指しています。
133
-
134
- このライセンスは、あなたに以下の権利を許諾します。
135
-
136
- - ✅ **この音声合成モデルの利用・複製・改変・派生物の作成**
137
- - 音声合成モデルを実行して音声を生成することはもちろん、モデルの複製や改変、派生モデルの作成も自由に行えます。
138
- - ✅ **この音声合成モデルやその派生物の配布**
139
- - このライセンスの条件に従う限��、改変の有無を問わず、自由に再配布することができます。
140
-
141
- ただし、これらの権利は「できないこと(禁止事項)」に定める制限に従うものとします。
142
-
143
- ## 用語の定義
144
-
145
- - **話者:** 話し手 (Speaker) のことをいいます。話者には「実在人物」の声と「キャラクター」の声の両方を含みます。
146
- - **音声合成モデル:** 話者の声を AI に学習させることで制作された、テキストからその話者に近い合成音声を生成できる、重み (Weight) やパラメータのことを指します。
147
- - **あなた:** このライセンスによって許可された行為を行う個人・法人のことをいいます。
148
- - **このライセンス:** このライセンス自身 (Aivis Common Model License: ACML) のことをいいます。
149
- - **この音声合成モデル:** このライセンスにより利用が許諾される音声合成モデルのことをいいます。
150
- - **利用:** この音声合成モデルの実行、複製、改変、配布、組み込み、その他あらゆる利用形態を含みます。
151
- - **派生物:** この音声合成モデルを基に作成された二次的著作物、改変物、または派生物を指します。
152
-
153
- ## できないこと(禁止事項)
154
-
155
- - ❌ **音声合成モデルの元となった話者や無関係な他者の「本人」「原作者」「公式関係者」であるとの誤解を招く/騙すような利用**
156
- - 生成した音声を、ディープフェイクや公式なコンテンツだと誤解されるような形で公開しないでください。
157
- - 「※非公式です」「本人とは一切関係ありません」と明記するなど、なるべく公式なものだと誤解されないよう注意を払ってください。
158
- - ❌ **話者のイメージ・尊厳・品位・社会的評価を「傷つける」「価値を下げる」「貶める」ような利用**
159
- - 第三者が『この声がこんな用途に使われるのは嫌だ』と感じるような使い方をしないでください。
160
- - 話者がキャラクターのときは、そのキャラクターが登場する作品に対しても同様に適用されます。
161
- - 具体的には、下記の禁止事項が該当します。
162
- - ❌ **実在する人物・団体・商品などを「批判」「攻撃」「嫌がらせ」「誹謗中傷」「差別」する活動への利用**
163
- - 「攻撃」とは、自他を傷つけるあらゆる行為(犯罪、戦争、暴行、自傷・自殺、薬物乱用、ヘイトスピーチ、誹謗中傷、侮辱、揶揄、アンチ活動、詐欺、クラッキング、その他あらゆる身体的・精神的・社会的加害を含むがこれらに限定されない)を、実行または扇動することをいいます。
164
- - あなたの主張が正当であるかどうかにかかわらず、批判や攻撃を目的とした活動にはお使いいただけません。
165
- - ❌ **人々を騙す目的で虚偽の情報やコンテンツを公開・流布する活動への利用**
166
- - フェイクニュースの作成や誤情報を広める目的ではお使いいただけません。
167
- - ❌ **虚偽または誇大な表現によるマーケティングや倫理的に問題のあるビジネスへの利用**
168
- - 消費者の誤解を狙った悪質なマーケティング活動・倫理的に問題のある事業活動(虚偽広告、誇大広告、高額情報商材、マルチ商法、ねずみ講を含むがこれらに限定されない)やその宣伝にはお使いいただけません。
169
- - ❌ **特定の政治的立場・政治団体・政治家・宗教団体・宗教家・排他的思想・社会的勢力・陰謀論への賛同・支援または反対・批判・非難を呼びかける活動(権利運動・署名運動・デモ・プロパガンダを含むがこれらに限定されない)への利用**
170
- - 「陰謀論」とは、科学的根拠や事実に基づかない主張(ワクチン、通信技術、医療、健康、社会問題などに関する誤った情報を含むがこれらに限定されない)のことをいいます。
171
- - あなたの主張が正当であるかどうかにかかわらず、特定の政治・宗教・排他的思想・社会的勢力・陰謀論に関する主張を広める活動にはお使いいただけません。
172
- - ❌ **反社会的・犯罪目的での利用**
173
- - 話者へのなりすましによるオレオレ詐欺や、反社会的勢力による利用などを含みます。
174
- - ❌ **営利目的での利用**
175
- - 以下のような、営利を目的としない使い方でのみお使いいただけます。
176
- - 個人による私的な創作活動
177
- - 学校や大学など教育機関における教育・研究目的での利用
178
- - その他、営利を目的としない活動での利用
179
-
180
- ## できること
181
-
182
- - ✅ **上記「できないこと(禁止事項)」に該当しない、すべての���営利利用**
183
- - 禁止事項に該当しない使い方であれば、どのような用途にも自由にお使いいただけます。
184
- - その際、下記の「なるべく守ってほしいこと」を尊重した利用をお願いします。
185
- - クレジット表記は任意です。音声合成モデルの制作者や話者のクレジット表記を行うかどうかは、あなたの判断にお任せします。
186
- - この音声合成モデルを他の人に配布・共有する場合は、必ずこのライセンス文書も一緒に添付してください。
187
- - ℹ️ **この音声合成モデルを組み込んだアプリ・Web サービスを不特定多数に公開する場合:**
188
- - 不特定多数のユーザー or AI (LLM) が任意のテキストを入力して音声合成できる状況において、このライセンスをユーザーや LLM に完璧に遵守させることは、技術的・現実的に極めて困難であると考えられます。
189
- - このため特例として、(技術的に禁止事項に該当する利用を防げる状態かに関わらず)**「アプリ・Web サービスの開発元自身がこのライセンスを遵守し、現実的な範囲でなるべく禁止事項に該当する利用が起きないよう努めていれば」お使いいただけます。**
190
-
191
- ## なるべく守ってほしいこと
192
-
193
- - ℹ️ **話者をリスペクト・尊重した利用をしてほしい**
194
- - 具体的にどのような使い方が「リスペクト」となるかは、あなたの良識にお任せします。
195
- - 話者がキャラクターのときは、そのキャラクターが登場する作品も十分にリスペクトしてください。
196
- - キャラクター愛・作品愛のある使い方をお願いします。
197
- - ℹ️ **刺激の強い/万人向けでない表現を公開するときは、「見たくない人・見るべきでない人の目に入らない」よう十分配慮してほしい**
198
- - 表現に合わせた適切なゾーニングをお願いします。
199
- - ゾーニングの例:「年齢制限を掛ける」「SNS のセンシティブ設定をオンにする」「コンテンツの前に注意書きを設置する」
200
- - ℹ️ **常識の範囲内で、良識ある利用をしてほしい**
201
- - 上記はあくまで任意であり、遵守されていなくてもライセンス違反にはなりません。
202
-
203
- ## 免責事項
204
-
205
- - この音声合成モデルは「現状のまま」提供されており、商品性や特定の目的への適合性、権利の非侵害などについて、明示的または黙示的を問わず、いかなる保証もありません。
206
- - 音声合成モデルの制作者は、この音声合成モデルの利用や取り扱いまたはその結果に関連して、契約や不法行為など、いかなる形の請求や損害賠償、その他の責任についても、一切の責任を負いません。あなた自身の責任においてお使いください。
207
- - このライセンスのいずれかの条項が無効または執行不能と判断された場合でも、残りの条項は完全に有効に存続するものとします。
208
- - このライセンスのいずれかの条項の権利行使を行わなかったとしても、それは当該条項または他の条項の権利放棄とはみなされません。
209
- - このライセンスはすべて日本語で提供され、日本語のみにより解釈されるものとします。
210
-
211
- 上記の免責事項は、適用される法令の下で許容される最大限の範囲で適用されるものとします。
212
  </details>
213
 
214
  ---
 
21
  ONNX形式ファイルは、Safetensors形式ファイルを変換して作成しています。<br>
22
  変換には、[litagin02/Style-Bert-VITS2/convert_bert_onnx.py](https://github.com/litagin02/Style-Bert-VITS2/blob/dev/convert_bert_onnx.py)を利用しています。<br>
23
 
24
+
25
+ <details>
26
+ <summary>デモ音声</summary>
27
+
28
+ ## デモ音声
29
+ Aivisspeechにて生成した無調整音声です。<br>
30
+ 音声の調整はパラメータ調整を含め、行っておりません。<br>
31
+
32
+ <audio controls src="https://cdn-uploads.huggingface.co/production/uploads/668a2a06aafa84bf3c3f1797/gttoi1AYXDwC4TGc4h7ZI.wav"></audio>
33
+ ```
34
+ やったー!テストで満点取れた!私とっても嬉しいな!
35
+ どうして私の意見を無視するの?許せない!ムカつく!あんたなんか死ねばいいのに。
36
+ あはははっ!この漫画めっちゃ笑える、見てよこれ、ふふふ、あはは。
37
+ あなたがいなくなって、私は一人になっちゃって、泣いちゃいそうなほど悲しい。
38
+
39
+ Aivisspeechバージョン:Aivisspeech 1.1.0-preview.2
40
+ モデルバージョン:1.0.0
41
+ ```
42
+
43
+ <audio controls src="https://cdn-uploads.huggingface.co/production/uploads/668a2a06aafa84bf3c3f1797/yEDIC7ppt16svu9tCkTV5.wav"></audio>
44
+ ```
45
+ 音声合成は、機械学習を活用して、テキストから人の声を再現する技術です。
46
+ この技術は、言語の構造を解析し、それに基づいて音声を生成します。
47
+ この分野の最新の研究成果を使うと、より自然で表現豊かな音声の生成が可能である。
48
+ 深層学習の応用により、感情やアクセントを含む声質の微妙な変化も再現することが出来る。
49
+
50
+ Aivisspeechバージョン:Aivisspeech 1.1.0-preview.2
51
+ モデルバージョン:1.0.0
52
+ ```
53
+ </details>
54
+
55
 
56
  ## Aivisspeech対応ファイル
57
  Aivisspeech形式ファイルは、拡張子が```.aivm``` ```.aivmx```のものとします。<br>
 
131
  Aivis Common Model License (ACML) - Non Commercial 1.0<br>
132
  https://github.com/Aivis-Project/ACML/blob/master/ACML-NC-1.0.md
133
  より引用
134
+
135
  <details>
136
  <summary>Aivis Common Model License (ACML) - Non Commercial 1.0</summary>
137
 
138
+ # Aivis Common Model License (ACML) - Non Commercial 1.0
139
+
140
+ このライセンスは、AI 音声合成モデルの利用条件と制限を定めるものです。
141
+
142
+ 音声合成技術の発展により、誰もが簡単に高品質な合成音声を作れるようになりました。
143
+ この技術は、創作活動はもちろん、AI との対話や新しいサービスの開発など、さまざまな可能性を広げる革新的な手段として注目されています。
144
+
145
+ 現在、音声合成モデルのライセンスは制作者ごとにまちまちで、利用条件も曖昧なことが多く、使いづらい状況が続いています。
146
+ Aivis Project が策定する ACML は、音声合成モデルの自由な利用を促進しながら、制作者と利用者の双方にとって安心して活用できる環境を実現することを目指しています。
147
+
148
+ また、多くの制作者に共通のライセンスとして採用していただくことで、モデルごとの規約に気を遣うことなく、誰もが安心して音声合成モデルを利用できる環境づくりを目指しています。
149
+
150
+ このライセンスは、あなたに以下の権利を許諾します。
151
+
152
+ - ✅ **この音声合成モデルの利用・複製・改変・派生物の作成**
153
+ - 音声合成モデルを実行して音声を生成することはもちろ���、モデルの複製や改変、派生モデルの作成も自由に行えます。
154
+ - ✅ **この音声合成モデルやその派生物の配布**
155
+ - このライセンスの条件に従う限り、改変の有無を問わず、自由に再配布することができます。
156
+
157
+ ただし、これらの権利は「できないこと(禁止事項)」に定める制限に従うものとします。
158
+
159
+ ## 用語の定義
160
+
161
+ - **話者:** 話し手 (Speaker) のことをいいます。話者には「実在人物」の声と「キャラクター」の声の両方を含みます。
162
+ - **音声合成モデル:** 話者の声を AI に学習させることで制作された、テキストからその話者に近い合成音声を生成できる、重み (Weight) やパラメータのことを指します。
163
+ - **あなた:** このライセンスによって許可された行為を行う個人・法人のことをいいます。
164
+ - **このライセンス:** このライセンス自身 (Aivis Common Model License: ACML) のことをいいます。
165
+ - **この音声合成モデル:** このライセンスにより利用が許諾される音声合成モデルのことをいいます。
166
+ - **利用:** この音声合成モデルの実行、複製、改変、配布、組み込み、その他あらゆる利用形態を含みます。
167
+ - **派生物:** この音声合成モデルを基に作成された二次的著作物、改変物、または派生物を指します。
168
+
169
+ ## できないこと(禁止事項)
170
+
171
+ - ❌ **音声合成モデルの元となった話者や無関係な他者の「本人」「原作者」「公式関係者」であるとの誤解を招く/騙すような利用**
172
+ - 生成した音声を、ディープフェイクや公式なコンテンツだと誤解されるような形で公開しないでください。
173
+ - 「※非公式です」「本人とは一切関係ありません」と明記するなど、なるべく公式なものだと誤解されないよう注意を払ってください。
174
+ - ❌ **話者のイメージ・尊厳・品位・社会的評価を「傷つける」「価値を下げる」「貶める」ような利用**
175
+ - 第三者が『この声がこんな用途に使われるのは嫌だ』と感じるような使い方をしないでください。
176
+ - 話者がキャラクターのときは、そのキャラクターが登場する作品に対しても同様に適用されます。
177
+ - 具体的には、下記の禁止事項が該当します。
178
+ - ❌ **実在する人物・団体・商品などを「批判」「攻撃」「嫌がらせ」「誹謗中傷」「差別」する活動への利用**
179
+ - 「攻撃」とは、自他を傷つけるあらゆる行為(犯罪、戦争、暴行、自傷・自殺、薬物乱用、ヘイトスピーチ、誹謗中傷、侮辱、揶揄、アンチ活動、詐欺、クラッキング、その他あらゆる身体的・精神的・社会的加害を含むがこれらに限定されない)を、実行または扇動することをいいます。
180
+ - あなたの主張が正当であるかどうかにかかわらず、批判や攻撃を目的とした活動にはお使いいただけません。
181
+ - ❌ **人々を騙す目的で虚偽の情報やコンテンツを公開・流布する活動への利用**
182
+ - フェイクニュースの作成や誤情報を広める目的ではお使いいただけません。
183
+ - ❌ **虚偽または誇大な表現によるマーケティングや倫理的に問題のあるビジネスへの利用**
184
+ - 消費者の誤解を狙った悪質なマーケティング活動・倫理的に問題のある事業活動(虚偽広告、誇大広告、高額情報商材、マルチ商法、ねずみ講を含むがこれらに限定されない)やその宣伝にはお使いいただけません。
185
+ - ❌ **特定の政治的立場・政治団体・政治家・宗教団体・宗教家・排他的思想・社会的勢力・陰謀論への賛同・支援または反対・批判・非難を呼びかける活動(権利運動・署名運動・デモ・プロパガンダを含むがこれらに限定されない)への利用**
186
+ - 「陰謀論」とは、科学的根拠や事実に基づかない主張(ワクチン、通信技術、医療、健康、社会問題などに関する誤った情報を含むがこれらに限定されない)のことをいいます。
187
+ - あなたの主張が正当であるかどうかにかかわらず、特定の政治・宗教・排他的思想・社会的勢力・陰謀論に関する主張を広める活動にはお使いいただけません。
188
+ - ❌ **反社会的・犯罪目的での利用**
189
+ - 話者へのなりすましによるオレオレ詐欺や、反社会的勢力による利用などを含みます。
190
+ - ❌ **営利目的での利用**
191
+ - 以下のような、営利を目的としない使い方でのみお使いいただけます。
192
+ - 個人による私的��創作活動
193
+ - 学校や大学など教育機関における教育・研究目的での利用
194
+ - その他、営利を目的としない活動での利用
195
+
196
+ ## できること
197
+
198
+ - ✅ **上記「できないこと(禁止事項)」に該当しない、すべての非営利利用**
199
+ - 禁止事項に該当しない使い方であれば、どのような用途にも自由にお使いいただけます。
200
+ - その際、下記の「なるべく守ってほしいこと」を尊重した利用をお願いします。
201
+ - クレジット表記は任意です。音声合成モデルの制作者や話者のクレジット表記を行うかどうかは、あなたの判断にお任せします。
202
+ - この音声合成モデルを他の人に配布・共有する場合は、必ずこのライセンス文書も一緒に添付してください。
203
+ - ℹ️ **この音声合成モデルを組み込んだアプリ・Web サービスを不特定多数に公開する場合:**
204
+ - 不特定多数のユーザー or AI (LLM) が任意のテキストを入力して音声合成できる状況において、このライセンスをユーザーや LLM に完璧に遵守させることは、技術的・現実的に極めて困難であると考えられます。
205
+ - このため特例として、(技術的に禁止事項に該当する利用を防げる状態かに関わらず)**「アプリ・Web サービスの開発元自身がこのライセンスを遵守し、現実的な範囲でなるべく禁止事項に該当する利用が起きないよう努めていれば」お使いいただけます。**
206
+
207
+ ## なるべく守ってほしいこと
208
+
209
+ - ℹ️ **話者をリスペクト・尊重した利用をしてほしい**
210
+ - 具体的にどのような使い方が「リスペクト」となるかは、あなたの良識にお任せします。
211
+ - 話者がキャラクターのときは、そのキャラクターが登場する作品も十分にリスペクトしてください。
212
+ - キャラクター愛・作品愛のある使い方をお願いします。
213
+ - ℹ️ **刺激の強い/万人向けでない表現を公開するときは、「見たくない人・見るべきでない人の目に入らない」よう十分配慮してほしい**
214
+ - 表現に合わせた適切なゾーニングをお願いします。
215
+ - ゾーニングの例:「年齢制限を掛ける」「SNS のセンシティブ設定をオンにする」「コンテンツの前に注意書きを設置する」
216
+ - ℹ️ **常識の範囲内で、良識ある利用をしてほしい**
217
+ - 上記はあくまで任意であり、遵守されていなくてもライセンス違反にはなりません。
218
+
219
+ ## 免責事項
220
+
221
+ - この音声合成モデルは「現状のまま」提供されており、商品性や特定の目的への適合性、権利の非侵害などについて、明示的または黙示的を問わず、いかなる保証もありません。
222
+ - 音声合成モデルの制作者は、この音声合成モデルの利用や取り扱いまたはその結果に関連して、契約や不法行為など、いかなる形の請求や損害賠償、その他の責任についても、一切の責任を負いません。あなた自身の責任においてお使いください。
223
+ - このライセンスのいずれかの条項が無効または執行不能と判断された場合でも、残りの条項は完全に有効に存続するものとします。
224
+ - このライセンスのいずれかの条項の権利行使を行わなかったとしても、それは当該条項または他の条項の権利放棄とはみなされません。
225
+ - このライセンスはすべて日本語で提供され、日本語のみにより解釈されるものとします。
226
+
227
+ 上記の免責事項は、適用される法令の下で許容される最大限の範囲で適用されるものとします。
228
  </details>
229
 
230
  ---