NLP– tag –
-
自然言語処理無料で誰でも使える「音声合成API」作ってみました
最近 VITS TTS が面白くてずっといじっていたベースコードを改造して、いくつかの音声合成モデルをファインチューニングしてみました。その内、イントネーションが割とよく、上出来だなーと思っているのは「あみたろの声素材工房」の音声を使って学習したモデルです。VITS モデル自体は下記のリンクで公開しています。VITS-Amitaro-Modelこちらのリンクでどいう音声なのか試せます。音声生成したいテキストを入力して 「Generate Voice!」 ボタンを押せば音声が作成されますVITS-TTS-Japanese-Only-Amitaroそのままモデル公開するだけでは使いにくいと思い、 API を作りました。APIは2種類の出力があって、渡したパラメータによって出力が変わります。"audio_array" 音楽データのArra... -
チャットボットUnity WebGL + ChatGPT (3.5) + VITS TTS 音声合成モデルでゲームNPC作りました
こちらの記事に記載しているWebGL は現在新しいバーションがでましたので、現在は動きません。現行版は Huggingface の方にご試しください。また、須藤春ちゃんもよろしくお願いいたします。具体的には以前使ったチャットボットのAPIがサービス終了したため、A3RT の TalkAPI → GPT3.5 (OpenAI)Docomo 音声合成API → VITS音声生成モデル( https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer )に変えました。まとめると・Unity WebGL で 3D モデルアバター・GPT3.5で返事生成 ・生成した返事を VITS音声生成モデルを音声生成今回はゲームNPCとして「ポーション屋さん」という設定で作成しています!document.getElementById("test_mokuran").innerHTML='';あま...
1