自然言語処理– category –
-
自然言語処理無料で誰でも使える「音声合成API」作ってみました
最近 VITS TTS が面白くてずっといじっていたベースコードを改造して、いくつかの音声合成モデルをファインチューニングしてみました。その内、イントネーションが割とよく、上出来だなーと思っているのは「あみたろの声素材工房」の音声を使って学習したモデルです。VITS モデル自体は下記のリンクで公開しています。VITS-Amitaro-Modelこちらのリンクでどいう音声なのか試せます。音声生成したいテキストを入力して 「Generate Voice!」 ボタンを押せば音声が作成されますVITS-TTS-Japanese-Only-Amitaroそのままモデル公開するだけでは使いにくいと思い、 API を作りました。APIは2種類の出力があって、渡したパラメータによって出力が変わります。"audio_array" 音楽データのArra... -
チャットボットUnity WebGL + ChatGPT (3.5) + VITS TTS 音声合成モデルでゲームNPC作りました
こちらの記事に記載しているWebGL は現在新しいバーションがでましたので、現在は動きません。現行版は Huggingface の方にご試しください。また、須藤春ちゃんもよろしくお願いいたします。具体的には以前使ったチャットボットのAPIがサービス終了したため、A3RT の TalkAPI → GPT3.5 (OpenAI)Docomo 音声合成API → VITS音声生成モデル( https://huggingface.co/spaces/Plachta/VITS-Umamusume-voice-synthesizer )に変えました。まとめると・Unity WebGL で 3D モデルアバター・GPT3.5で返事生成 ・生成した返事を VITS音声生成モデルを音声生成今回はゲームNPCとして「ポーション屋さん」という設定で作成しています!document.getElementById("test_mokuran").innerHTML='';あま... -
自然言語処理BERTで感情解析API作ってみました。
APIはこちらのリンクで試せます。https://www.aithinkso.net/emotion/emotion_web.py割と当たってくれる。65%ぐらい当たるかな?8軸でランダムだった場合、精度がたった12.5%なので、BERTの恩恵はかなり大きい今後の課題・Pretrainedと最適化のデータ両方ともJumanPPで作ったのでSudachiで作ってみたい・時間をかけて学習データのゴミを消したい・リクエストごとにBERTのモデルをロードしないようにDaemon化したい(メモリがやばい) -
チャットボットUnity WebGL + A3RT Talk API + Docomo音声合成API でウェブチャットボット作りました
具体的には・Unity WebGL で 3D モデルアバター・A3RT の TalkAPI (雑談API) で返事生成 ・生成した返事を Docomo 音声合成APIで音声生成ソースコードなど細かい説明は別の記事でいいかなと思います。作ったものはこちら。document.getElementById("test_mokuran").innerHTML='';
1