今週の現状報告
2週間に1度の更新がデフォになってきた。
【Project-NAIP ver.2 開発状況】
開発状況・・・停滞中。
現状、前回の報告からまったく進んでません。この2週間はこんな感じでした。
朗読プログラムを作る。
↓
音響モデルを変更したくなる。
↓
情報収集
↓
音響モデル作成環境構築
↓
サンプルから音響モデルを作成
↓
MMDAgentへの音響モデルの適応
↓
自作音響モデルを作りたくなる
↓
学習用音声データ群の用意
↓
自作音響モデルを作成
↓
MMDAgentへ適応 ←今ここ
【MMDAgentの音響モデルの変更方法(仮)】
MMDAgent公開から半年が経ちましたが、今だ音響モデルの変更についてはあまり触れられることが無かったので、思い切って挑戦してみました。
安易に足を踏み入れたら、奈落のそこ真っ逆さま、って感じでかなりもがき苦しみましたがなんとか自作音響モデルを作ることが出来ました。その成果はこちら。
ただし、10個の音声データで作成したのでかなりアレです。通常は503個の音声データから作るようですがそこまでの音声データを用意できなかった。
さて、肝心の音響モデル変更法ですが、割と簡単です。MMDAgentのVoiceフォルダ内の「mei_angry」、「mei_bashful」「mei_happy」「mei_normal」「mei_sad」の各フォルダ内に全ファイルを上書きしてください。そのあとMMDAgentを起動してみてください。声が変わっていると思います。
Open_JTalkで配布されている音響モデルも同様の方法で適応できます。こちらを適応すると男性声になります。
ちなみにこの方法たぶん正攻法ではないと思います。なので、自己責任でお願いします。
【MMDAgentの音響モデル作成方法(仮)】
さて、問題の音響モデルの自作方法ですが、正直説明できるほど自分の中でまとまっていません。申し訳ない。
なので、開発環境や参考にしたサイトをご紹介しておきます。これから挑戦してみたい人は参考にしてください。自分の場合はサンプルで動作確認後、サンプルの音声データとかラベルファイルを自作のものにすり替えて音響モデルを自作しました。
・参考にしたサイト
HTSによるHMM音声合成 (HTSの学習 話者依存学習を参考)
JuliusとJulian (自動ラベリングを参考)
・開発環境
Linux Fedora15 (VirtualBox上に用意)
ソフトウェア開発用途でインストール
・用意したもの
ActiveTcl8.4.19.4.292682-linux-ix86
HDecode-3.4.1
HTK-3.4.1
hts_engine_API-1.05
HTS-2.2_for_HTK-3.4.1
HTS-demo_NIT-ATR503-M001
openfst-1.2.7
SPTK-3.4.1
・必須なもの
atr503文章を読み上げた音声データ
基本Linux上でモデル構築をするので最低限Linuxのコマンドを打てるくらいの知識が必要。Perlのプログラミング知識があると幸せになれるかも。
WindowsでもCygwinで環境を用意できるらしいが、そんなことするよりFedoraを仮想環境で用意したほうがコンパイラの用意とか面倒なことしなくて済むのでオススメ。
正直、音声合成とか門外漢の素人なのでむしろ誰かに教えてほしいくらいですが、質問等あれば出来るだけお答えします。
というか、誰かやってみてください。そして意見交換しましょう。特に自動ラベリングについてとか・・・。
【Project-NAIP ver.2 開発状況】
開発状況・・・停滞中。
現状、前回の報告からまったく進んでません。この2週間はこんな感じでした。
朗読プログラムを作る。
↓
音響モデルを変更したくなる。
↓
情報収集
↓
音響モデル作成環境構築
↓
サンプルから音響モデルを作成
↓
MMDAgentへの音響モデルの適応
↓
自作音響モデルを作りたくなる
↓
学習用音声データ群の用意
↓
自作音響モデルを作成
↓
MMDAgentへ適応 ←今ここ
【MMDAgentの音響モデルの変更方法(仮)】
MMDAgent公開から半年が経ちましたが、今だ音響モデルの変更についてはあまり触れられることが無かったので、思い切って挑戦してみました。
安易に足を踏み入れたら、奈落のそこ真っ逆さま、って感じでかなりもがき苦しみましたがなんとか自作音響モデルを作ることが出来ました。その成果はこちら。
ただし、10個の音声データで作成したのでかなりアレです。通常は503個の音声データから作るようですがそこまでの音声データを用意できなかった。
さて、肝心の音響モデル変更法ですが、割と簡単です。MMDAgentのVoiceフォルダ内の「mei_angry」、「mei_bashful」「mei_happy」「mei_normal」「mei_sad」の各フォルダ内に全ファイルを上書きしてください。そのあとMMDAgentを起動してみてください。声が変わっていると思います。
Open_JTalkで配布されている音響モデルも同様の方法で適応できます。こちらを適応すると男性声になります。
ちなみにこの方法たぶん正攻法ではないと思います。なので、自己責任でお願いします。
【MMDAgentの音響モデル作成方法(仮)】
さて、問題の音響モデルの自作方法ですが、正直説明できるほど自分の中でまとまっていません。申し訳ない。
なので、開発環境や参考にしたサイトをご紹介しておきます。これから挑戦してみたい人は参考にしてください。自分の場合はサンプルで動作確認後、サンプルの音声データとかラベルファイルを自作のものにすり替えて音響モデルを自作しました。
・参考にしたサイト
HTSによるHMM音声合成 (HTSの学習 話者依存学習を参考)
JuliusとJulian (自動ラベリングを参考)
・開発環境
Linux Fedora15 (VirtualBox上に用意)
ソフトウェア開発用途でインストール
・用意したもの
ActiveTcl8.4.19.4.292682-linux-ix86
HDecode-3.4.1
HTK-3.4.1
hts_engine_API-1.05
HTS-2.2_for_HTK-3.4.1
HTS-demo_NIT-ATR503-M001
openfst-1.2.7
SPTK-3.4.1
・必須なもの
atr503文章を読み上げた音声データ
基本Linux上でモデル構築をするので最低限Linuxのコマンドを打てるくらいの知識が必要。Perlのプログラミング知識があると幸せになれるかも。
WindowsでもCygwinで環境を用意できるらしいが、そんなことするよりFedoraを仮想環境で用意したほうがコンパイラの用意とか面倒なことしなくて済むのでオススメ。
正直、音声合成とか門外漢の素人なのでむしろ誰かに教えてほしいくらいですが、質問等あれば出来るだけお答えします。
というか、誰かやってみてください。そして意見交換しましょう。特に自動ラベリングについてとか・・・。
今週の現状報告
ミクさんマジ天使!(ミクノポリスの感想)
【Project-NAIP ver.2 開発状況】
開発状況・・・41%くらい?
この2週間はある処理が思ったように実装できず、開発そのものはあまり進んでいません。
【MMDAgentで青空文庫朗読】
開発が進んでいないのはこの機能を実装しようとして躓いていたってのが本当のところ。2週間かけた分、朗読できるようにはなりました。棒立ちのままでですけど・・・。
【MMDの勉強開始】
いくらなんでも棒立ちのまま朗読するってのは絵的にアレなので、モーションを作ってみようかと。MMDは完全に初心者なので書籍を買ってみたり、解説動画を見てみたりして試行錯誤しながらモーション作成しています。近いうちにニコ生で朗読テストできればいいかな。
【Project-NAIP ver.2 開発状況】
開発状況・・・41%くらい?
この2週間はある処理が思ったように実装できず、開発そのものはあまり進んでいません。
【MMDAgentで青空文庫朗読】
開発が進んでいないのはこの機能を実装しようとして躓いていたってのが本当のところ。2週間かけた分、朗読できるようにはなりました。棒立ちのままでですけど・・・。
【MMDの勉強開始】
いくらなんでも棒立ちのまま朗読するってのは絵的にアレなので、モーションを作ってみようかと。MMDは完全に初心者なので書籍を買ってみたり、解説動画を見てみたりして試行錯誤しながらモーション作成しています。近いうちにニコ生で朗読テストできればいいかな。
今週の現状報告
やっべー、ACfa楽しすぎる。
【Project-NAIP ver.2 開発状況】
開発状況・・・40%くらい?
仕事がひと段落したので、NAIPの開発に集中できるかな?今のペースだと6月中の公開は無理かな。
【MMDAgentで青空文庫朗読】
今週、ふと思いついたネタ。MMDAgentで青空文庫を朗読すると、案外いけるかも。割と抑揚があるからそれっぽくなると思う。ネタとして思いついただけで、実装するかどうかは未定ですが。
【Project-NAIP ver.2 開発状況】
開発状況・・・40%くらい?
仕事がひと段落したので、NAIPの開発に集中できるかな?今のペースだと6月中の公開は無理かな。
【MMDAgentで青空文庫朗読】
今週、ふと思いついたネタ。MMDAgentで青空文庫を朗読すると、案外いけるかも。割と抑揚があるからそれっぽくなると思う。ネタとして思いついただけで、実装するかどうかは未定ですが。
今週の現状報告
久しぶりにアーマード・コアFAをプレイした。そして思い知る、やっぱ自分はアクション系が苦手だということに。
【Project-NAIP ver.2 開発状況】
まったく進んでおりません。今週なんか1行もソース書いてないし。
じゃあ、なんでブログを更新するかだって?更新すらやめてしまったら、開発までやめてしまいそうだからだよ。
最近、つくづく思うんだよね。年をとると知識や技術、経験が増えていくけど、代わりに趣味に使える時間が減っていってるように思うんだ。
まあ、ゲームする時間や睡眠時間を削ればいいんだけどね・・・。
【Project-NAIP ver.2 開発状況】
まったく進んでおりません。今週なんか1行もソース書いてないし。
じゃあ、なんでブログを更新するかだって?更新すらやめてしまったら、開発までやめてしまいそうだからだよ。
最近、つくづく思うんだよね。年をとると知識や技術、経験が増えていくけど、代わりに趣味に使える時間が減っていってるように思うんだ。
まあ、ゲームする時間や睡眠時間を削ればいいんだけどね・・・。
今週の現状報告
MGの00ライザーが欲しい。でも組み立てる時間が無い。2年に1度、プラモを作りたくなる時期があるが大抵プラモ買っても組み立てずに終わるか、なが~い時間かけてつくるかなんだよねぇ。だから最近はフィギアとかもう出来上がっているものを買っちゃうんだよねぇ。因みに最近(2年前)作ったのはコトブキヤのアルトアイゼン・リーゼ。
【Project-NAIP ver.2 開発状況】
開発状況・・・35%。
いや~、ほとんど進んでないっす。UIの部分は作り終えたので、コアとなるMMDAgentとの連携部分とかNAIP固有の機能部分とか作り直してるところなんですが。
クラス化が思うように進まなくて、どこまでをクラスにしようかとか、スレッド処理とか、Cのときとは勝手が違うのでなかなか進みません。
こう、C言語で初めてソース分割して、ライブラリ作成して、ヘッダファイルで管理しようとしたときに似てるかな。
【Project-NAIP ver.2 開発状況】
開発状況・・・35%。
いや~、ほとんど進んでないっす。UIの部分は作り終えたので、コアとなるMMDAgentとの連携部分とかNAIP固有の機能部分とか作り直してるところなんですが。
クラス化が思うように進まなくて、どこまでをクラスにしようかとか、スレッド処理とか、Cのときとは勝手が違うのでなかなか進みません。
こう、C言語で初めてソース分割して、ライブラリ作成して、ヘッダファイルで管理しようとしたときに似てるかな。