スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

今週の現状報告

 2週間に1度の更新がデフォになってきた。

【Project-NAIP ver.2 開発状況】
 開発状況・・・停滞中。
 現状、前回の報告からまったく進んでません。この2週間はこんな感じでした。

 朗読プログラムを作る。
    ↓
 音響モデルを変更したくなる。
    ↓
 情報収集
    ↓
 音響モデル作成環境構築
    ↓
 サンプルから音響モデルを作成
    ↓
 MMDAgentへの音響モデルの適応
    ↓
 自作音響モデルを作りたくなる
    ↓
 学習用音声データ群の用意
    ↓
 自作音響モデルを作成
    ↓
 MMDAgentへ適応 ←今ここ

【MMDAgentの音響モデルの変更方法(仮)】
 MMDAgent公開から半年が経ちましたが、今だ音響モデルの変更についてはあまり触れられることが無かったので、思い切って挑戦してみました。
 安易に足を踏み入れたら、奈落のそこ真っ逆さま、って感じでかなりもがき苦しみましたがなんとか自作音響モデルを作ることが出来ました。その成果はこちら
 ただし、10個の音声データで作成したのでかなりアレです。通常は503個の音声データから作るようですがそこまでの音声データを用意できなかった。

 さて、肝心の音響モデル変更法ですが、割と簡単です。MMDAgentのVoiceフォルダ内の「mei_angry」、「mei_bashful」「mei_happy」「mei_normal」「mei_sad」の各フォルダ内に全ファイルを上書きしてください。そのあとMMDAgentを起動してみてください。声が変わっていると思います。
 Open_JTalkで配布されている音響モデルも同様の方法で適応できます。こちらを適応すると男性声になります。

 ちなみにこの方法たぶん正攻法ではないと思います。なので、自己責任でお願いします。

【MMDAgentの音響モデル作成方法(仮)】
 さて、問題の音響モデルの自作方法ですが、正直説明できるほど自分の中でまとまっていません。申し訳ない。
 なので、開発環境や参考にしたサイトをご紹介しておきます。これから挑戦してみたい人は参考にしてください。自分の場合はサンプルで動作確認後、サンプルの音声データとかラベルファイルを自作のものにすり替えて音響モデルを自作しました。

・参考にしたサイト
 HTSによるHMM音声合成 (HTSの学習 話者依存学習を参考)
 JuliusとJulian (自動ラベリングを参考)
・開発環境
 Linux Fedora15 (VirtualBox上に用意)
 ソフトウェア開発用途でインストール
・用意したもの
 ActiveTcl8.4.19.4.292682-linux-ix86
 HDecode-3.4.1
 HTK-3.4.1
 hts_engine_API-1.05
 HTS-2.2_for_HTK-3.4.1
 HTS-demo_NIT-ATR503-M001
 openfst-1.2.7
 SPTK-3.4.1
・必須なもの
 atr503文章を読み上げた音声データ

 基本Linux上でモデル構築をするので最低限Linuxのコマンドを打てるくらいの知識が必要。Perlのプログラミング知識があると幸せになれるかも。
 WindowsでもCygwinで環境を用意できるらしいが、そんなことするよりFedoraを仮想環境で用意したほうがコンパイラの用意とか面倒なことしなくて済むのでオススメ。
 正直、音声合成とか門外漢の素人なのでむしろ誰かに教えてほしいくらいですが、質問等あれば出来るだけお答えします。
 というか、誰かやってみてください。そして意見交換しましょう。特に自動ラベリングについてとか・・・。
スポンサーサイト

テーマ : プログラミング
ジャンル : コンピュータ

プロフィール

CUBE370

Author:CUBE370
MMDAgent用の誰得プラグインを作ってます。
MMDAgentに関する情報や自作プラグインについて書いてます。

技術的なことはwikiのほうにまとめてます。
http://cube370.wiki.fc2.com/

つぶやき
最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。