スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

今週の現状報告

久々の現状報告。

【NAIPによる家電操作】
当初の目標でもあった、NAIPからの家電制御のテストしてます。家電を直接操作することはできないので、PCに接続できる学習リモコンをNAIPで制御することで擬似的に家電操作を可能にしようという試みです。
PCで制御できる学習リモコンはiRemoconなどいくつかありますが、今回はコスト面から考えてBUFFALOのPC用学習リモコンキットPC-OP-RS1を制御対象に選びました。
テストは良好で今のところ音声入力でエアコンやテレビの電源を操作できるようになりました。近々テスト版として公開する予定ですので、興味のある方は試してみてください。

【音響モデルの構築 その2】
ニコ動にMMDAgentの音響モデルを構築をしたという動画を見つけたので、改めて構築しようとしたのだけれども・・・。
まあなかなかうまくいかないものでエラーは出るは、構築できたモデルの出来がイマイチだったりと結局挫折。まあ、今後も音響モデルはいじっていくつもりです。出来るだけミクさんに近づけれるといいなあ。

誰か、HMMの話者適応について分かる人いないかなあ。現在挑戦中の話者依存以上に、ラベルとかサンプルデータとか意味が分からない。ちなみに、CEATECのデモの音響モデルは話者適応で製作されたものらしいです。
スポンサーサイト

テーマ : プログラミング
ジャンル : コンピュータ

コメントの投稿

非公開コメント

音響モデルの構築について

はじめまして、音響モデルの構築に興味を持っているものです。

専門書2冊買いました。森北出版の『フリーソフトでつくる音声認識システム』
(学生向けか割と平易に書いてある)とオーム社の『音声認識システム』(難しい)です。

それによりますと、ラベル付けとは、音声の発話秒数(正確にはフレーム数)に対して、
文字データを付与することだそうです。(森北出版の本より)

また、音素をつなぎ合わせて認識したり発話するわけですが、その音響モデルには
モノフォンからトライフォンまであり、トライフォンの適用にはロジカルトライフォンと
フィジカルトライフォンの対応ファイルが必要だそうです。(オーム社の本より)

モノフォンというのが、話者依存で、トライフォンが話者適応で間違ってたらすみません。
プロフィール

CUBE370

Author:CUBE370
MMDAgent用の誰得プラグインを作ってます。
MMDAgentに関する情報や自作プラグインについて書いてます。

技術的なことはwikiのほうにまとめてます。
http://cube370.wiki.fc2.com/

つぶやき
最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
FC2カウンター
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。