2017-06

スポンサーサイト

このエントリーをはてなブックマークに追加
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

Taps_dies さんのゆっくり将棋動画に音声認識キャプション同期機能で日本語字幕を付与する

このエントリーをはてなブックマークに追加
3月からYouTubeは日本語によるキャプション字幕同期機能の追加を開始したわけですが、どの程度音声認識にとって不利な状況でも同期してくれるのか確認してみました。

題材となるのは、タップダイスさんの動画、石田流基礎知識です。


ゆっくりボイス + BGM 付きの将棋講座動画ですが、人間の音声ではなく(ゆっくりボイス)しかもBGMが入ってくる状況で同期がどの程度取れるのか、ということで実験しました。こういう形態の講座はニコニコに投稿している人なら多いのではないかと思います。

まず字幕用の原稿を用意します。今回はUTF-8で用意しました。ゆっくりボイスで動画配信している人ならば、最初からあることの方が多いでしょう。
石田流ゆっくり.txt (リンク先はエンコード設定をUTF-8にしないと文字化けする可能性があります。)

これをYouTubeにアップロードします。詳しい説明はオフィシャルブログに任せます

で、その結果がこちら。


やや字幕同期に変な所は見受けられるものの、問題はまったくないと言っていいレベルだと思います。
ちなみに、音声同期機能はゆっくり音声との同期なので、実際の盤面の進行は考慮しておりません(^^;

棋譜の符号(▲△)なども入れてみましたが、特に問題なく認識してくれているようです。
ただYouTubeの機械翻訳機能ではうまく認識してくれないので、機械翻訳目的なら入れない方がいいでしょう。(棋譜をきちんと機械翻訳してくれるエンジンなんてあるのか知りませんが・・・)

注意点としては、一回に表示される字幕が15文字×2行しかないので、ゆっくりがものすごく流暢にしゃべる場合は、字幕がぶつぎりになってしまうことが多いです。

以前のエントリでも書きましたが、YouTubeの自動音声認識機能ではなく、キャプション同期機能で予め字幕を付与しておくと言語翻訳の叩き台にしたり、機械翻訳機能が使えたりなどなにかとメリットがあるので、動画をアップロードする人は字幕を付けておいた方がいいんじゃないかと思います。

またこれとは別ですが、歌のカラオケ字幕の自動付与に使えるんじゃないかと思い、初音ミクの曲を試したりしてみましたがだめでした。キャプション同期機能の限界はここら辺なんじゃないかと思います。

(追記:2011/06/18)
上記の動画にcrowdin.netを使って英語に翻訳した字幕を追加し、字幕ファイルを公開します。
石田流基礎知識ゆっくり英語字幕
石田流基礎知識ゆっくり日本語字幕
関連記事
スポンサーサイト

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

http://fantakeshi.blog50.fc2.com/tb.php/34-4fb4e60d
この記事にトラックバックする(FC2ブログユーザー)

«  | ホーム |  »

プロフィール

fantakeshi

Author:fantakeshi
Web:ここ
Twitter ID:fantakeshi
自作物やプログラムやまとまった技術的メモについて

RSSに追加

自作物

最新記事

Twitter

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

自作物 (26)
一般 (1)
将棋 (12)
BONANZA (1)
ponanza (1)
HTML5 (2)
Chrome (1)
WebAPI (1)
Webサイト (2)
プログラム (2)
Tips (1)

カウンター

検索フォーム

RSSリンクの表示

リンク

このブログをリンクに追加する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。