2017-10

スポンサーサイト

このエントリーをはてなブックマークに追加
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

HIDETCHIさんの将棋講座に日本語字幕をつける その2

このエントリーをはてなブックマークに追加
その1では既にある英語字幕のタイムコードを利用して字幕をつける方法を紹介しましたが、
今回は自分から英語を書き起こす方法です。

現状、自動的に音声認識した結果をダウンロードするためには動画のオーナーになっている必要があります。
この音声認識の結果はかなり気まぐれで、ちゃんと認識してくれるかどうかは正直運です。

オーナーの動画をダウンロードして再アップロードしても、音声部分が再圧縮されたりで、
同一の音声認識結果にならないことも多々あります。

それで、書き起こしたテキストを元にタイムコードを音声認識結果で付与させるという方法をとることを考えます。これならば少々の音声の劣化でもタイムコードがそれなりにきちんと付与されることが期待できます。

今回の題材は早石田の講座第1回についてです。

これが書き起こしたテキストです。
QuickIshidaAttack1.txt

これを適用した動画が以下です。



将棋の符号の部分はeight B や three C などと書いています。これは音声認識エンジンに音声の読みを解釈させやすくする目的です。
使ってみた感じでは少々の脱字は許容してタイムコードを付与してくれるようです。

ただ、音声区間の終わりについてはかなり信頼できて無加工でもいいと思いますが、始まりについては若干信用できない印象があります。内容がわかればそれでよい、という目的ならばよいですが、映画の字幕のように完璧にしゃべっている間と同期を取りたいと思うならCaptionTube等のツールで再加工が必要だと思います。

また、例の動画の序盤に顕著ですが、音楽が鳴っていたりすると、その部分が音声区間だと勘違いしてしまい、勝手にタイムコードを付与してしまうことがあります。

この書き起こしを作成するにあたって、YouTube書き起こし支援ページを作りました。ショートカットキーで2秒前にもどしたり動画のポーズが出来たりします。ただ、うっかりリロードすると、テキストの内容が一気に消えるなどの悲劇が起こるのでご注意を。
関連記事
スポンサーサイト

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

http://fantakeshi.blog50.fc2.com/tb.php/29-5cd43e2b
この記事にトラックバックする(FC2ブログユーザー)

«  | ホーム |  »

プロフィール

fantakeshi

Author:fantakeshi
Web:ここ
Twitter ID:fantakeshi
自作物やプログラムやまとまった技術的メモについて

RSSに追加

自作物

最新記事

Twitter

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

自作物 (26)
一般 (1)
将棋 (12)
BONANZA (1)
ponanza (1)
HTML5 (2)
Chrome (1)
WebAPI (1)
Webサイト (2)
プログラム (2)
Tips (1)

カウンター

検索フォーム

RSSリンクの表示

リンク

このブログをリンクに追加する

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。