水無月ばけらのえび日記

bakera.jp > 水無月ばけらのえび日記 > 2019年のえび日記 > 2019年8月

2019年8月

2019年8月11日(日曜日)

字幕職人の朝は早い……

公開: 2019年7月11日21時0分頃

2019年7月20日、JACことJapan Accessibility Conference - digital information vol.2 (japan-a11y-conf.com) が開催されました。私は実行委員、スタッフ、スポンサー担当、司会、登壇といった役割で関わりました。

なお、各セッションの内容については、セッション一覧 (japan-a11y-conf.com)をご覧ください。

個人的に最も印象に残ったのは、セッションB-5の "Ask Us Anything" の一幕。とある動画サービスで、「補聴器ユーザーの葛藤と苦悩」という番組があったのですが、なんと、そういうテーマであるにもかかわらず字幕がついておらず、補聴器ユーザーが視聴できなかったのだそうです……。

さて、そんなJACですが、一部を除いてセッションの様子は配信されておりまして、動画のアーカイブも公開しています。

JACに参加していた私はもう、字幕をつけたくて仕方ないわけです。

というわけで、動画に字幕をつけるというのが今日のお話です。

YouTube自動字幕

実は、YouTubeで動画を公開すると、自動で字幕をつけてくれます

以上。終わり。

と言いたいところなのですが、やはり自動認識の精度は完璧ではなく、かなり怪しい部分もあります。「えーっと」が「8」になっているのはまあ分かるのですが、時折、意味不明な日本語になっていることもあります。

特に、固有名詞については非常に弱いです。「伊敷さん」が「意識さん」になったり、「Sli.doで質問を」が「スライド幽霊質問を」になったり。このあたりはまあ、当然と言えば当然で、仕方のないところでしょう。

また、笑い混じりの発言にも弱く、「すみません喰い気味に(笑)」というところが「すいませんクイーン不不不不不不不不不不」となっていたりしました。

と、弱点はあるものの、全体としては結構な精度で字幕がつくので、状況によってはもう自動字幕だけで十分、ということもあるかもしれません。

字幕をつける方法あれこれ

YouTubeの動画に字幕を付ける方法はいくつかあります。詳しくは、YouTubeヘルプセンターの「自作の字幕を追加する (support.google.com)」を見ていただくと良いでしょう。

今回は何回か字幕を付ける機会があったため、試行錯誤しながらいくつかの方法を試しました。

書き起こしテキストから字幕を生成する

YouTubeには、書き起こしテキストから字幕を生成する機能があります。書き起こしテキストを貼り付けると、内容を読み取って自動的に分割し、タイミング情報を付けたうえで字幕を作成してくれます。

実はこれでわりと行けますが、意図通りに分割されないことがけっこうあります。また、日本語の記号類 (句読点、括弧など) は消えてしまうことがあります。

YouTubeには手動で字幕を編集・調整する画面もあるので、調整の量が少なければYouTube上でやってしまうのも良いでしょう。

字幕ファイルをアップロードする

もう少し本格的にやりたい場合は、字幕ファイルをアップロードすることもできます。

字幕ファイルにはいくつか形式がありますが、もっとも簡単なのは SBV という形式のものです。中身は以下のようなテキストファイルです。

29:24.000,29:28.000
今日ここ、Abema Towers(アベマタワー)っていう場所じゃないですか。

29:28.000,29:38.000
最近、Abema Primeっていう番組で、「補聴器ユーザーの葛藤と苦悩」という番組があったんですね。

字幕の表示開始と終了の時刻をカンマで区切って書き、改行して字幕のテキストを書くという上にシンプルな形式です。

字幕には改行を入れることもできます。改行を2つ連続させると字幕の終了とみなされます。

※ミスって字幕の終わりの改行を一つにしてしまうと、次の字幕の開始時刻、終了時刻、テキストまでがひとつの字幕として表示されることになります。

見ての通り簡単な形式ですので、ツールで生成することもできるでしょうし、何なら手作業で書くこともできます。

ただし、うっかり全部手作業で作ろうとすると、大変な時間を費やすことになるので注意してください。動画を再生しながら字幕の開始・終了時刻を入れていくのは、単純な作業ではありますが、時間はかかります。

字幕ファイルを生成させて調整する

合わせ技もあります。字幕をファイルとしてダウンロードすることもできるので、書き起こしから生成させたものをダウンロードし、手元で調整してから再アップロードすることも可能です。

実際のところ、これが最もお勧めです。

最大のポイントは、細かく分割すること

いろいろやってみて、最大のポイントだと思ったのが、字幕を分割することです。

字幕が長すぎると、文字を大きくしたときに、字幕が画面上を覆いつくして画面が見えなくなってしまいます。普通の感覚でワンセンテンスをそのまま一つの字幕にすると、たいてい、長すぎになります。先に挙げた.sbvファイルのサンプルはちょっと長すぎる例です。

YouTubeに書き起こしテキストを食わせて字幕を生成する場合は、長いと判断されると勝手に分割されます。ただしその場合、意図した場所で分割されないことが多いです。事前に細かく分割してから食わせましょう。

書き起こしテキストにも .sbv ファイルと同様のルールが適用されるのか、改行を2つ入れておくと、その分割位置を尊重してくれます。改行1つだと無視されて、勝手に違う場所で分割されてしまいます。また、長すぎると判断されるとさらに勝手に分割されることがあります。

一つの字幕はできれば10文字程度、最大でも10文字×2行くらいだと思ってください。細かすぎでは? と思うかもしれませんが、入れてみるとこんなものでちょうど良いはずです。あらかじめ、かなり細かく分割しておくことがポイントです。

まとめ:
  • JACの動画に字幕をつけてみた
  • 字幕をつける方法はいくつかある
  • 手動でタイミングを調整するのは大変
  • 書き起こしテキストからYouTubeで生成させて、ダウンロードして調整するとGood
  • テキストはあらかじめかなり細かく分割しておくと良い

関連する話題: アクセシビリティ

最近の日記

関わった本など