字幕職人の朝は早い……
2019年8月11日(日曜日)
字幕職人の朝は早い……
公開: 2019年7月11日21時0分頃
2019年7月20日、JACことJapan Accessibility Conference - digital information vol.2 (japan-a11y-conf.com) が開催されました。私は実行委員、スタッフ、スポンサー担当、司会、登壇といった役割で関わりました。
なお、各セッションの内容については、セッション一覧 (japan-a11y-conf.com)をご覧ください。
個人的に最も印象に残ったのは、セッションB-5の "Ask Us Anything" の一幕。とある動画サービスで、「補聴器ユーザーの葛藤と苦悩」という番組があったのですが、なんと、そういうテーマであるにもかかわらず字幕がついておらず、補聴器ユーザーが視聴できなかったのだそうです……。
さて、そんなJACですが、一部を除いてセッションの様子は配信されておりまして、動画のアーカイブも公開しています。
JACに参加していた私はもう、字幕をつけたくて仕方ないわけです。
というわけで、動画に字幕をつけるというのが今日のお話です。
YouTube自動字幕
実は、YouTubeで動画を公開すると、自動で字幕をつけてくれます。
以上。終わり。
と言いたいところなのですが、やはり自動認識の精度は完璧ではなく、かなり怪しい部分もあります。「えーっと」が「8」になっているのはまあ分かるのですが、時折、意味不明な日本語になっていることもあります。
特に、固有名詞については非常に弱いです。「伊敷さん」が「意識さん」になったり、「Sli.doで質問を」が「スライド幽霊質問を」になったり。このあたりはまあ、当然と言えば当然で、仕方のないところでしょう。
また、笑い混じりの発言にも弱く、「すみません喰い気味に(笑)」というところが「すいませんクイーン不不不不不不不不不不」となっていたりしました。
と、弱点はあるものの、全体としては結構な精度で字幕がつくので、状況によってはもう自動字幕だけで十分、ということもあるかもしれません。
字幕をつける方法あれこれ
YouTubeの動画に字幕を付ける方法はいくつかあります。詳しくは、YouTubeヘルプセンターの「自作の字幕を追加する (support.google.com)」を見ていただくと良いでしょう。
今回は何回か字幕を付ける機会があったため、試行錯誤しながらいくつかの方法を試しました。
書き起こしテキストから字幕を生成する
YouTubeには、書き起こしテキストから字幕を生成する機能があります。書き起こしテキストを貼り付けると、内容を読み取って自動的に分割し、タイミング情報を付けたうえで字幕を作成してくれます。
実はこれでわりと行けますが、意図通りに分割されないことがけっこうあります。また、日本語の記号類 (句読点、括弧など) は消えてしまうことがあります。
YouTubeには手動で字幕を編集・調整する画面もあるので、調整の量が少なければYouTube上でやってしまうのも良いでしょう。
字幕ファイルをアップロードする
もう少し本格的にやりたい場合は、字幕ファイルをアップロードすることもできます。
字幕ファイルにはいくつか形式がありますが、もっとも簡単なのは SBV という形式のものです。中身は以下のようなテキストファイルです。
29:24.000,29:28.000 今日ここ、Abema Towers(アベマタワー)っていう場所じゃないですか。 29:28.000,29:38.000 最近、Abema Primeっていう番組で、「補聴器ユーザーの葛藤と苦悩」という番組があったんですね。
字幕の表示開始と終了の時刻をカンマで区切って書き、改行して字幕のテキストを書くという上にシンプルな形式です。
字幕には改行を入れることもできます。改行を2つ連続させると字幕の終了とみなされます。
※ミスって字幕の終わりの改行を一つにしてしまうと、次の字幕の開始時刻、終了時刻、テキストまでがひとつの字幕として表示されることになります。
見ての通り簡単な形式ですので、ツールで生成することもできるでしょうし、何なら手作業で書くこともできます。
ただし、うっかり全部手作業で作ろうとすると、大変な時間を費やすことになるので注意してください。動画を再生しながら字幕の開始・終了時刻を入れていくのは、単純な作業ではありますが、時間はかかります。
字幕ファイルを生成させて調整する
合わせ技もあります。字幕をファイルとしてダウンロードすることもできるので、書き起こしから生成させたものをダウンロードし、手元で調整してから再アップロードすることも可能です。
実際のところ、これが最もお勧めです。
最大のポイントは、細かく分割すること
いろいろやってみて、最大のポイントだと思ったのが、字幕を分割することです。
字幕が長すぎると、文字を大きくしたときに、字幕が画面上を覆いつくして画面が見えなくなってしまいます。普通の感覚でワンセンテンスをそのまま一つの字幕にすると、たいてい、長すぎになります。先に挙げた.sbvファイルのサンプルはちょっと長すぎる例です。
YouTubeに書き起こしテキストを食わせて字幕を生成する場合は、長いと判断されると勝手に分割されます。ただしその場合、意図した場所で分割されないことが多いです。事前に細かく分割してから食わせましょう。
書き起こしテキストにも .sbv ファイルと同様のルールが適用されるのか、改行を2つ入れておくと、その分割位置を尊重してくれます。改行1つだと無視されて、勝手に違う場所で分割されてしまいます。また、長すぎると判断されるとさらに勝手に分割されることがあります。
一つの字幕はできれば10文字程度、最大でも10文字×2行くらいだと思ってください。細かすぎでは? と思うかもしれませんが、入れてみるとこんなものでちょうど良いはずです。あらかじめ、かなり細かく分割しておくことがポイントです。
まとめ:
- JACの動画に字幕をつけてみた
- 字幕をつける方法はいくつかある
- 手動でタイミングを調整するのは大変
- 書き起こしテキストからYouTubeで生成させて、ダウンロードして調整するとGood
- テキストはあらかじめかなり細かく分割しておくと良い
- 「字幕職人の朝は早い……」にコメントを書く
関連する話題: アクセシビリティ
- 前(古い): タブUIのキーボード操作はユーザーに理解できるのか?