令和3年度メディア芸術連携基盤等整備推進事業 報告会が2022年2月22日(火)に開催、ウェブ会議システムZoom・YouTube Liveでライブ配信された。メディア芸術連携基盤等整備推進事業は、産・学・館(官)の連携・協力により、メディア芸術の分野・領域を横断して一体的に課題解決に取り組むとともに、所蔵情報等の整備及び各研究機関等におけるメディア芸術作品のアーカイブ化の支援をすることで、文化資源の運用や展開を推進する事業。新たな創造の促進と専門人材の育成により、メディア芸術作品のアーカイブ化を継続的・発展的に実行していく協力関係の構築を目指している。本報告会では、本事業の一環として実施した「分野別強化事業」の5事業の報告、有識者検討委員と報告者による質疑応答がなされた。本稿ではそのうちの「全録サーバから生成したクレジット情報テキスト識別の高精度化とメタデータ処理の自動化の試行」を取り上げる。
報告者:一般社団法人 日本アニメーター・演出協会 事務局長 大坪英之
令和3年度の作業と事業目的
本事業は日本アニメーター・演出協会を核として、アニメ特撮アーカイブ機構、リスト制作委員会とともに、大きく分けて3つの作業を行った。ひとつ目はクレジット画面からのテキスト化の高精度化や、効率化、自動化で、2つ目はリスト制作委員会が保有するリストデータベースをメディア芸術データベースに投入するためのデータ変換。3つ目はスタッフやキャスト情報を蓄積することで、どのような利活用ができるのかの解説動画の公開や講演だ。
事業の目的としては、自動でクレジットデータを収集する仕組みをつくること、リストデータベースをメディア芸術データベースに連結すること、アニメ分野で作品を採録する仲間を増やすことの3つが挙げられる。
実施内容と成果
まず、自動でクレジットデータを収集する仕組みとは、朝の時点で、前日に放送されたすべてのアニメ作品の録画がされたうえで、作品のメタ情報の整理、オープニングやエンディングのクレジット情報のデータベースに登録が完了しており、疑わしいレコードを容易に確認できることを想定している。この1年間の試行錯誤により、その安定稼働のためのノウハウを積み上げたことがとても大きい経験となった。しかし、「すべての作品」という定義が非常に難しく、録画対象番組を探すのは手作業なのは変わらなかったり、万全に録画準備をしても、1%程度は録画を失敗してしまったりといった問題も見えてきた。作品のメタ情報の整理に向けては、映像ファイルからの切り出し機能、映像ファイルのフォルダの振り分け機能、文字の出現位置の検出やフォーマット解析の機能などを追加した。これらの機能の実装により、30分番組を2秒間隔でキャプチャして900枚程度になった画像から、文字の出現部分だけを処理して300枚まで削減でき、さらに重なりなどを処理して58枚まで厳選することができた。
また、リストデータベースの情報とメディア芸術データベースの連結を目指し、2000年以前に公開された作品、クレジット表記された情報、調査研究を除くという利用条件の範囲内において、データ移行を行った。その結果、データの粒度の違いや設計思想の違いにより、作業上の困難点があらためて明らかになった。例えば、姓と名のあいだに半角スペースがある、全角スペースがある、あるいは均等割りになっているというようなものに関して、人間が見ると同一人物だと認識できても、データ上は別人にカウントされてしまうといったことが挙げられる。さらに、アニメ業界の方々に対してのヒアリングも行い、メディア芸術データベースへデータを投入するための業界の協力の可能性を模索した。
アニメ分野で採録する仲間を増やすためには、大学での講演やウェブ講座の配信、プロデューサーへのヒアリングや私企業との意見交換などを実施した。具体的には、専修大学の藤原正仁氏からの声掛けで、学生に向けてメディア芸術データベースや、アニメーションの採録について講義を行うに至った。また「アニメ作品情報の「採録」と「利活用」」と題して、リスト制作委員会の原口正宏氏と特定非営利活動法人アニメ特撮アーカイブ機構(ATAC)の高橋望氏を迎え、ウェブ講座を配信した。この講座はYouTubeにて現在も視聴可能だ。これらに加えて、制作現場で所持しているクレジットデータの提供可能性について、アニメ制作会社および製作委員会構成会社の複数名にヒアリングした。
今後の課題
今後の方向性については、大筋として全録サーバやOCR、メタ化処理をコアな機能として機能を増強するという考え方と、扱うデータ量を増やすという考え方と、データの使い方、展開の仕方を増やすという考え方があるだろう。そのなかで我々は、まず機能強化から注力できればと考えている。
大坪英之
※URLは2022年4月13日にリンクを確認済み