令和2年度メディア芸術連携基盤等整備推進事業 連携基盤整備推進事業の最終報告会が、2021年2月19日(金)に東京・外苑前のnote placeおよびウェブ会議システムZoomにて開催された。メディア芸術連携基盤等整備推進事業は、産・学・館(官)の連携・協力により、メディア芸術の分野・領域を横断して一体的に課題解決に取り組むとともに、所蔵情報等の整備及び各研究機関等におけるメディア芸術作品のアーカイブ化の支援をすることで、文化資源の運用や展開を推進する事業だ。新たな創造の促進と専門人材の育成により、メディア芸術作品のアーカイブ化を継続的・発展的に実行していく協力関係の構築を目指している。最終報告会では、本事業の一環として実施した「連携基盤強化事業」の6事業の取り組みの主旨や進捗状況の報告、企画委員・有識者タスクチーム員と報告者による質疑応答がなされた。本稿ではそのうちの「リストDBからメディア芸術データベース(ベータ版)への登録、及び全録サーバのテキスト抽出の検証」について記載する。

概要

過年度のアニメ特撮アーカイブ機構(ATAC)によるアニメスタッフデータベースの持続的な構築・整備に向けての調査検証を踏まえ、2つの事業を展開する。ひとつは、録画したアニメーションからのスタッフクレジット抽出の自動化である。テレビ放送されるアニメーションをすべて録画し、EPGファイルを統合すると同時に、1秒毎に画面を切り出すプログラムを作成。OCR(光学的文字認識)によりスタッフクレジットを抽出、テキスト化までの自動化を試行する。もうひとつは、原口正宏氏(リスト制作委員会)による、作品と各話の情報、クレジット、役名、役職、キャストなどをまとめたリストデータベースを、メディア芸術データベースへ投入する仕組みの構築である。クレジットやキャスト情報をまとめることで、日本のアニメーションに関わる人数が可視化できる。その手順書を成果物として提示する。

最終報告

一般社団法人 日本アニメーター・演出協会
報告者:一般社団法人 日本アニメーター・演出協会 事務局長 大坪英之

OCRを利用したスタッフクレジット抽出の自動化を実施。事業を進めていく段階で、全録サーバの電気代や作業量、画面数から算出されるOCRの利用料などのコストは可視化されつつある。しかし、依然として判別が難しい文字への対応は課題であり、映像に直接含まれないあらすじやサブタイトルのデータ化、制作会社からのデータ取得なども検討事項である。また、ネットコンテンツについてもデータベース化を行いたいが、作品の把握と記録が非常に難しく、手をつけられていない。原口氏によるリストデータベースのメディア芸術データベースへの投入に向けての課題も多い。リストデータベースは画面上の表示を記録する仕組みのため、意味分類された要素別の記載ではなく、職域をまたぐ同一人物の統合や同名異人が考慮されていない。メディア芸術データベースに登録するにあたり、リレーショナル形式への自動分類方法を模索している。なお、本事業では著作権法を専門とする弁護士に確認のうえで実施した。

左:大坪英之
右:企画委員の南雅彦(株式会社ボンズ 代表取締役)

※敬称略

実施報告書(PDF 約2.0MB)