「ゲーム心理学」知見保管庫

「ゲーム心理学」の参考文献等を投稿します。

{171}Abhishek Dutta and Andrew Zisserman. (2019)

VGG Image Annotator(VIA)の概論。

 

ひとことで言えば、ブラウザ上で稼働する画像・音声の要素抽出(アノテーション)ツールである。

HTML・JavascriptCSSのみを使用しており、特段セットアップも必要なく、400KBの要領で、サクサク動作、オフライン稼働可能という特徴をもつ。2016年から開発が始まり、論文公開時とほぼ同時期にバージョン3が公開。2019年公開の論文が記事執筆時点で790の論文に引用されていることからも、このソフトウェアの汎用性がうかがえる。

このソフトは画像内の特定領域を手動で定義づけることができる。ただそれだと大規模な画像データに耐えられないため、自動アノテーションとその手動選別機能が備わっている。これの組み合わせで、動画の一要素のタグ付けが容易に行える。なお顔識別には専用の検出器を設けているらしい。

音声の識別も可能であり、どの話者がどれだけ喋っているかを可視化することもできる。図のようにタグ付け、識別の修正が可能である。

とてもうれしことに、このソフトウェアはオープンソースである。オープンソースは正義、古事記にも書いてある。

ソフト自体が汎用性の塊なんで、例えば顕微鏡に映った要素の識別、動画要素の識別と変化の記録、画僧の注釈づけなんかが行える。自動抽出と修正を繰り返せばより精度の高い抽出が行えるため、ほんとに重宝することになりそう。しかもとても扱いやすいときた。

ソフトウェアの存在は記事に残す、頭の片隅に置いておこう。

 

 

参考文献

Abhishek Dutta and Andrew Zisserman. 2019. The VIA Annotation Software for Images, Audio and Video. In Proceedings of the 27th ACM International Conference on Multimedia (MM '19). Association for Computing Machinery, New York, NY, USA, 2276–2279. https://doi.org/10.1145/3343031.3350535