MENU

【GCP】GoogleのCloud Vision APIにアニメ(二次元)画像を試してみた

若干前回とは趣向を変えて

世界のGoogle様の素晴らしき技術

前回、Amazon AWSの画像認識サービスを使って、アニメの画像認識を試してみました。

結果、ある程度タッチが古いものはそれなりの精度で顔認識可能、との結論が出ました。

fcg.hateblo.jp

今回は少し趣向を変え、Googleの画像認識サービスを使ってみます。

Cloud Vision APIを利用

Cloud Vision APIは対象の画像に対し、状況や特徴などの情報をタグで返してくれるサービス

前回の顔認識とは異なりますが、このAPIは画像検索と同じように、有名人の写っている画像ならタグとしてレスポンスされます。


……ここで考えたのが、例えばアニメキャラが写っている画像なら、画像検索の結果としてそのキャラを示すタグが返答されるのでは、という考え。

幸いこのAPIは手動でならデモサイトから手軽に実行できますし、API呼び出しも月に1000回までなら無料。

ものは試しということで、早速実験してみましょう。

実験内容

今回はある程度レスポンスが期待できそうなアニメということで、ちょうど手元にあった「アイドルマスター」のアニメを対象にしてみます。

ということで、まずは1話分(今回は16話を対象)から700枚ほど画像をキャプチャ。

え、なんで16話かって? それは簡単、那覇くんが好きだからです。


そこから一定のルールに従って、手動で対象とする画像を選択。ルールは以下の感じで。

  • 人物がひとりで写っているものを選択
  • ひとりも写っていない、複数人写っているものは除外


こうして選択したのは、55枚の画像。母数が少ないとか言わない。また、当然我那覇くんが多めです。

f:id:retro-gamer:20170914003413j:plain
©BNGI/PROJECT iM@S


これらの画像に対してCloud Vision APIを試してみて、①キャラまで特定 ②アイマス画像と特定 ③特定不可 の3パターンに分けて集計してみます。

結果のWeb Entitiesにキャラ名が含まれていれば①、「The Idolmaster」などが含まれていれば②、それらが無ければ③、という判定で。

実験結果と考察

早速ですが、結果は以下の通りとなりました。

キャラ 総画像数
我那覇響 19 1 16 2
如月千早 4 2 2 0
天海春香 5 0 4 1
双海亜美 1 0 1 0
三浦あずさ 1 0 0 1
萩原雪歩 1 0 1 0
音無小鳥 1 0 1 0
天ヶ瀬冬馬 2 1 1 0
プロデューサー 7 0 5 2
番組ディレクター 2 0 1 1
黒井社長 1 0 0 1
アシスタントプロデューサー 6 0 2 4
番組スタッフ 1 0 1 0
いぬ美 3 1 1 1
ハム蔵 1 0 1 1

なんと、意外と③が少ない結果になりました。

80%程度については「これはアイドルマスターの画像」だということは認識できている訳ですね。


また、①キャラの特定についてはそれなりの精度、というところでしょうか。

面白いのはなんと「いぬ美が特定できた」こと。「inumi」って表示されてましたよ、この犬。

冬馬も「あまとう」とかで出て来るし。唯一の日本語タグで出るとはさすがジュピター、格が違う。


具体的にどういうロジックでエンティティを算出しているのかは知りませんが、予想以上に高精度だと思います。

他の作品で試してみるのも面白いかも。


今回の記事も技術的なお話は相変わらず全くありませんでしたが、画像認識技術は結果がわかりやすく面白い。

今後も実験は続けてみようかと思います。

余談

今回の検証とは別に、2期オープニング(CHANGE!!!!)の中で美希・貴音・響のフェアリー組がきゅんパイア衣装でインタビュー受けているシーンを試したら、

  • Fairy
  • CHANGE!!!!
  • KisS
  • vampire
  • OOBAA MASUTAA

とかが出てきた。……こいつはすげえや