AIについて現時点でのまとめ

まずAIの基本構成
【AIエンジン】+【知識モデル】で構成

知識モデルとはいわゆるビックデータやweb上公開データを基にした
ナレッジデータベース

【思考】と【記憶】と考えるとわかりやすい。

Googleの現時点での提供サービス

* 画像分析(Google Cloud Vision API)
* 動画分析(Google Cloud Video Intelligence API)
* 音声認識(Google Cloud Speech API)
* テキスト分析(Google Natural Language API)
* 翻訳(Google Cloud Translation API)

これ以外にもYOLO2、ResNet50、Inception-v3 Places365とかGoogle以外でもいろいろモデルが出回っている

もちろん自前で【知識モデル】を用意したらヘルプディスクみたいなものからいろいろ出来るようになるがこれを用意するのが学習させたり精度を上げたりと結構大変です。

またオントロジーとしてどこまで要素を細分化するかも課題です。
写真に写っているものは分析する際どこまでブレイクダウンする必要があるも検討する課題です。

写真>人>男性>高齢者・・・

現時点でのソリューションを考えると、画像、動画、テキストを扱うかつ知識モデルが提供されているものをAI適用するのが一番の近道です。

1例をあげるとパンフレットデザインの最適化を考えると (レイアウト用のモデルPlaces365)

web上に公開されているパンフレットから一番良さそうなデザインをAIで見つけ出す。
つまり人の代わりにググって瞬時に調べてくれるところを自動化でき効率化が図れます。