サンプルで初体験! ラズパイ×カメラで人工知能 金田 卓士

注目特集 ビギナ向け
ビギナ向け!! ラズパイ×クラウド人工知能
注目特集
ラズパイ×クラウド人工知能
第
2章
手ぶらで俺的 AI ライフ・ロガーを作る
サンプルで初体験!
ラズパイ×カメラで人工知能
ご購入はこちら
ウェブ・カメラ
クラウドAI
「Microsoft Cognitive
Services API」
ウェブ・
カメラ
インターネット網
ラズベリー・パイ 3
スピーカ
スピーカ
USB
LTE
スマホ
(テザリング)
金田 卓士
アナログ
ラズベリー・パイ3
Wi-Fi
5V
モバイル・バッテリ
図 1 俺的 AI 日記コンピュータの人工知能はマイクロソフトのク
ラウド API &サンプルで実現する
モバイル・バッテリ
写真 1 ラズベリー・パイ 3 とカメラを使って行動を人工知能解
析してテキストに残す「俺的 AI 日記コンピュータ」
本稿では,カメラ画像を 10 秒ごとに記録して,画
像から自動生成したキャプション(説明文)を音声で
発話するという「俺的 AI 日記コンピュータ」を作成し
ま す( 写 真 1)
. ラ ズ ベ リ ー・ パ イ 3 と ク ラ ウ ド AI
「Microsoft Cognitive Services( 以下 MCS)」を使って
います.
ラズパイ×カメラ×クラウド API で
作る「俺的 AI 日記コンピュータ」
判断したからです.また,今回の「画像から文章を自
動生成」してくれる API を持っているのも同社だけで
す.この API は 5000 トランザクション / 月まで無料
で使えるので,およそ 5000 回,画像から文章を生成
できます.
● システム構成
システム構成は図 1 の通りです.ラズベリー・パイ
3 に USB 接続のウェブ・カメラとスピーカが接続され
ており,Wi-Fi を経由してインターネットに接続でき
るようになっています.そして,ウェブ・カメラから
取得した画像を,インターネットを経由して,クラウ
ド AI の各種 API に接続できるようになっています.
Wi-Fi についてはスマートフォンのテザリングを利用
しました.
● ハードは 5000 円 / ソフトは無料で試せる
● 鍵となる「日記」の自動生成にはクラウドの
API を利用
俺日記を生成するには,記録装置を常に携帯する必
要があります.スマホを使ってもよかったのですが,
乱暴に扱って壊したくありません.そこで 5000 円で
購入できる Linux コンピュータであるラズベリー・パ
イを利用します.
マイクロソフトの API を利用した理由は,第 1 章で
も述べましたが,同社が数々の画像認識コンテストで
優勝しており,画像認識では他社よりも優れていると
この装置を作成するにあたり,肝になってくるのが
画像からのキャプションの自動生成です.本装置では
MCS の Computer Vision API(以下 CV API)を利用
し,これを実現しています.CV API は,REST で画
像を送信すると,JSON 形式で画像の解析結果を返し
てくれるサービスです.表 1 に解析結果としてどのよ
うなレスポンスが返ってくるかまとめました.図 2 に
画像を音声として再生するまでの流れを示します.
120
2017 年 4 月号