注目特集 ビギナ向け ビギナ向け!! ラズパイ×クラウド人工知能 注目特集 ラズパイ×クラウド人工知能 第 2章 手ぶらで俺的 AI ライフ・ロガーを作る サンプルで初体験! ラズパイ×カメラで人工知能 ご購入はこちら ウェブ・カメラ クラウドAI 「Microsoft Cognitive Services API」 ウェブ・ カメラ インターネット網 ラズベリー・パイ 3 スピーカ スピーカ USB LTE スマホ (テザリング) 金田 卓士 アナログ ラズベリー・パイ3 Wi-Fi 5V モバイル・バッテリ 図 1 俺的 AI 日記コンピュータの人工知能はマイクロソフトのク ラウド API &サンプルで実現する モバイル・バッテリ 写真 1 ラズベリー・パイ 3 とカメラを使って行動を人工知能解 析してテキストに残す「俺的 AI 日記コンピュータ」 本稿では,カメラ画像を 10 秒ごとに記録して,画 像から自動生成したキャプション(説明文)を音声で 発話するという「俺的 AI 日記コンピュータ」を作成し ま す( 写 真 1) . ラ ズ ベ リ ー・ パ イ 3 と ク ラ ウ ド AI 「Microsoft Cognitive Services( 以下 MCS)」を使って います. ラズパイ×カメラ×クラウド API で 作る「俺的 AI 日記コンピュータ」 判断したからです.また,今回の「画像から文章を自 動生成」してくれる API を持っているのも同社だけで す.この API は 5000 トランザクション / 月まで無料 で使えるので,およそ 5000 回,画像から文章を生成 できます. ● システム構成 システム構成は図 1 の通りです.ラズベリー・パイ 3 に USB 接続のウェブ・カメラとスピーカが接続され ており,Wi-Fi を経由してインターネットに接続でき るようになっています.そして,ウェブ・カメラから 取得した画像を,インターネットを経由して,クラウ ド AI の各種 API に接続できるようになっています. Wi-Fi についてはスマートフォンのテザリングを利用 しました. ● ハードは 5000 円 / ソフトは無料で試せる ● 鍵となる「日記」の自動生成にはクラウドの API を利用 俺日記を生成するには,記録装置を常に携帯する必 要があります.スマホを使ってもよかったのですが, 乱暴に扱って壊したくありません.そこで 5000 円で 購入できる Linux コンピュータであるラズベリー・パ イを利用します. マイクロソフトの API を利用した理由は,第 1 章で も述べましたが,同社が数々の画像認識コンテストで 優勝しており,画像認識では他社よりも優れていると この装置を作成するにあたり,肝になってくるのが 画像からのキャプションの自動生成です.本装置では MCS の Computer Vision API(以下 CV API)を利用 し,これを実現しています.CV API は,REST で画 像を送信すると,JSON 形式で画像の解析結果を返し てくれるサービスです.表 1 に解析結果としてどのよ うなレスポンスが返ってくるかまとめました.図 2 に 画像を音声として再生するまでの流れを示します. 120 2017 年 4 月号
© Copyright 2024 ExpyDoc