オントロジーとLOD・ビッグデータ・A

オントロジー開発手順
1
オントロジー開発手順 (現在)
determine
scope
consider
reuse
enumerate
terms
define
classes
define
properties
define
constraints
create
instances
1.Scope決定(利用目的,タスク:検索改善、KM、QA…)
2.再利用(ワードネット,オントロジー検索エンジン)
3.用語枚挙(自然言語処理)
4.クラス定義
5.プロパティ定義:テーマによって標準的語彙がある
6.制約定義
7.インスタンス定義
8.Scopeから考えて4-7は妥当か? Go to 4
2
Ontologies: Vocabulary (= Standard Property Set)
XML: Name Space Prefix, DB: Metadata
rdf http://www.w3.org/1999/02/22-rdf-syntax-ns#
rdfs http://www.w3.org/2000/01/rdf-schema#
owl http://www.w3.org/2002/07/owl#
SKOS http://www.w3.org/TR/skos-reference/
dc http://purl.org/dc/elements/1.1/ 書誌
OAI-ORE: http://www.openarchives.org/ore/ アーカイブ
vCard: http://www.w3.org/Submission/vcard-rdf/ カード
rev http://dannyayers.com/xmlns/rev/# 評価
foaf http://xmlns.com/foaf/0.1/ 人
SIOC: http://rdfs.org/sioc/spec/ オンラインコミュニティ
geo http://www.w3.org/2003/01/geo/wgs84_pos# 位置
gn http://www.geonames.org/ontology# 地理
gr http://purl.org/goodrelations/v1# 商品
Music http://musicontology.com/ 音楽
PO http://purl.org/ontology/po/ メディア
DOAP: http://trac.usefulinc.com/doap プロジェクト
wikiont_class http://www.yamaguti.comp.ae.keio.ac.jp/wikipedia_ontology/class/
wikiont_property http://www.yamaguti.comp.ae.keio.ac.jp/wikipedia_ontology/property/
ldc※ http://www.yamaguti.comp.ae.keio.ac.jp/ld/class/
ldp※ http://www.yamaguti.comp.ae.keio.ac.jp/ld/property/
3
DC(Dublin Core) プロパティ 書誌語彙
http://dublincore.org/documents/dcmi-terms/
title リソースに与えられた名前
description リソースに関する説明
date リソースのライフサイクル中の出来事に関連する日時もしくは期間
creator リソースの作成*に主たる責任を持つ実体
contributor リソースへの協力、貢献に責任を持つ実体
publisher リソースを利用可能にすることに責任を持つ実体
type リソースの性質もしくはジャンル
format ファイル形式、物理メディア、リソースのサイズなど
language リソースの言語
identifier ある文脈における、リソースへの曖昧さのない参照
rights リソースに適用される権利に関する情報
relation 関連するリソース
source リソースの派生元リソース
subject リソースのトピック
coverage リソースの空間的あるいは時間的トピック、or適用対象、リソースが有効となる地域など
4
geo(GeoVocabulary) 位置語彙
http://www.w3.org/2003/01/geo/wgs84_pos#
SpatialThing 空間を表現
TemporalThing 時間を表現
Event ある特定の日時に開催されるイベント
Point ある地点を表現
lat 緯度
time 日時
location ある特定の地点などとの関係を表現
long 経度
alt 標高
lat_long 緯度経度(カンマで分けて表現)
5
gn(GeoNames) 地理語彙
http://www.geonames.org/ontology#
geonameid GeoNamesID
name 地理名称
asciiname 地理名称(ASCIIコードで表現)
alternatenames 代替名称
latitude 緯度
longitude 経度
featureClass see http://www.geonames.org/export/codes.html
featureCode see http://www.geonames.org/export/codes.html
countryCode 国名ID
cc2 代替国名ID
population 人口
elevation 海抜
gtopo30 900m×900m毎の平均海抜
timezone タイムゾーン
modification date 修正日時
locatedIn どこに位置するか表現
nearby 近くに何があるか表現
6
geo(GeoVocabulary) 具体例
7
LOD
(Linked Open Data)
8
LODの普及

Web上で公開され,相互に連結し合っているRDFデータ


これまで多く研究されてきた抽象的な概念構造が
現実的な有用性を生むには依然高いハードルがある
具体物であるインスタンスの記述をしたRDF(Linked Open Data)の
データベースを公開・共有し合うべきという風潮が高まっている
2007年5月
2011年9月
2008年5月
9
Linked Data Cloud
メディア
ユーザー生成
コンテンツ
出版物
政府
地理
クロスドメイン
生命科学
295のデータセット、310億を超えるトリプル
10
DBpedia
•http://www.dbpedia.org
•WikipediaのInfoboxを利用し、大規模なDBを構築
•LODにおいて、ハブとして広く利用されている
11
DBpedia Japanese (by NII)
http://ja.dbpedia.org/
• Dbpedia:Wikipedia英語版を対象
• DBpedia Japanese:Wikipedia日本語版を対象
12
13
Linked Open Data Initiative

2012年8月に発足


DBpedia
DBpedia Japanese
日本語LOD Cloud


日本語WordNet
日本語Wikipediaオントロジー
LODを普及促進する活動
日本語LOD Cloudの作成
2008年の欧米と同程度の規模
DBpedia Japaneseと相互リンクと
なっているのは以下の3つのみ
 本家DBpedia
 日本語WordNet
 日本語Wikipediaオントロジー
DBpedia Japaneseが持って
いない概念階層関係の補完
として,日本語LODハブの一
つとして期待されている
日本語Wikipediaオントロジー
人間には,ウィキペディアの内容(意味)
が判るけど人工物(コンピュータ,スマ
フォ,ロボット...)には判らない
Wikipediaからオントロジー(言葉階層木,言葉の
ネットワーク)に自動変換して,
人工物に言葉の意味(Sense)を理解させる
→日本語Wikipediaオントロジー
14
日本語Wikipediaオントロジー(文学)
15
クラス-インスタンス関係
さらにズームアップ(模式図)
プロパティ定義域
プロパティ値域
トリプル
日本の映
画作品
鼻
Is-a関係・プロパティ上位下位関係
日本
蜘蛛の糸
小説家
羅生門
日本
クラス
国籍
人物
文化
作家
文学
明治大学
の人物
配偶者
日本史
の人物
日本出身
の人物
存命人物
プロパティ
著作
文庫本
子供
インスタンス
塚本文
親族
東京都出
身の人物
時代小説・
歴史小説
作家
小説家
職業
家族
死没
俳人
津田青楓
芥川龍之介
門下生
文化活動
夏目漱石
最終学歴
日本の
小説家
芥川貴之志
こゝろ
誕生
職業
短編小説
小説
坊っちゃん
日本の
小説
ジャンル
日本の
大学
作曲家
芥川也寸志
代表作
明治の
人物
オペラ
作曲家
東京帝国
大学英文科
16
日本のクラ
シック音楽
の作曲家
日本語Wikipediaオントロジー
http://www.wikipediaontology.org/
17
18
日本における行政LOD実践
神奈川県横浜市 http://yokohama.spending.jp/
千葉県千葉市 http://chiba.spending.jp/
宮城県仙台市 http://sendai-miyagi.spending.jp/
福岡県福岡市版 http://fukuoka.spending.jp/
愛知県北名古屋市 http://kitanagoya.spending.jp/
宮城県南三陸町 http://minamisanriku-cho.spending.jp/
北海道江別市 http://ebetsu.spending.jp/
北海道札幌市 http://sapporo.spending.jp/
京都府京都市 http://kyoto-city.spending.jp/
東京都小金井市 http://koganei.spending.jp/
東京都武蔵野市 http://musashino.spending.jp/
宮城県石巻市 http://ishinomaki.spending.jp/
北海道旭川市 http://asahikawa.spending.jp/
茨城県水戸市 http://mito.spending.jp/
東京都杉並区 http://suginami.spending.jp/
東京都中野区 http://nakano-ku.spending.jp/
東京都調布市 http://chofu.spending.jp/
東京都葛飾区 http://katsushika.spending.jp/
大阪府吹田市 http://suita.spending.jp/
福島県会津若松市 http://aizuwakamatsu.spending.jp/
新潟県新潟市 http://niigata.spending.jp/
http://spending.jp/
http://citydata.jp/
19
Industrie 4.0
20
Future Smart Factory
Big Data
& AI
Image
Sensing
IoT
Robot
Manipulation
Manufacturing
でも結局はデータ連携がキーでは?
21
製造業のビッグデータ活用の成否
①
②
③
④
①組立工場内
②製品組立から納品までの進捗管理チャート
③グローバル販売生産管理
④世界34万台以上の建設機械の稼働状況
リーマンショック後、コマツでは建機の在庫が急増
→機械稼働管理システム「KOMTRAX」による建機の稼働状況に加えて、
流通在庫+販売状況の管理
→◎在庫1万8000台から約1万台まで削減
→×インドネシアの建設機械の稼働順調、販売順調と予測
しかし、通貨ルピア急落により販売激減(経済予測データも必要)
From 日経BigData 2014.02.12
22
M-BOM(製造で利用する部品表)
日本では公開ほぼ不可能
班组
工序
顺序
序号
工序名称
作業班
工程
番号
工程名称
和訳
零件图号
零件名称
図番
部品名称
零件
数量
部品
数量
和訳
整备
整备
整备
05
05
10
零部件清洗
零部件清洗
油漆及补漆
部品洗浄
部品洗浄
塗料とタッチアップ
整备
15
配气机构气缸盖罩装配小组装 バルブ仕組みとシレンダー・カバー組立の小備付
TC413301-91 气缸盖罩
シリンダー・カバー
16
整备
15
配气机构气缸盖罩装配小组装 バルブ仕組みとシレンダー・カバー組立の小備付
TC413302-91 扁螺母
偏平なナット
16
整备
15
配气机构气缸盖罩装配小组装 バルブ仕組みとシレンダー・カバー組立の小備付
整备
15
配气机构气缸盖罩装配小组装 バルブ仕組みとシレンダー・カバー組立の小備付
TC413310-91 手轮
整备
15
配气机构气缸盖罩装配小组装 バルブ仕組みとシレンダー・カバー組立の小備付
GB894.1-86
整备
15
配气机构气缸盖罩装配小组装 バルブ仕組みとシレンダー・カバー組立の小備付
整备
20
整备
TC4133032003
垫圈φ36×30×2 ワッシャーφ36×30×2
16
ハンドホイール
16
カラー30(collar)
16
GB3452-1-92 O型圈25×2.65G
O型リング25×2.65G
16
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
TC009001-91 曲轴箱侧盖(一)
クランク・ケースのサイドカバーチー
ム(1)
7
20
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
TC013001-91 曲轴箱侧盖(二)
クランク・ケースのサイドカバーチー
ム(2)
7
整备
20
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
TC012001-91 曲轴箱侧盖(三)
クランク・ケースのサイドカバーチー
ム(3)
2
整备
20
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
TC008001-91 凸轮轴侧盖
カムシャフトのサイドカバー
16
整备
20
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
GB1235-76
O型密封圈
275×8.6
O型シールリング275×8.6
16
整备
20
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
GB1235-76
O型密封圈
335×8.6
O型シールリング335×8.6
16
整备
20
凸轮轴侧盖.曲轴箱侧盖组小装 カムシャフトのサイドカバー、クランク・ケースのサイドカ
配
バー組の小組立
GB97.1-85
垫圈8
ワッシャー8
挡圈30
8
23
トレーサビィリティ
• 企業内でもBOM表現が異な
り連携が難しい
• Supply Chain 途絶問題
Tier 3以下の部品・材料メー
カが供給停止
• リコール問題
(問題部品トレース問題)
問題部品が使用されている
車の特定に多大な時間
24
Deep Learning
25
Quoc V. Le, Marc’Aurelio Ranzato, Rajat Monga, Matthieu Devin, Kai Chen,
Greg S. Corrado, Jeffrey Dean, and Andrew Y. Ng:
Building High-level Features Using Large Scale Unsupervised Learning,
ICML2012
Youtube 3日間、1000万 部位画像、人と猫の識別器
26
DNN (Deep Neural Network)の進展(1)
2012年:教師無しデータによるPre Training
2013年:Rectifier, Dropoutによる教師有りで直接、
巨大ニューラルネットを学習。
CNN(Convolution Neural Net)主流。
2014年:短期記憶可能なニューラルネット(LSTM: Long
Short Term Memory)。RNN(Recurrent Neural Net.ルー
プを含むようなニューラルネット)が注目。
・表現学習(特徴量自動生成)
・マルチタスク学習
(類似タスクからターゲットタスクの精度改善)
・マルチモーダル学習(画像キャプション自動生成)
27
ILSVRC (ImageNet Large Scale Visual Recognition Challenge)
Error
Rate
28
http://googleresearch.blogspot.jp/2014/11/apicture-is-worth-thousand-coherent.html
画像キャプションの自動生成
29
DNN (Deep Neural Network)の進展(2)
プログラム生成
知識学習
言語学習
Google, FB
対話学習
動作学習
進化計算+深層学習
画像切出し
音声認識
画像認識
Google, MSR
30
来店客数認識
テーブル上の物体認識
33
現状のAIの課題
• Deep Learning による知覚処理の進歩
→意味処理はまだ遠い。
→文脈バイアス、信号と記号の相互運用性
• 特徴量自動学習:知覚レベルで成功。
→知識レベルで領域オントロジー自動構築
• 生活体験と結びつく常識の自動構築
• 変化対応能力:規模変化、タスク変化
に追従してほしい(マルチタスク)
• マルチモーダル
• ELSI:モラルとメタ知識
34