研究資料

1
献立の雰囲気を考慮した
料理推薦システムの提案
東京電機大学
大野 礼儀
福原 知宏
山田 剛一
増田 英孝
2
目次
• 研究概要
• システム概要
• 相性と雰囲気分析
• 考察とまとめ
3
概要
単一のレシピを紹介するサイト
 献立内の料理の組み合わせを考える必要がある。
献立単位でまとめて紹介しているサイト
 ユーザの好みにあった献立を見つけることができる
とは限らない。
 料理の入れ替えなどの融通が利かない 。
雰囲気や料理同士の相性を考慮した、献立作成を
支援するシステムの開発を目指している。
4
雰囲気と相性の定義
雰囲気
→
献立制作者がイメージした
献立全体のテーマ
暑い日にさっぱりのさわやかメニュー
野菜でカサ増し!ボリュームメニュー
など
相性
→
料理が持つ特徴同士の関係性
 同じ献立内に汁物が二つ存在することはあまりない
 焼き魚とみそ汁は同じ献立に登場しやすい
など
5
システムの対象ユーザ
献立を考えるとき、、、
料理同士の相性が
イメージした雰囲気
献立を考える手間を
良い献立を作りたい
から献立を作りたい
省きたい
栄養バランスを考え
冷蔵庫にあるもので
献立の費用を
た献立を作りたい
献立を作りたい
抑えたい
などをユーザは考える。
6
システムの対象ユーザ
献立を考えるとき、、、
料理同士の相性が
イメージした雰囲気
献立を考える手間を
良い献立を作りたい
から献立を作りたい
省きたい
栄養バランスを考え
冷蔵庫にあるもので
献立の費用を
た献立を作りたい
献立を作りたい
抑えたい
などをユーザは考える。
7
システムイメージ
ユーザ
中華風のものが
食べたいけど
料理は決まってい
ない…
献立作成支援システム
献立の雰囲気として
「中華風」と入力
「中華風」に関連した語が
献立・レシピ情報に出現している
料理名とレシピを提示
推薦レシピ
•
•
•
•
•
中華スープ
麻婆豆腐
中華クラゲのサラダ
肉団子のスープ
青椒肉絲
クラゲの和え物
中華クラゲのサラダ
バンバンジー
春雨サラダ
クラゲの和え物
中華スープ
もやしの胡麻和え
中華クラゲのサラダ
ユーザがその中から料理を選択
はじめに入力した献立の雰囲気と
ユーザが選択した料理を考慮して
新たな料理を推薦する
ユーザが十分であると判断する
献立の完成
作成中の献立
• 麻婆豆腐
• 肉団子のスープ
• 春雨サラダ
8
献立を形成する料理同士の特徴分析
料理がどういった特徴から他の料理と
組み合わさって一つの献立を
形成しているのかを知る必要がある。
9
料理レシピ同士の共起分析のフロー
料理レシピ情報から特徴を抽出
料理レシピを特徴に基づいて
クラスタリング
献立の構成情報とクラスタリング
結果を用いてクラスタ同士の
共起関係を抽出
料理同士の相性や雰囲気を
見ることができるか分析
10
料理レシピ同士の共起分析のフロー
料理レシピ情報から特徴を抽出
料理レシピを特徴に基づいて
クラスタリング
献立の構成情報とクラスタリング
結果を用いてクラスタ同士の
共起関係を抽出
料理同士の相性や雰囲気を
見ることができるか分析
使用した献立と料理レシピ情報
11
節約レシピ~一週間の献立~内で紹介されている
2001年から2009年までの献立データを使用
使用した献立とレシピ数
献立数
2561
レシピ数
7702
12
レシピのクラスタリングに使用する特徴
レシピの特徴をベクトルで表現する。
ベクトル要素
レシピ1
レシピ名に現れる単語数
2402
レシピに使用されている食材のユニーク数
3657
単語1
単語2
…
単語X
食材1
食材2
…
wt1
wt2
…
wtX
wf1
wf2
…
…
…
…
レシピ7702
…
…
食材Y
wfY
13
レシピ名と食材名の前処理
レシピ名の前処理
 MeCabを用いて文章を形態素に分割、基本形に戻す。
 助詞,助動詞,接続詞や「○○入り」の「入り」な
どの重要ではない単語は除外する。
 「○○風」の「風」などの単体では重要ではない単
語は前の単語と連結し一つの単語とした。
食材名の前処理
MeCabを用いて読みのカタカナに変換し、「しお」
「塩」などの揺らぎを無くした。
14
レシピ情報の重み付け
レシピ名に現れる単語の重み
レシピに使用された食材名の重み
15
料理レシピ同士の共起分析のフロー
料理レシピ情報から特徴を抽出
料理レシピを特徴に基づいて
クラスタリング
献立の構成情報とクラスタリング
結果を用いてクラスタ同士の
共起関係を抽出
料理同士の相性や雰囲気を
見ることができるか分析
16
K-means法によるクラスタリング
クラスタリングは統計解析ソフトR を使用
K-means法でクラスタリングを行う
クラスタ数を200に設定
17
クラスタのヒストグラム
クラスタの出現頻度
60
50
40
ク
ラ
ス 30
タ
数
20
10
0
クラスタ内部のレシピ数
18
クラスタリングにより得られた
クラスタの一部
クラスタ番号
所属レシピ数 クラスタ内のレシピ一部抜粋 影響力が強い特徴語
11
44
シメジとインゲンのご飯
たくあんご飯
じゃこ入り豆ご飯
ご飯, 豆, ひじき,
じゃこ, 栗, 雑穀
24
24
キャベ玉みそ汁
なめこともやしのみそ汁
あさりのみそ汁
みそ汁, もやし,
たっぷり, 大根, 卵
162
20
コーンとかきのクリーム煮
ミートボールのクリーム煮
ほうれん草のクリーム煮
煮る, クリーム, 鶏,
豆腐, コーン
177
29
豆乳シチュー
白菜の豆乳シチュー
迎春シチュー
シチュー, クリーム,
白菜, 豆乳, カボチャ
 「煮る」や「みそ汁」「シチュー」といった料理のカテゴリが最も影響
力が強い特徴語として集まったクラスタが多く見られた。
19
料理の特徴がうまく抽出できまかった
クラスタの例
クラスタ番号 所属レシピ数 クラスタ内のレシピ一部抜粋
110
34
80
921
影響力が強い特徴語
チンゲン菜と厚揚げのにんにく チン, ゲン, 菜, 炒め
炒め
る, 煮る
チンゲン菜とほたてのシチュー
ちくわとチンゲン菜のかか和え
ポパイピザ
生麩のペペロンチーノ風
りんごとレーズンの甘煮
鍋, 天ぷら, 餃子, 中
華風, カルパッチョ,
水菜, ニラ
 一つの食材が大きく影響してしまい複数の料理カテゴリが出
現したクラスタが存在した
 900以上のレシピが属する特徴の希薄なクラスタが、生成さ
れた。
20
料理レシピ同士の共起分析のフロー
料理レシピ情報から特徴を抽出
料理レシピを特徴に基づいて
クラスタリング
献立の構成情報とクラスタリング
結果を用いてクラスタ同士の
共起関係を抽出
料理同士の相性や雰囲気を
見ることができるか分析
21
クラスタ同士の共起関係
クラスタを献立構成情報をもとに共起関係を分析
クラスタ内の料理レシピが献立に登場するか否かを
特徴として作成したクラスタをベクトル空間で表現する。
献立1 献立2
クラスタ1
1
0
….
クラスタ
200
…
献立
2560
献立
2561
…
0
1
1
1
…
0
0
…
22
料理レシピ同士の共起分析のフロー
料理レシピ情報から特徴を抽出
料理レシピを特徴に基づいて
クラスタリング
献立の構成情報とクラスタリング
結果を用いてクラスタ同士の
共起関係を抽出
料理同士の相性や雰囲気を
見ることができるか分析
23
クラスタ間の相性と雰囲気の発見
対象クラスタ
クラス
タ番号
11
177
影響が強
い特徴語
ご飯
豆
ひじき
じゃこ
シチュー
クリーム
白菜
豆乳
対象に最も近い
クラスタ
クラス
タ番号
影響が強
い特徴語
対象に2番目に
近いクラスタ
対象に3番目に
近いクラスタ
クラス
タ番号
影響が強
い特徴語
クラス
タ番号
影響が強
い特徴語
18
かき揚げ
えび
大豆
三つ葉
115
炒める
味噌
なす
ピーマン
101
ピリ
炒める
辛
豚肉
112
パイ
サーモン
鮭
チーズ
141
マスター
ド粒
ソテー
サーモン
190
チーズ
オムレツ
ミート
アボカド
 「ご飯」を特徴に持っているクラスタは、そのおかずになりそうなクラ
スタが共起頻度の高いものとして出現している。
 「シチュー」を特徴に持っているクラスタは、洋風で汁物ではない料理
を特徴に持つクラスタが共起頻度の高いものとして出現している。
24
考察
• 料理カテゴリに関する単語が最も強い影響力を持ったク
ラスタ同士では、クラスタ間に相性や雰囲気にあたるも
のを見ることができた。
改善点
• ソフトクラスタリングでのレシピの分類を検討
• 単語を正確に分割する
• 単語同士の意味的な距離を考慮する
25
まとめ
• レシピの特徴と献立の構成情報を用いて、料理同士の相
性や献立の雰囲気の発見ついて検討した。
• 料理カテゴリに関する単語が最も強い影響力を持ったク
ラスタ同士では、クラスタ間に相性や雰囲気にあたるも
のを見ることが
できた。
今後の課題
• 多対一の相性抽出の検討
• クックパッドデータの利用を検討