歌詞による楽曲の印象分類 - Welcome to Sirai`s

情報理工学部 情報知能学科
H207025 加藤 里奈




人は音楽を聴いたとき、「明るい」「暗い」などの印象を
持つ
大きな要因:曲調
曲調と歌詞には関係性がある
人が楽曲から受ける印象を歌詞から推測できないだ
ろうか




アンケートによる楽曲のカテゴリ分類
歌詞中の単語による楽曲のカテゴリ分類の試み
歌詞中の単語の共起ネットワークによる楽曲の分析
歌詞中の係り受けによる楽曲の分析

協力者:
◦ 18~28歳 男性52名 女性14名 合計66名

方法:
◦ 各楽曲(計50曲)の題名・アーティスト名・出だしの歌詞を見て、
その楽曲の印象を7つから選ぶ
◦ 知らない楽曲の場合、出だしの歌詞だけを見て楽曲の印象
を推測をしない
◦ 提示した印象に当てはまらない場合は8、楽曲を知らない場
合は9を選択する

印象カテゴリは7つとする
印象カテゴリ
「明るい」曲
「激しい」曲
「落ち着いた」曲
「リラックスできる」曲
「暗い」曲
「悲しい」曲
「軽快な」曲

印象語を用いてユーザに適切な楽曲推薦を行うシス
テム(市川ら,2006)
◦ 23種類の楽曲を表わす印象語でグループ化を行う
◦ 「印象語の数が多すぎて選ぶのに困る」という被験者の意見
があった

オリコンCD年間シングルランキング2007年の上位
50曲
◦ アンケートを行う際に楽曲を知っていることが前提
◦ アンケート協力者の大半を占める18~20歳が頻繁に音楽を
聴いていた年だと判断した

番号
印象カテゴリ
分類曲数
1
「明るい」曲
15曲
2
「落ち着いた」曲
18曲
3
「暗い」曲
1曲
4
「軽快な」曲
8曲
5
「激しい」曲
6曲
6
「リラックスできる」曲
1曲
7
「悲しい」曲
1曲
知らないと回答した数が全回答の半数を占める


歌詞中に現れる単語で印象カテゴリに分ける
KH Coderのコーディングを使用する
◦ テキストマイニングのためのフリーソフトウエア

コーディング
◦ データをいくつかの種類に分類すること
◦ KH Coderでは、コーディングルールを記述すればこのルー
ルに基づくコーディングを行う



コーディングルール:7つの印象語を類語辞典で引
いた結果
類語辞典:オンライン辞書サービス『Weblio類語辞
典』
ルールにある語が最も多く出現しているコードをそ
の楽曲のコードとする
印象カテゴリ
分類曲数
コーディングルールの語数
「明るい」曲
0曲
45語
「落ち着いた」曲
8曲
41語
「暗い」曲
10曲
108語
「軽快な」曲
3曲
16語
「激しい」曲
5曲
185語
「リラックスできる」曲
1曲
51語
「悲しい」曲
6曲
50語
コードなし
26曲
--
印象カテゴリ
アンケート
コーディング 適合
精度
再現率
「明るい」曲
15曲
0曲
0曲
-
0
「落ち着いた」曲
18曲
8曲
4曲
0.5
0.2
「暗い」曲
1曲
10曲
1曲
0.1
1.0
「軽快な」曲
8曲
3曲
1曲
0.3
0.1
「激しい」曲
6曲
5曲
0曲
0
0
「リラックスできる」曲
1曲
1曲
0曲
0
0
「悲しい」曲
1曲
6曲
0曲
0
0



カテゴリに分けることができたのは半分
精度・再現率が低い
印象語によって歌詞をカテゴリに分けることは有効で
はなさそう

アンケートで分類された楽曲の歌詞を、印象カテゴリ
毎に共起ネットワーク図に表わす
◦ KH Coderの共起ネットワークコマンドを使用
◦ 「明るい」、「落ち着いた」、「軽快な」、「激しい」

共起ネットワークとは
◦ 出現パターンの似通った語を線で結ぶ
◦ 線で結ばれた語は強い共起関係があるといえる
◦ 語が近くにあっても線で結ばれていなければ、共起関係があ
るわけではない
◦ 色分けは自動で行うため、色に意味はない




共起ネットワーク上:約90語
すべての含まれる語:2語
3つのカテゴリに含まれる語:10語
2つのカテゴリに含まれる語:22語

同じ語が異なるカテゴリの歌詞に現れていることが多
い

語と語の繋がりはどうか
「落ち着いた」
「明るい」
「軽快な」
「激しい」
印象によって語間の繋がりが違う
共起関係を用いて各印象カテゴリの特徴ができる
数値化が困難
係り受け解析

CaboCha(係り受け解析器)を用いて、各印象カテ
ゴリの歌詞の係り受けを求め、頻度を出す
◦ 「明るい」「落ち着いた」「軽快な」「激しい」

使用する品詞:名詞・形容詞・副詞
「明るい」曲の頻度表
出現回数



頻度表に含まれる係り受けが、分類したい楽曲の係
り受けに含まれていれば、ポイントを付ける
ポイントは、頻度表を作った際の出現回数を使用した
ポイントの最も高いカテゴリに楽曲を分類する



協力者:20~23歳 男性5名 女性5名 計10名
対象楽曲:頻度表を作る際に用いていない10曲
各楽曲(計10曲)を「明るい」「落ち着いた」「激しい」「軽
快な」「該当なし」の5つに分類してもらう
タイトル
アーティスト
印象:アンケート アンケートの
一致率
TSUNAMI
サザンオー
ルスターズ
落ち着いた
0.9 明るい
3
SMILY
大塚愛
明るい
0.9 明るい
1
羞恥心
羞恥心
明るい
0.6 該当なし
0
桜坂
福山雅治
落ち着いた
1.0 該当なし
0
らいおんハート
SMAP
落ち着いた
0.9 該当なし
0
マツケンサンバ
松平健
軽快な
0.6 該当なし
0
キセキ
GReeeeN
該当なし
0.4 軽快な
5
Jupiter
平原綾香
落ち着いた
0.9 落ち着いた
1
*~アスタリスク ~
オレンジレンジ 軽快な
0.5 明るい
1
月光花
Janne Da Arc 落ち着いた
0.4 落ち着いた
1
印象:頻度表
ポイント

アンケートと係り受けによる分類結果の一致率:0.3

ポイントの高い楽曲は、アンケートの結果と異なって
いる

歌詞を係り受け解析で印象カテゴリに分けることは難
しい

楽曲の歌詞だけで、印象カテゴリに分けることは困難

分析対象の追加
アンケート方法の再検討

◦ 知らない曲の軽減

ありがとうございました。

印象語のグループ化を用いた楽曲推薦システム
◦ 市川裕也、田村哲嗣、速水悟


8つのジャンルごとにユーザが選んだ印象語に最適
な楽曲を推薦する
印象語は23種類

テキストマイニングのためのフリーソフトウエアで、さ
まざまな日本語テキスト型データを計量的に分析する
ことができる

KH Coderでは英語を未知語として扱う
◦ 分析対象から外される

日本語の楽曲の場合、英語表現は単語や短い文
◦ あまり意味をなさないことが多い

これにより、英語は分析対象から外す


KH Codreには5種類の色分けの設定がある
サブグラフ検出
◦ 同じサブグラフに含まれる語は実線
◦ 互いに異なるサブグラフに含まれる語は波線
◦ 背景が白色で丸囲み枠が黒色の語は、ほかの語とグループ
を形成していない
◦ 色分けは自動で行うため、色分けに意味はない
「落ち着いた」曲
「激しい」曲
「明るい」曲
「軽快な」曲