イラストの著作権保護のためのHOG特徴量を用いた複製検出

木下研究室
工藤護
201070080

電子書籍の発達や大型のイラスト投稿サイトの影響
でインターネット上に多くのイラストが存在している。

それと同時に不正なコピーによる著作権の侵害が問
題となっている。

その為、このような問題に対処し、著作権を守る必要
がある。

画像の著作権を保護する方法として、電子透かしや
画像検索に基づく複製検出などの手法、「線画の著
作権保護のための部分的複製検出法」などの研究が
なされている。

しかし、電子透かし等では手書きで模写し、改変を加
えた場合など複雑な変化があった場合の検出が難し
くなっている。

保護対象の画像コンテンツとして、アニメや漫画などで用
いられるイラストコンテンツを対象とする。

オリジナルイラストの輪郭線や構図を複写や模写し、オリ
ジナルとは別の彩色を施すなどしたものをトレース画像と
定義。

データをそのまま用いる複製や画像を取り込むことによる
複製だけではなく、トレース画像の検出が可能な方式を目
的とする。

特徴量としてSURFとHOGを用いて比較検討を行う。

検出の対象とする画像を、以下の図のように定義。
WEB上のデータ
そのものや紙媒体
オリジナル
画像
サイズ・角度の
変化や部分的な
抜き出し
輪郭線や構図の
手書きによる模写
・データをそのまま
・紙媒体をスキャン
オリジナル
の直接利用
改変を加えた
複製
図1.検出対象の画像
トレース画像

複製検出の手段として画像の特徴を数値で表した特
徴量、その一種である局所特徴量を用いる。
オリジナル画像
輪郭線
輪郭線の
抽出
図2.特徴量抽出の流れ
データベース
特徴量の
抽出
オリジナル
画像
複製の疑い
がある画像
輪郭線
輪郭線
特徴量
特徴量
データベース
マッチング
投票
複製検出
図3.複製検出の流れ

本研究では局所特徴量として、SURF・HOGの二種類
を用いる。

計算速度が早いことからSURFを、物体の大まかな形
状が認識できることからHOGを用いた。

SURFとは物体認識に用いる特徴点を求める画像処
理のアルゴリズム。

最も一般的な特徴量であるSIFTと比べて計算速度が
早い。

特徴点の位置、特徴点の輝度勾配の方向、スケール、
64次元の特徴を表すベクトルが抽出される。
特徴点の検出
(x,y)座標
σ スケール
向きの検出
角度
特徴量の抽出
図4.SURF処理過程
16*4の64次元ベクトル

HOGは画像の局所領域から輝度勾配・輝度強度を
取り出す特徴量。

物体の大まかな形状を表現可能で、一般に歩行者や
人工物などの物体を検出するのに使用され文字認識
などにも用いられる。

輝度勾配ヒストグラムを正規化することで明るさの変
化にも対応可能と言われている。
局所領域をブロック・セルに分割
ブロックを移動し、セルの中での
輝度勾配ヒストグラムを計算
ブロックごとに正規化
全てのヒストグラムを統合して特徴量にする
図5.HOG処理過程

データベースには100枚のオリジナル画像から抽出
した輪郭線の特徴量を登録。

図1で定義した検出対象の画像の特徴量とマッチング
を行う。

検索質問とデータベースに登録した特徴量を照合し
て、著作権保護の対象に一致した数だけ投票を行う。

まず、オリジナル画像の直接利用をした場合の検出
する際の有効性の検証を行う。

クエリとしてオリジナルのデータをそのまま利用したも
の、印刷・取り込みをして複製したものを用いる。


どちらの特徴量も共に一致率90%を超え、一致率1位
の画像とオリジナル画像は一致した。
2位以下の画像の一致率についてはSURFが1%以下、
HOGが10%程度となって 100
90
80
おり複製の検出に十分
70
有効と考えられる。
60
50
40
30
20
10
0
SURF
HOG
図6.オリジナルの直接利用の検出

次に、オリジナル画像に改変を加えた場合の複製の
検出する際の有効性の検証を行う。

用いるクエリは、以下の画像を用いる。
①オリジナルのサイズを1/2倍、2倍にしたもの。
②30度、60度、90度の回転を加えたもの。
③画像の一部分を抜き出したもの。
100
90
80
70
60
50
40
30
20
10
0
100
90
80
70
60
50
40
30
20
10
0
100
90
80
70
60
50
40
30
20
10
0
2分の1
2倍
図7.サイズを変えた
複製の検出
30°
60°
90°
図8.回転を加えた
複製の検出
SURF HOG
図9.一部抜き出した
複製の検出

①の場合はSURFが95%、HOGが90%程度の一致率
となり、2位以下の一致率についてはSURFが1%以
下、HOGが10%程度となった。

②の場合はこちらもSURF95%、HOG90%程度と
なっており、2位以下については同様にSURFが1%以
下、HOGが10%程度となった。

③の場合はSURF92%、HOG88%程度となってお
り、2位以下はこちらもSURGが1%以下、HOGが
10%程度となった。

最後にトレース画像の検出する際の有効性の検証を
行う。

用いるクエリは、オリジナル画像の輪郭線部分を手書
きによって模写したものを用いる。


SURFの場合一致率が20%程度となり、1位の画像が
オリジナル画像と異なっていることが多くなっている。
HOGの場合一致率70%程度となっており、2位以下
の画像は一致率10%程度
100
90
となった。
80
70
60
50
40
30
20
10
0
SURF
HOG
図11.トレース画像の検出
SURF
HOG
直接利用
○
○
改変を加えた複製
○
○
トレース画像
×
○

実験からSURF、HOGともにオリジナルの直接利用や
回転やサイズの変化等の改変を加えた画像に対して
は有効だということが判明。

若干精度が下がったのは、近似最近傍探索を用いて
いることで本当の最近傍が得られていない事によると
考えられるが、ユーザが最終的に画像のチェックをす
るため高速化によるメリットのほうが大きいと考えられ
る。

トレース画像に対して
・SURFでは手書きによる線のぶれ(位置ずれや形状
の変化)に対応できず検出が困難。
・HOGでは複製の検出が可能だが、より高い精度で
の検出が求められる。

比較的変化が少ない複製に対してはSURFとHOGど
ちらの特徴量も有効である。

直接利用や改変を加えた画像だけではなく、トレース
画像に対してHOGは有効である。


HOGで局所領域の抽出の際、線分が十分含まれて
いなかった為、精度が落ちたと考えられる。
→線分を十分含んだ領域の抽出方法の検討。
データベースのメモリ量や計算時間が膨大なものとな
る。
→特徴量の次元数の効率のよい削減など、
メモリ量・計算時間の削減手法の検討。


工藤護,工藤敬文,木下宏揚,森住哲也,
”イラストの著作権保護のための局所特徴量を用いた
複製検出”,暗号と情報セキュリティシンポジウム
(SCIS2012),4F1-4
MORIZUMI Tetsuya, KUDO Mamoru, SUZUKI
Kazuhiro, KINOSHITA Hirotsugu :
“An electronic money system as substitute for
banknotes”, International Symposium on
Applications and the Internet(IEEE/IPSJ),ITeS
2010,pp.316-319(2010-7)