修士論文発表会 - Software Engineering Laboratory

類似度を用いたプログラムの再利用性
尺度の提案と実現
2002年2月20日
井上研究室
博士前期課程 2年
藤原 晃
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
1
背景
ソフトウェア開発効率を向上するための手法とし
て、再利用が注目されている
再利用とは既存のソフトウェア部品を同一システム内、
他のシステム内で用いること
部品が再利用に適しているか判断するために、
再利用性を定量的に示すことが必要
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
2
従来の再利用性評価手法
従来の再利用性評価手法は、個々の部品の静的な特性
を評価している
コードメトリクスを足し合わせて再利用性を評価[1]
インターフェース部分の情報から再利用性を評価[2]
静的な特性からは再利用性が低いと評価されていても、
実際には頻繁に再利用されている部品も存在する
利用実績に基づく再利用性を定量的に評価することが必要
[1] L. Etzkorn et al.: ``Automated reusability quality analysis of OO legacy software,'' Information
and Software Technology, Vol. 43, Issue 5, pp. 295-308 (2001).
[2]山本 他: ``再利用特性に基づくコンポーネントメトリクスの提案と検証," FOSE2001, (2001).
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
3
実績に基づく評価
計量社会学で一般に用いられている手法
Influence Weight[3](学術論文の重要度を評価)
多くの論文に引用される論文は重要である
重要な論文に引用される論文はまた重要である
他の応用
Page Rank[4] (Webページの重要度を評価)
多くのページからリンクされるページは重要である
重要なページからリンクされるページはまた重要である
[3] G. Pinski et al.:``Citation Influence for Journal Aggregates of Scientific Publications: Theory,
with Application to the Literature of Physics,“ Information Processing and Management, Vol. 12,
Num 5, pp. 297-312, (1976).
[4] L. Page et al.: ``The PageRank Citation Ranking: Bringing Order to the Web,'' http://wwwdb.stanford.edu/~backrub/pageranksub.ps
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
4
本研究の目的
利用実績に基づくソフトウェア部品の再利用性評価
手法を提案
提案手法による再利用性評価システムを実装
Javaソースコードに対して適用実験を行う
提案手法が利用実績を反映しているか
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
5
ソフトウェア部品
ソフトウェア開発者が再利用を行う単位をソフトウェ
ア部品と呼ぶ
ソースコードファイル、ドキュメントを部品として抽出
部品間には利用関係が存在する
c4
c5
c1
c1 '
c2
c2 '
c3
(a) 部品間の関係
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
6
類似部品群(1)
実際に部品を抽出した場合、コピーした部品やコ
ピーして一部変更した部品が多く存在する
類似した部品をまとめて類似部品群とする
c4
c5
cC44
c1
c1 '
c1
c2
c2 '
c3
c2 C2
cC55
c1 '
C1
c2 '
C3 c3
(a) 部品間の関係
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
7
類似部品群(2)
所属する部品同士に利用関係があれば、部品群
間にも利用関係がある
c4
c5
c1
c1 '
c2
c2 '
(a) 部品間の関係
C4
C5
C1
c3
C2
C3
(b) 部品群間の関係
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
8
相対的再利用性
再利用を用いてソフトウェア開発が繰り返されると、
利用関係は時間とともに変化していく
十分な時間が経過した状態で、部品の利用実績に
基づいて再利用性を評価
多数の部品間の利用関係から相対的に決まる
「相対的再利用性」
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
9
部品の分類
実際に部品を抽出した場合、コピーや類似した部品
が多数含まれる
類似部品群を相対的再利用性評価の対象とする
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
10
相対的再利用性評価値(1)
開発者は再利用性が高いと判断した部品群を利
用する
部品群を利用する→「再利用性が高い」という支持
投票をしたとみなす
多くの部品群から投票される部品群は再利用性評価が高い
再利用性評価が高い部品群から投票を受ける部品群は再利用
性評価が高い
部品群同士で互いに投票しあうことで評価値が循
環し相対的再利用性評価値が決まる
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
11
相対的再利用性評価値(2)
所属する部品群の評価値を部品の評価値とし、部
品を順位付けする
本提案手法を「Relative Reusability Ranking」
法(R3法)と呼ぶ
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
12
相対的再利用性評価値(3)
C1
0.333
vC
1 1
C1
0.200
C2
C1
C2
0.333
vC
0.400
0.200
0.167
2 2
50%
0.200
C2
0.167
100%
100%0.167 0.400
0.200
0.333
C1 C 0.1670.333 C2
0.333
C3 C2
C1 C2
C1 3
0.167
CvC
C0.250
C2 C 0.400
C2 0.167
0.417
13 3C
1
0.5000.333
0.167
0.167
1
2
0.334
0.250
C
0.500
0.2500.167 0.167
3
0.500
0.334 C3 0.417
0.167
0.250
C3
C3
C
C3 0.417
0.334 3 C
50%
3
0.417
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
13
Javaへの適用
ソースコードファイルを部品とする
類似度にはSlineを用いる[5]
2つのソースコード間で一致する行の割合
SMMT(Similarity Metrics Mesuring Tool)を用いて
Slineを計測する
継承、インターフェイスの実装、メソッド呼出を部品
間の利用関係とする
[5]山本, 松下, 神谷, 井上:``ソフトウェアシステムの類似度とその計測ツールSMMT'',
電子情報通信学会論文誌 D-I(採録決定).
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
14
R3-Systemの構成
Java ファイル (N個)
SMMT
ファイル間の関係
抽出部
クラスタ分析
ツール
部品群間の関係
抽出部
部品群の順位
→ファイルの順位
相対的再利用性
計算部
N個のファイルの順位
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
15
JDKへの適用
JDK(Java Development Kit) 1.3.0のソースコードへ
適用(1877 files, 18.4MB)
言語仕様上、直接的、間接的に利用しなければならな
いクラスが上位を占めている
順位
1
2
3
4
5
6
7
8
9
10
クラス名
java.lang.Object
java.lang.Class
java.lang.Throwable
java.lang.Exception
java.io.IOException
java.lang.StringBuffer
java.lang.SecurityManager
java.io.InputStream
java.lang.reflect.Field
java.lang.reflect.Constructor
評価値
0.161269
0.087124
0.055101
0.031032
0.013438
0.012144
0.011700
0.010277
0.009483
0.009370
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
16
研究室内ソースコードへの適用
研究室内で作成したツールと、使用したパッケージの
ソースコードへ適用(582 files, 6.1MB)
類似した部品は同一評価値を持っている
作成したツールより使用パッケージの方が評価が高い
順位
1
2
2
4
5
6
7
8
8
10
クラス名
antlr.Token
antlr.debug.Event
antlr.debug.NewLineEvent
antlr.collections.impl.Vector
jp.gr.java_conf.keisuken.text.html.HtmlParameter
jp.gr.java_conf.keisuken.net.server.ServerProperties
Jama.Matrix
jp.gr.java_conf.keisuken.util.IntegerArray
jp.gr.java_conf.keisuken.util.LongArray
jp.ac.osaka_u.es.ics.iip_lab.metrics.parser.java.IdentifierInfo
評価値
0.107270
0.061890
0.061890
0.054348
0.052461
0.036995
0.015649
0.013907
0.013907
0.013654
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
17
提案手法の応用
R3法をソフトウェア部品検索へ応用
インターネットを通じてソフトウェア部品を収集
R3法で部品を順位付け
検索結果を相対的再利用性で順位付けして表示
R3-System
インターネット
部品の収集
部品リポジトリ
順位付け
部品検索
エンジン
検索キー
検索結果
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
18
まとめ
まとめ
類似部品群間の利用関係から再利用性を評価する手
法を提案した
提案する手法に基づいて再利用性評価を行うシステムを
開発し、Javaソースコードを対象に適用した
適用結果から、提案する評価手法が利用実績を反映し
ていることが示された
今後の課題
より多くの部品に対して適用する
利用関係の種類による重み付けの検討
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
19
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
20
相対的再利用性評価値(4)
相対的再利用性評価値を求める計算は行列の固
有ベクトルを求める計算に帰着される
C1
50%
v1
C1
C2
v2
50%
0.200
0.400
100%
C2
0.200
100%
0.200
0.400
C3
v3
C3
0.400
0.200
 v1 
 
V   v2 
v 
 3
 0 0.5 0.5 


D  0 0
1 
1 0

0


V = Dt・V
λ=1の固有ベクトル
 0.4   0 0 1   0.4 
  
  
 0.2    0.5 0 0    0.2 
 0.4   0.5 1 0   0.4 
  
  
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
21
評価が循環しない場合
部品全体における票の重みの偏りを分析することで相対的
再利用性を評価している
票が全体に循環しなければ正しく評価できない
利用してない部品に対しては非常に低い重みの票を投票したとみなす
Software Engineering Research Group, Department of Informatics and Mathematical Science, Graduate School of Engineering Science, Osaka University
22