スライド 1 - トップエスイー

トップエスイー修了制作
原因分類情報を用いた Fault-Prone 予測モデル
の適用事例
三菱総合研究所
[email protected]
仙頭洋一
開発における問題点
手法・ツールの適用による解決
ソフトウェアリポジトリを用いたFPモジュール予
測では、どういった修正原因であるかについて
の情報は十分ではなく, 当該ファイル自体に欠
陥が含まれている場合の修正や依存関係にあ
るファイルの修正に連動した場合の修正が一
元的に扱われている。
オープンソースソフトウェア開発におけるリポジ
トリ情報と開発者による修正原因分類情報を用
いて、複数の定量的分析手法およびツール(R
等)による分析に基づく変数選択を実践し、FPモ
ジュール予測モデルの構築と、修正原因の違
いによるFPモデル・説明力のある変数の違いを
見出した。
ヘッダ
修正原因分類情報
①分析対象データ
Twitter4J
開発者視点での
原因分類情報を参
考に修正データを
集計
題材としたTwitter4Jのバグ分類
ソフトウェアリポジトリを活用したFP予測
1.0
0.8
0.6
0.8
0.4
0.6
0.2
0.4
0.0
0.2
②モデル化
原因分類ごとに予測モデルを構築する.
ロジスティック回帰モデルと複雑度メトリクス(後述)を用いる.
モデルの説明変数として選ばれるメトリクスは原因分類によっ
て違う
結果と課題
1.0
予測モデル構築と評価
0
1
1
分類情報あり
1.0
分類情報なし
0
0.8
特定の分類に着目したモデルのほうが適合率, F値が高い
0.2
0.4
0.6
原因分類によって予測モデルは変化することを確認
 原因分類によって、説明力のある変数は異なる
 分類なしでの予測ができたとしても、取るべきアク
ションが違うので結局何もできない懸念がある
 予測結果を実際の現場での判断要素として使うた
めには、原因分類を踏まえた予測が必要
0
1
修正あり(実績)
修正なし(実績)
国立情報学研究所
トップエスイー
トップエスイー: サイエンスによる知的ものづくり教育プログラム
National Institute of Informatics
~サイエンスによる知的のものづくり教育プログラム~
文部科学省科学技術振興調整費
産学融合先端ソフトウェア技術者養成拠点の形成