トップエスイー修了制作 原因分類情報を用いた Fault-Prone 予測モデル の適用事例 三菱総合研究所 [email protected] 仙頭洋一 開発における問題点 手法・ツールの適用による解決 ソフトウェアリポジトリを用いたFPモジュール予 測では、どういった修正原因であるかについて の情報は十分ではなく, 当該ファイル自体に欠 陥が含まれている場合の修正や依存関係にあ るファイルの修正に連動した場合の修正が一 元的に扱われている。 オープンソースソフトウェア開発におけるリポジ トリ情報と開発者による修正原因分類情報を用 いて、複数の定量的分析手法およびツール(R 等)による分析に基づく変数選択を実践し、FPモ ジュール予測モデルの構築と、修正原因の違 いによるFPモデル・説明力のある変数の違いを 見出した。 ヘッダ 修正原因分類情報 ①分析対象データ Twitter4J 開発者視点での 原因分類情報を参 考に修正データを 集計 題材としたTwitter4Jのバグ分類 ソフトウェアリポジトリを活用したFP予測 1.0 0.8 0.6 0.8 0.4 0.6 0.2 0.4 0.0 0.2 ②モデル化 原因分類ごとに予測モデルを構築する. ロジスティック回帰モデルと複雑度メトリクス(後述)を用いる. モデルの説明変数として選ばれるメトリクスは原因分類によっ て違う 結果と課題 1.0 予測モデル構築と評価 0 1 1 分類情報あり 1.0 分類情報なし 0 0.8 特定の分類に着目したモデルのほうが適合率, F値が高い 0.2 0.4 0.6 原因分類によって予測モデルは変化することを確認 原因分類によって、説明力のある変数は異なる 分類なしでの予測ができたとしても、取るべきアク ションが違うので結局何もできない懸念がある 予測結果を実際の現場での判断要素として使うた めには、原因分類を踏まえた予測が必要 0 1 修正あり(実績) 修正なし(実績) 国立情報学研究所 トップエスイー トップエスイー: サイエンスによる知的ものづくり教育プログラム National Institute of Informatics ~サイエンスによる知的のものづくり教育プログラム~ 文部科学省科学技術振興調整費 産学融合先端ソフトウェア技術者養成拠点の形成
© Copyright 2024 ExpyDoc