スライド 1

WS-3:
ソースコードの
類似性ワークショップ
大阪大学大学院 情報科学研究科
コンピュータサイエンス専攻 井上研究室
博士前期課程 1年
佐々木 裕介
Department of Computer Science,
Graduate School of Information Science & Technology,
Osaka University
自己紹介

所属
 大阪大学大学院情報科学研究科
 井上研究室(ソフトウェア工学講座)

研究内容
 大目的
 ソースコードの再利用を促進する
 卒業研究
 類似コードのグループ化
 再利用を目的としたソースコードDBの検索に利用
Department of Computer Science, Graduate School of Information Science & Technology, Osaka University
卒業研究の概要

ソフトウェア部品検索システムにおける類似コ
ードのグループ化
 対象とするのは大量のソースコード
 グループ化により類似情報の重複表示を避ける
 ユーザに有用な表示を選り抜いて提供

詳細
 http://sel.ist.osaka-u.ac.jp/~lab-
db/Bthesis/archive/121/121.pdf
Department of Computer Science, Graduate School of Information Science & Technology, Osaka University
私とソースコード類似性

目的
 再利用価値が類似したコードのグループ化

注目する要素
 外部からアクセスする方法
 外部から見た振る舞い

類似/非類似の判断基準
?
特定の振る舞いを
与える/返す
 各要素の一致度合が定めた閾値以上かどうか
Department of Computer Science, Graduate School of Information Science & Technology, Osaka University
問題点

次のようなコード対が存在する:
 制限を厳しくすれば非類似
 制限を緩くすれば類似
どこまでを類似と見るか
客観的材料が存在しない
データを提供し,議論を通じて
類似コードとは何か考える
Department of Computer Science, Graduate School of Information Science & Technology, Osaka University
このワークショップにおける目的 (1/2)

新たなソースコード類似性の基準を見つける
 色々な特徴が利用できた方が良い
 手法の高速化,他場面での応用

複数目的で利用できる基準を見つける
 コンセンサスの取れた類似基準
 他の目的で用いられている基準を応用
Department of Computer Science, Graduate School of Information Science & Technology, Osaka University
このワークショップにおける目的 (2/2)

類似判断が有効かどうかの評価
 コンセンサスに基づいた類似の正しさとは?
 各研究で使われている正解集合は妥当?
正解集合
との比較
評価?
評価!
手法
入力
出力
対象の抽出
類似判断
応用
Department of Computer Science, Graduate School of Information Science & Technology, Osaka University