A niching genetic programming-based multi

医療情報システム研究室
研究グループ名
【文献調査】
A niching genetic programming-based multi-objective
algorithm for hybrid data classification
白石 駿英
廣安 知之
山本 詩子
2014 年 09 月 12 日
タイトル
1
ハイブリッドデータ分類のための niching 遺伝的プログラミングに基づく多目的最適化アルゴリズム
著者
2
Marconi de Arruda Pereira, Clodoveu Augusto Davis Juniorc, Eduardo Gontijo Carranod, Joao Antonio de
Vasconcelosd
出典
3
Neurocomputing Volume 133, 10 June 2014, Pages 342-357
アブストラクト
4
本稿では、ハイブリッドデータ、すなわち、定期的(例えば、数値、論理的、およびテキスト)と非正規の(例
えば地理的)属性で構成のデータベースに分類規則を抽出するために遺伝的プログラミングに基づく多目的アル
ゴリズムを導入している。このアルゴリズムは、与えられたデータセットのクラスの中の項目を分類するための
より適しているルールを識別するために、人口アーカイブと組み合わせたニッチな技術を用いる。このアルゴリ
ズムは、ユーザが特定のアプリケーションに対してより適切な関数のセットを選択することができるように実装
されている。この機能は、データセットの分類問題の任意の種類の事実上適用可能な提案されたアプローチを行
う。また、分類問題は、精度と分類子の複雑さの最小化の最大化を目的関数として考慮されている多目的一つと
してモデル化される。かなり異なるデータセットとドメインと異なる分類の問題、のセットは、検討されている:
電源トランスや都市の発展のレベルのワイン、肝炎患者、初期故障。この最後のデータセットでは、属性の一部
は、地理的であり、それらは、点、線、または多角形として表されている。決定木(C4.5)、サポートベクターマ
シン(SVM)と放射基底関数(RBF)
:アルゴリズムの有効性は、他の 3 つの方法が、広く分類するために使用
されているものとして比較されている。統計的比較は、方法の信頼性の比較を提供するために、一方向 ANOVA
および Tukey の試験を用いて行われている。結果は、提案されたアルゴリズムは、それが分類アプリケーション
のかなりの範囲が適していることを示唆しているものを、試験したすべての場合において優れた分類の効果を達
成することを示している。
キーワード
5
Classification rules; Spatial data mining; Genetic programming; Multi-objective algorithm
参考文献
6
6.1
Bayesian classifier
[1] J. Wang, P. Neskovic, L.N. Cooper Neighborhood size selection in the k-nearest-neighbor rule using
statistical confidence Pattern Recognit., 39 (3) (2006), pp. 417-423
[2] S. Yang, H. Jian, Z. Ding, Z. Hongyuan, C.L. Giles, IKNN: informative K-nearest neighbor pattern
classification, in: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence
and Lecture Notes in Bioinformatics), LNAI, vol. 4702, 2007, pp. 248-264.
[3] X. Jiang, N. Nariai, M. Steffen, S. Kasif, E.D. Kolaczyk Integration of relational and hierarchical network
1
information for protein function prediction BMC Bioinf., 9 (350) (2008)
6.2
ANN
[4] S.H. Liao Expert system methodologies and applications - a decade review from 1995 to 2004 Expert Syst.
Appl., 28 (1) (2005), pp. 93-103
[5] M.B. Ara?jo, R.G. Pearson, W. Thuiller, M. Erhard Validation of species-climate impact models under
climate change Global Change Biol., 11 (9) (2005), pp. 1504-1513
[6] C.J. Mantas, J.M. Puche, J.M. Mantas Extraction of similarity based fuzzy rules from artificial neural
networks Int. J. Approx. Reason., 43 (2) (2006), pp. 202-221
6.3
SVM
[7] V. Vapnik The Nature of Statistical Learning Theory (2nd ed.)Springer-Verlag New York, Inc., New York,
NY, USA (1999)
[8] Y. Chen, J.Z. Wang Support vector learning for fuzzy rule-based classification systems IEEE Trans. Fuzzy
Syst., 11 (6) (2003), pp. 716-728
[9] Y. Lin Support vector machines and the Bayes rule in classification Data Min. Knowl. Discov., 6 (3)
(2002), pp. 259-275
6.4
GA・GP
[10] M.A. Pereira, J.A. Vasconcelos, A niched genetic algorithm for classification rules discovery in real
databases, in: XVIII Congresso Brasileiro de Autom?tica - CBA, Bonito, MS, Brazil, 2010, pp, 824-829
[11] F.J. Berlanga, A.J. Rivera, M.J. del Jesus, F. Herrera GP-COACH: genetic programming-based learning
of COmpact and ACcurate fuzzy rule-based classification systems for high-dimensional problems Inf. Sci. (NY),
180 (8) (2010), pp. 1183-1200
6.5
多目的最適化について
[12] D.E. Goldberg Genetic Algorithms in Search, Optimization and Machine Learning Addison-Wesley Longman Publishing Co., Inc., Boston, MA, USA (1989)
[13] M.A. Pereira, C.A. Davis Jr., J.A. Vasconcelos, A niched genetic programming algorithm for classification
rules discovery in geographic databases, in: SEAL 2010, Lecture Notes in Computer Science - LNCS, vol. 6457,
2010, pp. 260 - 269
2