2005年度情報理論ガイダンス

決定木
例1とそのデータ形式
% メールチェック推薦システム
% 'T:' Identifies the Attribute Title Line
% 'A:' Identifies Training Set Examples
% 'B:' Identifies Test Set Examples
T: Author, Thread, Length, Where Read, User Action;
A: known, new, long, home, skips;
A: unknown, new, short, work, reads;
B: known, new, short, home, skips;
B: known, new, long, work, skips;
例2とデータ形式
%ブーリアン
% 'T:' Identifies the Attribute Title Line
% 'A:' Identifies Training Set Examples
% 'B:' Identifies Test Set Examples
T: Input 1, Input 2, Output (xor);
A: 0.0, 0.0, 0.0;
A: 0.0, 1.0, 1.0;
A: 1.0, 0.0, 1.0;
A: 1.0, 1.0, 0.0;
% NO TEST EXAMPLES
例3とデータ形式
%
%
%
%
購入顧客
'T:' Identifies the Attribute Title Line
'A:' Identifies Training Set Examples
'B:' Identifies Test Set Examples
T: AGE, INCOME, STUD, CRED, BUYS;
A: <=30, high, No, fair, No;
A: <=30, high, No, excl, No;
A: 31..40, high, No, fair, Yes;
A: >40, med, No, fair, Yes;
A: >40, low, Yes, fair, Yes;
A: <=30, med, Yes, excl, Yes;
A: 31..40, med, No, excl, Yes;
A: 31..40, high, Yes, fair, Yes;
A: >40, med, No, excl, No;
% NO TEST EXAMPLES