資料2 文字情報基盤成果物のバージョンアップについて

資料2
⽂字情報基盤成果物のバージョン
アップについて
2014 年10⽉
独⽴⾏政法⼈情報処理推進機構
バージョンアップ概要
• 2014年9⽉19⽇に公開
• MJ⽂字情報⼀覧表Ver.004.01
– 国際規格の更新に伴う掲載情報の追加
– ⾏政実務で⽤いられる字辞典検字番号情報の追加
• IPAmj明朝フォントVer.003.01
– 2014年9⽉発⾏のISO/IEC 10646 第4版に対応
– 国際標準規格の最新版に対応し、前バージョンと
⽐較して約4,200⽂字が利⽤可
1
MJ⽂字情報⼀覧表Ver.004.01
• 国際規格更新に係る項⽬追加
– IPAmj明朝Ver.003.01で実装した「Moji_Johoコレ
クションIVS」
– IPAmj明朝Ver.003.01で実装した互換漢字に対する
SVS(Standardized Variation Sequence)
• ISO/IEC 10646第4版に伴う「対応するUCS」の更新
– 新たに付与したもの ・・・ 505⽂字
– 符号位置を変更したもの・・・ 2⽂字
• 以下の字辞典検字番号の追加
– 講談社新⼤字典
– ⾓川⼤字源
2
IPAmj明朝フォントVer.003.01
• UCS、IVSの符号化実装の追加
– ISO/IEC 10646 第4版に対応し、拡張Eに該当する
496⽂字をUCS符号化実装
– IVD Moji_JohoコレクションのIVSを10,710⽂字実装
– 互換漢字に対するSVSを89⽂字に対し実装
• 前のバージョンと⽐較して、利⽤可能な⽂字が
4,152⽂字増加
3
現在のUCS符号化状況
IPAmj明朝フォントVer.003.01の符号化状況
⼾籍統⼀(漢字のみ)
(55,270⽂字)
住基統⼀(漢字のみ)
(19,563⽂字)
⾮漢字
(2,014図形/1,684⽂字)
縦書⽤⽂字、リガチャを含む
⽂字情報基盤漢字
(58,815⽂字)
24,210⽂字
1,684⽂字
ISO/IEC 10646UCS
BMP (全65,536⽂字)
(Universal coded
Character Set)
26,237⽂字
1,941⽂字
5,930⽂字
CJK統合漢字拡張B,C,D
(全47,000⽂字)
IVD
現在は
符号化対象外
約800⽂字
約800⽂字
2015年度中に規格
が発⾏される⾒込み
CJK統合漢字拡張F
(全約3,900⽂字)
2014年度11⽉
から審議開始
CJK統合漢字拡張G
(国際提案中)
約300⽂
字
IVS追加
(IVD登録)
第2期登録を2015年度中
(規格発⾏後)に予定
4
今後の⾒通し
時期
内容
2015年
MJコレクションの第2期IVD登録をUnicodeコンソーシアムに
申請、Unicodeコンソーシアムが公開レビューを開始
2015年
ISO/IEC 10646第4版追補2(拡張F)の発⾏
2015年
Unicodeコンソーシアムの公開レビュー終了、
MJコレクション第2期の登録完了
2015年度中
ISO/IEC 10646第4版追補2と第2期MJコレクションに対応し
たMJ⽂字情報⼀覧表, IPAmj明朝フォントにバージョンアップ
5