文字化けの背景を知る Copyright © the University of Tokyo 課題の概要 日本語の文字コードについて理解を深める MacOS(テキストエディット)で利用可能なエン コーディング(コード化方式)を確認する テキストエディットで文字化けの状況を調べる 自分の名前の2文字の文字コードを調べる 文字コードの違い(同じものか否か)を推定する Copyright © the University of Tokyo テキストエディット – 準備 (1) Finderのサイドバーから「アプリケーション→テ キストエディット(TextEdit)」を起動する テキストエディット中で自分の名前の1文字を入力 する(後でもう1文字入力する) 「標準テキスト」ファイルになることを確認しておく (「テキストエディット→環境設定」) Copyright © the University of Tokyo テキストエディット – 準備 (2) テキストエディットでエンコーディングを変えてファ イルを保存する (「ファイル→別名で保存…」) UTF-8 Mac OS Windows ISO 2022-JP EUC Shift JIS 良く利用されるUnicode Mac OSの標準 Windowsの標準 いわゆるJISコード EUCコード Shift JISコード 上記の6種類で試してみる Copyright © the University of Tokyo テキストエディット – 準備 (3) エンコーディングと文字数がわかるファイル名にする 選択可能な文字コードが少ないときは,「エンコー ディングリストのカスタマイズ…」を行なう Copyright © the University of Tokyo テキストエディット – 準備 (4) 名前の2番目の文字を入力する エンコーディングを変えてファイルを保存する 全部で12(=6×2)個のファイルができるはず Copyright © the University of Tokyo 文字化けを試す (1) 「テキストエディット→環境設定…」の「開く/保存」 で,「ファイルを開くとき」のエンコーディングを「自 動」にする (最初の状態を覚えておく) UTF-8以外のファイルも読めるようにする Copyright © the University of Tokyo 文字化けを試す (2) 「ファイル→開く…」からファイルを選択して,様々 なエンコーディングのファイルを開く 文字化けの有無を確認する Copyright © the University of Tokyo 文字化けを試す (3) 「テキストエディット→環境設定…」の「開く/保 存」で,「ファイルを開くとき」のエンコーディングを 「自動」から元に戻しておく 必要というわけでないが,念のため Copyright © the University of Tokyo 文字コードの推定 (1) hexdumpコマンドで文字コードを16進表示する 同じエンコーディングで,1文字のファイルと2文字 のファイルとを比較することで,2文字目の文字 コードを推定できる(はず…) Copyright © the University of Tokyo 文字コードの推定 (2) 自分の名前の2文字が,どのようなコードになって いるか,16進表現と10進表現でまとめよ 実際には同種の文字コードを利用している場合が あるので,同種と考えられるものを推定せよ 自信が得られない場合には,3文字目まで入力し たファイルを作ってみるのも良いだろう Copyright © the University of Tokyo
© Copyright 2024 ExpyDoc