文字コードと改行コード

12.6.2. 文字コードと改行コード

文字コードは utf-8 が広く使われているが、他のコードも使われてきたことを 12.4. 人のための文字 で学びました。 mi でいろいろな文字コードのファイルを開いてみましょう。

文字コード #

前ページで練習した /home/hwb/exercise/text から japanese-1.txt を mi で開いた画面です。

ウィンドウ上部のツールバーの部分にISO-2022-JP と表示されています。 これが mi が自動で認識した文字コードです。

練習 #

同じフォルダには japanese-1.txt, japanese-2.txt, japanese-3.txt, japanese-4.txt の4つのテキストファイルがあります。

  1. それぞれの文字コードを mi で調べてみましょう
  2. 4つのファイルの中で「テキストエディット」で開けるのはどれでしょう? 理由を検討してください

使われている文字コードは 12.4.3. 多言語環境とUnicode で紹介した utf-8 と 12.4.4. 日本語文字コードと変換 で紹介した3種類のいずれかです。

また文章は以下のいずれかの冒頭です

吾輩は猫である (夏目漱石) 源氏物語 桐壺 (與謝野晶子訳) 柿の種 (寺田寅彦) 東京大学憲章 前文

変更と保存

文字コードの変更と保存 #

文字コードを指定して保存することもできます。

または、編集画面にある文字コード選択ボタンを押します。

このあとファイルを保存します。

改行コード #

文字のなかで改行を表すために CRLF という制御文字があり、環境によって 使い方に流儀があることを 12.2. ASCII で紹介しました。

mi は自動で判別します。

認識した改行コードは文字コードの隣に示されています。図なら LF (Mac/UNIX) です。

変更と保存

改行コードの変更と保存 #

mi では、メニューのドキュメント改行コード から改行コードを選択することができます。

また、編集ウィンドウにある改行コード選択ボタンを押すことでも選択できます。

ファイルの表示 文字コードと改行コード 編集