14.5 ファイルの分類

ファイルはその性質や拡張子などによって分類されます.このページでは,ファイルの分類について説明をします.

テキストファイルとバイナリファイル

ファイルは大きく分けて,バイナリファイルとテキストファイルに分けることができます.

テキストファイルとは,人間が読めるような文字で書かれたファイルのことです.たとえば,HTMLなどの言語で書かれたファイルや,Javaプログラムのソースファイルや,LaTeX のソースファイルなどはテキストファイルです.テキストファイルは mi やEmacs などのテキストエディタで内容を編集することができ,後で説明する cat や more などのコマンドでファイルの中身を確認することができます.

一方,画像ファイルやコンパイルされたプログラムのファイルは,Emacsなどのテキストエディタで中身を見ようとしてもきちんと見ることができません.これらは文字として解釈できないようなデータによって成り立っているからです.このようなファイルをバイナリファイルをいいます.バイナリファイルはプログラムによって作成されます.たとえば,Java言語のクラスファイルは,Javaのコンパイラによって生成されるバイナリファイルです.

実行可能ファイル

ファイルは,実行可能なプログラムが入ったファイルと,中身がデータなどで実行できないファイルに分けることができます. ここでは,ターミナルのコマンドラインから直接実行可能なプログラムが入ったファイルを実行ファイルと呼ぶことにしましょう.

ls コマンドを使うと指定したディレクトリ (指定しなければカレントディレクトリ) にどのようなファイルがあるかを見ることができます. ls -F とオプションを付けるとファイルが実行ファイルなのかどうかを見ることができます.

例えば,ls -F での出力が以下のようになったとしましょう.

ls -F return2
 Library/ Movies/ Music/ a.out* test.c

ここで a.out というファイル名に * (アスタリスク) が付いていることに注意してください. これが, a.out というファイルが実行ファイルであることを示しています.

拡張子

ファイル名の末尾には,よくピリオドに続く 3, 4 文字のアルファベットがあります.これを拡張子といいます.たとえば index.html という名前のファイルでは,ピリオド以下の “.html” の部分をファイルの拡張子と呼びます.拡張子には慣習があり,たとえば今の “.html” という拡張子は普通 HTML 形式のファイルに付けます.したがって,このファイルは名前から HTML 形式 のファイルだと推測されます.このように拡張子を見ることでファイルの種類の見当を付けることができます.

以下に代表的な拡張子を挙げます.

  • 文書関係
    • .txt プレーンテキストファイル
    • .rtf 画像なども入れられるリッチテキストフォーマット文書ファイル
    • .html HTML言語で書かれたファイル
    • .tex TeXやLaTeXのファイル
    • .dvi DVIファイル (LaTeXのファイルのコンパイル時にできる)
    • .ps PostScript(PS)ファイル
    • .pdf PDFファイル
  • プログラム関係
    • .java Java言語で書かれたソースファイル
    • .class コンパイルされたJavaファイル
    • .c C言語で書かれたソースファイル
    • .cc C++言語で書かれたソースファイル
  • アプリケーション関係
    • .app Mac OS Xにおけるアプリケーション
    • .exe Microsoft Windowsにおけるアプリケーション
  • 画像関係
    • .gif GIF形式の画像ファイル
    • .jpg JPEG形式の画像ファイル
    • .png PNG形式の画像ファイル
  • 音楽関係
    • .aac AAC(Advanced Audio Codec)形式の音声ファイル
    • .mp3 MP3(MPEG Audio Layer 3)形式の音声ファイル
  • ファイル圧縮・アーカイブなど
    • .tar TAR形式のアーカイブファイル
    • .gz GZIP形式で圧縮されたファイル
    • .zip ZIP形式で圧縮されたアーカイブファイル

ここにあげられた拡張子の多くは,多くのオペレーティングシステムで共通に用いられるものです.

拡張子と関連付け

Mac OS X ではそれぞれの拡張子が,そのファイル形式を扱えるようなアプリケーションに関連づけられています. 例えば,txt の拡張子がついたファイルをダブルクリックすると,テキストエディットというエディタでそのファイルが開かれます.html という拡張子がついたファイルならば,初期設定では Safari で開かれます.ファイルのアイコンの絵は,どのアプリケーションに関連づけられているかを表しているのです. Windows においても,拡張子によってファイルのアイコンをダブルクリックしたときに,どのアプリケーションで開かれるかが決まります.

Mac OS X では,拡張子は隠すように設定することもできます.Finder 上でもファイル情報を見るから,拡張子を隠すか隠さないかを選ぶことができます. 教育用計算機システムのiMac端末における Mac OS X は,デフォルトの状態では拡張子を隠さないように設定されていますが,一般の Mac OS X では,デフォルトの状態で拡張子は隠されています.拡張子が隠されていても,代わりにアイコンの絵柄でファイルの種類が見分けられるようになっています.ターミナルで操作する場合は拡張子は隠されません.

ファイル形式によっては,そのファイルを取り扱えるアプリケーションが複数あることもあります.たとえば PDF 形式のファイルは Preview でも Adobe Reader でも開けます.Mac OS Xにおいて拡張子とアプリケーションの関連づけを変えるには,関連づけを変えたい拡張子を持つファイルのアイコンを右クリックします. 出てくるメニューから「情報を見る」を選択し,「このアプリケーションで開く」のところから,開きたいアプリケーションを選択します.さらに「すべてを変更」 のボタンを押すと,その拡張子を持つ全てのファイルが,選択されたアプリケーションで開かれることになります.