22.3 データの圧縮

データの圧縮

マルチメディアデータを表現するために非常に多くの情報量を必要とするので, 場合によっては,データを圧縮してあつかった方がよい場合があります.特にネットワークを通して データをやりとりする際には,伝送時間を考えると,ファイルサイズがなるべく小さい方が有利です. 圧縮とは,特定の手順にもとづき,もとのデータの内容をなるべく失わずにファイルサイズを小さくするようにしたものです.

データ形式には,圧縮形式と非圧縮形式があります.非圧縮形式は,データを小さくしようということを 考えずに,そのまま素直に,元データを表現したものです.たとえば,画像データで考えれば, 画像の点,すなわちピクセルの情報を,ひとつひとつすなおにデータに置き換えて,情報を表したものに なります. しかし,たとえば,極端な例では,全部白い点で埋め尽くされているような画像では,すべての点のデータを 保持するよりも,すべて白い点だということだけ記録しておく方が,表現に必要なデータ量が少なくてすみます. 音や画像でも,データの中にある種のパターンが出てくるので,一般に圧縮することにより,データを小さく できるのです.

不可逆圧縮

圧縮形式のなかでも,可逆圧縮な形式と不可逆圧縮である形式があります.可逆圧縮というのは,もとのデータを完全に復元できるような圧縮の仕方です.すなわち,可逆圧縮では情報の損失はありません.一方,不可逆圧縮は,人間の目や耳になるべく気がつかない程度に情報を減らして圧縮する方法です.この場合は,多少の情報の損失がありますが,その分,よりデータのサイズを小さくすることができます.不可逆圧縮は,マルチメディアのデータの圧縮に有効です.たとえば,小説の文章を他人に送るのに圧縮して送って,伸張してみたらところどころ文字が変わっていたら話にならないわけです.しかし,音声や画像データなどだと,人間の目や耳に気がつかない程度に変わっていても問題がないことがあります.

たとえば,CDからMDに音楽をダビングすることを考えます.CDもMDもデジタルデータとして情報を 記録しています.そのデジタルデータの記憶容量としては,MDは,CDの1/5しかありません. CDのオーディオデータは圧縮形式ではないのに対し,MDのオーディオデータは,圧縮形式です. CDから,MDへのダビングでは,不可逆圧縮をすることにより,人間の耳では気がつかない程度に情報を削減し,データのサイズを大幅に減らしているのです. そのため人間の耳にはCDとほとんど変わらない音質でMDを楽しむことができるのです.