技術系サラリーマン勉強記

数学、物理、プログラミングなど日々勉強した内容を取り扱っていきます。

文字コードの勉強

簡単なメモを残します。

概要

コンピュータで文字を処理するには、文字を何らかの数値にする必要があります。この文字から数値にすることを文字の符号化といいます。

文字を符号化する上で重要な点が、文字と数値が一対一に対応することです。一対一に対応しないと正しく情報伝達ができなくなるでしょう。この文字と数値の対応関係のことを文字コードといいます。

文字と数値をどのように対応するか考えると、大きく二つのことを検討する必要がでてきます。

一つ目がどのような文字を扱うかです。これは文字集合と呼びます。英語圏の人は、アルファベット、数字と記号を扱えばよいかもしれませんが、日本人の場合はこれに加えひらがな、カタカナ、漢字を扱う必要がでてきます。このように文字集合の範囲をどうするかという問題は大きそうです。

二つ目がどのように文字に数値を割り振るかです。文字符号化方式といいます。同じ文字集合でも文字に数値を割り振る方法は多くあると考えられるでしょう。

このように文字と数値の対応関係である文字コードはなんだかいっぱいありそうだということが分かると思います。実際にASCII、Latin-1、Sshift-JIS、Unicodeなど多くの文字コードが世の中にあります。