Decoding Header

ヘッダのデコード

そもそも、メールのヘッダ部にエンコードの必要な文字、即ち、全角文字を用いること自体が避けるべきことである。しかしながら、標題に日本語が使えたほうが読み易いことは明らかであり、多くのメールソフトがこれをサポートしていることが現実であるため、ヘッダのデコード機能は、できれば実装しておきたいものである。

本文が変換（エンコード）されている場合、その状況はヘッダ部に記述されることになっている。ヘッダが変換（エンコード）されている場合は、この限りではなく、特殊な文字列による表現が採られる。つまり、特別な文字セットやエンコードが行われている部分に、印がつけられている。

たとえば、「こんにちは」という文字が、ＪＩＳ文字セット・ＢＡＳＥ６４エンコードされている場合、次のようになる。

=?ISO-2022-JP?B?GyRCJDMkcyRLJEEkTxsoSg==?=
=?	ISO-2022-JP	?	B	?	GyRCJDMkcyRLJEEkTxsoSg==	?=
1	2	3	4	5	6	7
Start	Character Set	Delim.	Encode	Delim.	Text	End

この例では、「GyRCJDMkcyRLJEEkTxsoSg==」は「こんにちは」がエンコーディングされたものである。ＪＩＳ文字は、やはり特殊なキャラクタがその始まりと終わりに付けられるため、多くの日本語部分は、「=?ISO-2022-JP?B?GyRC」で始まることになる。

Protocol	Name	RFC
MIME	MIME Part 3 ; Message Header Extensions for NON-ASCII Text	2047