そもそも、メールのヘッダ部にエンコードの必要な文字、即ち、全角文字を用いること自体が避けるべきことである。しかしながら、標題に日本語が使えたほうが読み易いことは明らかであり、多くのメールソフトがこれをサポートしていることが現実であるため、ヘッダのデコード機能は、できれば実装しておきたいものである。
本文が変換(エンコード)されている場合、その状況はヘッダ部に記述されることになっている。ヘッダが変換(エンコード)されている場合は、この限りではなく、特殊な文字列による表現が採られる。つまり、特別な文字セットやエンコードが行われている部分に、印がつけられている。
たとえば、「こんにちは」という文字が、JIS文字セット・BASE64エンコードされている場合、次のようになる。
=?ISO-2022-JP?B?GyRCJDMkcyRLJEEkTxsoSg==?= | ||||||
=? | ISO-2022-JP | ? | B | ? | GyRCJDMkcyRLJEEkTxsoSg== | ?= |
1 | 2 | 3 | 4 | 5 | 6 | 7 |
Start | Character Set | Delim. | Encode | Delim. | Text | End |
この例では、「GyRCJDMkcyRLJEEkTxsoSg==」は「こんにちは」がエンコーディングされたものである。JIS文字は、やはり特殊なキャラクタがその始まりと終わりに付けられるため、多くの日本語部分は、「=?ISO-2022-JP?B?GyRC」で始まることになる。
Protocol | Name | RFC |
---|---|---|
MIME | MIME Part 3 ; Message Header Extensions for NON-ASCII Text | 2047 |