メールと文字コード - 前書き
先日、次のようなすばらしい書籍が刊行されました。
プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)
- 作者: 矢野啓介
- 出版社/メーカー: 技術評論社
- 発売日: 2010/02/18
- メディア: 単行本(ソフトカバー)
- 購入: 34人 クリック: 578回
- この商品を含むブログ (129件) を見る
軽く内容を眺めたところ、必要そうなことは網羅しており、良い入門書だと思います。
しかし、実際に開発を行っていくと、入門書の範囲ではカバーできない問題に出くわしてしまうことがあります。
ウェブ系の問題については情報はウェブ上に散見されますが、メールの情報についてはあまり情報がありません。
そのため、メールの文字コードの処理に関して私の経験*1をまとめてみようと思います。
本記事はメールの処理において文字コードをどのように扱うかをまとめてみます。特に日本語の処理を主題として扱います。
本記事では以下の条件を前提として説明を行います。基本的な用語についての解説は一切しません。先に紹介した本を是非とも読んでみてください。
書き始めてみると、原稿用紙100枚くらいのボリュームになりそうな状況で、仕事の合間に書くため、1ヶ月くらいかかりそうです。そのため、書き進めた都度、掲載する予定です。
また、時間に余裕が出来たら、文字の制限や画像の関係ではてなダイアリーでは表現できないことがあるため、別のサイトでまとめ直して、公開しようと思っています。
*1:Muttの国際化・日本語対応パッチの開発、SpamAssassinの日本語対応パッチの開発