メールと文字コード - 前書き

先日、次のようなすばらしい書籍が刊行されました。

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

軽く内容を眺めたところ、必要そうなことは網羅しており、良い入門書だと思います。
しかし、実際に開発を行っていくと、入門書の範囲ではカバーできない問題に出くわしてしまうことがあります。
ウェブ系の問題については情報はウェブ上に散見されますが、メールの情報についてはあまり情報がありません。
そのため、メールの文字コードの処理に関して私の経験*1をまとめてみようと思います。


本記事はメールの処理において文字コードをどのように扱うかをまとめてみます。特に日本語の処理を主題として扱います。

本記事では以下の条件を前提として説明を行います。基本的な用語についての解説は一切しません。先に紹介した本を是非とも読んでみてください。

  • 文字コードに関する基礎知識があること。
  • MIMEについて理解していること。

書き始めてみると、原稿用紙100枚くらいのボリュームになりそうな状況で、仕事の合間に書くため、1ヶ月くらいかかりそうです。そのため、書き進めた都度、掲載する予定です。
また、時間に余裕が出来たら、文字の制限や画像の関係ではてなダイアリーでは表現できないことがあるため、別のサイトでまとめ直して、公開しようと思っています。

*1:Muttの国際化・日本語対応パッチの開発、SpamAssassinの日本語対応パッチの開発