Mac Clinic Tips:

英語以外の電子メールを送るしくみ

97年6月14日

Qusetion
Q1:
アメリカにいる友達とインターネットの電子メールでやり取りしたいのですが、こちらから日本語で送ったものが文字化けして読めないそうです。向こうから日本語で送られてきたものは読めます。
Q2:
私はこれから海外出張にPowerBookを持っていって電子メールを使おうと思うのですが、日本語のメールのやり取りもできるでしょうか。
Q3:
私は現在中国語を勉強しています。中国にいる友人と電子メールで文通をしたいのですが、Eudora-Jでは中国語そのものを受け付けてくれません。どうしたら中国語で電子メールができるのでしょうか。

Answer
日本に住んでいると何でも日本語で用が足りてしまうので、インターネットでも日本語が使えることが当たり前だと思っていませんか?
本当はこれは大変なことなのですね。

コンピュータはもともとアメリカで開発され発達してきたものなので、英語を基本に全てのシステムが考え出されてきました。英語のアルファベットはわずか26文字しかなく、大文字、小文字、数字、それからカッコや%等の記号を合わせても7ビット(2の7乗で128文字)あれば十分でした。この文字の組み合わせをASCIIコードと言います。(図1:ASCIIコード表)


インターネットのように一般の電話回線も使ってデータの搬送を行う場合、データの信号はシンプルであればあるほどいいわけです。その意味でも7ビットの文字はぴったりです。さらに通信ではデータが正確に伝わったことを確かめるために、チェックのための信号をつけて送ることがあります。通常コンピュータのデータの最小単位は1バイトで、これは8ビットですから、7ビットの文字を使えば1ビットをチェック用の信号として与えることができます。このような背景から、インターネットの電子メールでは7ビットのASCII文字だけを使うというルールができました。

しかし、7ビットで表現できる言語は非常に限られています。フランス語などアルファベットは同じですが、色々な発音記号が組み合わされます。ロシア語やギリシャ語は全く独自のアルファベットを使用します。コンピュータの世界ではASCII文字は絶対に必要ですから、これに各国独自に文字を加えて、8ビットの文字セットが作られました。8ビットならば全部で256文字扱えます。欧州のほとんどの言葉、ロシア語、ギリシャ語、ヘブライ語、アラビア語も8ビットの文字です。日本語にも半角カタカナというのがありますが、これも8ビットでどうにか日本語が表示できるように考え出されたものです。これらをまとめて1バイト言語といいます。
一方、日本語、中国語、韓国語のように字数が多い言語では1バイトでは文字が処理できないので、2バイトを使います。2バイトならば理論的には最大6万5千字を扱うことができます。2バイトの表現の仕方にも7ビットと8ビットがあり、日本語のJISコードは7ビット、シフトJISコードは8ビットです。中国語、韓国語も8ビット2バイト文字です。
いずれにしても各国語は非常に複雑な文字体系をとっており、英語以外の文字を電子メールで送るのはそう簡単ではないのです。

一般に電子メールで文字を送る場合、それが7ビットのASCIIならばそのまま、8ビットの欧州文字や、2バイト文字の場合は7ビットのASSCIIコードに変換されてから送信されます。受信者は再びそれを自国語の文字コードに再変換して読むわけです。
通常この作業はメーラー(電子メールソフト)が行いますが、システムによってはサーバーが行う場合もあります。
それぞれのパソコンで使っている文字体系は必ずしも国際標準のものではありません。たとえば、マックで使われている日本語はシフトJISコードを採用しています。これは8ビットでインターネットには向きませんので、いったん7ビットのJISコード(ISO-2022-JP)に変換する必要があります。さらにこれを7ビットASCIIコードに変換するわけです。Eudoraのヘッダをよく見ると、「charset=ISO-2022-JP」、「Content-Transfer-Encoding: 7bit」という表示がありますが、その変換を表しているわけです。(図2:Eudoraのヘッダ)



これは欧州文でも同じで、マックではMacRomanという独自の文字コードが使われています。英語以外の文字を使う場合は、このコードは一旦ISO規格の8ビットコードに変換され、さらに7ビットASCIIに変換される必要があります。(図3:電子メールの情報の流れの絵)




日本で日本人同士で電子メールのやり取りをする場合、全ての環境が日本語に対応しているので、文字の問題をほとんど気にする必要はないのですが、半角カナが使えないとか、ヘッダに日本語を使うと文字化けすることがある不自由は感じているでしょう。これが海外とやりとりするとなると色々問題が出てくるのですね。

海外で日本語でメールのやり取りをする

最近は海外にいる日本人の友達とメールのやり取りをしたり、自分自身が留学や仕事で滞在し日本と交信する機会が増えてきました。日本語を使えるパソコンを持っていても必ずしも簡単に日本語の電子メールが使えるわけではないので注意が必要です。
電子メールといってもアメリカのようにパソコン通信が発達しているところではパソコン通信を使う場合もあるかもしえません。しかし、たとえばCompuServeでは8ビット文字は認識しませんので日本語のメールは全て文字化けしてしまいます。日本とやり取りをするにはインターネットを使うほうが簡単です。
まず日本語が表使えるメーラーを用意します。Eudora Pro日本語版やClaris Mail日本語版のような市販ソフトは日本で購入しなければなりませんが、Eudora-JやEudora Lite+Kanji Plug-Inならばインターネットからダウンロードできます。これらのメーラーには日本語の2バイト文字を7ビットASCIIコードに変換する機能がついています。
普通ならばこれで日本と日本語でやり取りができるはずなのですが、海外のサーバーの中には日本語を拒否するものがあります。日本語は電子メールで送信されるときは、7ビットのアASCIIコードに変換されていますが、再び2バイトの文字に戻すために日本語の部分には特別な記号がつけられています。これをサーバーによっては不正な文字としてチェックするわけです。(図4:文字をチェックするサーバーの絵)



日本語の使用などを想定していない海外の大学や、海外の企業内のネットワークを通じてインターネットを利用する場合は問題になることがあります。この場合は、サーバーの管理者に連絡して、日本語が通る設定に変更してもらうことが考えられます。それが出来ない場合は、大手の商用プロバイダーに契約すれば基本的に日本語は使えるはずです。
海外から日本のプロバイダに接続して電子メールをやり取りする場合は、全く問題はありません。

別の方法としては、次に述べるように、電子メールの本文は英語とし、日本語はSimple Text等で作成したものを添付書類として送る方法があります。この場合はテキスト形式ではなく、Stuffit等で圧縮をしてバイナリデータにするのが最も簡単です。

中国語で電子メールする

中国語の場合は、日本と同じように2バイト文字を使いますが、中国と台湾で異なる文字コードを制定しています。中国のものはGBという8ビット2バイトのコード体系で、これはISO-2022-CHという7ビットのコードに変換することができます。しかし台湾のBig5という8ビット2バイトの文字コードを7ビットに変換する規格がありません。ですから、そもそも中国語(特に繁体字)で国際的に電子メールのやり取りをするのはまだ難しい状況にあります。
簡体字の方はまだ可能性があるのですが、日本語のメーラーでは中国語を7ビットのISO-2022-CHコードに変換する機能はついていません。Eudora-Jを使おうとしても、入力すら受け付けてくれません。Eudora-Cという中国語が使えるメーラーがあるようですが、どこで入手できるのが分かりません。またよしんば、メーラーが整ったとしても、サーバーの問題が残ります。日本のサーバーでは、2バイトの文字は全て日本語であることを前提にしているものがあります。反対に中国や台湾のサーバーは中国を扱うことを前提にしているかもしれません。この場合は、文字は通るのですが、全て文字化けしてしまいます。

従って、中国語でメールのやりとりをするのにいちばん確実な方法は、本文を自分でASCII文字だけのテキストに変換することです。この方法は、世界のどんな言葉とやり取りするときにも使えます。
7ビットのASCII文字だけで書かれた文書ならば、相手のパソコン環境やネットワーク環境を気にする必要もありません。受け取った人はそれを元の文字コードに戻すだけでよいのです。
中国語の場合は、まず適当なワープロで中国語の手紙を書きます。文字コードはGBかBig5のどちらか一方にし、異なるコードを混在させてはいけません。相手がマックの場合はStuffitで圧縮したものを添付書類で送るだけでよいのですが、相手が何のパソコンを使っているか分からないときはBase64かuuencode形式でテキストにエンコードさせます。電子メールではBase64の方が一般的になりつつありますが、まだインターネットのアプリケーションが未発達の地域では、Unixの基本エンコード方式であるuuencodeの方が一般的な場合も少なくありません。これは相手の事情に応じて選択してください。Eudora Proのように添付書類としてAppleDouble(Base64)やuuencode形式が選べる場合は、そのまま添付書類として送りますが、Eudoraのようにその機能がない場合は、Mpack(Base64)かUULiteなどのフリーウェアで一旦変換したものをメールの本文の中にペーストして送れば確実です。(図5:UULiteのアイコンの絵)


電子メールで色々な言語を使うことがそう簡単ではないことが少しは理解できたでしょうか。

(C)Harry Ono 1997.6.14.
Mac Fan Internet 97年7月号掲載