Mac Clinic Tips:

日本語や英語以外のホームページを見る方法

How to read home pages in foreign languages

作成:1997年5月11日

WWWはインターネット最大の発明といってよいでしょう。テキスト、画像、動画、サウンドとあらゆる種類の情報を得ることが出来ます。しかし一番大きな課題は各国の文字の表示です。どうしたら、英語や日本語以外の文字もホームページで読むことが出きるようになるのか、調べてみました。

●1.はじめに
●2.「文字セット」と「文字コード」
●3.文字セットの構成
●4.文字セットとフォント
●5.各国語のホームページの表示方法
 [欧米語(ラテン語1)]
 [中欧語]
 [キリル文字]
 [ギリシャ文字]
 [ヘブライ文字]
 [タイ語]
 [韓国語]
 [中国語]

(図版はメモリの関係で対応していません)
1.はじめに
インターネットのすさまじい発達により我々は居ながらにして、世界中の最新情報を得ることができるようになった。インターネットがなければ得ることが非常に難しかった小さな国の情報も入手することが可能になった。
現在海外には何10万というホームページが公開されているが、その90%以上は英語で書かれている。これは世界の共通言語が英語であるためだけでなく、インターネットの基本精神である「情報の等しい共有」の観点からはやはり英語で表示するのが最も多くの人に活用されるからだ。そしてそこにはもう一つ、英語以外の言語はコンピュータの処理が難しく、特にインターネットのように異なるハード、ソフトか混在して使われる環境では英語が一番安全という理由もある。
その意味でも日本の環境というのは特殊で、日本のホームページの90%以上は日本語で発信されている。これは日本の市場が大きいということもあるが、それ以上にコンピュータやインターネットにおける日本語処理環境が整っているからだといえよう。世界中には自国語で発信したくてもそれが出来ない国の方が多いのだ。

しかし、最近では少しづつ、自国語でのホームページも増えてきた。
ビジネスで特定の国を相手にしている人は自国語のホームページからより生の情報を得ることが出来るし、外国語を勉強している人は生の言葉に触れることが出来る。少しでも外国に興味のある人なら、自国語で書かれたホームページを見ると、それが読めなくてもその国を感じることが出来るはずだ。外国語が聞こえるとその国に居る気分になるように、ホームページで世界旅行の気分を味わうことも可能だ。
それでなくても、外国のホームページを見て文字化けがあるのは嫌な気分なものだ。

Netscape Navigator(以下ネットスケープ)を長く使ってきたユーザーならば、バージョン2.0以降、オプションメニューに「文書の文字コードセット」(Document Encoding...)というメニューが加わったのに気がついただろう。ネットスケープは英語版でも日本語版でも同じように日本語を含めた各国語表示ができる(かっこ内は英語版名称)。(図1:ネットスケープ3.0の文字コードセットメニュー)
一般のユーザーはマニュアルどおりにここは「日本語(自動判定)」(Japanese(Auto Detect))を選択しているはずだ。これだけで、日本語と英語のページが問題なく表示される。
このメニューには一番上から、欧米(Western)、日本語(Japanese)、中欧(Central Europe)、中国語(Chinese)、簡体字中国語(Simplified Chinese)、韓国語(Korean)、キリル文字(Cyrillic)、ギリシャ語(Greek)、トルコ語(Turkish)、ユーザー定義(User Defied)となっている。通常の漢字トークの状態で、このメニューの中国語を選択しても中国語のホームページはよめない。どうすれば、各国語のホームページを読むことができるようになるか、今回はネットスケープに的を絞って解説しよう。電子メールやニュースグループは文字の取り扱いのルールがWWWとは異なるため、必ずしも同じ方法で読めるようになるわけではない。

2.「文字セット」と「文字コード」

前述のネットスケープのオプションメニューは、日本語版では「文書の文字コードセット」となっているが、オリジナルの英語版は"Document Encoding..."だ。これは直訳すると「文書のコード化」である。これは日本語訳の方が分かりやすい。「文字コードセット」というのは正式な名称ではなく、「文字セット」と「文字コード」という二つの概念を一緒にしたものだ。

世界中には何百という言葉があるが、独自の文字を持った言語というのは少なく、大半は近隣で発明された文字を借用している。最も世界で使われているのがラテン文字(日本ではローマ字ともいう)で、欧米だけでなく、アフリカやアジアの一部でも使われている。英語の26文字だけではそれぞれの言語の発音をうまく表現できないので、英語のアルファベットに発音記号をつけたり、独自の文字を作り出したりしている。フランス語の獅竝、ドイツ語の氓筴などは馴染みがあるだろう。アラビア文字はアジア、アフリカの回教国で広く使用され、キリル文字(ロシア文字)は旧共産圏で、漢字は中国内(満州語でも蒙古語でも)や日本、韓国で使われている。それ以外に一か国で使われている独自の文字としてはひらがな/カタカナ、ハングル、、タイ文字、ギリシャ文字、ヘブライ文字などがある。

コンピュータで日常の言語が扱えるようにするには、入力→内部処理→文書保存→出力(画面表示、印刷)の過程で統一がとれた規則が必要である。まずどれだけの種類の文字を扱うかを決めなければならない。これを「文字セット」(文字集合)という。アルファベットにフランス語やドイツ語の特殊文字も入れたセットにするかとか、日本語の場合であればどこまでの漢字を入れるかを決める。昔のコンピューターは入力や出力に英文タイプライターを使っていたこともあり、またコンピューター技術の基本がアメリカで開発されたこともあり、英文タイプライターで使われている文字が選択された。大小のアルファベット、数字、記号、タイプライターを制御するのに必要なキー(シフトやリターン等)を合わせたものがまずASCIIセットとして決められた。
次に「文字コード」だが、コンピュータ内では全ての情報は数値で処理されるので、文字も"A"としてではなく"何番目の文字"という情報で処理される。この番地(コード)の与え方にもいろいろな工夫がなされている。
実際には「文字コード」と「文字セット」は厳密な区分なく使われているが、ここではコード化された各国語の文字の集合をまとめて「文字コードセット」と呼ぶ。

昔のコンピュータはIBMのメインフレームとIBMの端末というように一つのOSで使われるのが普通であった。パソコンになっても初めは単独で使われることを想定して作られていた。従って、そこで英語や日本語等の言語を扱う場合も、そのシステム内で統一が取れていれば問題なかった。文字セットや文字コードも各社独自のものが沢山生まれた。Macは早くから各国語対応を進めてきたので、文字コードも独自に開発されたものが沢山ある。
しかし、コンピュータのネットワークでの利用が増えてくると、異なるプラットフォーム(ハード・ソフトの違い)でも統一された文字システムが必要になってきた。そのために各国はそれぞれコンピュータ用の文字規格(文字種類とコードの標準化)を作るようになった。
更にインターネットの発達により、ネットワークが地球規模になると、国際的な文字規格の制定が必要になってきた。
現在、ユニコードと言って世界中のあらゆる文字を一つの文字セットとする検討がなされている。これが成功すれば、パソコンで文字コードを気にすることなく世界中の言葉を表示できるようになるだろう。

しかし、残念ながら、現在はまだ、システムの種類や国によってばらばらの文字セットが使われているのが現状である。作成された文章の文字セットが分からなければ、それを正しく表示することは出来ない。しかしこの文字セットの仕組みを理解し、適当な文字セットを用意すれば、ネットスケープでさまざまな言語を表示することも可能になるのである。

3.文字セットの構成

先ほども述べたように、世界中の文字セットには、ISO(国際標準化機構)のように国際レベルで標準化がなされているものや、ASCIIやJISのように国レベルで標準化がされているものもあれば、NEC-JISのようにそれぞれのコンピューターメーカーが作ったものがある。これらの詳しい説明は誌面の余裕がないので出来ないが、基本的な文字セットの考え方を整理してみよう。

7ビット1バイト文字セット
英語はアルファベットに数字や記号を加えてもわずか数10字の組み合わせなので、7ビットあれば表現できる。7ビットでは128文字の情報が処理できる。コンピュータの場合は印刷可能な文字以外に、コンピュータや周辺機器の制御のための文字も必要なので、これらを加えて一つの文字セットを構成する。この文字セットの代表はASCII(米国情報交換用標準コード)で、94の印刷可能な文字(大小のアルファベット、数字、%や?等の記号)と34の空白・制御文字で構成される(図2:ASCIIコード表)。フランス語、ドイツ語、ロシア語、タイ語、ヘブライ語なども7ビットで表現することができる。

8ビット1バイト文字セット
欧州語のほとんどは7ビットで表記することができるが、その場合は、英語セットの中のいくつかの記号を犠牲にしなければならない。しかしコンピュータの内部処理の共通言語は英語(ASCII)であるので、ASCIでない7ビット文字をコンピュータで使うには問題が発生する。そこで、ビットを一つ増やし8ビットとすれば、処理できる文字数は2倍の256文字となり、ASCII部分をそのまま残しても、さらに128文字を扱うことができるようになる。図(図3:8ビット文字のコード体系)に示すように文字セットを右半分と左半分に分け、左半分(0から127まで)にはASCII文字セットをそのまま入れ、右半分(128から255まで)には各国語をいれる。しかしこの場合も、右半分が単独で使われる場合を想定し、ASCIIの制御記号はそのまま残す。そのため実際に使えるのは94文字である。こうすれば英語のアルファベットもそのまま表示できるし、各国の特有の文字も表示できる。
パソコン単独でワープロを使う場合は、文字セットを切り替えることで一つの文書に中でいろいろな文字を表示することは可能であるが、インターネットのホームページの場合は一つのページで一つの文字セットしか使えないので、英語と各国語が混在したようなものを7ビットではうまく表示できない。

この文字セットとしてはISO-8859で規定されたものが10セットあり、この中でISO-8859-1(ラテン1=西欧語)や、ISO-8859-2(ラテン2=中欧語)、ISO-8859-5(キリル文字)がネットスケープでも読めるようになっている。 日本語にもこのタイプの文字セットがあり、JIS X 0201という半角カナ文字セットがそれだ。これはコンピュータ初期の頃に、どうにかして日本語を使えるようにしようとしたものであった。

2バイト文字セット
1バイトでは漢字のように種類が何千にも及ぶ文字を取り扱うことは出来ない。そこで考え出されたのが2バイトを使う方式だ。一般には全角文字という方が馴染みやすいだろう。2バイトでは理論的には最大16ビット、すなわち65,536文字を扱うことができる。
しかし現実には、インターネットへの対応を容易にするため、7ビット1バイト文字の印刷可能な文字94文字の2バイト化、すなわち94x94=8,934文字が使われる。2バイト文字は日本語処理のために開発されたもので、ISOではなくJISで基準化されている。日本語の場合、文字セット(含まれる漢字や記号の種類と並び方)は同一で、コード(呼び出し番号)が異なるJISコード、シフトJISコード、EUCコードの3つが存在する。この中には7ビット1バイトのASCIIと8ビット1バイトの半角カナも含まれるため、この文字セットを選択すると、英語のホームページもそのまま半角アルファベットで表示される。
またこのJIS文字セットをベースに、中国ではGB-8565、韓国ではKS C5601という国家規格で文字セットを規定している。台湾は全く独自のBig5という2バイト文字セットを使用している。

4バイト文字セット
これは先に述べた世界中の文字を一つの文字セットの中に入れてしまおうという試みで作られているものである。128グループx256行x256列=838万文字を扱うことが可能になる。これはパソコンが32ビット対応になることで可能になるもので、早期の実現を望みたいが、まだ実用化までには時間がかかりそうだ。

4.文字セットとフォント

Macのユーザーならば文字を表示するにはフォントが必要なことは知っているはずだ。英語であればTimesやHelvetica、日本語であればOsakaや細明朝体といった具合だ。しかしその中味がどうなっているかはあまり知らないはずだ。
文字セットの所で述べたように、それぞれの言語を正しく表示するには、そのページが書かれているのと同じ文字セットで構成されたフォントを入手し、システムフォルダ内にインストールする必要がある。さらにネットスケープのオプションメニューの「一般設定」の「フォント」ダイアログで、フォントを指定しなければならない。
インターネットの場合、英語の表示が中心なので、英語と各国語が同時に表示できる文字セット、すなわち8ビットの文字セットのフォントが必要である。7ビットの文字セットのフォントでは、英語の部分までもすべて変換されてしまう。

Macの標準フォントであるTimesやHelveticaは、どの文字セットで構成されているのだろうか?
答えはMacRomanという文字セットである。これはApple独自の8ビットの文字セットで、ISO-8859-1(ラテン1)文字セットを基本に中欧文字も入れたものである。つまり英語だけでなく、ドイツ語やフランス語も表示できるフォントを持っているということだ。ラテン1に属する言語の場合は新たなフォントをインストールする必要はない。
日本語の場合はどうだろう。日本語文字セット2バイトだが、7ビット1バイト文字と8ビット1バイト文字も同時に含んでいるので、英語もそのまま正しく表示できる。ネットスケープの設定で、ほとんどのユーザーがフォントの設定ではOsakaとOsaka-等幅を、文字セットでは「日本語(自動判定)」を選択していると思うが、これで英語のページも切り替えずに表示できるのはそういうわけだ。
しかし、日本語文字セットにはフランス語やドイツ語の特殊文字は含まれていないので、「日本語(自動判定)」を選択したままフランス語やドイツ語のホームページを表示すると一部に文字化けが発生する。この場合は、「欧米(ラテン1)」を選択すればOKだ。(図4:文字化けのないスペイン語のページ)

ラテン1以外の言語を表示する場合はそれぞれに必要な8ビットの文字セットを持ったフォントを入手しなければならない。7ビットと8ビットを見分けるにはどうしたらいいだろうか。一つ簡便な方法として、そのフォントのファイルをダブルクリックしてみる方法がある。するとそのフォントのサンプルが表示されるが、8ビットであれば英語の文字で"How razarback-jumping frogs can level six piqued."が表示され、7ビットであればこれが各国語に変形して表示されるので見分けることができる。

マイナーな言語の場合は、それぞれのホームページがどの文字セットで作られたかは分からないので、いくつかの文字セットのフォントを入手してインストールしておき、ネットスケープのフォント設定と文字セットをいろいろと変えてみるとうまく表示される場合がある。

次に具体的に各国語のホームページを見る方法を説明しよう。

5.各国語のホームページの表示方法

Macは古くから各国語対応を積極的に進めており、OSを切り替えることなく、多言語を同時に処理できる能力を持っている。これはMacの大きな特徴だ。現在AppleからはJapanese Language Kit(日本語)、 Chinise Language Kit(中国語)、 Korean Language Kit(韓国語)、 Arabic Language Kit(アラビア語)、Indian Language Kit(ヒンドゥ語)、 Hebrew Language Kit(ヘブライ語)、Cyrillic Language Kit(ロシア語)が販売されており、これを英語のOSや日本語のOSにインストールするだけで、それぞれの言語の入力や出力が可能になる。このキットの中には、多言語表示を可能にする機能拡張、World Script I(1バイト文字用)とWorld Script II(2バイト文字用)と、フォント、入力メソッド、スクリプトエンジン、キーボード配置が含まれている。
これらの言葉を頻繁に使う場合は、そのキットを購入されることをお奨めするが、インターネットでホームページを見るためだけであればキットがなくても可能な場合がある。
これ以外の言葉の場合は、基本的に英語システムなり、漢字トークのままで表示は可能と考えてよい。
ブラウザーとしてはネットスケープの3.0以降を使うことを前提に説明する。

[欧米語(ラテン語1)]
ラテン語1(正式にはISO-8859-1文字セットという)とは西欧の主要言語の文字を集めたグループである。この中には、英語、フランス語、ドイツ語、イタリア語、スペイン語、ポルトガル語、オランダ語、デンマーク語、ノルウェー語、スウェーデン語、フィンランド語を含む。
Appleの標準フォント、TimesやHelvetica等はこの文字セットを持っているため、これらの言語のホームページは何ら新たなソフトを加えなくても表示が可能である。
フォント設定で「欧米語」を選択しTimes等(比例)とCourier等(等幅)を指定する。文字コードでを選択すれば、どの言葉も文字化けなく表示される。文字コードで日本語を選択している場合、英語は問題なく表示されるが、一部文字化け("がノとなる)が気になる場合は欧米(ラテン1)を選択すればよい。

[中欧語]
ネットスケープの文字コードセットに中欧語というのがあるが、これにはチェコ語、ハンガリー語、ポーランド語、ルーマニア語、クロアチア語、スロベニア語が含まれる。ISO-8859-2(ラテン2)で規定される8ビット文字でローマ字を基本に発音記号を付加したものである。
これらのフォントはオレゴン大学のYamada Language Center(http://babel.uoregon.edu/yamada/guide.html)から容易に入手できる。全て8ビットであるので、そのままフォントフォルダに入れるだけでよい。
例えば、チェコ語の場合は、Greg's Czechというフォントを入手する。フォント設定には中欧というのがないので、「ユーザー定義」を選択し、比例、等幅ともにGreg's Czechを指定する。文字コードセットで「中欧(ISO)」を選択すればチェコ語のページもうまく表示できる(図6:サンプル画像)。

[ロシア語]
日本ではロシア文字というが、ロシア以外でもブルガリア、ウクライナ、白ロシア、セルビア、モンゴルでも使われているので、正式にはキリル文字というのが正しい。文字コードセットとしてはISO-8859-5で規定されたものと、ロシアの国内規格KOI8-R、さらにAppleの独自のコードがある。ロシア国内のホームページでは一般にはKOI8-Rが使われている。
ホームページを読むだけであれば、Cyrillic Language Kitを購入しなくても、適当なフォントを入手するだけでキリル文字の表示は可能である。
キリル文字のMac用フォントは同じくオレゴン大学Yamada Language Centerから入手できる。ここには7ビットのものと8ビットのものがあるが、下記のフォントをダウンロードし、システムフォルダにインストールしよう。
・KOI8コード:ER Bukinist KOI8、ER Kurier KOI8
・Macコード:ER Bukinist Macintosh、ER Kurier Macintosh
ネットスケープのフォントの設定でキリル文字(KOI)としてER Bukinist KOI8とER Kurier KOI8(等幅)を、キリル文字(Mac)としてER Bukinist Macintosh(比例)とER Kurier Macintosh(等幅)を指定する。そして、キリル文字のホームページに出会ったら、文字コードセットで「キリル文字(Mac)」を選択する。ロシアの場合は全て「キリル文字(KOI8-R)」でOKだ。(図7:サンプル画像)

[ギリシャ語]

ギリシャ文字は数学などで他の国でも日常的に使われており、日本語の文字セットにも入っている。日本語セットのものは2バイトの全角文字であるが、ギリシャ文字は英語のアルファベットとほぼ1対1で対応しており、1バイトで表わせる。
文字セットとしては、8ビットコードのISOー8859-7とギリシャ国家基準のELOTがある。ELOTには7ビットのELOT823と8ビットのELOT928がある。Yamada Language Centerで配付されているMac用ギリシャ語フォントは7ビットであるため英語とギリシャ語が混在しているホームページではうまく機能しない。またギリシャのホームページの99%はELOT823コードで書かれている。現在のところMac用のELOT823フォントは入手できないため、ISOフォントを入手することになる。
次のアーカイブ(ftp://ftp.hri.org/pub/greek/fonts/mac/)から、GrTimesとGrCourierの2つのフォントを入手できる。
ネットスケープのフォント設定で「ギリシャ語」を選択し可変フォントにGrTimes(9ポイント)を等幅フォントにGrCourier(9ポイント)を指定し、「文字コードセット」として「ギリシャ語(ISO)」を選択すれば、ギリシャ語のホームページが読めるようになる。(図8:サンプル画像)

[ヘブライ語]

ヘブライ語といっても馴染みがないかも知れないが、イスラエルの言葉だ。文字も特殊なものが使われており、アラビア語と同様に右から左に書く。旧約聖書はヘブライ語で書かれており、重要な言葉だ。ただインターネットでは、ほとんどのイスラエル人が英語が使えることもあり、ヘブライ語のページは多くはない。
ヘブライ文字は27文字で構成され他の欧州語と同じように7ビットでも8ビットでも表現できる。7ビットのものは英語が混在するホームページでは使えないので、ISO+8859-8で規定された8ビットの文字セットを使う。
Yamada Language Centerには沢山のヘブライ語フォントが登録されているがすべて7ビットのため使えない。次のアーカイブ(ftp://ftp.nilenet.com/pub/users/gweisz/macfont.sea.hqx)からNew York with Hebrew Blockというフォントを入手しシステムフォルダにインストールする。
ネットスケープのフォント設定で「欧米」を選択し、可変フォントにNew York with Hebrew Block(12ポイント)、等幅フォントにもNew York with Hebrew Block(9ポイント)を設定し、「文字コードセット」で「欧米(MacRoman)」を選べば、英語が混在したヘブライ語のページもばっちり読める。(図9:サンプル画像)


[タイ語]

いよいよアジア語だ。最近は東南アジアでもインターネットが普及しつつあるが、残念ながらまだ学術利用が多く、ほとんどが英語表示だ。自国の言語で生のニュースを伝えたホームページはほとんど存在しない。タイの場合もタイ語のページはまだ少ないがそのうち増えてくるだろう。
タイ文字は1バイト文字であり、フォントさえ入手できればネットスケープでタイ語が表示できる。機能拡張ふぉいるとしてWorld Script Iが入っていることを確かめよう。
Thai Macintosh Resourceのページ(http://www.fedu.uec.ac.jp/ThaiMac/ThaiUpdate)からMacOS Thai Enable2.0またはThai Font Installerを入手し、Ayudhayaフォントをシステムフォルダにインストールするだけだ。
ネットスケープのフォント設定で「ユーザー定義」を選択し、可変フォント、等幅フォントともにAyudhayaを指定する。そして「文字コードセット」で「ユーザー定義」を選択すれば、タイ文字の表示が可能になる。(図10:サンプル画像)

[韓国語]

韓国ではハングルという文字が使われているが、これは基本的に母音と子音を表す記号の組み合わせで構成されているため1バイトでも表示は可能である。事実1バイトのハングル文字セットも存在する。しかし現実にはハングルには5,000以上の組み合わせがあり、さらに一部では漢字もまだ使われているため2バイトの韓国語文字セットが規格化されている。いくつかの異なる規格があるが、ネットスケープを含め、最も一般的なものはKSC5601規格のセットである。これには2,350の合成ハングル、4,888字の漢字、それにひらがな、カタカナ、キリル文字等を加えた8,224文字の文字セットである。

2バイト文字を表示するには1バイト文字と2バイト文字を識別するためのコードを解析できる機能がアプリケーションソフトに含まれていなければならない。ネットスケープには文字セットとして「韓国語」があり、これはKSC5601の文字セットを解析できる。従って、適当なフォントを入手すればホームページの表示は可能になるはずだが、私が試した結果ではうまくいかなかった。
やはりオンラインでハングルのホームページを見るためには、Korean Language Kit(KLK)を漢字トークにインストールするのが最も手っ取り早いようだ。
ネットスケープのフォント設定で「韓国語」を選択し、適当なハングルフォントを指定した後、文字コードセットで「韓国語」を選択すればハングルが表示される。

KLKを買うほどではないがどうしても韓国語のホームページの内容を知りたい場合はどうするか。(図11:日本語モードのハングルのページ) ちょっと面倒だが、オフラインでエディターで読む方法を紹介しよう。まず、ネットスケープの画面から読みたいページを「別名で保存...」で保存する。このとき、「テキスト」形式で保存すると文字コードが変換されてしまうので、必ず「ソース」形式で保存するのがこつだ。エディターとしては趙小麟氏作のUnicorn Editor(ftp://ftp.fedu.uec.ac.jp/pub/china/software/IFCSS/mac/editor)(図12)とハングルのフォントとしてUnicornKoreanPluginを入手し、Unicorn Editorでファイルを開き、フォントメニューから一番上のハングル文字を選択すればハングル文が現れる。HTMLのタグが邪魔だが、情報は取れるだろう。(図13:サンプル画像)

[中国語]

漢字は何万もの種類があるため当然2バイト文字である。
いわゆる中国では国家基準により漢字に記号やひらがな、カタカナ、キリル文字等を加えて中国語文字セットを制定している。最も一般的なものはGB2312規格でこれは6,763字の漢字を含む7,445字のセットである。現在の中国では公式には簡体字が使われているが、市場では伝統字体(繁体字)も使われており、このために漢字の部分だけを置き換えたGB/T2312の文字セットが用意されている。一般にはGBイコール簡体字と考えられており、Chinese Language KitでもGBコードのフォントは簡体字しか用意されていない。
一方、中国以外の中国語圏では台湾で開発されたBig5と呼ばれる文字セットが最もよく使われている。これは13、053字の漢字に記号、ひらがな、カタカナ、キリル文字等を加えた13,720字のセットで、字体としては伝統字体(繁体字)が使われる。
GBとBig5の間には互換性は全くなく、また日本の漢字コードとも異なるため、中国や台湾の漢字のページを日本語環境で見ると、一見、漢字でありながら意味のない文章となる。

韓国語と同様に中国語のフォントだけを入手してもホームページを表示することは出来ない。Chiniese Language Kit(CLK) を購入し漢字トークにインストールするのが最も簡単である。このキットの中には簡体字と繁体字のフォントとGBとBig5に対応したスクリプトエンジンが含まれている。もちろん入力もできる。
ネットスケープのフォント設定で「中国語(簡体字)」としてBeijin等を、「中国語」としてTaipei等を指定する。中国や米国の中国語のページでは文字コードセットとして「中国語(GB)」を、台湾、香港等では「中国語(Big5)」を選択すると、漢字の表示が可能になる。(図14:台湾サンプル画像)

CLKがない場合はどうするか。
中国語の場合は究極の裏技として大阪大学にあるゲートウェイサーバーを通すという方法がある。このサーバーには中国語の漢字コードを日本語の漢字コードに置き換える変換テーブルが入っており、ここを通してホームページを見ると漢字トークの環境で中国語が表示できるようになる(日本にない漢字はローマ字表記になる)。しかしこの方法はサーバーへの負担が大きいので一般にはお勧め出来ない。
もう一つの方法は韓国語の場合と同じように、オフラインで中国語エディターで読む方法である。前述のUnicorn Editor に加え、MacViewHZというフリーウェア(Chen Xiao Dong氏作、から入手可能)がある。どちらもGBとBig5のフォントを内蔵しているので、漢字トークの環境で中国語を読むことができる。(図15:サンプル画像)試してみた結果ではすべての中国語のホームページが読めるわけではないが、ファイルとしてダウンロードできる中国語文献などは確実に読むことができる。



(C)Harry Ono 1997
このページへのリンクは構いませんが、許可なく本文全体ならびに一部の他のホームページへの転載、雑誌記事等への転載を禁じます。