Web Sound Sampling

Mac Clinic Tips:
Webにおけるサウンドファイル
Sound File Types for Web

作成：98年3月19日／掲載：98年6月6日
（本編は「Mac Fan Internet」98年5月号掲載記事を再編集したものである）

つい数年前まではホームページで画像が表示されるだけでも感動したのに、最近はライブの動画や音声が見聴きできるまでになった。本当にインターネットの技術革新はすさまじい。しかし、現実にはサウンド付きのホームページは非常に少ない。サウンドが自由に入れれれば、質問者のように自分のメッセージを声で発信したり、鳥の鳴き声のページとか、世界の鐘の音を集めたページとか、楽しいものが出来るに違いないのだが、そうは簡単には行かないのだ。しかし、手はある。今回は、インターネットにおけるサウンドファイルの問題と、ホームページでサウンドを発信する簡単な方法について解説しよう。

Webにおけるサウンドファイル

3月号で画像ファイルについて説明したが、画像フィルとサウンドファイルはよく似ている。ホームページで発信する場合も、同様にサウンドファイルを作り、それを表示するタグを書くだけだ。
画像ファイルの場合、ホームページで表示できるのは現在のところGIFとJPEGだけであり、NetscapeにもIEにもこれを再生する機能が含まれているため、ホームページの作者は、とにかくどちらかのフォーマットで画像ファイルを作ればよい。
しかし、サウンドファイルの場合はまだホームページ用の標準形式が定まっていない。サウンドファイルを再生する機能はブラウザには含まれておらず、プラグインソフトが必要だ。サウンドはまだ新しい技術であるために、多くの会社が技術開発にしのぎを削っており、新しいファイル形式が次々と生まれている。そして、それぞれのファイルを開くには専用のプラグインが必要となるため、どんなに一所懸命、サウンド付きのホームページを作っても、再生できる人は限られてしまうという現象も起こりうる。

サウンドファイルの種類

サウンドファイルはオリジナルのアナログ音声データをデジタル化してファイルとしたものだ。これには、もともとパソコンでDTM用として開発されていたものと、インターネット用に開発されたものがある。いくつか代表的なものを紹介しよう。

●AIFF(Audio Interchange File Format ）：
Macの標準サウンドファイル形式。DTM用に開発されたため、高品位のサンプリングデータで、音楽データの保存に向く。普通は圧縮せず、圧縮したものをAIFCと呼ぶ。

●WAV (Windows Audio )
Windowsの標準サウンドファイル形式。基本的な仕組みはほとんどAIFFと同じだが、ヘッダ情報が異なる。

●AU 、Sun Audio、NeXT
いくつかの呼称があるが基本は同じUnixの標準サウンドフィアル形式。インターネットの基本システムはUnixで作られているため、インターネットではこの形式のサウンドファイルが標準となっている。圧縮されているため音質はよくない。
AIFF，WAV，AUはデータ構造が類似しているため、相互に容易に変換することが出来る。そして、どれもMac、Windows、Unixで対応が可能である。

●MIDI（Musical Instrument Digital Interface ）
MIDI楽器を演奏するための楽譜データで構成されるファイル。サウンドファイルというよりもテキストファイルに近い。再生するためには音源（音色）データが必要。ファイルサイズが非常に小さく、高品位の音が得られるため、インターネットでの利用がさかん。

●MPEG(Moving Picture format Expert Group)
JPEGが通信回線で静止画を効率的に送信するために開発された規格であったのに対し、これは動画と音声の規格およびファイル形式。高度な圧縮法が特徴で、高品質でファイルが小さい。Macではソフト的に再生は出来るが、作成にはハードが必要になる。

●RealAudio
代表的なストリーミング式サウンド再生技術。ストリーミングではファイルをロードするのではなくデータを連続的に送る方式のため、厳密な意味ではファイル形式ではない。一般にはストリーミング式のファイルを発信するには専用のサーバーが必要になる。

Webとファイル形式の対応

さて、自分がホームページでサウンドを発信する場合、どのファイル形式にすればよいのだろうか。
上にあげた形式はどれもクロスプラットフォーム対応だが、先にも述べたように、ブラウザでのサウンド再生にはプラグインが必要であり、なるべく多くの人が持っているプラグインに対応したファイル形式を選ぶことが望ましい。
その観点で行くと、AIFF，AU，WAVということになる。Netscapeには標準でLiveAudioというプラグインが入っているが、これは全てに対応している。Appleから供給されているQuickTimeプラグインも同様だ。
RealAudioの様なストリーミングファイルを個人が扱うのは難しい。
MIDIも多くのプラグインが対応していため、再生には問題がないが、音楽に限定されるという欠点があるここでは除外して考えざるを得ない。
ということで、Macユーザーであれば作成ソフトも豊富なAIFFでサウンドファイルを作るのが一番よいだろう。

サウンドデータのデジタル化

さて、サウンドファイルを作るわけであるが、サウンドファイルを作るということは、アナログの音声をデジタル化するということである。
音というのは空気の振動であり、横軸に時間、縦軸に振動の波形で表わされる。カセットテープで音を録音するする場合は、波形をそのまま磁気テープの上に記録する。あくまでもアナログデータとして記録しているわけである。一方、コンピュータはデジタルデータしか扱えないので、コンピュータで録音する場合は、この波形を数値化しなければならない。
この音の波形を数値化する作業をサンプリング（標本化）、数値化されたデータをサンプル（標本）と呼ぶ。なぜこのような統計学で使われる用語が用いられているかというと、本来アナログの波は連続したものであるが、デジタル化する場合には、ある程度代表的な点をとらざるを得ないからだ。

サンプリングの概念を理解しやすくするためによく引き合いに出されるのが、気温の測定だ。温度計を用いて1日の気温の変化を測定せよと言われた場合、普通は一定時間毎に温度を測定して表を作る。標本化とは、本来気温のように連続的に変化するものを一定間隔で記録し、棒グラフにすることをいう。

しかし、3時間おきに測定した場合は、その間に温度が変化していてもそれは記録に残らない。そうならないように測定間隔を短くしていけばよいが、どんなに間隔をつめても、本来の連続変化の状態とは違って、単なる標本をとっているのに過ぎない。しかし、現実には、人間が感じれる温度変化は限られているので、それほど細かい間隔でとる意味もない。最も知りたい変化の間隔が望ましい測定の間隔となるが、これをサンプルレート（標本化率または標本周波数）とよび、デジタルデータの基本スペックとなる。

サウンドデータのサンプルレート

アナログの音の波形は、オーディオ機器の中では電圧の変化で表わされる。これに対し、一定間隔でパルス信号を送り、その度に電圧を測定し数値として記録していく。音を測定するには非常に短い間隔が必要であり、Hz（ヘルツ）を単位として用いる。1Hzとは1秒間に1回測定を行うこと、1KHzというと1秒間に1000回測定を行うことである。
実際の音の周波数に対して測定点は2倍必要になる。
人間が一般に聴くことのできる周波数は200～20K Hzであり、これを全てサンプリングするには40KHzが必要になる。CDのサンプルレートは44.1KHzだ。
一方、明瞭に話される人の声の周波数は300～3400Hzであるので、デジタル電話の規格であるISDNではサンプルレートを8KHzで規定している。
サンプルレートを少なくすると、音の中の高周波領域（高い音）が消えてしまい音が薄っぺらくなってしまう。

しかし、不必要にサンプルレートを高くしても、データ量が増えるため、インターネットのように低速の通信回線を使っている場合は、品質を無視して低いサンプルレートを採用せざるをえない。

サンプルビット

次は波の縦軸の数値化だ。先の気温の例で言うと何度という数値だ。温度の場合は絶対的な尺度があるため、温度計を読みながら記録をつけていくことが出来る。しかし、音の大きさには絶対的な尺度が無く、電気的には電圧の大小で測定するしかないが、最大値と思われる電圧を1とし、0との間で目盛りをつけて測定する。
ここで問題になるのが目盛りの付け方だ。どれだけ目盛りを細かくするかをサンプルビットという。1ビットは2目盛り、つまり大きい音と小さい音の2つで測定される。2ビットは4目盛り、3ビットは8目盛りである。通常はコンピュータが扱いやすい、8ビット（256目盛り）か16ビット（6万5千目盛り）が用いられる。これも細かいほど原音のカーブに近くなるが、データ量が増える。

反対にビット数を減らすと、原音との間で切り捨てられるデータが新たな並を作り、ノイズとなってあらわ得れる。CDでは16ビットが用いられているが、ホームページのサウンドであれば8ビットでも十分である。

なぜWebでサウンドは一般的でないか

ホームページを見てもらには軽いことが重要だ。軽いホームページとは、画像がすくなく、画像があっても、それぞれのファイルサイズが小さいものを言う。それほど現在の、通信環境はまだ整備されおらず、大量のデータを短時間に送信できる状況にはなっていないのだ。
たとえば、CD品質のサウンドファイルはどの程度のサイズになるのだろうか。サウンドファイルの計算は非常に簡単である。サウンドファイルにはサンプルレート（1秒当たりの測定数）、サンプルビット（1測定点あたりの消費メモリ＝この場合は目盛りではない）、チャンネル数（ステレオかモノか）、そしてサウンドの時間（秒）がスペックとしてあるが、これらを単純に掛け算すればよい。
CDの場合は、サンプルレート44.1KHz，ビット数16ビット、ステレオであるから、1秒当たりのデータ量は44.1Kｘ16ｘ2＝1411.2Kbpsとなる。bpsといえばモデムなどの速度だが、これは、もしCD品質のサウンドデータをライブ（ストリーミング）でオンラインで送るには、通信回線の容量が1411.2Kbps必要だという意味だ。これは専用線でも対応できない速度だ。
それでは、ライブではなく、ファイルとして一旦パソコンに送り、ブラウザーで再生する方法ではどうだろうか。もし3分間の曲を想定すると、上記の値に180秒を掛けて、8で割ると（8ビット＝1バイト）、31.8MBになる。これでは64Kbpsの回線でも、ホームページでこのファイルがロードされるのに66分かかることになる。これでは誰も聞いてくれない。反対に、30秒でロードされるサイズを計算してみると、わずか1.4秒分のサウンドしか遅れないことになる。

サウンドファイルにもデータ圧縮の技術がある。しかし、画像圧縮ほどには圧縮率も高く出来ず、音質への影響も大きい。

従って、ホームページで音を出すには、ファイルサイズを小さくすることを目標とし、音の品質については情報が伝わる程度に割り切るしかない。
品質をある程度維持したいならば、商用のサイトで一般的なストリーミングサウンドを採用せざるを得ないし、楽器演奏だけでよければMIDIを考えるしかない。今回は、個人が自然のサウンドを発信するのが目的なので、無理してでもAIFFファイルで発信するしかない。

サンプリングソフトはシェアウェアの"SndSampler"もしくは、"Sound Effects"を使う。どちらも録音から編集まで出来るが、基本的な録音と編集は"SndSampler"の方がよいだろう。複雑な効果を加えて凝った編集がしたいならば"Sound Effects"を使うとよい。音楽ソフトは用語が難しく、初心者には操作が難しいが、Mac Clinicの読者には日本語パッチが用意されているので、これを使えばかなり分かるはずだ。「薬局」からダウンロードできる。
"SndSampler"については詳しい操作方法と、それを使ったHTMLの書き方までを指導した「Webサウンドのためのサンプリング：SndSamplerの使い方」を参照して欲しい。