今さら聞けない!デジタルオーディオファイルとは

身近なものが次々とデジタル化されているが、「音」も例外ではなく、現在では多くの音がデジタルデータとして利用されている。音楽を配布する媒体として1980年に音楽CDが登場してから、音楽は基本的にデジタルに置き換わっている。音楽CDを聴く方法としてこれまで色々あったが、現在主流なのはmp3やFLAC等のオーディオファイルに変換してプレーヤーで再生する方法である。DAP(デジタルオーディオプレーヤー)のカタログにも普通に対応ファイル形式として書かれているが詳細については書いていないので、この記事で紹介しようと思う。

デジタルオーディオを扱うにあたって、まず、音楽CDとは何かを知っておく必要があるだろう。

音楽CDとは

先に音楽CDは1980年に登場したと書いたが、この記事を書いている時点で約37年前の話になる。そんな音楽CDが現在も現役で使用されており、廃止される気配も今のところないのは非常に優れた規格だったからと言えるだろう。映像のようにVHS→DVD→Blu-rayと次から次に規格が出てきて新しくなっていることを考えると音楽CDがいかに未来を見据えて規格化されたものかということがわかるだろう。

音楽CDの名称は正確には「CD-DA(Compact Disc Digital Audio)」である。コンパクトディスクにデジタルオーディオを入れたものという意味となる。コンパクトディスクというと主流は12cmの円盤であるが、少し前のシングルは8cmの円盤でよく発売されていた。現在ではシングルでもアルバムでも12cmで販売されている。

このコンパクトディスクにデジタルで音楽を記録したものがCD-DAとなる。デジタルなのでディスクには「0、1(ゼロ、イチ)」で記録されている。間違えてはいけないのはアナログレコードみたいにレコードの溝の波形を直接読み取るのではなく、ディスクに記録されている0,1の信号を読み取ってプレーヤー側で波形に変換しているということである。(これを行うのがデジタルーアナログ変換器、Digital – Analog Converter、つまりDACという)

コンパクトディスクは赤外線レーザーで0,1信号を非接触で読み取るため、基本的にどこも劣化するところはない。つまり何回再生させても同じ音質で音楽を聴くことが出来るという利点がある。アナログレコードのようにレコード自体や針が再生のたびに劣化して音質が変わったりするということが音楽CDには無いわけだ。

詳しく音楽CDの読み取りの仕組みを知りたい方はこちらを参考にすると良いだろう。アナログレコードとは全く違う仕組みということが理解できるだろう。

では、音楽CDがデジタルで記録されていることがわかったところで、CD-DAの規格を見ていこうと思う。

CD-DAの規格

音は空気や物質を媒体として伝わる「振動波」である。簡単に言うと空気が振動して音が聞こえているわけである。これをマイクで拾ってテープなどに記録していく。空気の振動なのでアナログデータである。これをアナログからデジタルに変換する必要がある。

デジタルデータは先ほど述べたように0,1で表現しないといけない。連続している振動波(アナログ)をデジタルデータにするには仕様を決めないと先に進まない。そこで約40年前に考え出されたのがCD-DAの規格である。

  • データ形式:LinearPCM(リニアPCM、LPCM)
  • サンプリング周波数:44,100Hz
  • 量子化ビット数:16bit
  • チャンネル数:2ch

データ形式のリニアPCMとは「pulse code modulation」で日本語では「パルス符号変調」言う。リニアと付いているが、これは振動波波形をそのままパルス符号変調するという意味である。

サンプリング周波数は1秒間に何回、振動波をデジタルデータにするか、ということである。CD-DAの仕様では1秒間に44,100回もデジタルデータとして記録するということだ。この回数が少ないとカクカクした振動波になってしまい、元のアナログデータとは違うものになってしまう。逆に多いと滑らかな振動波になり、アナログデータに近づくが、データとしては大きくなってしまう。つまり適度なサンプリング周波数を決めないといけなかったわけである。これはCDの容量と収録時間を考慮して44,100回と決まったようだ。

量子化ビット数は先ほどのサンプリング1回あたりに何段階のデータとして記録するか、ということである。波形で言うと振幅の大きさに該当する。CD-DAのように16bitあると10進数で0~65,535(65,536種類)を表現できる。

チャンネル数はステレオなので左右2chである。別々の音を右左で記録できるというのがCD-DAの規格である。

つまり、リニアPCMのデータとしては0~65,535の振幅を1秒間に44100回記録したものがステレオで記録されていることになる。40年前のデジタルがほとんど普及していない中、このような高サンプリング周波数、高ビット数を設定したおかげで現在まで規格変更されることなく生き残っていると言えるだろう。当時としてはかなりハイスペックな物だったと思う。パソコンもHDD容量も少なく、リニアPCMを音飛びなく、そのまま再生できるものはなかったと思う。

現在ではパソコンのHDDも大容量化し、リニアPCMも音飛びすることなく、余裕で再生できるようになっている。このことからパソコンで音楽を取り込んで聴く「PCオーディオ」が出来るようになったり、ネット回線の高速化によって音楽配信が出来るようになったりしている。音楽配信ができるようになったため、音楽CDよりも高音質と呼ばれるハイレゾというものも近年出ている。ハイレゾはここまで説明してきたサンプリング周波数を44.1kHzから96kHz,192kHz等に増やしたり、量子化ビットを16bitから24bitに増やしたものである。つまり、より細かくデジタルデータ化することによって、アナログ波形の再現性が高くなり、録音したそのままの音が聴けるということである。もちろん音楽CDの規格からは外れるので、音楽CDとしてハイレゾが出ることはないが、ネット配信で入手できる。音楽CDでも十分スペックは高いが、さらに良い音を求めるのであれば機器を揃えてハイレゾを聴いてみるのも良いだろう。

CD-DAに記録されているリニアPCMのデータはWAVEファイル(拡張子 .wav ウェーブ、ワブと呼ばれる)としてパソコンに取り込む(リッピング)することが出来る。このデータが音楽CDそのもの=音楽CD音質であり、無圧縮のデータである。全てはこのWAVEファイルが基本になっており、このWAVEファイルを変換して他の形式にしている。WAVEから他の形式に変換することをエンコード、他の形式からWAVEに戻すことをデコードという。

ロスレス圧縮形式とロッシー圧縮形式

WAVE以外の形式としては大きく分けると2種類になる。ロスレス圧縮形式(lossless,可逆圧縮形式)とロッシー圧縮形式(lossy,非可逆圧縮形式)である。ロスレス圧縮形式とはエンコードして圧縮した後、再度デコードすると元のファイルに戻るというものである。それに対してロッシー圧縮形式はエンコードして圧縮した後、再度デコードしても元のファイルに戻すことが出来ない形式である。

ロスレス圧縮は圧縮しても何も劣化しないので、CDの音質そのままということになる。また、いつでもWAVEに戻すことが出来るため、CD-Rに焼き直せば元のCDと同じ音質でCDプレーヤーで再生できる。ただし、音質を保ったまま圧縮するので、どうしてもファイルサイズが大きくなってしまう。現在ではポータブルオーディオプレーヤーやパソコンの容量が十分に大きいのでファイルサイズはあまり気にしなくてもよい。よりいい音で聴きたいのであればロスレス圧縮を選択したほうがよいであろう。

ロッシー圧縮は主に人間の耳では聞きづらいところの周波数を削ってファイルサイズを小さくする圧縮形式である。つまり、一度ロッシー圧縮してしまうと、削られた部分は戻すことが出来ず、WAVEにデコードしても元のCD音質には戻らない。(もちろん再生する場合もCD音質ではなくなっている)まだデジタル機器のスペックが低い時代にファイル容量を減らすために考えられたものである。そうは言っても、デジタルオーディオプレーヤーやiPhoneに入っている音源は現在でもロッシー圧縮という方が多いと考えられる(mp3を使っている方、itunesで取り込んでいる方、itunes storeやネット配信されているものをダウンロードしている方はほとんどがロッシー圧縮である。意識してロスレス圧縮形式を選んでなければロッシー圧縮を使っていると思ってよいだろう。いまは無きMDも実はatracというSony独自のロッシー圧縮形式である。)最近はハイレゾ配信でよくはなってきているが、少し前はCDから音質をかなり落としたロッシー圧縮を結構な価格でネット配信していた。そういう音源ばかり聴いて慣れていると、本物のCDを聴いたときに音質が良くて驚くこともある。

余談になるが、最近のハイレゾで売り出している音源や機器はハイレゾだからではなくて、ロッシー圧縮形式からロスレス圧縮形式を扱うようになったから音が良くなったと感じる人が多いのではないかと思うところもある。最初からCDでそのまま聴いていればCD音源もハイレゾもそこまで大きな違いはわからないのではないだろうか。

ロッシー圧縮を悪いように書いているが、実際には地デジ放送も映像と音声にロッシー圧縮(MPEG2)を使っているし、インターネット上に載せてある画像もほとんどがロッシー圧縮(JPG)であり、無圧縮では容量が大きくなりすぎる場合によく使われている。確かにこの技術がなければ、映像も画像も音声もインターネットや電波で送信するには厳しいものがある。用途を考えて適度に使用するというのがよいだろう。

それではロスレス、ロッシー圧縮形式を理解したうえで様々なファイル形式を見ていこう。

 さまざまなデジタルオーディオファイル形式

現在ではかなりの数のオーディオファイル形式が存在している。今は落ち着いているが、音質を保ったままファイル容量を少なくするために様々な圧縮方式が考えられ、次から次へと新しい音声ファイル形式が誕生してきた。メジャーなものからマイナーなものまであるが、現在、オーディオプレーヤーで対応しているものがメジャーな形式であると言えるだろう。

参考までにSonyの売れ筋の現在のウォークマンNW-A30シリーズの仕様を見てみる。

ソニー SONY ウォークマン Aシリーズ 64GB NW-A37HN : Bluetooth/microSD/ハイレゾ対応 ノイズキャンセリング機能搭載 ハイレゾ対応イヤホン付属 チャコールブラック NW-A37HN B

信号圧縮形式(音声圧縮形式)

MP3/WMA/ATRAC/ATRAC Advanced Lossless/
リニアPCM(WAV)/AAC/HE-AAC/FLAC/
Apple Lossless/AIFF/DSD(DSF, DSDIFFフォーマット対応)

書いてあるだけで11種類もある。特に説明も書いていないので、何のことか困惑する人もいるだろう。基本的にファイル形式は多くの人が利用している形式を使用しておけば問題ないだろう。

音楽CDからの取り込みを想定しているのであれば、

・たくさんの曲を詰め込みたい →  MP3(ロッシー圧縮)

・音質を最優先 → FLAC(ロスレス圧縮)

を選んでおけば困ることはないだろう。MP3とFLACであれば大抵のデジタルオーディオプレーヤーで再生できるからだ。他の形式を選ぶとプレーヤーが対応していなくて再エンコードするなど手間が発生する可能性がある。せっかくハイレゾ対応の機器を買うのであれば音質を優先してFLAC形式を使用するのが現状ベストと言えるだろう。より便利に使えるネットワークオーディオをする場合でも機器が対応しているのでそのまま利用することができるだろう。

また、ネット配信しているハイレゾもFLACで配信していることが多い。つまり、配信側もFLACがスタンダードな形式と認識しているということである。過去から違う形式を使っている方は仕方ないが、これから音楽をCDから取り込む場合はFLACを選択しておいてよいだろう。

Windowsパソコンであればfoobar2000というフリーソフトでCDの取り込みから音源の管理まで可能であるのでお勧めだ。

音楽再生プレーヤーfoobar2000の使い方まとめ

foobar2000でCDからFLACを作る手順

他の形式も気になる方はいると思うので1つずつ紹介していきたいと思う。(随時追加予定)

MP3(エムピースリー)

ロッシー圧縮で最も有名であり、昔からある圧縮形式である。正式名称は「MPEG1 Audio Layer3」であり、拡張子は「.mp3」である。

WMA(ウマ)

Windowsが開発したロッシー音声圧縮形式。正式名称は「Windows Media Audio」であり、拡張子は「.wma」である。

ATRAC(アトラック)

sonyが開発したロッシー音声圧縮形式。MD(MiniDisk)にも採用された圧縮形式。正式名称は「Adaptive TRansform Acoustic Coding」であり、拡張子はPCで扱うようになってからは「.aa3」やOpenMG Audioコンテナに入った「.oma」が使われている。

WAVE(ウェーブ、ワブ)

無圧縮の音源である。圧縮していないファイル形式で拡張子は「.wav」である。先ほど説明したリニアPCM形式で音声が記録されているものである。音声ファイルはすべてWAVEファイルが元となっている。無圧縮であるので一番ファイル容量が大きいが、CDで発売されているものに関しては一番音質がよい(並行でハイレゾ配信されている場合はもちろんハイレゾのほうがスペック上では音質がよくなる)

AAC(エーエーシー)

MP3に代わるロッシー圧縮形式として登場したAAC形式。拡張子は「.aac」である。ファイル容量を抑えてMP3よりも音質がよいとされている。

FLAC(フラック)

現在、最も普及しているロスレス圧縮形式である。正式名称は「Free Lossless Audio Codec」であり、拡張子は「.flac」である。名前の通り、フリーであり、歴史も長いので最もユーザーが多く、対応機器も多い。

 

さいごに

あまり音声ファイルの形式を意識して利用している方はいないかもしれないが、音質にこだわるのであればロスレス、ロッシー圧縮形式の違いぐらいは理解しておいた方が良いだろう。種類はたくさん用意されているが、実際に使うのは1つだけになると考えられるので、最初が重要である。そうは言っても複数の圧縮形式を持ってしまうということもあるだろう。そのために再生プレーヤー側ではより多くの形式のデコードに対応しているわけだ。

この記事をきっかけにデジタルオーディオファイルが何なのか、ファイル形式は何を使っているのかを見直していただければと思う。

オーディオ

Posted by kazutomo