MQAフォーマットって次世代MP3、かも。

 今回もうだうだ長いので、まずはまとめ3行。

 ・MQAフォーマットはハイレゾの高域を可聴域に押し込む技術。
 ・高域を不可逆圧縮で、時間軸レスポンスを重視した方式。
 ・言うなれば新世代のMP3。理屈は分かるが何だかビミョー。

 ◇

 さて、前回に引き続いてMQAのお話。
 今回はMQAフォーマットについて。「高域を低域に埋め込む」とはどういうことか。
 個人的にはビミョーという印象を持ってしまったが、その辺りも含めてつらつらと書いてみます。

 ◇

 前回書いたように、MQAでは音質について「時間軸で正確」というアプローチを取っているんですよ。

 ではそれを具体的に実現しようとすると、原理的にはハイレゾにするしかない。
 デジタルでサンプリングしている以上、サンプリング周波数=時間軸精度という制約を受けざるを得ないワケで、この周波数が高い程原理的に「時間軸の正確」性を保証し易い。
 というか、サンプリング周波数未満の時間軸の正確性を担保することは原理的に不可能ですわな。

 一方で、ハイレゾ配信ではデータ量が増える。そりゃそうだ、情報量が多いんだもの。
 この情報量の多さが問題だ、というのがMQAの主張。

 ・・・え?
 そもそもハイレゾ音源程度の情報量の多さで何が問題?動画がバンバン流れるこの高速回線時代に?

 ↑コレが自分の最初の感想で、結局最後までこの印象はひっくり返らなかったので、自分的にはビミョーという感想しか持っていないのだが。
 まぁ、ここは話を続けます。

 で、ここからはまたMQAの主張。
 人間の耳は「ダイナミックレンジには鈍感」なので、ハイレゾの高い周波数成分を圧縮して、可聴帯域内の微細な音量変化に押し込んでしまえば良くね、と。
 そうすればハイレゾをそのまま配信する場合と比べて、データ量を抑えることが出来るよね、と。

 例えば、24bit/44.1KHzのデータのうち下位6bitを「高周波数用」として割り当てると、従来の再生装置でも18bit相当の音源としては問題なく再生出来る。
 一方で、MQA対応の再生装置を使うと、18bit/44.1KHzに加えて、最大で176.4KHzまでのハイレゾ相当の周波数成分を復元出来る。
 その結果、ハイレゾの特徴である「時間軸での正確」性を担保できる、と。

 勿論「押し込む」ので原理的に不可逆圧縮、ハイレゾそのままよりは劣化していることは間違いない。
 だが、要するに「限られたデータ量を音量変化より周波数帯域に割り当てた方が幸せになれるでしょ」というのがMQAの主張なワケですよ。

 ・・・ん~、まぁ理屈は分かるのだけど。
 こういう発想は「限られたデータ量を音域全体でなく耳につく音だけに割り当てた方が幸せになれるでしょ」というMP3と根は一緒な気がするのよね。
 なので「新世代のMP3」と自分は解釈しました、はい。

 ◇

 ちなみに、この「時間軸での正確」性については、実は従来から別のアプローチもあるのであり。

 音の時間軸のズレは波形で見ればブレ・鈍りなんですよ。
 そして再生時にこの波形のブレ・鈍りを発生させる最大の要因がDACのオーバーサンプリング・デジタルフィルター処理。

 そこで、オーバーサンプリング処理時に「本来あるべき波形」を推測して近づけてしまおう、という技術が生まれたワケで。
 このテの技術は「失われた20KHz以上の再生」という言い方をされることもあるが、同時に「時間軸の正確」性も(何も考慮してない場合に比べて結果的に)改善されている、と。

 ♯「推測」なのでどうしても音に味付けが出るのが不可避なので、好き嫌いも出るのだが。でもそれを言い出したらそもそもオーバーサンプリング・デジタルフィルター処理自体原理的に音への影響は不可避なので、ね。

 この技術の先駆けが日本コロムビア=DENONのALPHA Processing。その他にもVictorのK2 TECHNOLOGY、PIONEERのLEGATO LINK CONVERSION、その他色々開発され実装されていったのだ、が。
 現在単品コンポとして生き残っているのは上記の中ではALPHA Processingのみで、K2はシステムオーディオのみ、LEGATO LINK CONVERSIONに至っては消滅の憂き目に遭ってますな。

 ♯PIONEERが現在採用している「Hi-bit32 Audio Processing」もLEGATO LINK CONVERSIONを血を引いていないワケでもないらしいのだが、直系という程でも無いようで・・・。

 あと、DENONの海外サイトにALPHA Processingの技術解説ドキュメント(英語)があるので、読んでみるのも一興かと。つかコレの日本語版何処?
 http://www.denon.com/pages/GlossaryDetail.aspx?GId=13

 ◇

 以上、こんな感じで。

 ちなみに、このMQAの原理を理解して最初に思い浮かんだのは、実はMP3ではなく昔あった4chレコードだったんですな。
 アレは2ch分の音声を可聴領域より上の帯域のFMに乗せてしまうという代物だったが、何か発想が似ているような気がして。
 ただ、流石に4chレコードなんてブツがアレ過ぎて絶対伝わらないと思ったので、次に思い浮かんだMP3ネタを上には書きました、と。

 ということで、今回はここまで。

Share

MQAのアプローチ自体は割と真っ当な気がする。

 今回もうだうだ長いので、まずはまとめ3行。

 ・MQAって最近何だか微妙に流行りつつあるらしい。
 ・MQAの高音質化のアプローチ自体は結構悪くない気がする。
 ・フォーマットと高音質化アプローチを一緒くたにしている現在のマーケティング手法はダメ過ぎ。

 ◇

 さて、巷ではほぼ話題になっていないが、俗にいう「おーでぃおふぁいる」なる人々の間で話題になっているらしい「MQA」というフォーマット。

 ハイレゾについていろいろ調べたり考えたりしている過程で引っかかってきた単語なのだが、個人的には「理屈に納得」した部分と「え゛ー」という部分と両極端だったので、取り敢えず触れてみる。
 但し、現在のMQAのマーケティング手法が正直あまりにも分かりづらく、かえって混乱を招いているだけな気しかしないので、

 ・MQAの高音質化アプローチ=「時間軸で音を正確にする」
 ・MQAフォーマットの原理と特徴=「高域を低域に埋め込む」

 の2パートに分割して、取り敢えず以下に書いてみる。

 ◇

 以下、「時間軸で音を正確にする」とはどういう意味かについて。

 これ以前自分が書いたネタ。というか、前回書いた元ネタの方がコレ、というネタバレ。
 詳細は前回のエントリ読んで下さいな。ざっくり言うと、時間軸での音のズレや変化に人間は結構敏感っぽい、という。
 振り返って、近年のオーディオ制作環境を見てみると、という話ですよ。

 最近の制作現場では基本的にデジタルの世界で音を捏ね回す。デジタルの素晴らしいことは伝送時にノイズが入らないことで、おかげでノイズフロア(無音時の雑音)が下がり、ダイナミックレンジが稼げるようになったと。
 更に、様々に音を加工しても劣化が少ないため、音源に対してアナログ時代には信じられない程の手を加えているというのが現代のオーディオパッケージ。

 が、デジタルの世界ではこの時間軸の変化が忘れ去られてきたのではないか、というのがMQAの主張。
 時間軸での変化が発生した結果、再生した音は当初の音とはかけ離れてしまう、と。

 実際問題として、デジタル世界でもフィルタを使ったりすると時間軸の変化は避けられない。これは数式ではじき出せる「原理」「理屈」そのもので、避けようがない。
 一番分かり易いところでは「リニアフェイズ」アルゴリズム。
 実際に処理した結果を見ると、実際の音の波形の前後に追加の波形が発生してしまう=時間軸では明らかに変化している。名前の通り位相こそはズレないのだが、逆に位相をズラさない為にはこれは不可避という。

 他にも、変換で使われるディザリング等、この時間軸での変化を発生させるポイントは、デジタル世界で処理していても相当に多い。
 しかも実際に処理に使われているアルゴリズム=数式を解いてみても、原理的に発生するもの。
 つまり、時間軸で見ると音はどんどん「正確」ではなくなっている、というワケですな。
 これが音質にとって致命的によろしくない、という主張ですよ。

 それに対して、MQAではどうするか。
 肝心のこの部分は、残念ながらきちっと書かれている文章は見つからず。
 とはいえここまでの流れを考えれば「ざっくりした」方向性は明確で、意図的に逆方向の時間軸変化を加え、結果的に時間軸のズレや変化が少ない音源を作る、ということではないかと。

 ◇

 以上、MQAの高音質へのアプローチ、でしたとさ。

 えっと・・・何となくBBEが思い浮かんでしまったのは自分だけですかね。アレはマイクやスピーカーという物理的な制約によって発生する群遅延特性を改善する為に電気的に補正をかけるというアプローチだが、「時間軸で補正」というのが共通点なので。

 さて、ここまでで予定よりだいぶ長くなってしまったので、「MQAフォーマットの原理と特徴」は次エントリにて。

Share