聞こえることと聴こえることは違う、と考えることにした。

 今回もうだうだ長いので、三行まとめ。

 ・ハイレゾオーディオは聴くと確かに音が違う。何か理屈で説明つくのかね。
 ・ハイレゾ制作環境では可聴域の音にも差が出る可能性はありそう。
 ・人間の耳は時間軸方向には結構敏感なのかも。

 ◇

 さて、巷で話題の「ハイレゾ」。
 以前の自分は正直全く興味無かったのだが、とあるタイミングで同じ音楽のCDとハイレゾを聴き比べるという機会がありまして。

 「アレ?違うよねコレ?」

 自分の耳でも違いが分かってしまったのですよ。明らかにハイレゾの方が気持ちが良い。
 個人的にはこれかなり衝撃的でした。違いが分かってしまうの、という意味で。

 ということで、感覚として納得してしまったのですよ。
 それ以来、自分でもハイレゾ音源を入手するようになって今に至っているワケです。

 ということで、本日のエントリーは「S.Kazの考えるハイレゾとは」という、いつもにも増してウザい話になっております。
 以下、いろんな意味でご注意下さい&閲覧は自己責任で。

 ◇

 さて、上記ような衝撃体験の後。

 自分としてはどうしても納得出来る説明が欲しかったワケですよ。
 何しろ自分の基本的な認識は「ピュアオーディオ」=「色んな意味で残念な世界」なので

 注:意見には個人差があります。

 科学的に納得出来る説明が欲しい、と。
 ちなみに当方、

 ・CD品質(16bit/44.1KHz)と24bit/48KHzでは、差が良く分からんです。
 ・24bit/48KHzと24bit/96KHzの落差は結構ある。これは(それなりの再生機器であれば)聴き分けが出来る筈。
 ・24bit/96KHzと32bit/96KHzの差は全然分かりません。

 ♯192KHzの音源は買ったことがないので差が分かるか不明。

 という状態。
 つまり、ビット数の差は分からないがサンプリング周波数の差は結構分かるということ。

 とはいえ「人間には20KHz以上の音は聞こえない」ということについては、現在のところ科学的にも否定しようがない模様。
 つまり理屈詰だとハイレゾの意味は無い・・・って、ならばどうしてこの差があるんだ?

 ということで、自分が至った結論は以下。

 ・ハイレゾで音源を作成したことで20KHz以下の可聴領域にも有意な差が出ていて、それが聴き分け出来る理由に違いない。

 これが証明出来る何かがあれば・・・と思って色々調べていると、ちらほらと面白い話が。
 個人的には結果的に凄く納得してしまったので、結論としてこれでいいかと思っている。
 以下、その二つの理由をつらつらと書いてみる。

 ◇

 理由そのⅠ。ハイレゾ音源「制作環境」が音が良いのかも。

 高い周波数まで扱うことを前提とした結果、可聴領域=低い周波数についても結果的に高音質になっているという考え方。

 アナログの世界で言えば、一般的な電子部品の周波数特性を考えると、高周波まで特性の良い素子は大抵低周波での特性も良い。「特性に余裕がある」ということで、これが結果的に可聴領域の音に良い影響を与えている可能性があるんじゃね、と。

 デジタルの世界でも、サンプリング周波数が高いということは単純にデータ密度が濃いということ。例えば1KHzのサイン波を描くのに48点使えるか96点使えるか、この2倍密度の濃さが音質に影響を与えている可能性があるのではないか、と。

 更にデジタルの世界の話をする場合、昨今の音源作成のデジタル処理の多さも見落とせないポイントかと。
 ハイレゾに対応することでデジタル処理で音を加工する際の加工精度が従来より要求されるようになり、結果として可聴領域にも良い影響を与えている可能性はあってもおかしくないよね、的な。

 最後の点については、48KHzと96KHzでは音が豹変するVSTも実際いくつも見ているので、良い悪いは兎も角音が変わることについては「あるだろ」としか。

 ◇

 理由そのⅡ。人間の耳は時間軸方向には結構敏感なのかも。

 最近知ったのだが、人間の耳(というか脳)は「時間軸の音のズレや変化」については従来考えられていたよりずっと敏感だ、という研究があるらしい。
 これはどういうことかというと、20KHzの音の1サイクルは0.05ms=50μsで、これ以上高い周波数は「聞こえ」ないが、一方で音の出るタイミングのズレや音の立ち上がり方の違いについてはもっと短い時間でも認識出来る、ということ。

 言われてみればそうかもね、ぐらいには考えられる話で。
 例えば人間の左右の耳の間は16cm程度しか離れていないにも拘わらず、遠くの音の音源方向が何となく分かる。
 音源からの距離の比率を考えると、非常に僅かな時間差だけでこの感覚を導き出しているワケで、それはつまり脳がそれなりの精度で音の位相差を処理しているということではないかと。

 それに人間は兎も角として、生物の中には反響音を解析するソナーのような能力を持っている種だって居るぐらいなので、生体原理としては精細な時間軸での認識は不可能ではない筈。

 更にこの話は位相特性とか群遅延特性という話に繋がっていったり、当方大好きBBEの動作原理にも微妙に繋がったりとしているのだが、この辺りは語り始めると長くなるので省略して、と。

 まぁ要するに、サンプリング周波数が高いということは当然時間方向の解像度が高いワケで、その分音が正確に再現され、良い音に聴こえるんじゃね、という話。

 ◇

 以上のような理屈から、当方は「ハイレゾって多分プラセボではない」と信じることにしたのだ、が。
 さて、ホントのトコはどうなんだろうね。

Share