ストリーミング配信向けのマスタリングにおけるラウドネス管理の価値

今回ストリーミング向けマスター音源をマスタリングしつつ、ストリーミングプラットフォームの音源仕様について調べていて感じたことを備忘録のつもりで書き留めていこうと思います。

 

まず、前提として音圧(ラウドネス)と音量の違いについて断りを入れておくと、

音量は音の大きさ、音圧は音の面積や密度の概念、音量の大小は必ずしも人間の聴感と比例せず、音圧の考え方のほうが人間の聴感に近い考え方です。

なので音圧を基に議論が展開されることを念頭においていただきたい。

 


今回極めて問題になったファクターは、ストリーミングサービス内で音源を再生するときに掛かる処理『ラウドネスノーマライゼーション』というもの

 

これは簡単に言うと、いろいろな音量の音源を通して聴くうえで聞き手が音量操作をしなくても快適にリスニングできるための機能ということです。ただそれだけです。

 


しかし、巷ではこのラウドネスノーマライゼーションの基準値(spotifyが-14LUFS、youtubeが-16LUFSなどに音圧をそろえている)について

リミッターなどでダイナミクスを犠牲にしてまで音圧をいくら稼いでも結局プラットフォーム側で下げられてしまう、それなら元から基準値付近の音圧でマスタリングするべきだなどと

あたかも音圧が大きいことが悪いかのようにミスリードする意見が散見される。

これは、過去にEDMなどのジャンルで起きた『音圧戦争』なるものに対するコンプレックスのようなまやかしのようなものだと感じた。

(リミッターだけで音圧を稼ぐのは確かに良くないが…)


※LUFS=ラウドネスユニットフルスケール≒人間の聴感に近い音圧の指標

 

ストリーミングサービスにおいてラウドネスノーマライゼーションが働くと

音圧が大きい楽曲の音圧は下げられる、しかしその低減処理ではフェーダーやボリュームを下げるのと同じように音質変化は殆どない、

逆に楽曲の統合ラウドネス(integrated Loudness)が小さいとプラットフォーム側の処理によって音圧を増す処理が加えられて意図しない音質に変化してしまうことになった。(今回実際にそうなった)

さらに、ストリーミング配信の多くの楽曲でラウドネス値はLUFS-6付近であるのが実態だった。

つまり、ストリーミングにアップロードする音源は integrat LUFS-6前後(超えてもOK)であっても問題ないし、そもそもジャンルや使う楽器によって楽曲全体の音圧が大きい時間が違うのでintegrated loudnessだけで判断すること自体が間違っているのだろうと思った。

 

 

ここで要点になってくるのは

 

integrated Loudness(統合ラウドネス)という枠組みの妙

dBTP(true peak)というファクタについて

 

の二つ

 

まず、統合ラウドネスというのは楽曲全体の音圧を積算して出される値(平均値に近い考えかた)であり、同じ長さの楽曲なら音数が少ない曲や減衰の早い楽器が多い楽曲は必然的にこの値は下がる、

一方でロックやメタルなどバンドの音源は音圧が大きい楽器が混在しているためまともにミックスしていればラウドネス値はかなり高い状態になる

ここでintegrated loudness基準でマスターの音圧を決めてしまうとロックやメタルは小さい音量にせざるを得ない状態になる

この問題はリミッターによる音圧稼ぎとは無関係に起こる、つまり音圧が高くなること自体は何らまずいことではない。

 

世の中のラウドネスノーマライゼーション議論ではどんなジャンルのどんな音数の楽曲についての話かという重要な要素がほとんど登場せず、リミッターで音圧を稼ぐべきではないという話ばかりが先行していて結局核心部分を解決する意見は存在していないと感じた。

さらには、アップロードするマスター音源のラウドネスと、プラットフォームの再生の標準ラウドネスが混同されていることすらある気がした。

 

実態はストリーミング配信向けのマスター音源のラウドネスに制限はなく(もちろん-0db以内で)、ミックスマスタリングして自分の耳で納得したラウドネスのままマスター音源を書き出して構わないということであった。

 

 

もう一つ重要なファクタはdBTP(true peak)

これは別名IPS(インターサンプルピーク)と呼ばれ。サンプリングしたデジタルデータ間に存在する潜在的なピーク値のことだ。

サンプルピークが0dBFS以内であっても別のフォーマットや別のサンプリング周波数に変換(リサンプリング)する際サンプルとサンプルの間の数値を生成する処理において0dBFSを超えた値が発生してハードクリップする可能性がある訳だが、その計算結果のオーバーシュートを×4倍のオーバーサンプリングによって再現して数値化したのがトゥルーピークである、

リサンプリングはストリーミング配信やデジタル再生機器において避けられない処理である場合が多いのでdBTP(true peak)に配慮する必要が出てくる。

が、EDMのように低音がデカすぎて長い時間トゥルーピークの0dbを超えるようなことがない限りクリップの影響は顕在化しない気がします、特にバンドサウンドでは各楽器が倍音を多く出しているので瞬間的なクリップであればまったく影響がないように思います。

 

と、ここまで長々と色々書いてきましたが…

結論としてはシンプルで

特にバンドサウンドのマスタリングに於いては、トゥルーピークが0db~-1dbであればどんなラウドネスでもほぼ問題なく、リサンプリング後もサンプルピークが+3db以内に収まり歪みは気にならないおおよそ意図通りの迫力のある音源にすることができるというという経験則を得たのでした。