DAWのシェア

DAW Share

DAWのシェアを調べました。グローバルでは、Ableton Live、Logic Proが人気で、日本ではCubase、Studio Oneが人気であることがわかりました。

DAWのシェア

DAW Share
DAWのシェアをまとめました。2015年、2018年のask.audioのアンケート結果と、2016年、2017年のdtmstation.comのアンケート結果を元にしています。

DAWのTwitterフォロワー数

Twitter followers of DAW developers

DAWのTwitterアカウントのフォロワー数をまとめました。

DAWのTwitterアカウントがある場合はDAWのTwitterアカウントのフォロワー数、DAWのTwitterアカウントがなくて会社のTwitterアカウントがある場合は会社のTwitterアカウントのフォロワー数、どちらも無い場合は0をプロットしました。DAWのTwitterアカウントよりも会社のTwitterアカウントのほうがフォロワー数が多い傾向があるので、必ずしもフォロワーが多いから人気があるわけではないことに注意してください。

DAWのリリース年

Initial Release Date of DAW

DAWがリリースされた年をまとめました。

DAWの前身としてMidi Sequencerを作っていた会社が多いですが、その場合はMidi Sequencerのリリース年をリリース年としています。Digital PerformerはMidi Sequencerの前身として1984年に楽譜制作ソフト「Professional Composer」を作っていますが、これは初期リリースに含めていません。

DAWのシェア考察

日本ではCubaseとStudio Oneが人気

dtmstation.comのアンケート結果によると、日本ではCubaseとStudio Oneが人気があります。感覚的に日本ではCubaseとStudio Oneが多いと予想していましたが、そのとおりの結果が出ました。

グローバルではAbleton Liveが人気

ask.audioのアンケート結果によると、グローバルではAbleton Liveが人気があります。この結果は感覚的にピンと来なかったのですが、Twitterのフォロワー数やSimilarWebのデータも見た結果、確かにAbleton Liveは人気がありそうです。※ SimilarWebのデータは掲載していません。

なぜ日本とグローバルで人気DAWが異なるのか?

日本語対応の充実度や、日本マーケティングに注力しているかどうかが、グローバルと日本のDAWシェアの違いを作っている可能性があります。流行っている音楽の違いも原因の一つかもしれません。

Ableton Liveがグローバルで人気1位の理由

Ableton Liveを使ってみた

Ableton Liveがグローバルで人気1位の理由を探るために実際にAbleton Liveを使ってみました。

結果、Cubase、Studio One、FL Studioと比較して、大きい差は見つけられませんでした。パターンを配置できるところはFL Studioに近く、ピアノロールとミキサーはCubaseやStudio Oneに近いです。長く使わないと差がわからないのかもしれません。

Ableton Live体験版はこちら

Ableton Liveユーザーの声

Ableton Liveはオーディオが得意

Not the best when it comes to dealing with actual audio clips, as opposed to MIDI. Still very capable, but a little more scattered and convoluted than Ableton and Logic.

Honestly? I use FL because I torrented a copy in high school, and got used to the workflow. I did eventually buy a copy because I’m not a douche. I use ableton as well now, because it’s much better for working with audio clips and live performance.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Ableton LiveはFL Studioよりもオーディオが得意らしいです。

Ableton Liveは習得に時間がかかる

Ableton is a bit more expensive and might be more harder to learn, FL is less expensive and it’s lifetime + kind if beginner friendly at first.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Haha that’s the normal first reaction to opening Ableton — “wtf is this”

Source: https://www.reddit.com/r/WeAreTheMusicMakers/comments/82qf7i/which_daw_is_right_for_me/

Ableton Liveは習得に時間がかかるみたいです。

Ableton Liveは習得に時間がかからない

I really dislike the fact that people call FL beginner friendly compared to Ableton. Having used both for years, Ableton is so much easier to get into. Could be just me tho.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Ableton Liveは実は簡単に使えるという意見もあります。

Ableton Liveはヒップホップ制作に向いている

Now that being said….Ableton….w/Push 2 is the goat DAW if you are into sample based production…specifically chopping samples…real hip hoppy stuff. My beef with Ableton is its archaic windows 98 looking interface.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Ableton LiveをAbleton Push 2と一緒に使うと、ヒップホップ制作に良いみたいです。アメリカでヒップホップが流行っている流れを受けてAbleton Liveが流行っている可能性があります。

Ableton Liveのユーザーは優しい

Ableton user forums are generally quite helpful and the community will treat a newcomer with some respect. You better put on your bulletproof vest when using the FL Studio user forums because I’ve never seen that many arrogant pricks in one place in all my life! They’d rather ridicule you than answer your simple question (even the Image-Line employees!). Thankfully I know the software pretty well now so I avoid their forums at all costs.

Source: https://www.quora.com/Why-is-Ableton-Live-more-popular-than-FL-studio

Ableton LiveユーザーはFL Studioユーザーよりも優しいみたいです。

Ableton Liveはアーティストの成長を促す

What makes Ableton makes so good is number 1 its relationships with simple and complex ways of doing things, it has a germen quality about it t, in other words, the UI, the look and feel is very high, enabling high flow ie its easy to “waste” hours playing with sounds, there are crucial in becoming a better producer, a weekend playing and making sounds rather than “songs” is more valuable in learning, than a 6 month class (or do both)h.

Source: https://www.quora.com/Why-is-Ableton-Live-more-popular-than-FL-studio

Ableton Liveは自然と長く使ってしまうから、アーティストとして成長しやすいという意見があります。

トップアーティストが使っているDAW

もしあこがれのアーティストがAbleton Liveを使っていたら、Ableton Liveが流行るかもしれません。

Marshmello: Ableton Live, FL Studio, Logic Pro

こちらの情報によるとMarshmelloはAbleton Live、FL Studio、Logic Proを使っている可能性があります。

Travis Scott: FL Studio

こちらの情報によるとTravis ScottはFL Studioを使っている可能性があります。

その他アーティスト

こちらの情報によると、Calvin Harris、David Guetta、Armin van Buuren、Skrillex,Zeddは、Pro Tools、FL Studio、Ableton Live、Logic Pro、Cubase、Studio Oneを使っているみたいです。

参考文献

DAWのアンケート

https://ask.audio/articles/top-12-most-popular-daws-you-voted-for
https://ask.audio/articles/the-top-11-most-popular-daws-you-voted-for

アンケート結果

DAWのTwitter

Ableton Twitter: https://twitter.com/Ableton
Pro Tools Twitter: https://twitter.com/AvidProTools
Steinberg Twitter: https://twitter.com/steinbergmedia
FL Studio Twitter: https://twitter.com/fl_studio
PreSonus Twitter: https://twitter.com/presonus
Propellerhead Software Twitter: https://twitter.com/propellerheadsw
Cockos Twitter: https://twitter.com/cockos
Cakewalk Inc. Twitter: https://twitter.com/cakewalkinc
Bitwig Twitter: https://twitter.com/bitwig
MOTU Twitter: https://twitter.com/motutech

DAWのリリース年

Ableton Live Initial Release Date: https://en.wikipedia.org/wiki/Ableton_Live
Logic Pro Initial Release Date: https://en.wikipedia.org/wiki/Logic_Pro
Pro Tools Initial Release Date: https://en.wikipedia.org/wiki/Pro_Tools
Cubase Initial Release Date: https://en.wikipedia.org/wiki/Steinberg_Cubase
FL Studio Initial Release Date: https://en.wikipedia.org/wiki/FL_Studio
Studio One Initial Release Date: https://en.wikipedia.org/wiki/Studio_One_(audio_software)
Reason Initial Release Date: https://en.wikipedia.org/wiki/Reason_(software)
Reaper Initial Release Date: https://en.wikipedia.org/wiki/REAPER
Sonar Initial Release Date: https://en.wikipedia.org/wiki/Cakewalk_(sequencer)
Garage Band Initial Release Date: https://en.wikipedia.org/wiki/GarageBand
Bitwig Studio Initial Release Date: https://downloads-as.bitwig.com/stable/1.0.1/release-notes-1.0.1.html
Digital Performer Initial Release Date: https://en.wikipedia.org/wiki/Digital_Performer

まとめ

DAWのシェアを調べました。

グローバルと日本では人気DAWが異なることがわかりました。グローバルでは、Ableton Live、Logic Proが人気で、日本ではCubase、Studio Oneが人気です。その理由はいろいろ考えられますが、はっきりしたことはわかりませんでした。

メディア掲載情報

Earth

2018/12/20 “MusicTech”

MinusDelayがDVDに同梱されました。

“MusicTech Magazine Issue 190: Gear Of The Year 2018”

2018/12/11 “FINDERS”

音圧爆上げくんのスマートフォン版が紹介されました。

“全ての「スマホ動画クリエイター」に捧ぐ、音声自動マスタリングアプリ「音圧爆上げくん」”

2018/11/11 “gearnews.com”

MinusDelayが紹介されました。

“Best free plug-ins this week: Snare Designer, Minus Delay & DeEss”

2018/11/06 “Computer Music Japan”

ClearMixerが紹介されました。

“ワンタッチで自動的に帯域かぶりをけずるプラグイン、BAKUAGE「ClearMixer」リリース”

2018/10/28 “Computer Music Japan”

MinusDelayが紹介されました。

“【無料】発音タイミングを早めるプラグイン、Bakuage「MinusDelay」無償配布開始!”

ClearMixer v1.2.0をリリースしました。32トラックをサポート

ClearMixer

ClearMixer v1.2.0をリリースしました。トラック数を16トラックから32トラックに増やしました。

ClearMixerとは?

ClearMixerは、自動で楽器間のマスキングを減らす、VSTミキサープラグインです。干渉の少ないミックスをかんたんに行いたい方に最適です。

最新版ダウンロード

デモ版

製品版

製品版購入

※ アップデート方法: install.batを実行すればOKです。

※ 使い方は同梱のREADMEをご覧ください。

更新内容 (v1.2.0)

トラック数を16トラックから32トラックに増やしました。

32トラック版 (最新バージョン)

ClearMixer v1.2.0 32 Track ClearMixerSender v1.2.0 32 Track

16トラック版 (古いバージョン)

ClearMixer 16 Track

YouTube向けのラウドネス最適化オプションを追加しました

Estimated Weighting Curve Used for YouTube Loudness Normalization

YouTubeのラウドネスノーマライゼーション仕様に合わせて、音圧を最適化するためのオプションを、音圧爆上げくんのカスタムマスタリングに追加しました。

“目標音圧モード”オプション

目標音圧の基準計算方法を指定します。

target loudness mode option

ラウドネス (従来動作)

ITU-R BS.1770で定義されたラウドネスを目標音圧に合わせるようにリミッティングします。従来と同じ動作です。

YouTubeラウドネス

YouTubeラウドネスノーマライゼーションで使われているラウドネスの近似値を目標音圧に合わせるようにリミッティングします。近似計算式はYouTubeのラウドネスノーマライゼーションアルゴリズム調査に基づいて作られています。

調査によるとラウドネスノーマライゼーションの基準値は-10.3dBなので、実際の音圧は目標音圧から少し下がることを考慮して、目標音圧を-9dB程度に設定すると、ちょうどラウドネスノーマライゼーションが働くか働かないかのぎりぎりの音圧に設定できます。

YouTube向けにラウドネスを最適化するには?

こちらで追加された”Ceiling”オプションも合わせて、以下の設定でマスタリングすると、YouTube向けに最適化されたマスタリングを行えます。

“目標音圧モード”: “YouTubeラウドネス”

“目標音圧”: “-9dB”

“Ceiling モード”: “True Peak (15kHz Lowpass)”

“Ceiling”: “-0.5dB”

※ YouTubeラウドネスノーマライゼーションの基準値が-10.3dBに対して目標音圧が-9dBなのは、実際の音圧が目標音圧から少し下がるからです。

従来動作をさせるには?

以下の設定をすると従来動作をします。

“目標音圧基準”: “ラウドネス”

音圧爆上げくんに”Ceiling”オプションを追加しました

先日の音圧爆上げくんのアップデートで、Trueピーク(インターサンプルピーク)を基準にリミッティングするようにしましたが、用途によって普通のピークを基準にリミッティングしたい場合もあります。

そのための”Ceiling”オプションを音圧爆上げくんの”カスタムマスタリング”に追加しました。

“Ceiling”オプション

最大出力レベルを指定します。一般的なリミッターVSTプラグインのCeilingと同じものです。0dBFSが最大です。後の処理でエンコードが必要な場合は少し小さめの値にしておくと、エンコードによるクリッピングを予防できます。

“Ceiling モード”オプション

最大出力レベルの基準計算方法を指定します。一般的なリミッターVSTプラグインのオーバーサンプリングオプションやTrue Peak(インターサンプルピーク)オプションと同じものです。

Peak

Peakはいわゆる普通のピークで離散波形の振幅の最大値を基準とします。

True Peak

True Peakはインターサンプルピークで、離散波形を連続波形に変換した後の振幅の最大値を基準とします。

True Peak (15kHz Lowpass)

True Peak (15kHz Lowpass)は15kHzでローパスフィルタをかけた後のインターサンプルピークを基準とします。YouTubeの再エンコードによるピーク変化をシミュレーションできるので、YouTube用の音声を作る場合に最適です。

従来動作をさせるには?

以下のように設定すると従来と同じ動作をさせられます。

“Ceiling”: 0dBFS

“Ceiling モード”: “Peak”

音圧爆上げくんをアップデートしました

音圧爆上げくんをアップデートしました。

ワンタッチマスタリングの設定をなくしました

音圧爆上げくんをかんたんに使えるようにするために、ワンタッチマスタリングの設定をなくしました。低音を保存するオプションや、動画タイトルオプションを使う場合は、カスタムマスタリングをご利用ください。

ワンタッチマスタリングの目標音圧を下げました

YouTube動画など幅広い用途で無難なマスタリングができるように、ワンタッチマスタリングの目標音圧を-9dBに下げました。

高音圧を求める方はカスタムマスタリングをご利用ください。

使用頻度の少ない機能を削除しました

「奥行きをプラスする」機能と「やさ上げ」機能を削除しました。もし必要であれば復活させるので教えてください。

プリセットマスタリングをカスタムマスタリングに統合しました

UIをシンプルにするためにプリセットマスタリングをカスタムマスタリングに統合しました。

「YouTubeラウドネス補正」指標を追加しました

「YouTubeラウドネス補正」指標は、YouTubeにアップロードしたときに、ラウドネスノーマライゼーションによってラウドネスがどのくらい補正されるかの予測値です。

YouTubeにアップロードする場合はこの値が小さくなりすぎないようにすると良いです。

こちらの調査結果を元に計算しています。

「Trueピーク」指標を追加しました

「Trueピーク」指標は、インターサンプルピークです。

「Trueピーク (15kHzローパス)」指標は、15kHzのローパスフィルタをかけた後の波形のインターサンプルピークです。

YouTubeなど一部の動画プラットフォームではアップロードした動画の再エンコードが行われます。その際に波形が変化します。特に影響が大きいのは再エンコードのときに適用されるローパスフィルタです。

こちらによると、YouTubeの再エンコードで適用されるローパスフィルタのカットオフ周波数は15.1kHz, 15.8kHz, 18kHz, 20kHzです。

「Trueピーク (15kHzローパス)」指標が0dBFS以下であれば、YouTubeにアップロードしたときにクリッピングする可能性は少ないはずです。

ピークにヘッドルームをもたせるようにしました

今まではマスタリング後の音源のピークを0dBFSに合わせていましたが、それだと音源の再エンコード時にクリッピングが発生しやすいです。

クリッピングを気にせずに音源を扱えたほうが便利なので、ピークに少し余裕をもたせるようにしました。具体的には、「Trueピーク (15kHzローパス)」が-0.5dBFS以下になるようにしています。

Shazamとは? – 曲を検索できるアプリ

曲を検索できるアプリ”Shazam”についてご紹介します。

Shazamとは?

マイクから拾った音で曲を検索できるアプリです。

Shazamをインストール

以下のリンクからインストール可能です。

 

Shazamの使い方

Shazamを起動すると以下の画面になります。

Shazam

中央のボタンをタップすると以下の画面になり、マイクから音を拾い、曲を検索します。

Shazam Detect

しばらく待つと曲が特定されます。

以上が基本的な使い方です。他に、My Shazamをタップし、過去に検索した曲の履歴を見ることも可能です。

Shazamの原理

以下によると、ShazamはAcoustic fingerprintという技術で実装されているみたいです。

Robust Landmark-Based Audio Fingerprinting

Acoustic fingerprint – Wikipedia

まとめ

曲を検索できるアプリ”Shazam”をご紹介しました。

日本のYouTube動画の音圧を分析しました

Japanese YouTube Loudness Histogram

日本のYouTube動画の音圧を分析しました。

YouTubeでは、ラウドネスノーマライゼーションが導入されています。YouTubeのラウドネスノーマライゼーションは、音圧が大きすぎる動画の音量を下げますが、音圧が小さすぎる動画の音量は上げません。

仮に、YouTubeに音圧が小さすぎる動画がたくさんあるとしたら、音質を損なわない範囲で音圧を上げることで、YouTube上で再生される音量を大きくできる可能性があります。

Question

YouTubeに音圧が小さすぎる動画はどのくらいあるのか?

前述の通りです。

YouTube動画の長さが長いと音圧は下がるのか?

長さが長くなると、偶然、波形のピークが大きくなる確率が高まります。リミッターを使っていれば、それらのピークを抑えられますが、リミッターを使っていない場合、長さが長くなるほど音圧が小さくなる可能性があります。

このことから、長さとラウドネスの関係を調べれば、リミッターが使われているかどうかを判断する材料になりそうです。長さとラウドネスに関係する要素は他にもあるので、これだけで判断はできませんが、一旦、長さと音圧の関係を調べてみます。

分析対象動画

A. 日本のトップYouTuber

「はじめしゃちょー(hajime)」チャンネルのほとんど全ての動画

B. 日本の音楽チャンネル

「Lantis Channel」チャンネルのほとんど全ての動画

C. 日本のTV局チャンネル

「AbemaTV公式 YouTube」チャンネルのほとんど全ての動画

※ 2018/12/08以前の動画

※ ほとんど全ての動画というのは解析に失敗したものがあるから

※ 動画一覧はAppendixに記載

分析指標

ラウドネス

音圧を表す指標です。ITU-R BS.1770-3で計算しました。

ラウドネスレンジ

ダイナミックレンジを表す指標です。EBU TECH 3342の窓長とオーバーラップ長を変更し計算しました。窓長0.4秒、オーバーラップ長0.3秒。

分析結果

ラウドネス

ラウドネス ヒストグラム

Japanese YouTube Loudness Histogram

ラウドネス 累積密度分布

Japanese YouTube Loudness CDF

ラウドネス 時系列

Japanese YouTube Loudness Time series

ラウドネスレンジ

ラウドネスレンジ ヒストグラム

Japanese YouTube Loudness Range Histogram

ラウドネスレンジ 累積密度分布

Japanese YouTube Loudness Range CDF

ラウドネスレンジ 時系列

Japanese YouTube Loudness Range Time Series

ラウドネスとラウドネスレンジの関係

ラウドネスvsラウドネスレンジ 散布図

YouTube Loudness vs Loudness Range

ラウドネスvsラウドネス 平均と標準偏差

Japanese YouTube Loudness vs Loudness Range error bar

長さ

長さ ヒストグラム

Japanese YouTube Length Histogram

長さ 累積密度分布

Japanese YouTube Length CDF

長さ 時系列

Japanese YouTube Length Time series

長さとラウドネスとの関係

長さvsラウドネス 散布図

Japanese YouTube Length vs Loudness

長さvsラウドネス 平均と標準偏差

Japanese YouTube Length vs Loudness error bar

考察

YouTubeに音圧が小さすぎる動画はどのくらいあるのか?

「ラウドネス 累積密度分布」を見ると、「ランティス」以外は、90%以上の動画のラウドネスが-14dB以下です。

今回使ったラウドネス計算式は、YouTubeのものと異なるので、これ以上はラウドネスノーマライゼーションがかかるというラインは示せませんが、こちらを参考にすると、-14dBは十分小さいと思うので、Lantis以外は音圧を上げれば、YouTube上で再生したときの音量が上がる可能性がありそうです。

YouTube動画の長さが長いと音圧は下がるのか?

「ラウドネスvs長さ 平均と標準偏差」によると、そのような事実はなさそうです。

Appendix

日本のYouTube動画分析結果 (tsv)

まとめ

日本のYouTube動画の音圧を分析しました。

「はるあん」はラウドネスノーマライゼーションに完全準拠したYouTuber!?

はるあん」は、ラウドネスノーマライゼーション完全準拠したYouTuberかもしれません。

ラウドネスノーマライゼーション完全準拠YouTuberとは?

YouTubeのラウドネスノーマライゼーション仕様を理解し、うまく利用しているYouTuberのことです。

ラウドネスノーマライゼーションとは?

YouTubeが自動的に動画間の音量を揃える機能です。

YouTube動画の右クリックメニューから“詳細統計情報”を見たことはありますか?

youtube video stats

この中の“Content loudness”に注目してください。この値は、YouTubeがラウドネスノーマライゼーションを行うときに基準にする値です。

“Content loudness”がプラスだとYouTubeによって音量が下げられます。マイナスだと音量はそのままです。

音に関する2つの事実

ラウドネスノーマライゼーションをうまく利用するには、以下の2つの事実が重要です。

A. 音圧と音質はトレードオフの関係にある

B. 音量が大きいほど良い音に聴こえる

ラウドネスノーマライゼーションをうまく利用する方法

YouTubeでは、ラウドネスノーマライゼーションがはたらくので、音圧をあげても音量が上がらなくなるポイントがあります。前述の”Content loudness”が0になるポイントです。

音圧と音質はトレードオフの関係にあるので、YouTubeで”Content loudness”が0以上になるように音圧を上げると、音量が上がらないので、音量が大きいほど良い音に聴こえる効果を得られずに、音質だけ下がります

なので、YouTubeに動画を上げるときの最適解は、“Content loudness”を0付近、または0以下にすることです。

はるあん動画の”Content loudness”

最近のはるあんの動画の”Content loudness”を見てみてください。どの動画も0dB付近にあると思います。

2018/12/02の動画 (“Content loudness” 0.0dB)

2018/09/23の動画 (“Content loudness” 0.0dB)

つまり、はるあんの動画は、YouTubeにおいて音圧と音質を最大限両立しているということです。意図せずこうなることは珍しいので、意図して行っているかもしれません。

しかし、少し前の動画では、“Content loudness”が0dBから乖離しています。

2018/05/25の動画 (“Content loudness” -1.7dB)

2017/11/12の動画 (“Content loudness” -8.5dB)

最近、ラウドネスノーマライゼーションに対応したのかもしれません。

まとめ

YouTuber「はるあん」がラウドネスノーマライゼーションに完全準拠しているかもしれない、という記事でした。

YouTuber用途やニュース用途であれば、YouTubeのラウドネスノーマライゼーション基準は十分低いので、今後、SEOのように対応するのが当たり前になるかもしれません。

YouTubeのラウドネスノーマライゼーションアルゴリズム

Estimated Weighting Curve Used for YouTube Loudness Normalization

YouTubeに最高音質の動画を上げるためには、YouTubeのラウドネスノーマライゼーション仕様を知る必要があります。

しかし、YouTubeのラウドネスノーマライゼーション仕様は公開されていません。すでに調査されている方もいますが、具体的な計算式まではわかっていません。

YouTubeのラウドネスノーマライゼーションの計算式を推定してみました。

YouTubeのラウドネスノーマライゼーション仕様

以下が調査結果のサマリーです。

ラウドネスノーマライゼーションは、ピークがクリッピングしない範囲で、できるだけ音源のラウドネスをラウドネス目標値に合わせる形で、行われる。

音源のラウドネスは、独自の仕様で計算されるが、EBU TECH 3341のShort-term loudnessのWeighting Curveを以下のものに差し替えて、Short-term loudnessの最大値を取ることで、1dB程度の精度で近似できる。

Estimated Weighting Curve Used for YouTube Loudness Normalization

調査方針

YouTubeのラウドネスノーマライゼーションの大枠の仕組みと、ラウドネス計算の詳細に分けて調査します。

YouTubeのラウドネスノーマライゼーションの大枠

こちらに参考にすると、おそらく以下のようになっていると思います。

YouTubeのラウドネスノーマライゼーションは、ピークがクリッピングしない範囲で、できるだけ音源のラウドネスをラウドネス目標値に合わせる形で行われる。式で書くと以下になります。

Compensation (dB) = Min(-Peak, Target – Loudness)

Peakは音源のピーク、Loudnessは音源のラウドネス、Targetは定数でラウドネス目標値、Compensationは補正ゲインを表します。全体の音量がCompensationの分だけ均一に変化します。

YouTube動画を右クリックし、詳細統計情報から見られるContent Loudnessは、Loudness – Targetに相当します。

YouTubeのラウドネス計算式

YouTubeのラウドネス計算式は、独自のものが使われているみたいです。なので、推測する必要があります。

ITU-R BS.1770-3を参考にし、以下のようなモデルを考えます。

イコライザー -> 窓で切り出し -> LUFSに変換 -> Gating -> Aggregation

イコライザー

イコライザーで周波数ごとに重み付けをします。

事前の実験で、ITU-R BS.1770-3で採用されているK-weightingや、その他のポピュラーなweightingが当てはまらなかったので、直接周波数特性を推定します。

窓で切り出し

波形をRect窓で切り出します。

窓長とオーバーラップ率がパラメータです。

参考に、ITU-R BS.1770-3とEBU TECH 3341のmomentaryとintegratedのパラメータは、窓長が400ms、オーバーラップ長が100ms(オーバーラップ率は75%)です。EBU TECH 3341のshort-term loudnessパラメータは、窓長が3秒、オーバーラップ長が2.9秒以上(オーバーラップ率は96.7%以上)です。

LUFSに変換

切り出した波形のRMSを計算し、Log10(RMS)でLUFSに変換します。

ステレオの1000Hz正弦波で0になるように補正もかけます。ITU-R BS.1770-3の場合の補正量は-0.691dBです。

Gating

ラウドネスに対する無音時間の影響をへらすために、切り出して得られた複数のRMS値の中で、音の小さいものを捨てます。

ITU-R BS.1770-3とEBU TECH 3342を参考にし、Absolute threshold gatingと、Relative threshold gatingを行います。

パラメータはそれぞれのThreshold値です。Gatingをしないパターンも試します。

参考に、ITU-R BS.1770-3とEBU TECH 3341のパラメータは、Absolute Thresholdが-70LKFS、Relative Thresholdが-10dBです。EBU TECH 3342のLoudness Range計算用のパラメータは、Absolute Thresholdが-70LKFS、Relative Thresholdが-20dBです。

Aggregation

Gatingで残った複数のRMS値の平均、または、最大値を取ります。

ITU-R BS.1770-3では平均を取りますが、こちらによると、Short-termの最大値を使っている可能性があるみたいです。

パラメータ推定に使うテスト動画

ラウドネス計算モデルのパラメータを推定するためのテスト動画を用意します。

こちらによると、ラウドネスノーマライゼーションは、ある程度の再生数が無いと適用されなかったり、投稿してからある程度時間が経たないと適用されなかったりする可能性があるらしいです。自前でテスト動画を用意せずに、十分な再生数があり、投稿してから十分な時間が経っている既存の動画をいくつか選び、テスト動画とします。

テスト動画の一覧はAppendixに記載しました。

イコライザーパラメータ推定

音量が一定の正弦波テスト動画を使うと、ラウドネスに対するイコライザー以外の影響を排除できます。これを使って、まずはイコライザーの周波数特性を推定します。

様々な周波数の正弦波音源に対して、YouTube上のContent Loudnessを計測し、音源のRMSとの差分を取ることで、周波数特性を推定します。推定結果は以下です。詳細なデータはAppendixをご覧ください。

Estimated Weighting Curve Used for YouTube Loudness Normalization

16kHz以上は、同じ周波数でも動画によって結果が異なるなど、結果が不安定だったので、以降の議論では、15kHz以下のデータのみ使います。44Hz以下と15kHz以上は、線形補間で外挿します。

イコライザー以外のパラメータ推定

次に、イコライザーの周波数特性を固定し、イコライザー以外のパラメータを推定します。

さまざまなパラメータでさまざまな動画のラウドネスを計算します。YouTubeが計算するラウドネス(Content Loudess)と比較し、誤差がもっとも少ないパラメータを探します。テスト動画一覧はAppendixに記載しました。

パラメータ一覧

パラメータ
窓長400ms, 3sec
オーバーラップ率75%, 96.7%
Absolute thresholdなし、-70LKFS
Relative thresholdなし、-10dB, -20dB
Aggregationmean, max

結果一覧

ParametersEstimated Target (LUFS)Error Stddev (dB)Error Max (dB)
abs threshold none, rel threshold none, window 0.4sec, overlap 75%, mean-16.154494085.5125536210.73290254
abs threshold none, rel threshold none, window 3sec, overlap 96.7%, mean-14.976814844.90827864611.91484089
abs threshold none, rel threshold -10dB, window 0.4sec, overlap 75%, mean-13.949879233.9543709897.389401665
abs threshold none, rel threshold -10dB, window 3sec, overlap 96.7%, mean-13.686847213.6840072747.647167492
abs threshold none, rel threshold -20dB, window 0.4sec, overlap 75%, mean-14.498314374.5312554069.145055115
abs threshold none, rel threshold -20dB, window 3sec, overlap 96.7%, mean-14.016606914.0487230579.667181199
abs threshold -70LUFS, rel threshold none, window 0.4sec, overlap 75%, mean-16.154494085.5125536210.73290254
abs threshold -70LUFS, rel threshold none, window 3sec, overlap 96.7%, mean-14.976814844.90827864611.91484089
abs threshold -70LUFS, rel threshold -10dB, window 0.4sec, overlap 75%, mean-13.892175143.9115433187.447105751
abs threshold -70LUFS, rel threshold -10dB, window 3sec, overlap 96.7%, mean-13.665658633.6660259727.668356069
abs threshold -70LUFS, rel threshold -20dB, window 0.4sec, overlap 75%, mean-14.471706544.523919589.171662946
abs threshold -70LUFS, rel threshold -20dB, window 3sec, overlap 96.7%, mean-14.005124264.0383895339.678663846
abs threshold none, rel threshold none, window 0.4sec, overlap 75%, max-8.9937215021.1069610212.968119771
abs threshold none, rel threshold none, window 3sec, overlap 96.7%, max-10.312464140.901435591.746039964
ITU-R BS.1770-3-10.3931764511.0314121233.14216451
RMS-13.0300789610.175618429.41685531

誤差がもっとも少ないパラメータの組み合わせは、窓長3秒、オーバーラップ率96.7%、Max Aggregationで、誤差の標準偏差は0.9dB、最大誤差は1.7dBでした。EBU TECH 3341のShort-term loudnessの最大値ですね。ラウドネス目標値は-10.3LUFSです。

以上で、YouTubeのラウドネス計算方法を推定できました。

Appendix

イコライザーパラメータ測定結果 (tsv)

イコライザー以外のパラメータ推定用データ (tsv)

参考文献

ITU-R BS.1770-3

EBU TECH 3341

EBU TECH 3342

Youtubeのラウドネスノーマライゼーションを検証してみた。

変更履歴

2018/12/09 計算ミスを修正しました (最新版)

2018/12/07 初版

まとめ

YouTubeのラウドネスノーマライゼーションの計算式を調べました。1dB程度の精度で近似できる式を見つけました。