PhonicMind – 音源からボーカルを抽出/除去できるオンラインサービス

PhonicMindという、音源からボーカルだけを抽出/除去できるオンラインサービスと、その他の類似ソフトウェア/サービスについてご紹介します。

PhonicMindとは?

PhonicMindは、2-mix音源から自動でボーカルを抽出/除去できるオンラインサービスです。

音源をアップロードすると、音源からボーカルだけを抜き出した音源と、ボーカルだけを取り除いた音源の二つの音源をダウンロードできます。

PhonicMind公式サイト

PhonicMindの評判

以下のリンク先の反応を見ると、PhonicMindの評判は良いみたいです。

PhonicMind, a vocal remover that actually works when it comes to isolating the vocals. HIGHLY RECOMMENDED! from makingvaporwave

Has anyone tried PhonicMind? from IsolatedVocals

PhonicMindの仕組み

PhonicMindは、ディープニューラルネットを使っているみたいです。

PhonicMind’s vocal remover uses deep neural networks to do vocal elimination.

Source: https://phonicmind.com/faq/

その他のボーカル除去/抽出ソフトウェア

Vocal Remover ( vocalremover.org )

VocalRemoverは、PhonicMindと同様、2-mix音源から自動でボーカルを除去/抽出できるオンラインサービスです。

左メニューの”Vocal Remover”からボーカル除去、”Vocal Extractor”からボーカル抽出を行えます。

Vocal Remover

試してみたところ、帯域がボーカルに近く、定位が中央にある音はボーカルと一緒に抽出されてしまいます。また、ボーカル除去はリバーブ成分が残っています。

推測ですが、定位、周波数帯域、トランジェントの情報を使ってボーカルを抽出するような伝統的な手法を使っていると思います。

VocalRemover ( vocalremover.com )

VocalRemoverは、PhonicMindと同様、2-mix音源から自動でボーカルを除去/抽出できるオンラインサービスです。

VocalRemover

試してみたところ、vocalremover.orgよりも品質が高いです。ボーカル除去後のリバーブ成分も弱いです。PhonicMindと同じくらいのクオリティに感じました。

Lakeside Audio Isola Pro FX

Lakeside Audio Isola Pro FXは、2-mix音源から半自動で様々な楽器を抽出できるVSTプラグインです。

Lakeside Audio Isola Pro FX

Midiでヒントを与える”MIDIモード”と、周波数帯域を指定する自動モードがあり、”MIDIモード”のほうが品質が高いらしいです。VSTなのでリアルタイムで処理できます。

PhonicMindとLakeside Audio Isola Prox FXの比較動画です。少しアーティファクトが出ていますが、PhonicMindと同じくらいのクオリティに感じました。

iZotope RX7

iZotope RX7は、音楽制作とポストプロダクションの両方に対応した、2-mix音源を修復したり調整したりするためのスタンドアロンソフトウェアです。

iZotope RX7

iZotope RXは2007年に初期バージョンが発表され、2018年のRX7のリリースで、2-mix音源からボーカル、ベース、打楽器などを自動抽出し、音量を再調整する機能が追加されました。

以下の情報によると、音源分離アルゴリズムにニューラルネットを使っているみたいです。

The evolution of our intelligent audio technology continues with the Music Rebalance module in RX 7. Music Rebalance is a new tool that gives users the ability to boost, attenuate, or even isolate musical elements from audio recordings. It is a natural progression of our neural network-based source separation technology, first introduced in the forms of Dialogue Isolate and De-rustle in RX 6 and now evolved to extract multiple musical components from complex mixes.

Source: https://www.izotope.com/en/blog/music-production/exploring-the-technology-that-makes-rx-7-music-rebalance-possible.html

Audionamix XTRAX STEMS

Audionamix XTRAX STEMSは、2-mix音源をボーカル、ドラム、それ以外の楽器の3つに全自動で分離するスタンドアロンソフトウェアです。

Audionamix XTRAX STEMS

こちらの情報によると、ニューラルネットを使っていて、ADX TRAXより優れているらしいです。

Audionamix ADX TRAX

Audionamix ADX TRAXは、ボーカルを抽出するスタンドアロンソフトウェアです。ボーカル抽出に特化しています。PhonicMindなどと違い、スペクトラムを見ながら手動で微調整できます。

Audionamix ADX TRAX

BlueLab REBALANCE

BlueLab REBALANCEは、2-mix音源をボーカル、ベース、ドラム、それ以外の楽器の4つに分け、それぞれの音量を調整できるVSTです。2019年1月リリースです。VSTなのでリアルタイムで処理できることが特徴です。

試したところ、PhonicMindよりも低クオリティでした。推測ですが、伝統的なアルゴリズムを使っていると思います。

BlueLab REBALANCE

どのボーカル除去/抽出サービスを使えば良い?

カラオケ音源を作りたい

PhonicMindか、VocalRemoverが良いと思います。

ウェブサービスなので、ソフトウェアのインストールなどの手間が不要だからです。

耳コピ(トランスクリプション)したい

Lakeside Audio Isola Pro FXか、iZotope RX7か、Audionamix XTRAX STEMSが良いと思います。

ボーカル以外の楽器も抽出可能だからです。この中のどれが良いかは使っていないのでわかりません。

まとめ

PhonicMindを代表とする、ボーカルを抽出したり除去したりするためのソフトウェア/サービスについてご紹介しました。

DAWのシェア

DAW Share

DAWのシェアを調べました。グローバルでは、Ableton Live、Logic Proが人気で、日本ではCubase、Studio Oneが人気であることがわかりました。

DAWのシェア

DAW Share
DAWのシェアをまとめました。2015年、2018年のask.audioのアンケート結果と、2016年、2017年のdtmstation.comのアンケート結果を元にしています。

DAWのTwitterフォロワー数

Twitter followers of DAW developers

DAWのTwitterアカウントのフォロワー数をまとめました。

DAWのTwitterアカウントがある場合はDAWのTwitterアカウントのフォロワー数、DAWのTwitterアカウントがなくて会社のTwitterアカウントがある場合は会社のTwitterアカウントのフォロワー数、どちらも無い場合は0をプロットしました。DAWのTwitterアカウントよりも会社のTwitterアカウントのほうがフォロワー数が多い傾向があるので、必ずしもフォロワーが多いから人気があるわけではないことに注意してください。

DAWのリリース年

Initial Release Date of DAW

DAWがリリースされた年をまとめました。

DAWの前身としてMidi Sequencerを作っていた会社が多いですが、その場合はMidi Sequencerのリリース年をリリース年としています。Digital PerformerはMidi Sequencerの前身として1984年に楽譜制作ソフト「Professional Composer」を作っていますが、これは初期リリースに含めていません。

DAWのシェア考察

日本ではCubaseとStudio Oneが人気

dtmstation.comのアンケート結果によると、日本ではCubaseとStudio Oneが人気があります。感覚的に日本ではCubaseとStudio Oneが多いと予想していましたが、そのとおりの結果が出ました。

グローバルではAbleton Liveが人気

ask.audioのアンケート結果によると、グローバルではAbleton Liveが人気があります。この結果は感覚的にピンと来なかったのですが、Twitterのフォロワー数やSimilarWebのデータも見た結果、確かにAbleton Liveは人気がありそうです。※ SimilarWebのデータは掲載していません。

なぜ日本とグローバルで人気DAWが異なるのか?

日本語対応の充実度や、日本マーケティングに注力しているかどうかが、グローバルと日本のDAWシェアの違いを作っている可能性があります。流行っている音楽の違いも原因の一つかもしれません。

Ableton Liveがグローバルで人気1位の理由

Ableton Liveを使ってみた

Ableton Liveがグローバルで人気1位の理由を探るために実際にAbleton Liveを使ってみました。

結果、Cubase、Studio One、FL Studioと比較して、大きい差は見つけられませんでした。パターンを配置できるところはFL Studioに近く、ピアノロールとミキサーはCubaseやStudio Oneに近いです。長く使わないと差がわからないのかもしれません。

Ableton Live体験版はこちら

Ableton Liveユーザーの声

Ableton Liveはオーディオが得意

Not the best when it comes to dealing with actual audio clips, as opposed to MIDI. Still very capable, but a little more scattered and convoluted than Ableton and Logic.

Honestly? I use FL because I torrented a copy in high school, and got used to the workflow. I did eventually buy a copy because I’m not a douche. I use ableton as well now, because it’s much better for working with audio clips and live performance.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Ableton LiveはFL Studioよりもオーディオが得意らしいです。

Ableton Liveは習得に時間がかかる

Ableton is a bit more expensive and might be more harder to learn, FL is less expensive and it’s lifetime + kind if beginner friendly at first.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Haha that’s the normal first reaction to opening Ableton — “wtf is this”

Source: https://www.reddit.com/r/WeAreTheMusicMakers/comments/82qf7i/which_daw_is_right_for_me/

Ableton Liveは習得に時間がかかるみたいです。

Ableton Liveは習得に時間がかからない

I really dislike the fact that people call FL beginner friendly compared to Ableton. Having used both for years, Ableton is so much easier to get into. Could be just me tho.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Ableton Liveは実は簡単に使えるという意見もあります。

Ableton Liveはヒップホップ制作に向いている

Now that being said….Ableton….w/Push 2 is the goat DAW if you are into sample based production…specifically chopping samples…real hip hoppy stuff. My beef with Ableton is its archaic windows 98 looking interface.

Source: https://www.reddit.com/r/edmproduction/comments/6lp1ix/what_daw_do_you_use_and_why/

Ableton LiveをAbleton Push 2と一緒に使うと、ヒップホップ制作に良いみたいです。アメリカでヒップホップが流行っている流れを受けてAbleton Liveが流行っている可能性があります。

Ableton Liveのユーザーは優しい

Ableton user forums are generally quite helpful and the community will treat a newcomer with some respect. You better put on your bulletproof vest when using the FL Studio user forums because I’ve never seen that many arrogant pricks in one place in all my life! They’d rather ridicule you than answer your simple question (even the Image-Line employees!). Thankfully I know the software pretty well now so I avoid their forums at all costs.

Source: https://www.quora.com/Why-is-Ableton-Live-more-popular-than-FL-studio

Ableton LiveユーザーはFL Studioユーザーよりも優しいみたいです。

Ableton Liveはアーティストの成長を促す

What makes Ableton makes so good is number 1 its relationships with simple and complex ways of doing things, it has a germen quality about it t, in other words, the UI, the look and feel is very high, enabling high flow ie its easy to “waste” hours playing with sounds, there are crucial in becoming a better producer, a weekend playing and making sounds rather than “songs” is more valuable in learning, than a 6 month class (or do both)h.

Source: https://www.quora.com/Why-is-Ableton-Live-more-popular-than-FL-studio

Ableton Liveは自然と長く使ってしまうから、アーティストとして成長しやすいという意見があります。

トップアーティストが使っているDAW

もしあこがれのアーティストがAbleton Liveを使っていたら、Ableton Liveが流行るかもしれません。

Marshmello: Ableton Live, FL Studio, Logic Pro

こちらの情報によるとMarshmelloはAbleton Live、FL Studio、Logic Proを使っている可能性があります。

Travis Scott: FL Studio

こちらの情報によるとTravis ScottはFL Studioを使っている可能性があります。

その他アーティスト

こちらの情報によると、Calvin Harris、David Guetta、Armin van Buuren、Skrillex,Zeddは、Pro Tools、FL Studio、Ableton Live、Logic Pro、Cubase、Studio Oneを使っているみたいです。

参考文献

DAWのアンケート

https://ask.audio/articles/top-12-most-popular-daws-you-voted-for
https://ask.audio/articles/the-top-11-most-popular-daws-you-voted-for

アンケート結果

DAWのTwitter

Ableton Twitter: https://twitter.com/Ableton
Pro Tools Twitter: https://twitter.com/AvidProTools
Steinberg Twitter: https://twitter.com/steinbergmedia
FL Studio Twitter: https://twitter.com/fl_studio
PreSonus Twitter: https://twitter.com/presonus
Propellerhead Software Twitter: https://twitter.com/propellerheadsw
Cockos Twitter: https://twitter.com/cockos
Cakewalk Inc. Twitter: https://twitter.com/cakewalkinc
Bitwig Twitter: https://twitter.com/bitwig
MOTU Twitter: https://twitter.com/motutech

DAWのリリース年

Ableton Live Initial Release Date: https://en.wikipedia.org/wiki/Ableton_Live
Logic Pro Initial Release Date: https://en.wikipedia.org/wiki/Logic_Pro
Pro Tools Initial Release Date: https://en.wikipedia.org/wiki/Pro_Tools
Cubase Initial Release Date: https://en.wikipedia.org/wiki/Steinberg_Cubase
FL Studio Initial Release Date: https://en.wikipedia.org/wiki/FL_Studio
Studio One Initial Release Date: https://en.wikipedia.org/wiki/Studio_One_(audio_software)
Reason Initial Release Date: https://en.wikipedia.org/wiki/Reason_(software)
Reaper Initial Release Date: https://en.wikipedia.org/wiki/REAPER
Sonar Initial Release Date: https://en.wikipedia.org/wiki/Cakewalk_(sequencer)
Garage Band Initial Release Date: https://en.wikipedia.org/wiki/GarageBand
Bitwig Studio Initial Release Date: https://downloads-as.bitwig.com/stable/1.0.1/release-notes-1.0.1.html
Digital Performer Initial Release Date: https://en.wikipedia.org/wiki/Digital_Performer

まとめ

DAWのシェアを調べました。

グローバルと日本では人気DAWが異なることがわかりました。グローバルでは、Ableton Live、Logic Proが人気で、日本ではCubase、Studio Oneが人気です。その理由はいろいろ考えられますが、はっきりしたことはわかりませんでした。

メディア掲載情報

Earth

2018/12/20 “MusicTech”

MinusDelayがDVDに同梱されました。

“MusicTech Magazine Issue 190: Gear Of The Year 2018”

2018/12/11 “FINDERS”

音圧爆上げくんのスマートフォン版が紹介されました。

“全ての「スマホ動画クリエイター」に捧ぐ、音声自動マスタリングアプリ「音圧爆上げくん」”

2018/11/11 “gearnews.com”

MinusDelayが紹介されました。

“Best free plug-ins this week: Snare Designer, Minus Delay & DeEss”

2018/11/06 “Computer Music Japan”

ClearMixerが紹介されました。

“ワンタッチで自動的に帯域かぶりをけずるプラグイン、BAKUAGE「ClearMixer」リリース”

2018/10/28 “Computer Music Japan”

MinusDelayが紹介されました。

“【無料】発音タイミングを早めるプラグイン、Bakuage「MinusDelay」無償配布開始!”

ClearMixer v1.2.0をリリースしました。32トラックをサポート

ClearMixer v1.2.0をリリースしました。トラック数を16トラックから32トラックに増やしました。

ClearMixerとは?

ClearMixerは、自動で楽器間のマスキングを減らす、VSTミキサープラグインです。干渉の少ないミックスをかんたんに行いたい方に最適です。

最新版ダウンロード

デモ版

製品版

製品版購入

※ アップデート方法: install.batを実行すればOKです。

※ 使い方は同梱のREADMEをご覧ください。

更新内容 (v1.2.0)

トラック数を16トラックから32トラックに増やしました。

32トラック版 (最新バージョン)

ClearMixer v1.2.0 32 Track ClearMixerSender v1.2.0 32 Track

16トラック版 (古いバージョン)

ClearMixer 16 Track

YouTube向けのラウドネス最適化オプションを追加しました

Estimated Weighting Curve Used for YouTube Loudness Normalization

YouTubeのラウドネスノーマライゼーション仕様に合わせて、音圧を最適化するためのオプションを、音圧爆上げくんのカスタムマスタリングに追加しました。

“目標音圧モード”オプション

目標音圧の基準計算方法を指定します。

target loudness mode option

ラウドネス (従来動作)

ITU-R BS.1770で定義されたラウドネスを目標音圧に合わせるようにリミッティングします。従来と同じ動作です。

YouTubeラウドネス

YouTubeラウドネスノーマライゼーションで使われているラウドネスの近似値を目標音圧に合わせるようにリミッティングします。近似計算式はこちらの調査結果に基づいて作られています。

調査によるとラウドネスノーマライゼーションの基準値は-10.3dBなので、実際の音圧は目標音圧から少し下がることを考慮して、目標音圧を-9dB程度に設定すると、ちょうどラウドネスノーマライゼーションが働くか働かないかのぎりぎりの音圧に設定できます。

YouTube向けにラウドネスを最適化するには?

こちらで追加された”Ceiling”オプションも合わせて、以下の設定でマスタリングすると、YouTube向けに最適化されたマスタリングを行えます。

“目標音圧モード”: “YouTubeラウドネス”

“目標音圧”: “-9dB”

“Ceiling モード”: “True Peak (15kHz Lowpass)”

“Ceiling”: “-0.5dB”

※ YouTubeラウドネスノーマライゼーションの基準値が-10.3dBに対して目標音圧が-9dBなのは、実際の音圧が目標音圧から少し下がるからです。

従来動作をさせるには?

以下の設定をすると従来動作をします。

“目標音圧基準”: “ラウドネス”

音圧爆上げくんに”Ceiling”オプションを追加しました

先日の音圧爆上げくんのアップデートで、Trueピーク(インターサンプルピーク)を基準にリミッティングするようにしましたが、用途によって普通のピークを基準にリミッティングしたい場合もあります。

そのための”Ceiling”オプションを音圧爆上げくんの”カスタムマスタリング”に追加しました。

“Ceiling”オプション

最大出力レベルを指定します。一般的なリミッターVSTプラグインのCeilingと同じものです。0dBFSが最大です。後の処理でエンコードが必要な場合は少し小さめの値にしておくと、エンコードによるクリッピングを予防できます。

“Ceiling モード”オプション

最大出力レベルの基準計算方法を指定します。一般的なリミッターVSTプラグインのオーバーサンプリングオプションやTrue Peak(インターサンプルピーク)オプションと同じものです。

Peak

Peakはいわゆる普通のピークで離散波形の振幅の最大値を基準とします。

True Peak

True Peakはインターサンプルピークで、離散波形を連続波形に変換した後の振幅の最大値を基準とします。

True Peak (15kHz Lowpass)

True Peak (15kHz Lowpass)は15kHzでローパスフィルタをかけた後のインターサンプルピークを基準とします。YouTubeの再エンコードによるピーク変化をシミュレーションできるので、YouTube用の音声を作る場合に最適です。

従来動作をさせるには?

以下のように設定すると従来と同じ動作をさせられます。

“Ceiling”: 0dBFS

“Ceiling モード”: “Peak”

音圧爆上げくんをアップデートしました

音圧爆上げくんをアップデートしました。

ワンタッチマスタリングの設定をなくしました

音圧爆上げくんをかんたんに使えるようにするために、ワンタッチマスタリングの設定をなくしました。低音を保存するオプションや、動画タイトルオプションを使う場合は、カスタムマスタリングをご利用ください。

ワンタッチマスタリングの目標音圧を下げました

YouTube動画など幅広い用途で無難なマスタリングができるように、ワンタッチマスタリングの目標音圧を-9dBに下げました。

高音圧を求める方はカスタムマスタリングをご利用ください。

使用頻度の少ない機能を削除しました

「奥行きをプラスする」機能と「やさ上げ」機能を削除しました。もし必要であれば復活させるので教えてください。

プリセットマスタリングをカスタムマスタリングに統合しました

UIをシンプルにするためにプリセットマスタリングをカスタムマスタリングに統合しました。

「YouTubeラウドネス補正」指標を追加しました

「YouTubeラウドネス補正」指標は、YouTubeにアップロードしたときに、ラウドネスノーマライゼーションによってラウドネスがどのくらい補正されるかの予測値です。

YouTubeにアップロードする場合はこの値が小さくなりすぎないようにすると良いです。

こちらの調査結果を元に計算しています。

「Trueピーク」指標を追加しました

「Trueピーク」指標は、インターサンプルピークです。

「Trueピーク (15kHzローパス)」指標は、15kHzのローパスフィルタをかけた後の波形のインターサンプルピークです。

YouTubeなど一部の動画プラットフォームではアップロードした動画の再エンコードが行われます。その際に波形が変化します。特に影響が大きいのは再エンコードのときに適用されるローパスフィルタです。

こちらによると、YouTubeの再エンコードで適用されるローパスフィルタのカットオフ周波数は15.1kHz, 15.8kHz, 18kHz, 20kHzです。

「Trueピーク (15kHzローパス)」指標が0dBFS以下であれば、YouTubeにアップロードしたときにクリッピングする可能性は少ないはずです。

ピークにヘッドルームをもたせるようにしました

今まではマスタリング後の音源のピークを0dBFSに合わせていましたが、それだと音源の再エンコード時にクリッピングが発生しやすいです。

クリッピングを気にせずに音源を扱えたほうが便利なので、ピークに少し余裕をもたせるようにしました。具体的には、「Trueピーク (15kHzローパス)」が-0.5dBFS以下になるようにしています。

Shazamとは? – 曲を検索できるアプリ

曲を検索できるアプリ”Shazam”についてご紹介します。

Shazamとは?

マイクから拾った音で曲を検索できるアプリです。

Shazamをインストール

以下のリンクからインストール可能です。

 

Shazamの使い方

Shazamを起動すると以下の画面になります。

Shazam

中央のボタンをタップすると以下の画面になり、マイクから音を拾い、曲を検索します。

Shazam Detect

しばらく待つと曲が特定されます。

以上が基本的な使い方です。他に、My Shazamをタップし、過去に検索した曲の履歴を見ることも可能です。

Shazamの原理

以下によると、ShazamはAcoustic fingerprintという技術で実装されているみたいです。

Robust Landmark-Based Audio Fingerprinting

Acoustic fingerprint – Wikipedia

まとめ

曲を検索できるアプリ”Shazam”をご紹介しました。

日本のYouTube動画の音圧を分析しました

Japanese YouTube Loudness Histogram

日本のYouTube動画の音圧を分析しました。

YouTubeでは、ラウドネスノーマライゼーションが導入されています。YouTubeのラウドネスノーマライゼーションは、音圧が大きすぎる動画の音量を下げますが、音圧が小さすぎる動画の音量は上げません。

仮に、YouTubeに音圧が小さすぎる動画がたくさんあるとしたら、音質を損なわない範囲で音圧を上げることで、YouTube上で再生される音量を大きくできる可能性があります。

Question

YouTubeに音圧が小さすぎる動画はどのくらいあるのか?

前述の通りです。

YouTube動画の長さが長いと音圧は下がるのか?

長さが長くなると、偶然、波形のピークが大きくなる確率が高まります。リミッターを使っていれば、それらのピークを抑えられますが、リミッターを使っていない場合、長さが長くなるほど音圧が小さくなる可能性があります。

このことから、長さとラウドネスの関係を調べれば、リミッターが使われているかどうかを判断する材料になりそうです。長さとラウドネスに関係する要素は他にもあるので、これだけで判断はできませんが、一旦、長さと音圧の関係を調べてみます。

分析対象動画

A. 日本のトップYouTuber

「はじめしゃちょー(hajime)」チャンネルのほとんど全ての動画

B. 日本の音楽チャンネル

「Lantis Channel」チャンネルのほとんど全ての動画

C. 日本のTV局チャンネル

「AbemaTV公式 YouTube」チャンネルのほとんど全ての動画

※ 2018/12/08以前の動画

※ ほとんど全ての動画というのは解析に失敗したものがあるから

※ 動画一覧はAppendixに記載

分析指標

ラウドネス

音圧を表す指標です。ITU-R BS.1770-3で計算しました。

ラウドネスレンジ

ダイナミックレンジを表す指標です。EBU TECH 3342の窓長とオーバーラップ長を変更し計算しました。窓長0.4秒、オーバーラップ長0.3秒。

分析結果

ラウドネス

ラウドネス ヒストグラム

Japanese YouTube Loudness Histogram

ラウドネス 累積密度分布

Japanese YouTube Loudness CDF

ラウドネス 時系列

Japanese YouTube Loudness Time series

ラウドネスレンジ

ラウドネスレンジ ヒストグラム

Japanese YouTube Loudness Range Histogram

ラウドネスレンジ 累積密度分布

Japanese YouTube Loudness Range CDF

ラウドネスレンジ 時系列

Japanese YouTube Loudness Range Time Series

ラウドネスとラウドネスレンジの関係

ラウドネスvsラウドネスレンジ 散布図

YouTube Loudness vs Loudness Range

ラウドネスvsラウドネス 平均と標準偏差

Japanese YouTube Loudness vs Loudness Range error bar

長さ

長さ ヒストグラム

Japanese YouTube Length Histogram

長さ 累積密度分布

Japanese YouTube Length CDF

長さ 時系列

Japanese YouTube Length Time series

長さとラウドネスとの関係

長さvsラウドネス 散布図

Japanese YouTube Length vs Loudness

長さvsラウドネス 平均と標準偏差

Japanese YouTube Length vs Loudness error bar

考察

YouTubeに音圧が小さすぎる動画はどのくらいあるのか?

「ラウドネス 累積密度分布」を見ると、「ランティス」以外は、90%以上の動画のラウドネスが-14dB以下です。

今回使ったラウドネス計算式は、YouTubeのものと異なるので、これ以上はラウドネスノーマライゼーションがかかるというラインは示せませんが、こちらを参考にすると、-14dBは十分小さいと思うので、Lantis以外は音圧を上げれば、YouTube上で再生したときの音量が上がる可能性がありそうです。

YouTube動画の長さが長いと音圧は下がるのか?

「ラウドネスvs長さ 平均と標準偏差」によると、そのような事実はなさそうです。

Appendix

日本のYouTube動画分析結果 (tsv)

まとめ

日本のYouTube動画の音圧を分析しました。

「はるあん」はラウドネスノーマライゼーションに完全準拠したYouTuber!?

はるあん」は、ラウドネスノーマライゼーション完全準拠したYouTuberかもしれません。

ラウドネスノーマライゼーション完全準拠YouTuberとは?

YouTubeのラウドネスノーマライゼーション仕様を理解し、うまく利用しているYouTuberのことです。

ラウドネスノーマライゼーションとは?

YouTubeが自動的に動画間の音量を揃える機能です。

YouTube動画の右クリックメニューから“詳細統計情報”を見たことはありますか?

youtube video stats

この中の“Content loudness”に注目してください。この値は、YouTubeがラウドネスノーマライゼーションを行うときに基準にする値です。

“Content loudness”がプラスだとYouTubeによって音量が下げられます。マイナスだと音量はそのままです。

音に関する2つの事実

ラウドネスノーマライゼーションをうまく利用するには、以下の2つの事実が重要です。

A. 音圧と音質はトレードオフの関係にある

B. 音量が大きいほど良い音に聴こえる

ラウドネスノーマライゼーションをうまく利用する方法

YouTubeでは、ラウドネスノーマライゼーションがはたらくので、音圧をあげても音量が上がらなくなるポイントがあります。前述の”Content loudness”が0になるポイントです。

音圧と音質はトレードオフの関係にあるので、YouTubeで”Content loudness”が0以上になるように音圧を上げると、音量が上がらないので、音量が大きいほど良い音に聴こえる効果を得られずに、音質だけ下がります

なので、YouTubeに動画を上げるときの最適解は、“Content loudness”を0付近、または0以下にすることです。

はるあん動画の”Content loudness”

最近のはるあんの動画の”Content loudness”を見てみてください。どの動画も0dB付近にあると思います。

2018/12/02の動画 (“Content loudness” 0.0dB)

2018/09/23の動画 (“Content loudness” 0.0dB)

つまり、はるあんの動画は、YouTubeにおいて音圧と音質を最大限両立しているということです。意図せずこうなることは珍しいので、意図して行っているかもしれません。

しかし、少し前の動画では、“Content loudness”が0dBから乖離しています。

2018/05/25の動画 (“Content loudness” -1.7dB)

2017/11/12の動画 (“Content loudness” -8.5dB)

最近、ラウドネスノーマライゼーションに対応したのかもしれません。

まとめ

YouTuber「はるあん」がラウドネスノーマライゼーションに完全準拠しているかもしれない、という記事でした。

YouTuber用途やニュース用途であれば、YouTubeのラウドネスノーマライゼーション基準は十分低いので、今後、SEOのように対応するのが当たり前になるかもしれません。