다이나믹 레인지를 나타내는 지표입니다. EBU TECH 3342 창 길이와 오버랩 길이를 변경하고 계산했습니다. 창 길이 0.4 초, 오버랩 길이 0.3 초.
분석 결과
라우드니스
음량 히스토그램
음의 누적 밀도 분포
음량 시계열
음량 범위
음량 범위 히스토그램
음량 레인지 누적 밀도 분포
음량 범위 시계열
음량 및 음량 레인지의 관계
음량 vs 음량 범위 산포도
음량 vs 음량 평균과 표준 편차
길이
길이 히스토그램
길이 누적 밀도 분포
길이 시계열
길이와 음의 크기와의 관계
길이 vs 음량 산포도
길이 vs 음량 평균과 표준 편차
고찰
YouTube에 음압이 너무 작은 동영상은 얼마나 있는가?
"음의 누적 밀도 분포 '를 보면'란티스 '를 제외하고는 90 % 이상의 동영상의 음량이 -14dB 이하입니다.
이번 사용한 음량 계산이 YouTube 것으로 다르기 때문에 더 이상은 음량 노멀 라이 제이션이 걸린다는 라인 나타낼 수 있지만, 여기 를 참고로하면, -14dB 충분히 작다고 생각 때문에 Lantis 이외는 음압 를 올리면 YouTube에서 재생할 때 볼륨이 오를 가능성이있을 것입니다.
YouTube 동영상을 오른쪽 클릭하고 자세한 통계에서 볼 수있는 Content Loudness는 Loudness - Target에 해당합니다.
YouTube 음량 계산
YouTube 음량 계산식은 자신의 것이 사용되고있는 것입니다. 그래서 추측해야합니다.
ITU-R BS.1770-3을 참고하여 다음과 같은 모델을 생각합니다.
이퀄라이저 -> 창에서 잘라 -> LUFS로 변환 -> Gating -> Aggregation
이퀄라이저
이퀄라이저 주파수마다 가중치를합니다.
사전 실험에서 ITU-R BS.1770-3에서 채용되고있는 K-weighting 및 기타 인기있는 weighting가 맞지 않았기 때문에 직접 주파수 특성을 추정합니다.
창문으로 잘라
파형을 Rect 창에서 잘라냅니다.
창 길이와 오버랩 비율이 매개 변수입니다.
참고로 ITU-R BS.1770-3와 EBU TECH 3341의 momentary과 integrated 매개 변수는 창 길이가 400ms 겹침 길이가 100ms (오버랩 비율은 75 %)입니다. EBU TECH 3341의 short-term loudness 매개 변수는 창 길이가 3 초 겹침 길이가 2.9 초 이상 (오버랩 비율은 96.7 % 이상)입니다.
매개 변수는 각각의 Threshold 값입니다. Gating을하지 않는 패턴도 시도합니다.
참고로 ITU-R BS.1770-3와 EBU TECH 3341 매개 변수는 Absolute Threshold가 -70LKFS, Relative Threshold가 -10dB입니다. EBU TECH 3342의 Loudness Range 계산을위한 매개 변수는 Absolute Threshold가 -70LKFS, Relative Threshold가 -20dB입니다.
Aggregation
Gating 남은 여러 RMS 값의 평균 또는 최대 값을 취합니다.
ITU-R BS.1770-3에서 평균을 가지고 있지만, 여기 에 따르면, Short-term의 최대 값을 사용하고있을 가능성이있는 것입니다.
매개 변수 추정에 사용 테스트 동영상
음량 계산 모델의 매개 변수를 추정하기위한 테스트 동영상을 제공합니다.
여기 에 따르면, 음량 노멀 라이 제이션은 어느 정도의 재생수가 없으면 적용되지 않으며 게시 한 후 어느 정도 시간이 지나지 않는다고 적용되지 않거나 가능성이있는 것 같습니다. 자기 부담으로 테스트 동영상을 준비하지 않고 충분한 재생수이 게시 한 후 충분한 시간이 지난 기존의 동영상을 여러 선택 테스트 동영상합니다.
테스트 동영상 목록은 Appendix에 기재했습니다.
이퀄라이저 매개 변수 추정
볼륨이 일정한 정현파 테스트 동영상을 사용하면 음량에 대한 이퀄라이저 이외의 영향을 배제 할 수 있습니다. 이것을 사용하여 우선 이퀄라이저의 주파수 특성을 추정합니다.
다양한 주파수의 정현파 음원에 대해 YouTube에서 Content Loudness를 측정하여 음원의 RMS와의 차이를 취하는 것으로, 주파수 특성을 추정합니다. 추정 결과는 다음과 같습니다. 자세한 데이터는 Appendix를 참조하십시오.
16kHz 이상은 동일한 주파수에서 동영상에 따라 결과가 다를 수 있습니다 결과가 불안정했기 때문에 이후의 논의에서는 15kHz 이하의 데이터만을 사용합니다. 44Hz 이하로 15kHz 이상은 선형 보간 외삽 있습니다.
이퀄라이저 이외의 매개 변수 추정
다음은 이퀄라이저의 주파수 특성을 고정하고 이퀄라이저 이외의 매개 변수를 추정합니다.
다양한 파라미터로 다양한 동영상의 음량을 계산합니다. YouTube에서 계산하는 라우드니스 (Content Loudess)과 비교하여 오차가 가장 적은 매개 변수를 찾습니다. 테스트 동영상 목록은 Appendix에 기재했습니다.
오차가 가장 적은 매개 변수의 조합은 창문 길이 3 초 오버랩 비율 96.7 %, Max Aggregation에서 오차의 표준 편차는 0.9dB 최대 오차는 1.7dB였습니다. EBU TECH 3341의 Short-term loudness 최대 네요. 음의 목표치는 -10.3LUFS입니다.