LANDR vs "AI Mastering" (édition de qualité sonore)

Nous avons comparé LANDR et AI Mastering en termes de qualité sonore.

Vue d'ensemble

Nous avons proposé un indice permettant d'évaluer objectivement le mix MEI 20190207.

Nous avons comparé les sons maîtrisés avec AI Mastering et LANDR à MEI 20190207.

Nous avons constaté que AI Mastering avait une valeur MEI plus élevée que 20190207 par rapport à LANDR.

AI Mastering a tendance à dire que la plage de volume est supérieure à celle du LANDR, que le boom est faible, que la profondeur est faible et que la chaleur est petite.

* Puisqu'il y a des sons comparatifs chez les autres personnes, écoutez s'il vous plaît

Méthode de comparaison

Maîtriser divers sons avec LANDR et AI Mastering et comparer les résultats avec divers indicateurs.

Son à comparer

Nous avons choisi le son à comparer à partir du jeu de données d’évaluation de mixage suivant. Cet ensemble de données d’évaluation de mixage comprend plusieurs sons mixés pour diverses chansons et des résultats d’évaluation subjective par plusieurs personnes pour chaque son mixé.

Dans la licence audio de mixage, CC BY, nous avons sélectionné comme cible de comparaison celle ayant la plage de sonie la plus large pour chaque chanson et celle ayant la note subjective moyenne la plus basse.

La raison en est qu’il est facile de maîtriser sans artefacts lorsque la plage de sonie est large et que le mastering automatique ne correspond pas lorsque l’évaluation subjective est faible.

Veuillez consulter le référentiel GitHub ci-dessous pour une liste de mixage spécifique.

MixBrowser

THE MIX EVALUATION DATASET

Index

MixEvaluationIndex20190207 (MEI20190207)

MixEvaluationIndex 20190207 (MEI 20190207) est un indice d'évaluation objectif de l'audio mixé construit à l'aide de données d'évaluation subjectives du jeu de données d'évaluation Mix. C'est un index d'évaluation de l'audio mixte, mais je pense qu'il peut également être utilisé pour évaluer le mastering audio. Il est destiné à une évaluation complète. C'est l'indicateur principal dans cette comparaison.

Le MEI 20190207 est calculé par la somme pondérée de divers indices. Les indices originaux sont la matrice de covariance étendue du spectre, la moyenne du spectre, la dureté, la dissonance. En termes simples, je le calcule en fonction de la forme du spectre, de la plage dynamique, de l'étalement de l'espace, de la bande passante de l'attaque et de la quantité de distorsion.

L'audio mixte utilisé pour l'apprentissage du poids est tout l'audio mixte publié dans MixBrowser, avec prévisualisation audio. Certains extraits audio étaient 404 non trouvés.

MixBrowser

Loudness

C'est la sonie définie par l'UIT-R BS.1770. En fonction de la plate-forme à diffuser et de la manière dont l'utilisateur écoute, il est fort probable que les chansons avec une sonie soient plus susceptibles d'être lues avec des sons plus forts que d'autres. Cela sonne mieux lorsque vous jouez avec des sons forts.

Si la qualité du son est la même, le volume doit être élevé.

Autres indicateurs

Gamme de Loudness, True Peak

Cadre de mastering

S'il vous plaît voir GitHub ci-dessous.

Résultat de comparaison

Changer le montant de MEI 20190207

Il s'agit de la moyenne de changement de MEI 20190207 par rapport à l'original pour toutes les chansons. AI Mastering a tendance à avoir une valeur MEI plus élevée que 20190207 par rapport à LANDR.

Gamme de Loudness vs. Loudness

J'ai tracé la moyenne de toutes les chansons en volume et la moyenne de toutes les chansons en volume avec un diagramme de dispersion. En général, le volume et la plage de volume sont dans une relation de compromis, mais la diminution de la plage de volume lorsque AI Mastering a un volume plus élevé que LANDR est faible.

True Peak

True Peak (inter sample sample) est une moyenne de toutes les chansons. Si True Peak est supérieur à 0 dB, il peut être déformé en raison du réencodage, etc., mais il semble exister des cas où AI Mastering et LANDR dépassent tous les deux 0 dB. Si vous définissez l'option Plafond sur True Peak dans AI Mastering, vous pouvez empêcher que True Peak ne dépasse 0 dB et éviter ainsi de dégrader la qualité du son. LANDR est probablement impossible à éviter car il n'y a pas de tel paramètre.

Changer le montant de Dissonance

La dissonance est un indice permettant de mesurer le degré de dissonance. Il est utilisé pour calculer MEI 20190207, plus la dissidence est faible, plus l'indice MEI 20190207 est élevé.

Si vous définissez le niveau de mastering sur 1 dans AI Mastering, Dissonance semble augmenter. Si vous définissez le niveau de matriçage à 0.5, vous obtiendrez une augmentation équivalente à LANDR.

Changer la quantité de dureté

La dureté est un indice permettant de mesurer la dureté du son. Il est utilisé pour calculer MEI 20190207, et plus la dureté est élevée, plus l'indice MEI 20190207 est élevé. AI Mastering et LANDR semblent tous deux augmenter la dureté.

Changements dans le boom

Le booming est un indice pour le degré de boomy. Le contenu est l'index de boom proposé ci-dessous. Il n'est pas utilisé pour le calcul de l'IED 20190207.

Indice d'essor comme mesure pour l'évaluation de la sensation d'essor

La maîtrise de l'intelligence artificielle a tendance à réduire le boom.

Changer la quantité de luminosité

La luminosité est un indicateur de luminosité. Il est calculé par la combinaison linéaire du logarithme du rapport d'énergie de la composante haute fréquence sur l'énergie totale et du logarithme du centroïde spectral. Il n'est pas utilisé pour le calcul de l'IED 20190207.

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

AI Mastering et LANDR ont tendance à augmenter la luminosité.

Changer le montant de la profondeur

La profondeur est un indicateur de profondeur. Il est défini dans D 5.2 ci-dessous. Selon D 5.2, la profondeur a une signification spatiale et une signification caractéristique de fréquence, mais cet indice de profondeur ne représente qu'une signification caractéristique de fréquence. Il n'est pas utilisé pour le calcul de l'IED 20190207.

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

Selon la définition, la profondeur augmentera s’il existe de nombreuses composantes basse fréquence. AI Mastering a tendance à réduire la profondeur.

Quantité de changement de chaleur

La chaleur est un indicateur de chaleur. Ce qui suit est une implémentation. Il n'est pas utilisé pour le calcul de l'IED 20190207.

Timbral_Warmth.py (Github)

La maîtrise de l'intelligence artificielle a tendance à réduire la chaleur.

Comparaison du son après le mastering

Pour chaque chanson, j'ai pris trois des originaux, LANDR, avec le plus gros MEI 20190207, AI Mastering avec MEI 20190207 le plus gros. Étant donné que le volume n'est pas aligné, faites attention aux biais dus à la différence de volume.

Toutes les listes de sons sont ci-dessous. Veuillez essayer MEI 20190207 si le son élevé est vraiment bon. La notation de licence de chaque chanson est décrite dans le répertoire audio de Github.

ai-mastering / mastering_comparison (Github)

In The Meantime

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Lead Me

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Not Alone

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Pouring Room

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Red To Blue

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Github

Des informations détaillées sont énumérées ci-dessous.

ai-mastering/mastering_comparison (Github)

Attention

Ce qui est écrit comme "AI Mastering" sur le graphique ou Github représente AI Mastering.

Résumé

J'ai comparé LANDR et AI Mastering.