AI Mastering博客 - 第2节 - 第4节 - 自动在线音频控制服务

2019年2月20日2021年9月11日

LANDR vs“AI Mastering”（音质版）

我们比较了LANDR和AI Mastering的音质。

摘要

我们提出了一个可以客观地评估混合MEI 20190207的指数。

我们在MEI 20190207上比较了掌握AI Mastering和LANDR的声音。

我们发现AI Mastering的MEI 20190207比LANDR更高。

AI Mastering倾向于响度范围大于LANDR，Boominess小，Depth小，Warmth小。

*由于其他人有比较声音，请听

比较方法

使用LANDR和AI Mastering掌握各种声音，并将结果与各种指标进行比较。

声音要比较

我们从以下混合评估数据集中选择要比较的声音。该混合评估数据集包括针对各种歌曲的多个混合音频以及针对每个混合音频的多个人的主观评估结果。

在混音音频许可证CC BY中，我们选择每首歌曲具有最大响度范围的歌曲和具有最低平均主观评级的歌曲作为比较目标音调。

原因是当响度范围大时很容易掌握没有伪影，并且当主观评价低时自动母带制作不匹配。

请参阅下面的GitHub存储库以获取特定的混合列表。

MixBrowser

THE MIX EVALUATION DATASET

指数

MixEvaluationIndex20190207 (MEI20190207)

MixEvaluationIndex 20190207（MEI 20190207）是使用混合评估数据集的主观评估数据构建的混合音频的客观评估指标。它是混合音频的评估指标，但我认为它也可以用于评估母带音频。它旨在进行全面评估。它是这次比较的主要指标。

MEI 20190207通过各种指数的加权和来计算。原始指数是光谱的扩散协方差矩阵，光谱的平均值，硬度，不稳定性。简单地说，我根据频谱的形状，动态范围，空间的扩展，攻击的带宽和失真量来计算它。

用于重量学习的混合音频是MixBrowser中发布的所有混合音频，带有预览音频。一些预览音频是404 Not Found。

MixBrowser

响度

它是ITU-R BS.1770规定的响度。取决于要传送的平台以及用户如何收听，与其他歌曲相比，具有响度的歌曲很可能与更响亮的声音一起播放。你用大声的声音听起来会更好。

如果声音质量相同，响度应该很大。

其他指标

响度范围，真峰

掌握设置

请参阅下面的GitHub。

比较结果

更改MEI 20190207的金额

所有歌曲的MEI 20190207平均值相对于原来的变化。 AI Mastering往往比LANDR具有更高的MEI 20190207。

响度与响度范围

我用散点图绘制了响度中所有歌曲的平均值和响度的所有歌曲的平均值。通常，响度和响度范围处于权衡关系，但是当AI Mastering具有比LANDR更高的响度时响度范围的减小很小。

True Peak

真峰值（样本间峰值）是所有歌曲的平均值。如果真峰值大于0 dB，则可能由于重新编码等原因而失真，但似乎存在AI Mastering和LANDR都超过0 dB的情况。如果在AI Mastering中将Ceiling设置为True Peak，则可以防止True Peak超过0 dB，这样可以避免降低音质。 LANDR可能无法避免，因为没有这样的设置。

改变不协调量

不协调是衡量不和谐程度的指标。它用于计算MEI 20190207，Dissonance越低，MEI 20190207越高。

如果在AI Mastering中将母版制作等级设置为1，则Dissonance似乎会增加。将母带级别设置为0.5将导致相当于LANDR的增加。

改变硬度

硬度是衡量声音硬度的指标。它用于计算MEI 20190207，硬度越高，MEI 20190207越高。 AI Mastering和LANDR似乎都会增加硬度。

繁荣的变化

繁荣是Boomy学位的指标。内容是下面提出的蓬勃发展指数。它不用于计算MEI 20190207。

繁荣指数作为评价繁荣感觉的衡量标准

AI Mastering倾向于降低Boominess。

改变亮度

亮度是亮度的指标。它是通过高频分量的能量比与总能量的对数和光谱质心的对数的线性组合来计算的。它不用于计算MEI 20190207。

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

AI Mastering和LANDR倾向于提高亮度。

改变深度

深度是深度的指标。它在下面的D 5.2中定义。根据D 5.2，深度具有空间意义和频率特征含义，但该深度指标仅表示频率特征含义。它不用于计算MEI 20190207。

D5.2: First prototype of timbral characterisation tool for semantically annotating non-musical content

根据定义，如果存在许多低频分量，则深度将增加。 AI Mastering倾向于降低深度。

温暖的变化量

温暖是温暖的标志。以下是一个实现。它不用于计算MEI 20190207。

Timbral_Warmth.py (Github)

AI Mastering倾向于降低温暖。

掌握之后的声音比较

对于每首歌曲，我选择了原有的三个最大的MER 20190207，AI Mastering和MEI 20190207最大的一首。由于响度不对齐，请注意因音量不同而产生的偏差。

所有声音列表如下。请尝试MEI 20190207高音是否真的很好。每首歌的许可符号在Github的音频目录下描述。

ai-mastering / mastering_comparison（Github）

In The Meantime

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Lead Me

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Not Alone

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Pouring Room

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Red To Blue

Original

AI Mastering Best MEI20190207

LANDR Best MEI20190207

Github

详细信息如下。

ai-mastering/mastering_comparison (Github)

警告

什么在图表上写成“AI Mastering”或者Github代表AI Mastering。

摘要

我比较了LANDR和AI Mastering。

2019年2月16日2021年9月11日

“AI Mastering”更新

AI Mastering已更新。

增加了过采样功能

过采样功能已添加。使用过采样可以减少“真峰值”和“峰值”之间的分离。但是，处理时间会延迟。将过采样设置为1x将导致与以前相同的行为。

如果您担心True Peak，请尝试一下。

增加了“限制器误差谱图”

“限制器误差频谱图”以频谱图形式可视化，其中定时和哪个频带影响限制器误差。我认为使用它时减少限制器错误会更容易。

由于显示了相对值，因此您首先不必担心“限制器错误”是否很小。在没有原始声音的区域，例如超高频范围和静音部分，整体颜色趋于变厚，但如果你聆听无关紧要没有问题。

重要的是在黑暗部分存在的密集部分颜色。该图像包含15 kHz以下的许多垂直线。该线是发生的失真，不能完全压缩强攻击声的峰值。

有关如何减少限制器错误，请参阅以下文章。

什么是限制器错误？

添加Dissonance指标

不协调指数是声音不和谐程度的指标。由于存在许多声音，其频谱在频率方向上密集地集中，例如打击乐器和噪声，并且由于存在许多具有诸如钢琴和弦的音高的音高而变得更小，所以不稳定指数趋于变小。

加快音频分析

在AI Mastering中，上传音频后，在音频分析完成后开始母带制作。随着我们加快音频分析，掌握应该更快开始。

2019年2月16日2021年9月11日

音频质量的感知评估（PEAQ）

我们将介绍PEAQ（音频质量的感知评估）。

PEAQ

PEAQ可以感知参考声音和目标声音之间的差异吗？这是一种通过计算进行客观评价的方法。我认为它可以用来评估限制器的性能和mp3编码器的性能。

PEAQ (Wikipedia)

ITU-R BS.1387

PEAQ许可证

据维基百科称，PEAQ似乎受到专利保护。所以你不能自由使用它。根据以下网站，您可以通过OPTICOM签署许可证。

PEAQ (OPTICOM)

Licensing (OPTICOM)

PEAQ的实施

在下面的文章中，比较了多个PEAQ的准确性和计算时间。似乎GstPEAQ对准确性有好处。

GstPEAQ – PEAQ 算法的开源实现

GstPEAQ

它是作为GStreamer插件创建的PEAQ实现。它以C语言实现，许可证为LGPL 2。

HSU-ANT/gstpeaq (Github)

PEAQ测试数据

可从以下链接下载的zip文件包含测试数据。根据zip文件中的许可符号，似乎除了评估PEAQ实现之外不应该使用它。

ITU-R BS.1387

摘要

我们介绍了PEAQ。我想把它介绍给AI Mastering，但我放弃了它，因为我无法自由使用它。

2019年2月2日2021年9月11日

音频共享 - 重用音频内容

我将介绍Audio Commons。

音频共享

“Audio Commons Initiative”旨在根据知识共享许可向创意产业提供音频内容。我不知道倡议的含义，但我认为它可能在某种意义上用于组织。

音频共享介绍摘要

·可重复使用的音频内容（音效，现场录音，音频样本，歌曲）本来应该更多，但目前的情况很少。

·原因是内容重用和技术问题（搜索，许可证澄清）缺乏共享文化。

·Audio Commons Initiative解决了这些问题并鼓励重用音频内容。

音频共享（官方网站）

音频共享（Twitter）

音频共享生态系统

Audio Commons Ecosystem（ACE）是由Audio Commons Initiative支持的音频内容，用户和工具的生态系统。 Audio Commons Ecosystem支持在专业，非专业和个人领域重用Creative Commons许可下提供的音频内容。

生态系统的特征

内容创建者：创建内容的人。作曲家等

内容提供商：提供内容的人。 Jamendo，Freesound等

内容用户：使用内容的人。游戏制作人等

音频共享本体论

Audio Commons ontology是Audio Commons Ecosystem中使用的音频内容的本体。使用Audio Commons本体，您可以注释音频内容（提供元数据）。

音频共享的参与者

除了大学，属于Waves，Jamendo，AudioGaming的人也参加了Audio Commons。

音频共享团队

Audio Commons'Github存储库

Audio Commons使用Github分发各种库。

音频共享（GitHub）

音频共享的有趣工具

Timbral Explorer

多个音频样本以二维方式可视化。圆圈表示一个音频样本，并且被布置为使得声音彼此相似。单击圆圈会发出声音。如果单击附近的圆圈，则会发出类似的声音，单击距离中的圆圈将发出不相似的声音。

如果你可以在DAW中使用它，那么选择音频样本似乎很容易。

Timbral Explorer

摘要

Audio Commons介绍。

2019年2月1日2021年9月11日

听力障碍患者的演讲者，“Mirai演讲者”？

我们为听力损失和类似产品的患者介绍扬声器“Mirai扬声器”。

什么是“未来演讲者”？

“Mirai音箱”是无障碍音箱。它是Sound Fun Corporation的产品。

声迷官网

我如何自己获得“Mirai Speaker”？

有可能以2，980日元/月的价格租用。

“Mirai音箱”出租

“Mirai Speaker”原理

我认为它基于以下专利。该原则的细节似乎未知。

专利（通用扬声器）

什么是Comuoon？

“Comuoon”是一个对话支持设备。它是环球声音设计有限公司的产品。

环球·声音设计公司官方网站

我怎么能得到自己的“Comuoon”？

好像可以在7，600日元+ 36 * 5，800日元= 216，400日元购买。似乎有时候你可以使用“日常生活齿轮工具福利系统”。

关于购买方法（Comuoon官方网站）

“Comuoon”的原则1 - 声音的转换

comuoon清除麦克风输入的声音并将其转换为清晰易听的声音。

源

它似乎转换输入声音，以便更容易听到和输出它。如果您根据引用来源上发布的图像进行估算，则有可能提升重要频段以供EQ收听。

“Comuoon”原理2 - 横波扬声器

“Susumushi扬声器”是一个演讲者，应用了Sumushi研磨翅膀并产生声音的原理，似乎是Comuoon的暗示。

哥白尼产品为听障人士提高听力难度

我找到了一篇由Yoshihiro Muto教授撰写的论文，他在上述文章中介绍了“Susumushi发言人”。本文分析了弯曲到音乐盒的底衬的声学特性。它类似于“Mirai扬声器”的结构。 “Comuoon”和“Mirai speaker”的根源是否相同？

还介绍了具有组合压电元件和膜片的结构的“横波扬声器”。也许这就是所谓的“Sumushi演讲者”或“Yokonowa演讲者”？

功率采集垫和横波扬声器中非线性行为的已知和未知现象

当假设产生空气中的横波时，似乎测量每个距离的声强的结果与结果一致。然而，由于没有描述导出模拟中使用的三个参数的方法，并且没有讨论导出参数的有效性，所以不知道模拟结果是否实际存在。

还有一种理论认为没有横波的声音，所以碰巧计算结果和实验结果一致，原则实际上可能是基于另一个原理。

可以产生平面波的扬声器

一些扬声器具有可以产生平面波的扬声器。作为检查的结果，它被称为平面扬声器，平面扬声器，平面波扬声器等各种名称。似乎没有统一的呼叫方式。

假设“Mirai扬声器”和“横向波扬声器”的基本点是平面波而不是横波，其他可以产生平面波的扬声器也可能对听力损失患者有效。

我检查了我可以单独购买的扬声器。

F. P. S.

FPS在线商店

TOA公司

TOA PW-1230数字平面波形扬声器，黑色

听力损失与平面波的关系

如果平面波从“Mirai扬声器”或“横波扬声器”中出来，则有可能听到听力损失患者的平面波。如果是这样，请考虑原因。

假设1 - 因为体积很难随距离衰减

与球面波相比，平面波的体积倾向于根据距离而衰减。即使它远离扬声器，也很容易听到，因此听力受损的患者可能很容易听到。

我们可以通过比较听力的容易度与平面波和在相同位置相对于受试者的位置处调整到相同体积的球面波来验证该假设。

假设2 - 耳朵稍微移动时的音量变化很小

它类似于假设1，但是由于耳朵结构和房间反射的影响，平面波与球面波相比，当球形波与耳球相比稍微改变耳朵方向或耳朵位置时内耳的体积变化它有可能很小。

似乎没有人与耳朵的位置和方向完美地固定，所以当移动它们时音量的大小改变会影响听力的容易程度。

如果完全固定的耳朵位置和方向以及条件一点一点地移动，则可以验证假设1的实验。

假设3 - 因为几乎没有混响

平面波具有很强的方向性，因此房间内的反射很少，并且混响声可能会减少。混响量可能会影响听力的容易程度。

可以通过测量球面波和平面波的混响量并将听觉容易度与校正后的声音进行比较来验证，使得混响量与混响等相同。

假设4 - 因为混响很简单

它类似于假设3，但混响的结构有可能影响听觉的容易程度而不是混响的数量。例如，使用混响和短延迟，即使具有相同的混响量，听觉的容易度也可能不同。

可以通过测量球面波和平面波的脉冲响应并将听觉容易度与通过卷积等模拟混响结构的声音进行比较来验证。

摘要

我们为听力损失和类似产品的患者推出了一个扬声器“Mirai扬声器”。

※价格等是文章撰写时的信息。有关最新信息，请访问官方网站。

2019年2月1日2021年9月11日

SoundBridge - 2018年发布的免费DAW

我们将介绍SoundBridge，这是2018年发布的免费DAW。

什么是SoundBridge？

SoundBridge 是 2018 年发布的免费 DAW。与 Windows 和 Mac 兼容。据此，SoundBridge似乎已经制作了三年多了。

SoundBridge官方网站

SoundBridge的功能

因为它用音乐教材监视， DAW本身的特点是能够免费使用它。

如何使用SoundBridge

免费会员注册SoundBridge

我们将在SoundBridge官方网站上注册成为免费会员。

下载SoundBridge

成员注册完成后，将显示根据所用操作系统的SoundBridge安装程序的下载链接。如果操作系统自动判断错误，您可以从“我的帐户”屏幕下载每个操作系统的SoundBridge安装程序。

安装SoundBridge

启动SoundBridge安装程序并根据屏幕进行安装。所有默认设置都可以。

启动SoundBridge

启动SoundBridge时，将出现以下屏幕，因此请输入您的帐户信息并登录。

SoundBridge示例项目

使用默认设置进行安装时，示例项目将安装在Documents目录中。从SoundBridge左下角的“文件”菜单中打开它。由于错误，某些项目无法打开。 ExampleProject.soundbridge打开了。

我会玩的。

如果您尝试编辑示例项目弹出窗口，提示您在SkyTracks.io中注册，则无法编辑它。如果要编辑它，请打开一个新项目。

钢琴卷SoundBridge

它与普通DAW钢琴卷相同。

SoundBridge调音台

它与通用DAW混音器相同。

什么是SoundBridge学院？

SoundBridge Academy是一款付费在线视频资料，您可以了解音乐制作。附加DAW项目文件可能很有用。可能会看到一个名为DAW的视图，其中包含丰富的付费手册。

SoundBridge学院

SoundBridge的声誉

我有臭氧8插件冻结应用程序v1.09的问题，一个简单的电子邮件生成快速响应和及时更新修复.5星级的客户服务。

源

似乎如果你报告一个bug，它将由急速修复。

我很乐意每月支付费用来访问您的学习内容，教程，并且您可以让新手感兴趣学习者每月津贴/样品包等

源

学习音乐理论的地方似乎是SoundBridge的魅力所在。

SoundBridge将来会收费吗？

为了尽可能多地访问所有这些人，我们决定完全免费使用该软件。

源

虽然不能保证将来不会收费，但由于它用音乐教材监听，如果这种方法顺利进行，DAW本身可能很长时间免费。

Ableton和PreSonus在免费博客上提供提示和有用的内容，并通过DAW进行监控。 SoundBridge可以将其视为反向。

摘要

我们介绍了2018年发布的免费DAW，SoundBridge。

2019年2月1日2021年9月11日

我制作了视频和演示音频，显示了“ClearMixer”的效果

我们将介绍了解“ClearMixer”效果的电影和演示音频。

“ClearMixer”介绍视频

“ClearMixer”介绍视频评论

状态设置

在电影中，Band Noise（窄带噪声）和Sine Wave（正弦波）同时振铃。通常在这种情况下，当Band Noise和Sine Wave的音量大致相同时，您可以听到浑浊，但证明使用“ClearMixer”会降低浊度。

通过“强度”参数控制干扰

从0:21到0:37，我操纵“ClearMixer”的“Intensity”参数并控制Band Noise和Sine Wave之间的干扰。增加“ClearMixer”的“强度”会降低正弦波振铃频段内的波段噪声。我认为用耳机听时很容易理解。您可以使用电影中显示的“ClearMixer”频谱分析仪查看它。这使得Sine Wave更容易听到。

通过“输出”参数切换输出声音

从0:38到0:47，通过操作“ClearMixer”的“Output”参数切换输出声音。使用ClearMixer不会处理Dry的声音，而Wet表示ClearMixer处理的声音。 Wet - Dry表示ClearMixer处理之前和之后的差异声音。干扰代表干扰分量。我认为在听干湿时很容易理解减干效果。

只收听Band Noise

从1：00到1:12，我将Sine Wave静音并仅播放Band Noise，然后控制干扰。我认为，正弦波被静音可以更清楚地理解ClearMixer的干扰降低效果。

改变正弦波的音量

1：18~1：38，正弦波的音量正在变化。查看“ClearMixer”的频谱分析仪，您可以看到频段噪声的干扰减少量根据正弦波的音量而变化。我觉得我感觉几乎不舒服，因为它变化很顺利。

“ClearMixer”演示音频

原始音频

应用“ClearMixer”后的音频

应用“ClearMixer”后的音频（过度应用）

虽然应用“ClearMixer”后原始音频和音频之间的差异是微妙的差异，但我认为通过关注基础泛音和钢琴中音之间的干扰很容易听到。我认为它整体来说很干净。

应用“ClearMixer”后，我认为您可以通过听音频（过度应用）来理解，但如果干扰过度减少，则会产生轻微不愉快的声音。我认为在查看“ClearMixer”的“总干扰”指数时控制干扰量是好的。作为参考，原始音频的“总干扰”约为15％，应用“ClearMixer”后音频的“总干扰”约为8％，应用“ClearMixer”后音频的“总干扰”约为3％是的。

我认为“ClearMixer”在观察指数时可以用来客观地混合是有道理的。

“ClearMixer”最新版本下载

演示版

产品版本

购买产品版本

*更新方法：运行install.bat即可。

*请参阅捆绑的README以了解用法。

摘要

我们介绍了显示“ClearMixer”效果的视频和演示音频。

2019年1月26日2021年9月11日

“AI Mastering”更新

AI Mastering已更新。以下是更新内容。

掌握删除功能

添加了删除母版制作的功能。您可以在每个母版制作详细信息屏幕上的“母带列表屏幕”或“编辑按钮”中删除。请注意，它不能撤消。 ※不能用于智能版

掌握保护功能

我们添加了一个功能来保护母带制作并防止它被自动删除。使用高级计划限制功能，您可以同时保护多达100个。保留期是保费计划的合同期限。 ※不能用于智能版

怎么用

您可以从母带列表屏幕或每个母版制作详细信息屏幕上的“编辑按钮”中“保护”。

是否受保护由主控列表屏幕上的“状态列”指示你可以查看。

笔记

它不用于使用保护功能存储重要数据。我建议下载重要数据并保留备份。

视频编码具有公平优先级

我们决定以公平的优先级进行视频编码。即使有更多的主人，也很难受到影响。

掌握过程本身已经完成了公平的优先事项，但其优先级并未应用于视频编码。因此，当有人掌握时，声源尽快完成，但是存在运动图像完成缓慢的现象。这是一个解决它的解决方案。

更改结算清单的显示内容

更正了“用户设置”页面上的结算列表的显示内容。

具体来说，当打开PayPal链接但未完成结算时，显示“未付款”，但很难理解，因此一开始根本没有显示。

修复了登录失败的问题

修复了在桌面版或某些浏览器上登录失败的错误。对由此带来的任何不便，我们深表歉意。请从以下链接下载最新版本。

下载最新的桌面版

2019年1月23日2021年9月11日

什么是限制器错误？

我们介绍AI Mastering的“限制器错误”。

什么是“限制器错误”？

“Limiter error”是由 AI Mastering的限制过程引起的声音错误 。

通常，如果使用限制器将声压提高太多，声音将会失真，但限制器误差会定量地表示失真。它是基于心理声学设计的，因此它尽可能接近人类的意义。单位是dB。如果限制器误差为1 dB或更低，则您应该无法听到差异。

该图是简化的，但事实上它以稍微复杂的方式计算它。

“限制器错误”发生的原因

限制器误差的原因在于，由于试图使声压接近目标声压而波形失真，同时通过限制处理将波形的峰值限制为小于天花板。

有些声音会因为限制而扭曲和防止失真。失真是否容易取决于限制器，但在AI Mastering的情况下， 打击乐器很难扭曲，低音，接近正弦波，持续的声音很容易扭曲 。

不产生“限制器错误”的提示

降低目标声压

降低目标声压可以更容易地减少限制器误差。当你可以降低声压时，这是最好的。

“天花板模式”设置为“峰值”

在AI Mastering的自定义母带处理中，您可以使用“天花板模式”选项选择是基于真实峰值还是正常峰值进行限制。

因为它基于真峰值更保守地抑制峰值，所以天花板下降，并且倾向于发生限制器误差。

通过将“天花板模式”设置为“峰值” ，可以减少限制器误差。相反，它更有可能因有损压缩而失真。

小基峰

低音是接近正弦波的低音持续声音，因此很容易在限幅器处扭曲。

虽然它不仅限于AI Mastering，但如果您使用放大器模拟器等来增加低音的泛音 ，您可以在保持音量的同时降低峰值。相反，音质会发生变化。

我不在乎“限制器错误”很大

存在音乐上可接受和不可接受的情况，其中发生“限制器错误”。

例如，低音的声音暂时太大而且峰值弹出，所以如果整体降低低音的声音，会出现“限制器错误”，但我认为它在音乐上是可以接受的。

另一方面，我认为在通过在相同情况下强制抑制基峰来扭曲它的情况下，它在音乐上是不可接受的。

“如果没有发生限制器错误，则没有问题”建立（至少虽然它被设计为已建立），“如果发生限制器错误则存在问题”未建立。

所以，如果你用耳朵听，没有问题，你也不介意“限制器错误”很大。

改进计划“限制器误差谱图”

AI Mastering显示的“限制器错误”是整个声源的平均值。实际上，每个时间和频段的本地“限制器错误”都不同。
如果存在类似“限制器错误”的频谱图，您可以看到在哪个时间段以及在“限制器错误”的频段内，您可以轻松识别原因。

它正在考虑之中。

摘要

我们介绍了AI Mastering的“限制器错误”。

2019年1月9日2021年9月11日

PhonicMind - 一种可以从声源中提取/删除人声的在线服务

我们介绍PhonicMind，一种在线服务，只从声源中提取/删除人声，以及其他类似的软件/服务。

什么是PhonicMind？

PhonicMind是一种在线服务，可以自动从2种混音声源中提取和删除人声。

上传声源时，您可以下载两个声源，即仅从声源中提取声音的声源和仅移除声乐的声源。

PhonicMind官方网站

Phonic Mind的声誉

看看下面链接的反应，PhonicMind的声誉似乎很好。

PhonicMind，一个声音去除器，实际上在隔离人声时起作用。强烈推荐！
经过u/Bumblebe5 在makingvaporwave

有人试过PhonicMind吗？从 IsolatedVocals

PhonicMind如何运作

PhonicMind似乎使用深度神经网络。

PhonicMind’s vocal remover uses deep neural networks to do vocal elimination.

Source: https://phonicmind.com/faq/

其他声音清除/提取软件

声音去除器（vocalremover.org）

与PhonicMind一样，VocalRemover是一项在线服务，可以自动从2种混音声音中删除/提取人声。

您可以从左侧菜单中的“Vocal Remover”中删除人声，并从“Vocal Extractor”中提取人声。

声音卸妆

当我尝试时，乐队靠近人声，中心定位的声音与声乐一起被提取出来。此外，声音去除还留有混响成分。

你可以想象，我认为你正在使用传统的方法来提取人声，频带，瞬态信息。

VocalRemover（vocalremover.com）

与PhonicMind一样，VocalRemover是一项在线服务，可以自动从2种混音声音中删除/提取人声。

VocalRemover

我尝试过，质量高于vocalremover.org。人声去除后的混响成分也很弱。我觉得和PhonicMind一样的品质。

Lakeside Audio Isola Pro FX

Lakeside Audio Isola Pro FX是一款VST插件，可以从2种混音声源中自动提取各种乐器。

Lakeside Audio Isola Pro FX

有“MIDI模式”给Midi提示和自动模式指定频段，“MIDI模式”似乎有更高的质量。因为它是VST，所以它可以实时处理。

它是PhonicMind和Lakeside Audio Isola Prox FX的对比视频。出现了一个小小的神器，但我觉得和PhonicMind的质量相同。

iZotope RX 7

iZotope RX 7是一款独立的软件，用于修复和调整2 - 混音源，支持音乐制作和后期制作。

iZotope RX 7

iZotope的RX是2007年的最初版本公告是2018年的，释放的RX7的，从2-混合声，低音，打击乐器和自动提取，重新调节音量的能力已被添加声乐。

根据以下信息，似乎神经网络被用于声源分离算法。

The evolution of our intelligent audio technology continues with the Music Rebalance module in RX 7. Music Rebalance is a new tool that gives users the ability to boost, attenuate, or even isolate musical elements from audio recordings. It is a natural progression of our neural network-based source separation technology, first introduced in the forms of Dialogue Isolate and De-rustle in RX 6 and now evolved to extract multiple musical components from complex mixes.

Source: https://www.izotope.com/en/blog/music-production/exploring-the-technology-that-makes-rx-7-music-rebalance-possible.html

Audionamix XTRAX STEMS

Audionamix XTRAX STEMS是一款独立软件，可将双混音源完全分为三个人声，鼓和其他乐器。

Audionamix XTRAX STEMS

根据此信息，它使用了神经网络，似乎优于ADX TRAX。

Audionamix ADX TRAX

Audionamix ADX TRAX是一个独立的软件，可以提取人声。我们专注于声音提取。与PhonicMind不同，您可以在观看频谱时手动微调。

Audionamix ADX TRAX

BlueLab REBALANCE

BlueLab REBALANCE是一个VST，可让您调整每个2 - 混音源的音量，分为4个人声，低音，鼓和其他乐器。它于2019年1月发布。它是VST，因此可以实时处理。

我尝试过，它的质量低于PhonicMind。我猜，我猜你使用的是传统算法。

BlueLab REBALANCE

应该使用哪种声音去除/提取服务？

我想制作一个卡拉OK声源

我认为PhonicMind或VocalRemover很好。

因为它是一个Web服务，所以不必安装软件和其他麻烦。

我想复制（转录）我的耳朵

我认为Lakeside Audio Isola Pro FX，iZotope RX 7或Audionamix XTRAX STEMS都不错。

也可以提取除人声之外的乐器。我不知道哪个更好，因为我不使用它。

摘要

我们代表PhonicMind推出了用于提取和删除人声的软件/服务。