12

ИИ Звукоинженер

Заменили ли технологии человека, занимающегося сведением и мастерингом?
Технологии машинного обучения пришли в музыкальную индустрию намного раньше, чем начался глобальный хайп на эту тему. Я впервые попробовал технологии от Ozone в 2001 году. Восьмая версия 2019 года уже представляла из себя полноценного, технологичного помощника музыканта. Сегодняшняя 12-я версия - вообще пушка.
Убила ли эта технология профессию звукоинженера?
Любой начинающий музыкант, записав свой первый трек на домашнем компьютере, ужасается качеству результата: звучит тихо и мутно. Начинает гуглить проблему, утопает в бесконечных ютуб-обзорах, которые часто сделаны такими же бедолагами...
В студиях подобных проблем не возникало, музыканты даже не думали об этом. Иногда, на этапе сведения, некоторые участвовали в этом процессе, но это было скорее про художественную ценность результата, но никогда не про качество: опытные мужики за большими пультами делали своё великое дело тихо и незаметно.
Матчать

Шумоподавление

Все мы пользуемся наушниками с шумоподавлением, если используем их не дома, а, например, в метро. Как работает это чудо? Как говорится, никогда не учи физику - и будешь удивляться всю жизнь.

Но каждый всё же помнит, что звук - это волна. А если одна волна сталкивается с точно такой же другой, они гасят друг друга, и в результате наступает тишина. На этом принципе и работают наушники: их микрофоны слушают шум метро и... просто вычитают его из общего потока звуковых волн, в том числе музыки, что ты слышишь. А высокие вычислительные мощности позволяют это делать совсем незаметно и (почти) в реальном масштабе времени.
Секрет яркого, сочного микса - в устранении частотных конфликтов. Это как бы "шумоподавление наоборот".
Например, в диапазоне частот в районе 50 Гц живёт kick, удар большого барабана. Иногда к нему непрошенным гостем заваливается бас. Что в результате? Гул вместо грува. Задача звукоинженера - поставить "виртуальную" дверь - и тогда будет слышен и удар барабана, и нота баса.

Намного сложнее диапазон частот в районе 300 Гц. Кто-только не ленится наведаться сюда! Бас-гитара на верхних нотах, саксофон с тромбоном, синтезаторы, рояль, внезапно выехавший из кустов... Словно мёдом намазано. Проблема в том, что если разогнать эту вечеринку - микс станет пустым и скучным. А если оставить - получится "стена звука", фирменный приём, которым так гордился саунд продюсер Фил Спектор в 70е, но в результате загубивший несколько гениальных альбомов. Не верите? Послушайте, например All Things Must Pass Джорджа Харрисона, в оригинале, а затем в недавнем ремиксе/реместере. По-настоящему хорошие саунд продюсеры делают из этого диапазона частот "закрытый клуб" с жёстким фейсконтролем и дресс-кодом.

И так далее вверх по таблице аудиочастот, вплоть до "метёлочек". Так звукоинженер, устраняя частотные конфликты, делает микс сочным и необязательно громким - лёгким и прозрачным, чтобы было приятно слушать. Причём на любой аппаратуре - от дешёвых bluetooth колонок до аппаратуры класса Hi End.
И тут пришли новые технологии и сказали: мы обучили виртуального звукоинженера слышать все эти частотные проблемы, Более того, это не человек, а машина, а, значит, слышит идеально. И это действительно так.

Подобную технологию взяли на вооружение конкуренты, но Ozone (не путать с маркетплейсом) обошёл их на повороте, позволив внедрить "виртуального звукоинженера" прямо в процесс написания трека, прямо в DAW (digital audio workstation).

Для того, чтобы попробовать эту технологию на полную силу, мне пришлось отнести свой iMac в ремонтное алелье и существенно нарастить его мощности... И оно того стоило. Мой альбом Funk You, сделанный с помощью виртуального звукоинженера, звучит довольно хорошо. Но есть нюансы.

Плагин Ozone я поставил на каждой дорожке трека, и сводил постепенно: сначала ударные и бас, и затем добавляя дорожку за дорожкой. Ozone внимательно слушал и предлагал вариант сведения. И у меня был выбор: принять его вариант - или перейти на "ручное управление".

И вот что в итоге. Виртуальный звукорежиссеёр может и слышит всё идеально, но иногда, как говорится, выплескивает воду с ребёнком. Иными словами, в "Клуб 300 гц" он может не пустить хороший баритон-саксофон, но пропустить туда ненужные "хвосты" от синтезатора Муга.

Третий альбом - 50/50 mashups - я уже сводил с Ozone, не надеясь на чудо, а используя эту технологию как полноценный co-pilot.
Но если в дальнейшем у меня возникнет идея записать живой состав инструментов - оркестр или джаз бенд - я скорее приглашу опытного звукорежиссёра, и мы сделаем всё по-старинке, олдскульно, без всяких электрических co-pilot.

Самое грустное в этой истории то, что звукорежиссёров становится всё меньше, а новых появляться не будет. Технологии, конечно, разовьются, но опыт, о котором я рассказал в этой статье, показывает, что звукоинженер - полноценный участник творческого процесса. Ведь Джорджа Мартина не просто так называли "пятым битлом". С рутинными задачами ИИ технологии справляются отлично, но вот с творчеством у ИИ пока всё так себе.