12

ИИ Звукоинженер

Заменили ли технологии человека, занимающегося сведением и мастерингом?
Технологии машинного обучения пришли в музыкальную индустрию намного раньше, чем начался глобальный хайп на эту тему. Я впервые попробовал технологии от Ozone в 2001 году. Восьмая версия 2019 года уже представляла из себя полноценного, технологичного помощника звукорежисёра.
Убили ли эти технологии профессию?
Любой начинающий музыкант, записав свой первый трек на домашнем компьютере, ужасается качеству результата: звучит тихо и мутно. Начинает гуглить проблему, утопает в бесконечных ютуб-обзорах, которые часто сделаны такими же бедолагами...
В студиях подобных проблем не возникало, музыканты даже не думали об этом. Иногда, на этапе сведения, некоторые участвовали в этом процессе, но это было скорее про художественную ценность результата, но никогда не про качество: опытные мужики за большими пультами делали своё великое дело тихо и незаметно.
Матчать

Шупоподавление

Все мы пользуемся наушниками с шумоподавлением, если используем их не дома, а, например, в метро. Как работает это чудо? Как говорится, никогда не учи физику - и будешь удивляться всю жизнь.

Но каждый всё же помнит, что звук - это волна. А если одна волна сталкивается с точно такой же другой, они гасят друг друга, и в результате наступает тишина. На этом принципе и работают наушники: их микрофоны слушают шум метро и... просто вычитают его из общего потока звуковых волн, в том числе музыки, что ты слышишь. А высокие вычислительные мощности позволяют это делать совсем незаметно и (почти) в реальном масштабе времени.
Секрет яркого, сочного микса - в устранении частотных конфликтов. Это как бы "шумоподавление наоборот".
Например, в диапазоне частот в районе 50 Гц живёт kick, удар большого барабана. Иногда к нему непрошенным гостем заваливается бас. Что в результате? Гул вместо грува. Задача звукоинженера - поставить "виртуальную" дверь - и тогда будет слышен и удар барабана, и нота баса.

Намного сложнее диапазон частот в районе 300 Гц. Кто-только не ленится наведаться сюда! Бас-гитара на верхних нотах, саксофон с тромбоном, синтезаторы, рояль, внезапно выехавший из кустов... Словно мёдом намазано. Проблема в том, что если разогнать эту вечеринку - микс станет пустым и скучным. А если оставить - получится "стена звука", фирменный приём, которым так гордился саунд продюсер Фил Спектор в 70е, но в результате загубивший несколько гениальных альбомов. Не верите? Послушайте, например All Things Must Pass Джорджа Харрисона, в оригинале, а затем в недавнем ремиксе/реместере. По-настоящему хорошие саунд продюсеры делают из этого диапазона частот "закрытый клуб" с жёстким фейсконтролем и дресс-кодом.

И так далее вверх по таблице аудиочастот, вплоть до "метёлочек". Так звукоинженер, устраняя частотные конфликты, делает микс сочным и необязательно громким - лёгким и прозрачным, чтобы было приятно слушать. Причём на любой аппаратуре - от дешёвых bluetooth колонок до аппаратуры класса Hi End.
И тут пришли новые технологии и сказали: мы обучили виртуального звукоинженера слышать все эти частотные проблемы, Более того, это не человек, а машина, а, значит, слышит идеально. И это действительно так.

Подобную технологию взяли на вооружение конкуренты, но Ozone (не путать с маркетплейсом) обошёл их на повороте, позволив внедрить "виртуального звукоинженера" прямо в процесс написания трека, прямо в DAW (digital audio workstation).

Для того, чтобы попробовать эту технологию на полную силу, мне пришлось отнести свой iMac в ремонтное алелье и существенно нарастить его мощности... И оно того стоило. Мой альбом Funk You, сделанный с помощью виртуального звукоинженера, звучит довольно хорошо. Но есть нюансы.

Плагин Ozone я поставил на каждой дорожке трека, и сводил постепенно: сначала ударные и бас, и затем добавляя дорожку за дорожкой. Ozone внимательно слушал и предлагал вариант сведения. И у меня был выбор: принять его вариант - или перейти на "ручное управление".

И вот что в итоге. Виртуальный звукорежиссеёр может и слышит всё идеально, но иногда, как говорится, выплескивает воду с ребёнком. Иными словами, в "Клуб 300 гц" он может не пустить хороший баритон-саксофон, но пропустить туда ненужные "хвосты" от синтезатора Муга.

Третий альбом - 50/50 mashups - я уже сводил с Ozone, не надеясь на чудо, а используя эту технологию как полноценный co-pilot.
Но если в дальнейшем у меня возникнет идея записать живой состав инструментов - оркестр или джаз бенд - я скорее приглашу опытного звукорежиссёра, и мы сделаем всё по-старинке, олдскульно, без всяких электрических co-pilot.

Самое грустное в этой истории то, что звукорежиссёров становится всё меньше, а новых появляться не будет. Технологии, конечно, разовьются, но опыт, о котором я рассказал в этой статье, показывает, что звукоинженер - полноценный участник творческого процесса. Ведь Джорджа Мартина не просто так называли "пятым битлом". С рутинными задачами ИИ технологии справляются отлично, но вот с творчеством у ИИ пока всё так себе.