Спектральный анализ
Функции спектрального анализа позволяют специальными методами проанализировать частотный спектр звука и представить его либо в виде трехмерного графика с осями «частота – амплитуда – время», либо в виде спектрограммы (по горизонтальной оси откладывается время, по вертикальной – частота, а амплитуда сигнала на каждой частоте отображается цветом). Такое визуальное представление полезно для оценки тембра.
Звуковая волна, графическое отображение которой видно в рабочих окнах редакторов звука, обычно представляет аудиоданные во временной области (в системе координат «амплитуда – время»), а анализатор спектра позволяет оценить звуковую запись в частотной области.
На рис. 1.79 показан возможный вид звуковой волны во временной области (по горизонтали – время, по вертикали – амплитуда звукового сигнала), а на рис. 1.80 – в частотной области.
Рис. 1.79. Звуковая волна во временной области
Рис. 1.80. Звуковая волна в частотной области
В данных, отображаемых в частотной области (в форме спектрограммы или сонограммы), видны амплитуды и частоты синусоидальных волн, которые при смешивании могли бы звучать, как естественный звук. Наблюдая частотные составляющие звука и соответствующие им амплитуды, можно определить основную частоту и ее обертоны, присутствующие в записи. Аналогично нежелательные шумы могут быть проанализированы для определения предполагаемых фильтров, с помощью которых они приглушаются или удаляются.Для отображения спектра используются два разных метода – спектрограмма и сонограмма.На рис. 1.81 показан возможный вид спектрограммы.#Autogen_eBook_id81 Рис. 1.81. Спектрограмма
По горизонтали откладывается частота в герцах (Hz). По вертикали – амплитуда в децибелах (dB). Можно отобразить множество спектрограмм семпла в разных точках отсчета времени. В этом случае график становится трехмерным, как на рис. 1.82. #Autogen_eBook_id82 Рис. 1.82. Спектрограмма в разных точках отсчета
Возможный вид сонограммы показан на рис. 1.83. #Autogen_eBook_id83 Рис. 1.83. Сонограмма
На сонограмме по горизонтали откладывается время, а по вертикали – частота. Амплитуда каждой частотной составляющей представлена интенсивностью цвета любой точки графика. Этот метод отображения спектральной информации полезен для определения отличий частотного содержания записанной фонограммы от образцов спектра, созданных из натуральных звуков речи, музыкальных инструментов, голосов птиц и т. д. Что такое быстрое преобразование Фурье Математический метод, используемый для преобразования звуковой волны из временной области в частотную, называется преобразованием Фурье по имени французского математика и физика Жана Батиста Жозефа Фурье (1768–1830). Фурье был одним из первых математиков, утверждавших, что любой периодический сигнал может быть восстановлен при помощи сложения серий гармонических синусоидальных волн. С начала 1800-х годов – времени появления его первой работы – анализ Фурье был применен ко многим типам сигналов с целью лучшего понимания их составляющих. Так как преобразование Фурье – чрезвычайно трудоемкая вычислительная задача, для выполнения спектрального анализа используется техника, называемая Fast Fourier Transform, или быстрое преобразование Фурье, сокращенно – FFT (соответственно, БПФ). FFT использует специальные математические методы, чтобы сократить время вычислений путем наложения ограничений на размер выборки для анализа (например, ограничиваясь степенью 2). Размер такой выборки, называемый также числом быстрого преобразования Фурье (FFT-числом), определяет количество выборок звукового сигнала, используемых для анализа, и количество дискретных частотных групп. Если работа ведется с большим числом частотных групп, то они имеют меньшую ширину в частотном диапазоне, что позволяет точнее определить частоты.Поскольку живой звук обладает постоянно меняющимся спектром, при большом размере выборки нельзя гарантировать хорошего качества его исследования. Например, при FFT-анализе звукового файла с частотой дискретизации 44100 Гц при количестве выборок равном 4096 единиц будет анализироваться почти 100 мс длительности звука (4096/ 44100). Если звук не остается постоянным в течение этого времени, вы не сможете оценить спектр самых незначительных временных интервалов. Это существенная проблема, возникающая при анализе сигналов: разрешающая способность временных интервалов противоречит частотному разрешению.Анализ спектра в Sound Forge Анализатор спектра в Sound Forge версии 4.5 находится непосредственно в программе, а не в виде встраиваемого приложения, как в предыдущей версии.Он позволяет наблюдать спектральную картину не только файла, но и выделенного участка звуковой волны, а также дает возможность отслеживать изменение спектральной картины звука непосредственно при воспроизведении или при записи. Спектр сигнала может быть представлен как в виде обычной амплитудно-частотной характеристики, так и в виде сонограммы, где интенсивность различных частот выражена разными цветами.Для получения спектра звукового файла откройте его и выделите часть звуковой волны для анализа. Из строки меню Sound Forge выберите Tools (Инструменты) и далее Spectrum Analysis (Анализ спектра). В открывшемся окне спектрального анализа, показанном на рис. 1.84, спектрограмма отображает амплитуду (в децибелах) каждой частотной составляющей от 0 Гц (DC) до частоты Найквиста (половина от частоты дискретизации). Сегодня самыми распространенными частотами дискретизации являются 44,1 кГц (компакт-диск) и 48 кГц (DAT).#Autogen_eBook_id84 Рис. 1.84. Окно спектрального анализа
Когда вы перемещаете курсор по спектрограмме, в поле рядом с ним отображаются значения частоты и амплитуды текущей позиции курсора на графике частотного спектра, как показано на рис. 1.85. #Autogen_eBook_id85 Рис. 1.85. Значения частоты и амплитуды в текущей позиции курсора на графике
Если изображена сонограмма, выберите опцию Normal Display из меню Display, чтобы увидеть спектрограмму. При открытом окне анализатора спектра можно выделять часть звуковой волны, перемещая курсор или любым другим способом, какой допустим в Sound Forge. Выбрав команду Update! (Обновить) из меню анализатора спектра, вы тем самым отобразите спектр текущего выделения в звуковом файле. Если часть звуковой волны не выделена, анализу подвергаются выборки, непосредственно следующие за позицией курсора. Чтобы видеть несколько спектров одновременно, из меню Options откройте диалоговое окно Spectrum Settings (Установки спектра), которое показано на рис. 1.86, и увеличивайте значение в поле Slices displayed (Число отображаемых секторов) от 1 до 64. Каждый сектор представляет FFT-число выборок. #Autogen_eBook_id86 Рис. 1.86. Диалоговое окно Spectrum Settings
Выбрав число спектров, которые вы хотите увидеть, нажмите кнопку OK. Каждый график будет представлять собой спектрограмму, начинающуюся с различных отсчетов времени в звуковом файле, как изображено на рис. 1.87. #Autogen_eBook_id87 Рис. 1.87. Несколько спектральных характеристик в окне анализатора
Для перемещения по графикам секторов используется маленький горизонтальный регулятор (внизу слева). При движении ручки регулятора слева направо графики последовательно убираются с экрана, а восстанавливаются при обратном движении. Диалоговое окно Spectrum Settings содержит расширенные параметры, используемые при анализе и построении графика спектра. Для лучшего отображения типа анализируемых аудиоданных установки могут быть сохранены (надо нажать кнопку Save As, и будет предложено ввести название типа анализа). Сохраненные установки выбираются затем в раскрывающемся поле Name. Программа поставляется с шестью предустановками для анализа: • Audible range (от 20 до 20000 Гц – весь воспринимаемый на слух диапазон); • Lower frequencies (от 50 до 1000 Гц – низкие частоты); • Multiple slices (от 50 до 5000 Гц); • Sonogram 1 (от 100 до 5000 Гц); • Sonogram 2 (от 50 до 1000 Гц); • Voice, low freq. (от 50 до 1500 Гц). Следующее поле в окне установок – FFT size (Размер FFT). О нем уже говорилось выше в разделе «Что такое быстрое преобразование Фурье». FFT Overlap (от 0 до 99 %). Эта опция управляет величиной перекрытия между выборками для FFT-анализа. Меньшие значения сокращают число отдельных выполненных функций анализа, что уменьшает общее время обработки. Большие значения приводят к более подробному анализу и соответственно к крайне медленной обработке. Незначительное перекрытие может придать графику слишком сжатый вид, зависящий от длины выбранного фрагмента записи. Smoothing window (Окно сглаживания). Опция определяет функцию, примененную к данным перед анализом. Эта функция имеет мощный эффект для придания резкости пикам FFT-графика и плавности переходам (крутизне волны) между смежными частотами. Эффекты от применения этих функций могут быть легко оценены анализом простой синусоидальной волны. Доступны следующие шесть функций: • Rectangle window (Прямоугольное окно). К данным перед анализом не применяется дополнительных функций. Дает очень резкие пики и крутую волну; • Triangular window (Треугольное окно) дает несколько меньшую крутизну волны, чем Rectangle window. Это окно называют также выборкой Бартлетта или Парзена; • Hamming, Hanning и Blackman обычно используются в аудиоприложениях; • Blackman-Harris состоит из шести функций, включенных в число округляющих пики графика, и дает наименьшую крутизну соседней полосы. Forward/Backward. Когда в спектрограмме отображается несколько секторов, можно укладывать их на графике во времени либо в прямом, либо в обратном порядке в зависимости от нажатой кнопки. Set sonogram resolution (Установить разрешение сонограммы) от 1 до 10000 выборок. Эта опция определяет количество FFT-выборок, используемых в сонограмме и удерживающих время обработки и разрешение графика постоянными. Увеличение количества выборок увеличивает горизонтальное разрешение графика, но и удлиняет время обработки. Если флажок не включен, число выборок определяется длиной выделенного фрагмента в звуковой волне и перекрытием (Overlap). Использование этой опции может привести к довольно долгому времени обработки. Logarithmic graphing размечает горизонтальную координату не в линейном, а в логарифмическом масштабе. В таком случае большая область графика отводится низким частотам. Опция доступна только в режиме Normal display. Freq. Min. определяет низшую частоту (от 0 до 47,9 кГц), отображаемую на графике, когда выбрано масштабирование Zoom to Range (Масштаб по интервалу). Freq. Max. определяет высшую частоту (от 0,001 до 48 кГц), отображаемую на графике, когда выбрано масштабирование Zoom to Range. Ceiling (Верхний предел) от -149 до 0 дБ. Опция определяет самый верхний уровень амплитуды сигнала, изображаемый на графике, если выбрано масштабирование Zoom to Range. Floor (Нижний предел) от -150 до -1 дБ. Опция определяет самый нижний уровень амплитуды сигнала, изображаемый на графике, если выбрано масштабирование Zoom to Range. Hold peaks during monitoring (Сохранять пики во время текущего контроля). Если включена эта опция, наивысшее значение каждого пика частоты будет отмечено на спектрограмме маленькой линией. Maintain last monitored view (Сохранять последний контролируемый просмотр). Если этот флажок установлен, состояние спектрограммы при остановке воспроизведения сохраняется. В противном случае график спектрограммы соответствует звуковой волне в точке позиции курсора. Рассмотрим дальнейшие настройки, доступные из меню Options. Auto Update (Автоматическое обновление). Если отмечена эта опция, спектрограмма обновляется при любых изменениях позиции курсора или выделенных фрагментов в текущем файле. Monitor Playback (Контроль при воспроизведении). Спектрограмма изменяется в режиме реального времени при воспроизведении текущего файла. Разрешение графика будет зависеть от текущего размера выборки FFT и быстродействия вашего компьютера. Monitor Input (Контроль при вводе). Спектрограмма изменяется в режиме реального времени при подаче входного сигнала в вашу звуковую карту. Эта опция дает возможность анализа акустических характеристик помещения для записи в реальном времени. Show Position (Показывать позицию). Если данная опция включена, рядом с позицией курсора отображаются значения частоты и амплитуды текущей позиции курсора на графике спектра (как уже отмечалось выше). В противном случае позиции не отображаются. Show notes (Показывать ноты). Одновременно с отмеченной опцией Show Position можно вместо частоты в герцах получить буквенное обозначение ноты, соответствующей частоте в текущей позиции курсора (то есть ноты, ближайшей к данной частоте), как показано на рис. 1.88. #Autogen_eBook_id88 Рис. 1.88. Обозначение ноты и значение амплитуды в текущей позиции курсора на графике
Print Display (Распечатать график). По этой команде содержимое окна спектрального анализа выводится на печать. Close (Закрыть). Эта команда закрывает окно спектрального анализа. Спектрограмма снабжена мощными инструментами, позволяющими масштабировать ее как в интервале частот, так и в интервале амплитуд. Частотный и амплитудный интервалы определяют максимум и минимум частот и амплитуд, отображаемых не только в спектрограмме, но и в сонограмме.Для выбора интервала частот в Sound Forge выполните следующие операции:1. Щелкните левой кнопкой мыши по спектрограмме в конце частотного интервала, который вы хотите увеличить, и удерживайте кнопку.2. Перемещайте мышь влево или вправо, пока не выберете тот диапазон частот, который вас интересует, а затем отпустите кнопку мыши.3. Координата частоты спектрограммы теперь начинается и заканчивается теми частотами, которые вы выбрали. Чтобы сдвинуть выбранный диапазон вдоль частотного спектра, пользуйтесь длинным горизонтальным регулятором, расположенным под графиком, или клавишами управления курсором (влево/вправо) на клавиатуре.4. Чтобы вернуть графику прежний вид, выберите опцию Zoom Out Full (Полный вид) из меню Display или из контекстного меню. Для максимального увеличения масштаба дважды щелкните по графику переднего сектора спектрограммы или выполните команду Zoom to Range (Масштаб по интервалу) из меню Display. Команда устанавливает масштаб по значениям, указанным в полях Display Range диалогового окна установок спектра Spectrum Settings. Контекстное меню появляется при щелчке правой кнопки мыши по изображению спектра или при одновременном нажатии клавиш Ctrl + Shift + F10 на клавиатуре. Для выбора интервала амплитуд в Sound Forge надо сделать следующее: 1. Щелкните левой кнопкой мыши по спектрограмме в конце интервала амплитуд, который вы хотите увеличить.2. Удерживая левую кнопку, нажмите и удерживайте правую кнопку мыши. Увеличивающийся прямоугольник диапазона изменяется как в сторону вертикального, так и в сторону горизонтального выделения.3. Перемещайте мышь вверх или вниз, пока не выберете диапазон амплитуды, который вам необходим, и затем отпустите кнопку. Теперь в окне будет отображаться только выбранный диапазон амплитуды.Интервалы частоты и амплитуды можно выбрать также, настраивая параметры Display Range в окне настроек спектра (Spectrum Settings) в меню Display. В Sound Forge можно выполнить одновременный выбор интервала амплитуды и интервала частоты. Это делается таким образом:1. Щелкните левой кнопкой мыши по изображению спектра.2. Удерживая левую кнопку мыши, дважды щелкните правой. Увеличивающийся прямоугольник диапазона изменяется как в сторону вертикального, так и в сторону горизонтального выделения.3. Отпустите левую кнопку, когда изображение будет соответствовать масштабу вновь выбранного диапазона.Можно менять также интервалы частоты и амплитуды при помощи диалогового окна Spectrum Settings. Дополнительные команды меню Display в Sound Forge Normalize dB. Эта команда устанавливает интервал амплитуд спектрограммы равным максимальному и минимальному значениям графика. Logarithmic. Опция размечает горизонтальную координату не в линейном, а в логарифмическом масштабе. В таком случае большая область графика отводится низким частотам. Команда работает только в режиме Normal display и недоступна при изображении спектра в виде сонограммы. Grab/Pan (Захват). Как только вы изменили масштаб, включение данного режима позволит передвигать спектрограмму вертикально и горизонтально. Чтобы включить или выключить этот режим, выбирайте его из меню Display или из контекстного меню. Для выключения можно также воспользоваться клавишей Escape. В режиме захвата, перемещая мышь (щелкнув по левой кнопке мыши и удерживая ее), вы двигаете измененный в масштабе график спектра, перенося временно скрытые разделы спектра в видимую область. Для перемещения графика допускается и использование клавиш управления курсором. Sync Graphs (Синхронизация). Синхронизируются оба изображения в стереофайле, чтобы имелась возможность наблюдать одну и ту же FFT-область в обоих каналах. Line Graph – для изображения спектрограммы применяется линия. Bar Graph – для изображения спектрограммы используются серии прямоугольных полос, соответствующие FFT-выборкам (см. рис. 1.89). #Autogen_eBook_id89 Рис. 1.89. Спектрограмма из серии прямоугольных полос, соответствующих FFT-выборкам
Filled Graph изображается в виде графика с заливкой цветом, как показано на рис. 1.90. #Autogen_eBook_id90 Рис. 1.90. Спектрограмма с заливкой цветом
В этом режиме возможны проблемы с некоторыми драйверами видеоадаптеров. Если вы сталкиваетесь с такими проблемами, как неверное оттенение или чересчур замедленная прорисовка, обновите версию драйвера или воспользуйтесь режимами Line Graph и Bar Graph. Окно полного обзора, размещенное в нижней левой области окна анализатора спектра, указывает, где вы находитесь в файле относительно всего FFT. Прямоугольник с пунктирными линиями представляет область, которую вы видите в большем графике. Стереофайлы в Sound Forge При просмотре спектра стереофайла спектрограмма изображается для каждого канала. Установки для отдельных каналов производятся независимо. Например, если вы щелкнете кнопкой мыши по верхнему графику (при этом высвечивается его рамка, что и означает выделение) и затем выполните команду Normalize dB из меню Display, изменится вертикальный масштаб только верхнего графика. Это справедливо и для большинства других установок: вам следует всегда выбирать для изменений тот график, который вы хотите редактировать. Позиции курсора отмечаются только для выделенного графика. Чтобы переключиться между графиками, щелкните кнопкой мыши по нужному графику или воспользуйтесь клавишей Tab . Однако если помечена опция Sync Graphs (в меню Display), изменения масштаба и другие установки синхронизируются между двумя графиками. Получение сонограммы в Sound Forge 1. Откройте звуковой файл и выделите часть звуковой волны для анализа. Анализ очень длинных частей аудиозаписи может занять продолжительное время и понизить временное разрешение, поэтому выделяйте относительно короткие фрагменты. Кроме того, если аудиосигнал имеет низкий уровень амплитуды, вы можете увеличить его, используя в Sound Forge функции Volume (Громкость) или Normalize (Нормализация). 2. Если окно спектрального анализа еще не открыто, выберите из меню Tools команду Spectrum Analysis. 3. В самой спектрограмме или в окне установок спектра Spectrum Settings выберите диапазон частоты и амплитуды, который хотите просмотреть (см. раздел выше). В большинстве случаев вы захотите увидеть полный диапазон, но если файл, например, речевой, можно установить частотный интервал от 100 до 5000 Гц, чтобы видеть только важные детали.4. Из меню Display или контекстного меню выберите либо Sonogram (Color), либо Sonogram (B&W). Пока окно индикации обрабатываемого материала активно, вычисляется сонограмма, а затем отображается на экране. Sonogram (Color) изображает сонограмму в цвете (частота – по вертикали, время – по горизонтали, амплитуда представлена цветом). Sonogram (B&W) дает изображение в черно-белом режиме (частота – по вертикали, время – по горизонтали, амплитуда представлена градациями серого), как показано на рис. 1.91.#Autogen_eBook_id91 Рис. 1.91. Сонограмма в черно-белом режиме
Если на графике часть звуковой волны не отмечалась, сонограмма будет анализировать звуковые данные от позиции курсора до конца файла. Вам потребуется часто экспериментировать с различными параметрами в окне Spectrum Settings, чтобы получить наилучший из возможных графиков. Пробуйте сузить диапазоны частоты и амплитуды в максимально возможной степени, чтобы достигнуть больших контрастов. Если график слишком короткий, поднимите разрешающую способность сонограммы (sonogram resolution) до 200 выборок. Для большей разрешающей способности по частоте увеличьте FFT-размер. Чтобы снизить время обработки, понижайте число выборок (samplings) или FFT-размер. Интенсивность цвета можно корректировать, двигая регулятор внизу сонограммы. В правой нижней части окна изображена цветовая масштабная линейка (в децибелах). Выполнение этой функции может занять много времени, если у вас нет драйвера обработки цветовой палитры и не установлена программа Video for Windows.Если вы выделяете другой фрагмент в звуковом файле, выберите в меню команду Update! которая сгенерирует новую сонограмму на основании вновь выбранных звуковых данных. Чтобы переключиться в спектрограмму, выберите команду Normal Display из меню Display. Если поле Set sonogram resolution (Установка разрешающей способности сонограммы) в окне Spectrum Settings отключено, используйте функцию FFT overlap (Установка перекрытия FFT), чтобы определить, сколько сделать выборок. Для длинных файлов их число может быть значительным, поэтому на обработку потребуется много времени.