Процесс записи аудиоинформации в память компьютера

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Звуковая волна — это непрерывная волна с меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон. Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц). Звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого участка устанавливается определенная величина амплитуды. Каждому участку присваивается определенный код. Этот процесс называется временной дискретизацией. Естественно, чем меньше «размер» участка, тем выше качество звукозаписи. Представление непрерывного звукового сигнала в виде дискретных цифровых сигналов выполняют специальные устройства – аналогово-цифровые преобразователи (АЦП). Обратное преобразование для воспроизведения звука, закодированного числовым кодом, выполняют цифро-аналоговые преобразователи (ЦАП). АЦП и ЦАП являются компонентами звуковых карт.

Современные звуковые карты могут обеспечить 16, 32, 64- битную глубину кодирования , т.е. производят кодирование 2 16 ,2 32 , 2 64 различных уровней сигнала. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2 I , где I — глубина звука.

Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

И так, качество двоичного кодирования звука определяется глубиной кодирования и частотой дискретизации.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц – качеству звучания аудио-CD. Возможны как моно-, так и стереорежимы.

при аналоговом представлении физическая величина принимает бесконечное множество значений, и её значения изменяются непрерывно,
при дискретном представлении физическая величина принимает конечное множество значений, и её величина изменяется скачкообразно.

Звуковая информация преобразуется из аналоговой формы в дискретную путём дискретизации, т. е. разбиения непрерывного (аналогового) сигнала на отдельные элементы. В процессе дискретизации производится кодирование — присвоение каждому элементу конкретного значения в форме кода.

Дискретизация — преобразование непрерывного потока информации (например, звука) в набор дискретных значений, каждому из которых присваивается значение его кода.

Источник представляет сообщение в алфавите, который называется первичным, далее это сообщение попадает в устройство, преобразующее и представляющее его во вторичном алфавите.

Код – правило, описывающее соответствие знаков (или их сочетаний) первичного алфавита знаком (их сочетаниями) вторичного алфавита.

Кодирование – перевод информации, представленной сообщением в первичном алфавите, в последовательность кодов.

Декодирование – операция, обратная кодированию.

Кодер – устройство, обеспечивающее выполнение операции кодирования.

Декодер – устройство, производящее декодирование.

При решении задач используются следующие понятия:

^ Временная дискретизация – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук.

Глубина звука (глубина кодирования) — количество бит на кодировку звука.

Уровни громкости (уровни сигнала) — звук может иметь различные уровни громкости. Количество различных уровней громкости рассчитываем по формуле N= 2 I где I – глубина звука.

^ Частота дискретизации – количество измерений уровня входного сигнала в единицу времени (за 1 сек). Чем больше частота дискретизации, тем точнее процедура двоичного кодирования. Частота измеряется в герцах (Гц). 1 измерение за 1 секунду -1 ГЦ.

1000 измерений за 1 секунду 1 кГц. Обозначим частоту дискретизации буквой f. Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20 кГц.

Качество двоичного кодирования – величина, которая определяется глубиной кодирования и частотой дискретизации.

^ Аудиоадаптер (звуковая плата) – устройство, преобразующее электрические колебания звуковой частоты в числовой двоичный код при вводе звука и обратно (из числового кода в электрические колебания) при воспроизведении звука.

Характеристики аудиоадаптера: частота дискретизации и разрядность регистра.

Разрядность регистра -число бит в регистре аудиоадаптера. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического тока в число и обратно. Если разрядность равна I, то при измерении входного сигнала может быть получено 2 I =N различных значений.

Размер цифрового моноаудиофайла ( V) измеряется по формуле:

V=f*t*I, где f –частота дискретизации (Гц), t – время звучания или записи звука, I разрядность регистра (разрешение). По этой формуле размер измеряется в битах.

Размер цифрового стереоаудиофайла ( V) измеряется по формуле:

V=2*f*t*I, сигнал записан для двух колонок, так как раздельно кодируются левый и правый каналы звучания.

Учащимся полезно выдать таблицу 1, показывающую, сколько Мб будет занимать закодированная одна минута звуковой информации при разной частоте дискретизации:

Тип сигнала	Частота дискретизация, КГц
Тип сигнала	44,1	22,05	11,025
16 бит, стерео	10,1 Мб	5,05 Мб	2,52 Мб
16 бит, моно	5,05 Мб	2,52 Мб	1,26 Мб
8 бит, моно	2,52 Мб	1,26 Мб	630 Кб

Устно. Известно, что Петя поет самым громким голосом в классе. На каком из ниже представленных графиков отражен голос Пети?

Содержание

— изучение использования средств работы с аудио информацией в управлении организацией;

— освоение принципов выбора техники цифровой звукозаписи и обработки аудио файлов;

— овладение навыками использования он-лайн сервисов для обработки аудио файлов.

Объем звуковой информации

Чем больше по объему аудио файл, тем лучше будет качество его воспроизведения. Объем более качественного файла всегда меньше объема файла с низким качеством, при равной их продолжительности.

Для расчета объема информации, занимаемого аудио файлом с одной звуковой дорожкой, используют нижеприведенную формулу:

где (N ) — общее время звучания аудио файла, сек,

(f) — частота дискретизации аудио файла, Гц,

(k) — глубина кодирования аудио файла, бит.

Рассмотрим пример, когда время звучания аудио файла 5 минут с высоким качеством воспроизведения с частотой дискретизации 48000 Гц и глубиной кодирования 64 бит, то объем такого файла будет составлять:

(V = 5 * 60 * 48000 * 64 = 921600000 бит,)

что составляет 115200000 байт, или 115200 Кбайт, или 115,2 Мбайт.

Для стереозвука расчет объема производится по той же формуле, лишь только с той разницей, что нужно еще умножить на два, так как файл со стереозвуком обычно занимает в два раза больше места из-за того, что процесс дискретизации во время кодирования стереозвука проводится для каждой дорожки отдельно.

Полный цикл преобразования звука: от оцифровки до воспроизведения у потребителя [ править | править код ]

Помехоустойчивое и канальное кодирование [ править | править код ]

Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого при записи к сигналу, полученному на выходе АЦП, добавляется искусственная избыточность (контрольный бит), которая впоследствии помогает восстановить поврежденный отсчет. В устройствах записи звука обычно используется комбинация из двух или трех помехоустойчивых кодов. Для лучшей защиты от пакетных ошибок также применяется перемежение. Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). К полезному сигналу добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и преобразует поступивший канальный сигнал в цифровой поток данных. После коррекции ошибок сигнал поступает в ЦАП.

Принцип действия ЦАП [ править | править код ]

Цифровой сигнал, полученный с декодера, преобразовывается в аналоговый. Это преобразование происходит следующим образом:

Декодер ЦАП преобразует последовательность чисел в дискретный квантованный сигнал
Путём сглаживания во временной области из дискретных отсчетов вырабатывается непрерывный во времени сигнал
Окончательное восстановление сигнала производится путём подавления побочных спектров в аналоговом фильтре нижних частот

Параметры, влияющие на качество звука при его прохождении по полному циклу [ править | править код ]

Основными параметрами, влияющими на качество звука при этом являются:

Также немаловажными остаются параметры аналогового тракта цифровых устройств кодирования и декодирования:

Введение

О том, как пользоваться звуковой картой, написано множество книг и статей, в том числе и на нашем сайте. Однако, на этот раз речь пойдет не о том, что уже и без того известно каждому постоянному читателю раздела Мультимедиа, а о том, что называется практикой цифровой звукозаписи. Наверняка любой владелец мультимедийного компьютера рано или поздно приступает к этой увлекательной деятельности. Собственно, для этого (и не только) компьютер и приобретают. Тем не менее, процесс этот не столь прост, и нужно иметь некоторый навык для достижения максимального качества. Цель этой статьи — дать читателям сайта (и владельцам SB Live! среди них в частности) некоторые полезные рекомендации в этой области, которые по тем или иным причинам не освещены в прессе или Сети должным образом.

Начну с того, что в свое время передо мной встал вопрос сведения моей кассетной фонотеки в MP3 файлы, и я вынужден был потратить не одну ночь для того, чтобы сделать процесс перегона аудиоинформации в компьютер по возможности более качественным и более универсальным для большинства аудиозаписей. Скажу сразу, несмотря на солидный опыт звукозаписи (и аналоговой и цифровой), это, на первый взгляд, невинное занятие потребовало у меня мобилизации многих сил и знаний.

Однако, пользователь приличной звуковой карты совершенно не обязан (как я) иметь высшее радиотехническое образование, и все же, достойное качество полученной записи требовать вправе. Считаю своим долгом дать аудитории iXBT тот самый минимум информации, который, надеюсь, избавит многих от неприятностей, связанных с оцифровкой аудио (таких как помехи, наводки и т.д). Полагаю, что некоторые сведения в этом материале будут полезны и опытным пользователям. Для того чтобы не выйти за рамки приличия, скажу также, что все написанное ниже — результат обобщения опыта многих людей, но, конечно же, не претендует на истину в последней инстанции. Обоснованная критика от читателей — это всегда хорошо! (Свои отзывы на статьи можно писать и в нашу конференцию О материалах сайта).

Общие замечания

Наиболее часто пользователям мультимедиа приходится оцифровывать следующие источники:

Виниловые пластинки. Здесь главное — хороший проигрыватель и предусилитель-корректор (тот, что встраивается в дорогие усилители). Из отечественных проигрывателей порекомендую Феникс ЭП 009С (алмазный эллипс в качестве головки, автоматический тонарм). А дальше — записываем пластинку на компьютер, чистим от щелчков (Click Removal), фильтруем инфразвук ниже 16 Гц (для устранения рокота) и нарезаем запись на песни. Шум лучше не удалять, так как шум в 65-70 дБ на выходе проигрывателя (или корректора) не так уж и велик. Например, 65-70 дБ выдает аналоговый выход большинства CD-ROM и ведь ничего? А вот с фоном (неприятным низкочастотным тоном в 50, 100, 150 и так далее Гц) лучше разобраться до оцифровки — где-то висит земля, или перепутаны полюса внутри проигрывателя.

Микрофон. Я подразумеваю хороший микрофон и микрофонный усилитель. И про то, и про другое можно найти массу информации в печатных изданиях, да и в Сети тоже. Дам совет только в одном.

Дело в том, что в студийной практике применяется один очень умный принцип для соединительных кабелей. Про витую пару сигнальных линий все уже знают, но вот как припаивать провода на концах проводов — лишь посвященные, да и то не все.

На рисунке ниже показано, как правильно изготовить шнур, который не внесет никакого вклада в качество записи, если он состоит из качественных проводов. В качестве экрана — медная оплетка (желательно, чтобы везде применялась медь!). Сигнальные жилы внутри экрана — витая пара медных многожильных проводов. Подобный кабель лучше купить в каком-нибудь магазине, где продают профессиональные микрофоны, гитары, и т.п. (дешевле обойдется провод, чем помехи). Стоит отметить, что только с микрофоном необходимо столь щепетильно отнестись к кабелю, иначе будете менять микрофонные усилители и сами микрофоны до греческих календ.

Если картинка не очень понятна, знайте сам ПРИНЦИП:

Экран соединен с металлической основой капсюля (если она металлическая) или просто висит внутри корпуса микрофона, а на входе (только лишь на входе. ) экран соединяется с землей. Тогда помехи и наводки, попав в экран, стекают в одну точку (как бы компенсируются), а не циркулируют по экрану. Экран не должен быть «антенной для помех»!

Я надеюсь, инженеры простят мне столь вольное толкование этой важной истины, а эстеты подобный эскиз :).

В случае с электрогитарой — руководствоваться тем же! Электрогитара — тот же микрофон, только менее чувствительный. Экран коммутационной схемы внутри гитары (если нет — сделайте из жести или шоколадной фольги) присоединяем к экрану, а потом, также соединяем на входе карты или приставки с землей. Не играйте на этом инструменте вблизи системного блока — изготовьте кабель подлиннее.

Вот только не стоит гробить студийную технику! Просто проверьте, как распаяны разъемы и все. Микрофон с профессиональным разъемом CANON (это такой здоровый, с защелкой) имеет обычно землю на штырьке номер 3 — тот, что посередине, если не так — уточните у продавца (не дарить же 100$ за новенький Shure SM58!?).

Шнуры от микрофонного усилителя/процессора/магнитофона и т.д. паяем по тому же принципу (экран соединяем с землей на входе), только здесь добавляется еще жила второго стереоканала. Не мешает заземлить и системный блок компьютера.

Надеюсь, вы согласны с тем, что грамотно созданный шнур не столь уж плох в сравнении с кабелем Monster Cable или Vampire, хотя если ваш шестиканальный DSP-усилитель стоит 1000$ — все же потратьтесь на приличный кабель.

Запись с микрофона нуждается лишь в частотной коррекции (если АЧХ у микрофона имеет ощутимую неравномерность и спад раньше 18-19 кГц). Кое-кто чистит и шум, но «правильный» тракт до оцифровки менее шумен, чем капли дождя, падающие на подоконник и безжалостно фиксируемые на Ваш микрофон.

А вот с компакт-кассетой 2 не так все просто. Тут запись и очистка от артефактов — самое настоящее искусство и подходы у опытных людей свои. Я же поделюсь моими методами, позволившими ИМХО 3 выжать из кассеты все ценное.

2 Ирония судьбы — компакт-кассета и компакт-диск сейчас уже не кажутся нам компактными. А уж их «некомпактных» собратьев из эпохи динозавров так вообще мало кто помнит. Так что, производителям надо было быть поосторожнее с выбором названий в своё время.

3 ИМХО — сокращение от In My Humble Opinion, «по моему скромному мнению». Англоизм, стандартное слово в обиходе постоянных участников конференций. Обычно применяется пишущим сообщение перед каждой спорной фразой, чтобы указать, что это лишь ЕГО скромное мнение, не уводить тему в сторону, и не вызывать шквал протеста от оппонентов, которые забивают тем самым конференцию «мусором».

Вся штука в том, что у компакт-кассеты ограниченный ресурс эксплуатации (примерно 300 прогонов). Потом информация начинает теряться, звук становится рассыпчатым, глухим, прерывистым. Кроме того, более целесообразно гонять CD с отполированными MP3 файлами, чем вставлять кассету, крутить головку, чистить тракт спиртом и т.д. (хотя и у этого ритуала есть приверженцы!). К тому же, отреставрированная фонограмма с приличной по качеству кассеты ИМХО иногда даст фору по насыщенности деталями и аналоговой «теплоте» многим 128 Кбит MP3 — файлам. Я не распространитель мифов о дискретной и мертвой цифровой записи (хотя лет пять назад был другого мнения, да и АЦП/ЦАП были не те), но кассету хоронить рано, и владельцы хороших стационарных аппаратов меня поддержат!

Реставрация

Прежде всего, необходимо усвоить, что даже если Ваш аппарат выдает музыкальную информацию лишь 40-14000 Гц на Ferro-кассете, он все равно воспроизводит какие-то звуки и на более высоких частотах (вплоть до 20-21000 Гц), только они не вписались в нормы ГОСТа и МЭКа, то есть очень ослаблены и утоплены в шумах. Именно это нам и предстоит исправить.

1. Выравнивание АЧХ

Почти на любую стандартную кассету (TDK D, и т.д.), да и на кассеты подороже аудиозапись попадает практически одинаково. Если у вас не TEAC за 900$ или не Nakamichi Dragon, то разницы нет: AIWA или ВЕГА. На подобных «бюджетных» аппаратах воспроизводимый с кассеты сигнал больше зависит от свойств магнитной ленты, нежели от тракта воспроизведения. А магнитная лента на «железных» кассетах просто не пропустит частоты выше 14000 Гц, остальное будет жестоко ослаблено.

АЧХ тракта запись-воспроизведение для магнитофона ВЕГА-МП122С:

Конечно, тракт записи-воспроизведения у всех магнитофонов различен и особенно дотошным владельцам хороших стационарных магнитофонов исследования предстоит проделать самостоятельно. Для этого (а также для дальнейшего мастеринга) нам понадобятся последние версии знакомых программ (или хотя бы их демо-версии):

Cool Edit Pro 1.2, или 2000 для создания белого шума, синусов, фильтрации и очищения от шумов и т.д.
Sound Forge 4.5 для монтажа (оцифровка, нарезка материала)
SpectraLAB 4.32 для всестороннего анализа
Энтузиасты могут применять внешние денойзеры (удаление шума), типа Sonic Foundry Noise Reduction 2.0, Arboretum Restoration-NR и др., но я после многочисленных субъективных и объективных исследований остановился на встроенном средстве Cool Edit Pro (хотя долго не мог с этим смириться). Все же программисты Syntrillium Software свой хлеб едят не зря! 4 То же касается и фильтрации.

4 Cледует отметить, что коммерческая версия программы Cool Edit (Cool Edit Pro 1.2) существенно отличается от своего бесплатного собрата (Cool Edit 2000). Например, Cool Edit 2000 не имеет функции Preview (предварительного прослушивания) при обработке, Multitrack-режима и т.д. И тем не менее, все необходимое для наших задач имеется в обеих версиях программы Cool Edit.

Процедуру исследования тракта записи/воспроизведения магнитофона лучше проделать так:

Очистить воспроизводящую головку магнитофона и прижимной ролик с ведущим валом спиртом, затем, поместив чистую (с обеих сторон!) кассету в магнитофон, приготовить ее к записи.
Далее, подав белый шум 5 (48 кГц) на вход (Generate/Noise…/White, mono, intensity = 12 в Cool Edit), добиться оптимального уровня записи на Вашем магнитофоне и записать около 3-х минут (если компьютер не ниже Celeron+64Mb) или 60 секунд этого шума (ежели машина слабее). Магнитная лента весьма неравномерно реагирует на последовательное изменение значения частоты (Frequency Sweep), поэтому, из соображений статистики лучше использовать белый или розовый шум. Это обеспечивает более точный и равномерный график АЧХ.
Далее, следует, не вынимая кассету и не подкручивая воспроизводящую головку, записать только что полученный белый шум — с кассеты на Line-In звуковой карты (частоту дискретизации ставим 48 кГц). 6
Теперь нормализуем полученный сигнал под -1 дБ (Process/Normalize… в Sound Forge 4.5), и сохраняем.
В SpectraLAB выбираем Mode/Post Process, и открываем только что полученный файл. Делаем настройки (Settings): 48000, 16bit, FFT Size = 65536 (для слабой машины 16384), mono, Average = linear. Выделяем весь файл в режиме View/Time Series, жмем правую кнопку и приказываем: Compute and Display Average Spectrum.
Смотрим на спектр и кривимся неравномерности АЧХ нашего магнитофона J. В Cool Edit открываем этот же файл и поднимаем ослабленные частоты (FFT Filter etc.). Сохраняем (но не закрываем. ) в другой файл и этот другой открываем в SpectraLAB (первый файл пригодится в случае порчи второго). Чтобы запомнить огибающие спектра в SpectraLAB для сравнения — жмите Set в районе Overlays.
Не красиво? Отменяйте в Cool Edit фильтрацию — и снова!

5 Использовать розовый шум предпочтительнее, так как он ближе по свойствам к музыкальному сигналу.

6 Почему это обязательное условие для получения налучшего качества записи, читайте статьи с измерениями тестовых параметров звуковых карт на нашем сайте.

Как видите, искусство и здесь требует жертв :(. Однако я повторяю — на хороших аппаратах тракты Record-Play очень схожи, и вы можете воспользоваться моими результатами исправления АЧХ для магнитофона МП ВЕГА-122С. Для этого в файле C:Windowscool.ini найдите раздел [Filters96] и в незанятой строке запишите (в одну линию!) следующее:

Item29=RESTORATION,3,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,9,3444, 21,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,4004,100,4012,5,4096,5, 19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,9,3444,21,3583,28,3688,42,3773, 48,3848,61,3925,76,3957,96,3998,100,4004,100,4012,5,4096,5,2,0,12000,1,2,0,0,1000, 100,5,-10,100,-0.5,12,24000,1,0,1,1,48000

Теперь в Transform/Filters…/FFT Filter (все в том же Cool Edit) ищем пресет RESTORATION и корректируем фонограмму. Все. Я убил 2 дня, чтобы выровнять АЧХ своей ВЕГИ до значения ±0,5 дБ от 10 до 19500 Гц! Наслаждайтесь. АЧХ ВЕГИ-МП122С до (зеленый график) и после (желтый график) частотной коррекции:

Кроме того, всем известно, что АЧХ самой звуковой карты, тем более — внешнего кольца Line-Out-Line-In тоже обладает характерным спадом в области высоких частот, и в этом обычно виновен АЦП, нежели более-менее линейный ЦАП. Оцифровка получается тусклой, лишенной прозрачности и воздушности в верхнем регистре. С этой проблемой желательно справиться перед обработкой записанного материала и об этом речь пойдет ниже.

2. Владельцам SB Live!

Многие владельцы SB Live!1024 Value знают, что АЧХ кодека SigmaTel STAC9721 совсем не идеальна и уже после 4,5 кГц начинается ступенчатый спад:

Основной вклад в это вносит АЦП кодека, в чем можно убедиться, скажем, в этой статье. Сделано это, с одной стороны, для нашего же блага: таким образом предотвращается проникновение паразитных гармоник в слышимую область спектра. С другой стороны, подобное «подрезание» верхов имеет и негативное последствие: на достаточно серьезной Hi-Fi-аппаратуре этот ньюанс может быть вполне заметен.

Поэтому, всем владельцам SB Live! НАСТОЯТЕЛЬНО рекомендую каждую записанную фонограмму через Line-IN сначала, то есть до последующей обработки, пропустить через следующий фильтр (тот же cool.ini и тот же раздел):

Item36=CORRECtion,3,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391, 12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825, 89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,2046,10,2391,12,2569,15, 2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,56,3726,70,3825,89,4096,100, 2,0,12000,1,2,0,0,1000,100,3,-10,100,0,14,24000,1,0,0,1,48000

Кстати, номер Item должен не совпадать ни с каким другим, ну а так — любой…

После подобной операции неравномерность АЧХ в кольце LineOUT — LineIN для звуковой карты SB Live! удалось уменьшить до ±0,1 дБ! В этом можно убедиться, взглянув на спектрограмму (мне это далось в свое время опять же ценой пары ночей).

АЧХ звуковой карты SBLive (кодек STAC9721) до и после частотной коррекции. Шкала графика 5 дБ!:

Теперь линейный вход у нас — референс! Enjoy…

Владельцам микрофона МД-52А (студийный, 20-16000Гц) посоветую следующую коррекционную фишку:

Item40=MIC_MD52A,3,8,0,0,1723,17,2158,37,2569,53,3176,89,3316,100,3480,100,4096, 100,11,0,50,4,51,5,60,6,73,8,81,10,85,14,87,17,79,19,60,24,51,4096,50,2,1,6000,1,4, 0,0,648,31,831,57,1000,100,3,0,100,0,16,24000,2,1,0,1,48000

Не забываем, что строка неразрывна во всю свою длину.

3. Шумоподавление

Теперь поговорим о шумоподавлении. Как я уже указал — Noise Reduction в Cool Edit — на мой взгляд — лучший. Звукорежиссеры хвалят Arboretum Ionizer, якобы из-за того, что он избавлен от внесения фазовых артефактов в обработанный материал (если знаете где взять — напишите!), знакомые советуют Sonic Foundry Noise Reduction. Но мои уши пока что влюблены в CoolEdit-овский шумодав. Кроме того, ни в каком другом нет столько настроек и опций, да и то, что он работает медленнее (читай добросовестнее) других — тоже говорит о многом. Существует также весьма неплохая программа реставрации DART Pro, однако детальное сравнение всех этих программных продуктов выходит за рамки данной статьи.

Итак, после многотрудной фильтрации необходимо взять 1,5-1,6 секунд шума перед каждой (для максималистов) или какой-нибудь средней фанерой (но только с той же кассеты и стороны, откуда взята фонограмма). Далее:

1. Сделать профиль этого 1,5 секундного шума (Get Profile from Selection) с параметрами:

Snapshots in profile = 1024…4096 (в зависимости от мощности компьютера).
FFT Size = 4096 (эту цифру я нашел оптимальной для подавления шума после многочисленных экспериментов); Не рекомендую ставить максимальный размер FFT, так как это повлечет в результате увеличение так называемого Hiss-шума сигнале.
2. Теперь, отфильтрованную фонограмму выделяем и уничтожаем шум тем же Noise Reduction в Cool Edit. Параметры могут быть разными (поэкспериментируйте с кнопкой Preview). Но я, после долгих опытов, могу для магнитофона порекомендовать следующие параметры:

Precision Factor = 12 (для максималистов — все 14, для Preview — 8). Параметр определяет точность вычислений;
Smoothing Amount = 0 (именно 0!). Параметр вносит допуск на погрешность вычитания спектра шума из спектра сигнала в дБ. Чем больше — тем хуже;
Transition W >Noise Reduction Level = 35…42 (при Transition W >Нередко приходиться повторно нормализовать фонограммы под -0,2 дБ (это стандарт для CD-Audio), так как шумоподавление может серьезно уменьшить энергию сигнала. Все готово к MP3-кодированию! Правда, бытует мнение, что нормализация перед сжатием в MP3 — это очень вредно, и Вы на это должны идти лишь в случае ощутимого различия между уровнями отдельных каналов или просто слабого (-3…-6 дБ) уровня фонограммы в конечном итоге. Это как раз тот случай, когда решать Вам.

4. Сжатие

Лично я пользуюсь кодером Fraunhofer IIS, встроенный в BPM Studio Pro 3.0. Остальные кодеры (ИМХО) от Fraunhofer IIS не могут преодолеть своеобразного шелеста в полученном файле, причем на всех битрейтах. А вот к LAME -f я отношусь настороженно, этот кодер, по-моему, только на АЧХ и хорош.

Теперь о битрейте. Честно говоря, все ньюансы сохраняются лишь при 256 Кбит/c, но и при 192 Кбит/c фонограмма почти неотличима от исходной. Для проверки того, какой битрейт наилучший для данной фонограммы, я применяю довольно жестокую методику субъективного сравнения. Сначала кодирую наиболее ответственный фрагмент (насыщенный высокими частотами или с какими-нибудь знакомыми ньюансами) во все битрейты: 128, 160, 192, 224, 256. Затем последовательно соединяю в Sound Forge оригинальный фрагмент с закодированным и слушаю. Обычно 128 и 160 Кбит/с выпадают из рассмотрения сразу, а настоящая борьба разворачивается между 192 и 256 Кбит/с (ну не люблю я поток в 224 Кбит/c, ибо кривой он какой-то :)).

Для отреставрированных фонограмм вполне хватает и 192 Кбит/с, но опять-таки некоторым и 256 Кбит/c подчас не хватает. Скажу также, что магнитофонные записи представляют собой весьма непростой для кодирования материал. Как-то раз я подверг, как теперь принято говорить, «зачистке» фонограмму с весьма посредственным качеством и закодировав потом все в 192 Кбит/c я был потрясен услышанным! Результат звучал словно джаз на 112 Кбит/c, то есть омерзительно. У этого феномена очень глубокая причина и я могу написать еще одну статью на эту тему, если желаете. Так что, доверяйте технике и спектрограммам, но контрольное прослушивание устроить не ленитесь. Тем не менее, по большей части эта информация относится к обладателям хорошего тракта усилитель-колонки (наушники).

Заключение

Вот так, проявив стремление получить максимум из возможного, можно добиться вполне пристойного качества записи с любого источника. Просто не нужно никогда довольствоваться тем, чем нас снабдили производители звуковых карт, а искать, изучать и требовать Звук. Надеюсь, вы со мной согласны, уважаемые читатели.

«Обычный» аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде. Как же происходит преобразование аналогового сигнала в цифровой?

Цифровой звук – это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество» будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот – приблизительно от 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Как этого добиться и как происходит оцифровка? Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть», то есть описать математический вид функции и сохранить в памяти компьютера. Однако практически это невозможно, поскольку звуковые колебания нельзя представить аналитической формулой (как y=COSx, например). Остается один путь – описать функцию путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям – амплитудной и временной (приближать в точках – значит, говоря простым языком, брать значения функции в точках и записывать их с конечной точностью).

Таким образом, оцифровка сигнала включает в себя два процесса — процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации — это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени (рис. 1).

Квантование — процесс замены реальных значений сигнала приближенными с определенной точностью (рис. 2). Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежутки времени и регистрация полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим.

Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.

Теперь о практических проблемах.

Во-первых, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.

Во-вторых, частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения (под фразой «в цифровом звуке есть такие-то частоты и шумы» подразумевается, что когда этот звук будет преобразован обратно из цифрового вида в аналоговый, то в его звучании будут присутствовать упомянутые частоты и шумы). Так, например, джиттер (jitter) – шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к «захвату» не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. Как мы говорили, при квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.

Справочка: стандартные параметры записи аудио компакт-дисков следующие: частота дискретизации — 44.1 КГц, уровень квантования – 16 бит. Такие параметры соответствуют 65536 (2) уровням квантования амплитуды при взятии ее значений 44100 раз в секунду.

На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя — всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.

Поехали дальше. Как получить аналоговый звук опять из цифры?

Мы же его должны услышать, а цифровки нам слышать не дано.

Как после оцифровки прослушивать звук? То есть, как преобразовывать его обратно из цифрового вида в аналоговый?

Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала:

Еще совсем недавно воспроизведение звука в домашних компьютерах было проблемой, так как компьютеры не оснащались специальными ЦАП. Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker). Вообще говоря, этот динамик до сих пор имеется почти во всех PC, но никто уже не помнит как его «раскачать», чтобы он заиграл. Если вкратце, то этот динамик присоединен к порту на материнской плате, у которого есть два положения – 1 и 0. Так вот, если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом он «плавно раскачивается» вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox – это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый – то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью звуковой карты – подключаемой, либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом. Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно). Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнями. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.