Добрый день, коллеги! Сегодня мы поговорим о такой важной вещи, без которой просто не будет вашей домашней студии. Это - звуковая карта (она же звуковая плата, аудиокарта или аудиоинтерфейс). Вы познакомитесь с процессами, происходящими на аппаратном уровне, с основами цифрового звука,
с понятиями и определениями, которые вам будут встречаться далее все
чаще и чаще в моем блоге. Я расскажу так же о том, на какие нюансы
следует обратить внимание при выборе звуковой карты. Звуковые карты предназначены для работы со звуком. Они бывают нескольких видов: интегрированная, внутренняя (internal) и внешняя (external).
Интегрированные карты - по-сути, чипы на материнских платах, как
правило довольно просты и не вполне подходят для ваших будущих задач.
Они предназначены лишь для звукового сопровождения различных событий
операционной системы или установленных приложений: звук в играх, в
видео-файлах, наконец, просто воспроизведение музыки. Сделать с их
помощью качественную аудио продукцию у вас не получится. Внутренние звуковые карты
делятся на "простые” (бытовые) и "серьезные” (остальные). "Простые”
выполняют те же ограниченные функции, что и интегрированные. А вот
"серьезные” уже рассчитаны на, действительно, серьезную работу с аудио
материалом. Они отличаются наличием конвертеров ЦАП-АЦП (цифро-аналоговый / аналого-цифровой преобразователи) высокого класса, возможностью работы с высоким битрэйтом (bitrate - битность, разрядность файла) и сэмплрэйтом (samplerate - частота сэмплирования, частота дискретизации), поддержкой протокола ASIO * подробно о нем далее, и конечно хорошим показателем соотношения сигнал/шум (измеряется в децибелах – дБ, dB). Внешние
звуковые карты бывают только "серьезные”, т. е. полу-профессиональные и
профессиональные. Они более всего удобны для применения в студиях
звукозаписи, так как являются прежде всего многоканальными HDD-рекордерами, оцифровщиками аналогового аудиосигнала, и наоборот. * Еще звуковые карты различаются количеством каналов (вход / выход), но об этом – позже, в практической части. Пока же – теория. Конвертеры ЦАП-АЦП (цифро-аналоговый / аналого-цифровой преобразователи). Конвертеры обеспечивают преобразование входящего звукового сигнала
из аналогового состояния, т. е. естественного, природного, лишенного
математической дискретности, в цифровое его представление - состояние,
формат. И наоборот – из цифрового его представления в исходящий
электрический сигнал, далее, уже с помощью усилителя, в звуковую волну. Собственно, в слышимый нами звук. * Естественно, если сигнал приходит не с выхода микшерного пульта или синтезатора
и не с выхода воспроизводящего устройства (во всех этих случаях, он уже
представлен в виде непрерывного электрического сигнала), то ему
предстоит вначале претерпеть преобразование в электрический сигнал с
помощью мембраны капсюля микрофона или звукоснимателя гитары. И тут и там задействован принцип электромагнитной индукции. Конвертеры высокого класса (A) позволяют преобразовать входящий аналоговый сигнал в цифровой
с наименьшими потерями - погрешностями в подробности его представления.
И преобразовать цифровой в аналоговый так же точно, т. е. качественно. С
высоким битрэйтом и сэмплрэйтом. То
есть, если вы запишите, например, голос с помощью звуковой карты с
конверторами высокого класса, то он будет записан более качественно,
естественно и с минимумом аппаратного шума. И чем выше будут параметры bitrate и samplerate, тем лучше будет ваша запись в плане качества, в плане приближенности к первоисточнику, к оригиналу. Цифровой звук. Цифровой формат. Битрэйт и сэмплрэйт. Цифровой звук, это
- способ представления электрического сигнала посредством дискретных
численных значений его амплитуды. Допустим, мы имеем аналоговую звуковую
дорожку хорошего качества и хотим ввести ее в компьютер, т. е. оцифровать, и желательно без потери качества. Как этого добиться и как происходит оцифровка? Звуковая волна
- это некая сложная функция, зависимость амплитуды звуковой волны от
времени. Казалось бы, что раз это функция, то можно записать ее в
компьютер "как есть", то есть описать математический вид функции и
сохранить в памяти компьютера. Однако, практически это невозможно.
Звуковые колебания нельзя представить аналитической формулой Как y=COSx,
например. Остается один путь - описать функцию путем хранения ее
дискретных значений в определенных точках. Говоря другими словами, в
каждой точке времени можно измерить значение амплитуды сигнала и
записать в виде чисел. Однако и в этом методе
есть свои недостатки, так как значения амплитуды сигнала мы не можем
записывать с бесконечной точностью, и вынуждены их округлять. То есть,
мы будем приближать эту функцию по двум координатным осям: амплитудной и
временной Приближать в точках - значит, брать значения функции в точках
и записывать их с конечной точностью. Таким образом, оцифровка сигнала включает в себя два процесса: процесс дискретизации – т. е. осуществление выборки и процесс квантования. Процесс дискретизации, это - процесс получения значений величин преобразуемого сигнала в определенные промежутки времени. Сэмплрэйт (samplerate), это - частота дискретизации (или частота сэмплирования) - частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (в частности, аналого-цифровым преобразователем - АЦП). Измеряется в герцах (Hz). Квантование, это - процесс замены реальных значений сигнала приближенными с определенной точностью. Битрэйт (bitrate), это - уровень квантования, объем информации в единицу времени (bits per second). То есть, какое количество информации о каждой секунде записи мы можем потратить. Измеряется в битах (bit). Таким образом, оцифровка,
это - фиксация амплитуды сигнала через определенные промежутки времени и
регистрация полученных значений амплитуды в виде округленных цифровых
значений. Так как значения амплитуды являются величиной непрерывной, нет
возможности конечным числом записать точное значение амплитуды сигнала,
именно поэтому прибегают к округлению. Записанные значения амплитуды
сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать
замеры амплитуды (чем выше частота дискретизации, т. е. – выше сэмплрэйт) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования, т. е. – выше битрэйт), тем более точное представление сигнала в цифровой форме мы получим. Надо
помнить, что частота дискретизации устанавливает верхнюю границу частот
оцифрованного сигнала, а именно, максимальная частота спектральных
составляющих равна половине частоты дискретизации сигнала. Значит, чтобы
получить полную информацию о звуке в частотной полосе, скажем, до 22
050 Гц, необходима дискретизация с частотой не менее 44.1 КГц. Проблемы цифрового звука. Существуют и некоторые проблемы, связанные с оцифровкой звука. В цифровом звуке
из-за дискретности информации об амплитуде оригинального сигнала
появляются различные шумы и искажения. Точнее, когда этот звук будет
преобразован обратно из цифрового вида в аналоговый, то в его звучании
будут присутствовать упомянутые частоты и шумы. Так, например, джиттер (jitter),
это - шум, появляющийся в результате того, что осуществление выборки
сигнала при дискретизации происходит не через абсолютно равные
промежутки времени, а с какими-то отклонениями, с погрешностью. То есть,
если дискретизация проводится, например, с частотой 44.1 КГц, то
отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то
немного позже. Из-за того, что входной сигнал
постоянно меняется, то такая ошибка приводит к захвату не совсем верного
уровня сигнала. В результате, во время проигрывания оцифрованного
сигнала, в звуке может ощущаться некоторое дрожание и искажения.
Появление джиттера является результатом не абсолютной стабильности
аналогово-цифровых преобразователей. Еще одной
неприятностью является шум дробления. Напомню, что при квантовании
амплитуды сигнала происходит ее округление до ближайшего уровня. Эта
погрешность так же вызывает ощущение несколько грязного звучания. Хранение оцифрованного сигнала. Оцифрованный сигнал
в виде набора последовательных значений амплитуды можно сохранить. Он
хранится на жестком диске или в памяти компьютера в определенном
формате. Это - PCM (Pulse Code Modulation) или WAV (Windows PCM/ADPCM) формат. WAV формат
- формат записи (стерео или моно) звука без сжатия. Так всего одна
минута стерео записи звука сделанная с CD-качеством (частота
дискретизации 44,1 КГц) содержит 60 с х 44 100Гц х 2 канала = 5 292 000
отсчетов. На каждый отсчет может приходиться 8 или 16 бит. Таким
образом, в варианте 8 бит на отсчет, одна минута звука займет в памяти
42 336 000 бит = 5 292 000 байт. Около 5 Мб. Вот так. Во время работы, вас будет интересовать прежде всего, именно WAV
формат, WAV файлы. А отличаются они между собой, кроме длинны - времени
звучания, еще и объемом, т. е. количеством данных. Чем выше битность (битрэйт) WAV файла и его частота дискретизации (сэмплрэйт) тем он подробнее. Чем WAV файл
подробнее, тем больше он "весит”, тем значительнее его объем в байтах,
тем больше места он занимает на жестком диске. Но его высокое качество
оправдывает все эти условные моменты. Протокол ASIO. Audio Stream Input/Output. ASIO - компьютерный драйвер "серьезной” звуковой карты, предназначенный для работы с цифровым аудио, разработанный легендарной немецкой компанией Steinberg. Он обеспечивает низкое время ожидания отклика (low-latency) во время работы и является удобным интерфейсом для взаимодействия специализированного программного обеспечения со звуковой платой компьютера. Принимая во внимание, что DirectSound Microsoft обычно используется, как стерео вход и выход (stereo in / out) для нужд непрофессиональных пользователей, то ASIO
драйвер позволяет музыкантам и звукорежиссерам обрабатывать свой аудио
материал с помощью программного обеспечения Windows, вместо внешних
"традиционных” аппаратных средств. ASIO обходит,
т. е. минует обычный путь от пользовательского запроса до слоя
посреднических программ Windows таким образом, что данный
пользовательский запрос соединяется непосредственно, напрямую с
аппаратными средствами звуковой карты. Это обхождение значительно
сокращает время ожидания отклика, сокращает задержку между запросами и,
благодаря этому принципу, звуковая карта работает с аудиосигналом почти в реал-таймовом режиме. На
самом деле, конечно, это не так. Просто задержка настолько мала, что
фактически не заметна. И еще. Протокол ASIO "бит-идентичен", то есть,
биты, посланные им в звуковую плату, идентичны имеющимся, т. е. заявленным в WAV файле. Этим обеспечивается необходимая для профессиональной работы высокая звуковая точность. Децибел. Отношение сигнал/шум. Динамический диапазон. Децибел,
это - некая относительная величина (одна десятая часть Белла). Не
абсолютная физическая, как например, грамм или метр, а такая же
относительная, как кратность или проценты, предназначенная для измерения
отношения, т. е. разности уровней других величин, обычно сигналов.
Сегодня децибел в основном применяется в акустике, где в децибелах
измеряется громкость звука и электронике. Отношение сигнал/шум (ОСШ, SNR, Signal-to-Noise Ratio), это - безразмерная величина, равная отношению мощности полезного сигнала к мощности шума. Обычно выражается в децибелах (дБ, dB). Чем больше это отношение, тем менее заметен шум. Для профессиональных звуковых карт характерным считается значение ~ 100-114 дБ. Этот же показатель является одновременно и заявленным динамическим диапазоном
звуковой карты. Собственно, динамический диапазон воспроизводимого
звука показывает - во сколько раз интенсивность самого громкого звука
может быть больше, чем интенсивность самого тихого. * Этот параметр
указывается производителем конкретной звуковой карты. Уровень звукового давления (SPL, Sound Pressure Level), это -
измеренное по относительной шкале значение звукового давления,
отнесённое к опорному давлению pSPL = 20 мкПа, соответствующему порогу
слышимости синусоидальной звуковой волны частотой, равной 1 кГц. * Интересно. Интенсивность звукового давления от разных источников: -
10 дБ SPL — тихий шёпот; -
20 дБ SPL — обычный, фоновый уровень шума в жилых помещениях; -
40 дБ SPL — тихий голос, негромкий разговор; -
50 дБ SPL — голос умеренной громкости, средняя динамика разговора; -
70 дБ SPL — стук клавиш пишущей машинки; -
80 дБ SPL — работающий двигатель грузовика; -
100 дБ SPL — сигнал автомобиля на дистанции 5—7 м; -
110 дБ SPL — работающий двигатель трактора на дистанции 1 м; -
120 дБ SPL — пороговое ощущение боли; -
150 дБ SPL — шум при взлете самолета с реактивным двигателем; -
200 дБ SPL — ядерный взрыв. Если
давление превышает порог 140 дБ SPL, то вполне возможны травматические
последствия для ушной барабанной перепонки, могут возникнуть серьезные
баротравмы, а в некоторых случаях – смерть. - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - Итог данного поста. При выборе звуковой карты обращаем внимание на класс конвертеров (A-класс), на возможность работы с высокой частотой дискретизации (сэмплрэйт – от 44 100 до 96 000 Hz) при высоком уровне квантования (битрэйт – 24 bit), на поддержку протокола ASIO (2.0), и на значительный динамический диапазон карты (100-114 dB). И выбираем скорее внешнюю, чем внутреннюю звуковую карту. Кроме этого, из того, о чем пока вообще не упоминалось, желательно наличие отдельного регулируемого выхода для подключения наушников, наличие микрофонных предусилителей на некоторых входах карты и фантомного питания в них – но, об этом позже, а так же наличие коаксиального или оптического цифрового входа/выхода (S/PIDF I/O). Разъемы MIDI контроллера "на борту” звуковой карты так же приветствуется. Ну что же. На сегодня теории, думаю, предостаточно. На связи!
|