Что такое звуковые данные

Урок « Кодирование звуковой информации «

Аналоговый и дискретный способы представления звука

Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме.

При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно.

При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Аналоговое и дискретное кодирование

Примером аналогового хранения звуковой информации является виниловая пластин­ка (звуковая дорожка изменяет свою форму непрерывно), а дискретного — аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Восприятие звука человеком

Звуковые волны улавливаются слуховым органом и вызывают в нем раздражение, которое передается по нервной системе в головной мозг, создавая ощущение звука.

Колебания барабанной перепонки в свою очередь передаются во внутреннее ухо и раздражают слуховой нерв. Так образом человек воспринимает звук.

В аналоговой форме звук представляет собой волну, которая характеризуется:

    Высота звука определяется частотой колебаний вибрирующего тела.

Герц (Гц или Hz) — единица измерения частоты колебаний. 1 Гц= 1/с

Человеческое ухо может воспринимать звук с частотой от 20 колебаний в секунду (20 Герц, низкий звук) до 20 000 колебаний в секунду (20 КГц, высокий звук).

— аналоговый — непрерывный — звук

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой.

Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон.

Кодирование звуковой информации

Для того чтобы компьютер мог обрабатывать звук, непрерывный звуковой сигнал должен быть превращен в последовательность электрических импульсов (двоичных нулей и единиц).

В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Т.о. при двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала.

Рис. Временная дискретизация звука

Таким образом, непрерывная зависимость амплитуды сигнала от времени А(t) заменяется на дискретную последовательность уровней громкости.

На графике это выглядит как замена гладкой кривой на последовательность «ступенек»:

Каждой «ступеньке» присваивается значение уровня громкости звука, его код (1, 2, 3 и так далее).

Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Преобразование аналоговой формы представления звука в дискретную происходит в процессе аналогово-цифрового преобразования (АЦП).

Преобразование дискретной формы представления звука в аналоговую происходит в процессе цифро-аналогового преобразования (ЦАП)

Качество кодирования звуковой информации зависит от :

1) частотой дискретизации, т.е. количества измерений уровня сигнала в единицу времени. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации), тем точнее процедура двоичного кодирования.

2) глубиной кодирования, т.е. количества уровней сигнала.

Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле: N = 2 i = 2 16 = 65536, где i — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код.

Количество измерений в секунду может лежать в диапазоне от 8000 до 48 000, то есть частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 кГц. При частоте 8 кГц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 кГц — качеству звучания аудио-С D . Следует также учитывать, что возможны как моно-, так и стерео-режимы.

Читайте также:  Как сделать формат avi

Можно оценить информационный объем стереоаудиофайла длительностью звучания 1 секунда при высоком качестве звука (16 битов, 48 кГц). Для этого количество битов, приходящихся на одну выборку, необходимо умножить на количество выборок в 1 секунду и умножить на 2 (стерео):

Решение: 16 бит • 48 000 • 2 = 1 536 000 бит = 192 000 байт = 187,5 Кбайт.

Оценить информационный объем цифрового стерео звукового файла длительностью звучания 1 минута при среднем качестве звука (16 битов, 24 кГц ).

Решение: 16 бит × 24 000 × 2 × 60 = 46 080 000 бит = 5 760 000 байт = 5 625 Кбайт ≈ 5,5 Мбайт

Стандартное приложение Звукозапись играет роль цифрового магнитофона и позволяет записывать звук, то есть дискретизировать звуковые сигналы, и сохранять их в звуковых файлах в формате W АV. Эта программа позволяет редактировать звуковые файлы, микшировать их (накладывать друг на друга), а также воспроизводить.

Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.

Цель-мотивация. Подготовка к ЕГЭ.

1. Просмотр презентации по теме с комментариями учителя. Приложение 1

Материал презентации: Кодирование звуковой информации.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера:

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ:

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация. Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так

далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Аудиоадаптер (звуковая плата) — специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:

  • Частотой дискретизации
  • Разрядностью(глубина звука).

Частота временной дискретизации

— это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

Читайте также:  Новый смартфон с 3 камерами

11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.

Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 =65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2 I = 2 16 = 65536, где I — глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

Звуковой файл — файл, хранящий звуковую информацию в числовой двоичной форме.

2. Повторяем единицы измерения информации

1 Кбайт = 2 10 байт=1024 байт

1 Мбайт = 2 10 Кбайт=1024 Кбайт

1 Гбайт = 2 10 Мбайт=1024 Мбайт

1 Тбайт = 2 10 Гбайт=1024 Гбайт

1 Пбайт = 2 10 Тбайт=1024 Тбайт

3. Закрепить изученный материал, просмотрев презентацию, учебник [1]

4. Решение задач

Учебник [1], показ решения на презентации.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

V=1 ×16 × 48 000 × 2=

1536000 бит/8 =192000 байт/1024 = 187,5 Кбайт

Задача (самостоятельно). Учебник [1], показ решения на презентации.
Определить информационный объем цифрового аудио файла длительностью звучания которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении 8 битов.

10 × 8 × 22 050 бит/8 = 220500 байт/1024 = 215,332/1024 Кбайт = 0,21 Мбайт

5. Закрепление. Решение задач дома, самостоятельно на следующем уроке

Определить объем памяти для хранения цифрового аудио­файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

V=2×60 ×16 × 44,1 × 1=

(120 × 16 × 44 010) бит = 84672000 бит/8= 10584000байт/1024 = 10335,9375 Кбайт/1024 = 10,09 Мбайт

В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретиза­ции и разрядность?

V= T ×I × H × 1; I × H= V / T

I × H= 2,6 Мб/1 мин. = 2,6×1024×1024×8 бит/ 60 сек=21810380,8/60=

Если I=8 ,бит, то H=44,1 кГц.

Если I=16 бит, то H=22,05 кГц.

Объем свободной памяти на диске — 5,25 Мб, разрядность звуковой платы — 16. Какова длительность звучания цифро­вого аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Одна минута записи цифрового аудиофайла занимает на дис­ке 1,3 Мб, разрядность звуковой платы — 8. С какой частотой дискретизации записан звук?

Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

Цифровой аудиофайл содержит запись звука низкого качест­ва (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?

Две минуты записи цифрового аудиофайла занимают на дис­ке 5,05 Мб. Частота дискретизации — 22 050 Гц. Какова раз­рядность аудиоадаптера?

Читайте также:  Не могу установить ориджин выдает ошибку

Объем свободной памяти на диске — 0,1 Гб, разрядность зву­ковой платы — 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

№ 92. 124,8 секунды.

№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти — 15,1 Мб.

№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации — 11 кГц, разрядность аудиоадаптера — 8. Длительность звучания равна 60,5 с.

1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера )

2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.

3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.

Для того чтобы получить звук в цифровой форме, то есть закодировать его в виде последовательности чисел, необходимо «поймать» каким-то образом звуковые колебания в воздухе, превратить их в колебания электрического тока, а затем преобразовать эти колебания в числа. В этом случае получается оцифрованный звук – первая из двух разновидностей звуковых данных, с которыми работают компьютерные устройства. Помимо оцифрованного звука, на компьютере для воспроизведения музыки применяется еще одна его разновидность – синтезированный звук, или звук в формате MIDI.

Преобразование из аналогового электрического сигнала в цифровой код происходит так: амплитуда аналогового электрического сигнала измеряется через определенные промежутки времени и записывается в виде чисел. Частота, с которой производятся такие измерения, называется частотой дискретизации. Стандартом при преобразовании звукового сигнала к цифровому виду считают частоту 44 100 Гц.

Таким образом, при дискретизации амплитуда входного сигнала делится на одинаковые промежутки (шаги квантования), каждый промежуток обозначается целым числом, затем через установленные частотой дискретизации промежутки времени амплитуда сигнала измеряется, и в памяти сохраняется то целое число, к которому относится измеренное значение.

При восстановлении сохраненные в массиве числа преобразуются в аналоговый сигнал. Звук на графике выглядит в виде «ступенек», и даже после их сглаживания при помощи фильтров восстановленный сигнал все равно отличается от изначального. Для того чтобы вывести это отличие за границы различимого человеческим слухом, диапазон квантования разбивают на гораздо большее количество уровней.

После того как оцифровка звука состоялась, его записывают в один из име­ющихся стандартных форматов сохранения цифрового необработанного звука (обычно это формат WAV).

Синтезированный звук имеет совершенно другую природу по сравнению с оцифрованным. Он генерируется сразу из цифровых данных.

Для воспроизведения синтезированного звука применяют специальное устройство, MIDI-синтезатор (Musical Instrument Digital Interface). MIDI-синтезатор имеет встроенный банк данных, в котором записано, какой звук и какой длительности должен звучать при поступлении на вход синтезатора того или иного кода (MIDI-команды). В банк данных MIDI-синтезатора записана имитация звучания множества инструментов. Кроме того, там могут храниться реальные звуки, за­писанные в цифровой форме (свистки, хлопки в ладоши, удары барабанов или сирены). Таким образом, на вход MIDI-синтезатора на самом деле подается закодированная партитура музыкального произведения, а на выходе MIDI-синтезатор воспроизводит звучание, довольно близкое к реальному звучанию оркестра. Например, караоке-проигрыватель – это и есть MIDI-синтезатор. Формат MIDI-файлов предусматривает послоговое встраивание слов песни для их синхронного воспроизведения вместе с музыкой.

Срочно?
Закажи у профессионала, через форму заявки
8 (800) 100-77-13 с 7.00 до 22.00

No related posts.

9726552