21.01.2011
Дискретные нотные каналы
Метод динамических нотных каналов для обработки и сжатия аудио сигнала - это мой личный путь в познавании механизмов преобразования волновых сигналов. На мой взгляд, идейка тут выкристаллизовалась довольно интересная и перспективная в будущем. На самом деле в основу этого алгоритма я положил нотную таблицу - таблицу нотных каналов. Это один из приемов психоакустики, т.е. особенности человеческого слуха. Ведь человеку в большинстве случаев (я имею ввиду из людей с обычным слухом) достаточно разделить звуковой спектр на ноты, сгладить неровности обратного преобразования и мы получим сигнал для человека очень близкий по звучанию (практически неотличимый от оригинала) но огромной степень сжатия, гораздо большей чем сейчас используется в mp3 сжатии. Да конечно, человек может слышать незначительные изменения частоты звучания и внутри ноты, но это отклонение от основной частоты можно заложить в несколько бит информации, тем самым сохраняя значительную степень сжатия.
Однако в ходе моих исследований в этой области, я окончательно пришел к выводу, что когда мы слышим что-либо - мозг видит спектральную картинку. Тем более лишать будь то ИИ или ЭС лишать их исходного сигнала психоакустическим фильтром нет смысла. Да и современные хардверные технологии позволяют нам не сильно заботиться о таких мелочах, как дополнительные 30% прироста сжатия для БПФ, которые мог бы дать этот метод в будущем.
Данная
программа наглядно демонстрирует таблицу нотных каналов, в зависимости от выбранного источника и частоты дискретизации аудио потока. Также снизу показана наглядная работа генераторов синусойдальных сигналов и спектральный анализатор на я бы сказал легендарных компонентах
Mitov Software, о применении которых я еще напишу не одну
статью, но об этом позже...
Исходники этой программы буду в будущем выкладывать только в персональном контенте из-за того, что там задействованы сторонние компоненты, без которых программа работать не будет. Программа делит весь спектр частот на диапазоны соответствующие нотам и разделяет их по октавам. Далее снизу есть настройки трех регуляторов амплитуды и частоты трех синусойд, которые показаны на графике расположенном слева, дальше происходит суммирование трех сигналов в один, после чего он передается в спектральный анализатор реализованный с на БПФ. После чего уже разложенный спектр подается на спектрограмму "Водопад", расположенную снизу справа. В качестве исходного сигнала можно использовать не только синусойду, а также треугольные импульсы и меандр. Также программа оснащена кнопками остановки и запуска генераторов сигнала.
С помощью преобразование звука в дискретные нотные каналы, можно будет реализовать и такие механизмы как автоматическое преобразование музыки в некогда широко известные форматы MID/MOD. Эти форматы позволяли сжимать музыкальные файлы, правда вручную, но в сотни раз меньше чем mp3, а также визуализацию игры на музыкальных инструментах, например на гитаре, с возможностью ее настройки...
Страница
1 - 1 из 2
Начало | Пред. |
1
2
|
След. |
Конец
Рейтинг:
3.25
Количество показов: 188469