RU2596033C2 - Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере - Google Patents
Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере Download PDFInfo
- Publication number
- RU2596033C2 RU2596033C2 RU2012142246/28A RU2012142246A RU2596033C2 RU 2596033 C2 RU2596033 C2 RU 2596033C2 RU 2012142246/28 A RU2012142246/28 A RU 2012142246/28A RU 2012142246 A RU2012142246 A RU 2012142246A RU 2596033 C2 RU2596033 C2 RU 2596033C2
- Authority
- RU
- Russia
- Prior art keywords
- phase
- patch
- block
- signal
- signals
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims description 34
- 238000012937 correction Methods 0.000 claims abstract description 53
- 238000004458 analytical method Methods 0.000 claims abstract description 35
- 238000005516 engineering process Methods 0.000 claims abstract description 4
- 230000017105 transposition Effects 0.000 claims description 44
- 238000012545 processing Methods 0.000 claims description 41
- 230000015572 biosynthetic process Effects 0.000 claims description 22
- 238000003786 synthesis reaction Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 10
- 238000011084 recovery Methods 0.000 claims description 9
- 238000000605 extraction Methods 0.000 claims description 7
- 230000002123 temporal effect Effects 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract description 8
- 239000000126 substance Substances 0.000 abstract 1
- 230000006870 function Effects 0.000 description 12
- 230000001419 dependent effect Effects 0.000 description 10
- 230000005484 gravity Effects 0.000 description 9
- 230000004044 response Effects 0.000 description 9
- 230000001934 delay Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000005452 bending Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000004606 Fillers/Extenders Substances 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Изобретение относится к передаче речи и может быть использовано для получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудиосигналов в фазовом вокодере. Устройство для получения широкополосного расширенного аудиосигнала из входного сигнала, состоящее из генератора патчей для получения одного или более сигналов патчей из входного сигнала, где генератор патчей предназначен для расширения временной шкалы (1800, 1808) полосовых сигналов, поступающих от банка фильтров анализа, и где генератор патчей содержит блок регулятора фазы (1806) для регулировки фазы сигналов поддиапазонов, используя коррекцию фазы, зависящую от канала банка фильтров. 3 н. и 17 з.п. ф-лы, 16 ил.
Description
Изобретение относится к передаче речи и может быть использовано для получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудиосигналов в фазовом вокодере.
Аудиосигналы могут быть изменены по отношению к ритму воспроизведения при сохранении оригинального уровня. При помощи фазовых вокодеров [1-3] или другими техническими средствами, как например алгоритмы модификации времени или уровня методом совмещения и добавления с синхронизацией тона (SOLA - Sinhronized Overlap-Add), Более того, эти методы могут использоваться для выполнения транспонирования сигнала при сохранении оригинальной длительности воспроизведения. Последнее может быть выполнено путем растяжения аудиосигнала на целый множитель и последующей регулировкой уровня воспроизведения растянутого аудиосигнала, с применением того же множителя. Для сигнала с временной дискретностью, последнее соответствует субдискретизации растянутого по времени аудиосигнала на множитель удлинения, принимая, что частота квантования остается неизменной.
Методы растяжения ширины полосы сигнала, основанные на фазовом вокодере, такие как описанные в [4-5], генерируют, в зависимости от общей ширины полосы сигнала, изменяемое число поддиапазонов (уровней), которые суммируются для образования результирующего сигнала, представляющего необходимую общую ширину полосы.
Временное фазирование одиночных патчей, которое возникает в результате применения фазового вокодера, является специфической задачей. В общем случае, эти патчи имеют временную задержку разной длительности. Это происходит потому, что интервал синтеза фазовых вокодеров организован на фиксированных транзитных участках, которые зависят от множителя растяжения, и поэтому каждый одиночный патч имеет временную задержку заданной длительности. Это ведет к частотно зависимой временной задержке результирующего сигнала растянутой полосы частот. Поскольку эта частотно зависимая задержка влияет на свойства вертикальной когерентности общего сигнала, это оказывает негативное воздействие на переходные характеристики способа растяжения полосы сигнала.
Другая проблема возникает при рассмотрении одиночных патчей, в которых недостаток межчастотной когерентности оказывает отрицательное влияние на частотные характеристики фазового вокодера.
Задачей настоящего изобретения является представить концепцию для генерирования широкополосного растянутого аудиосигнала, который дает улучшенное звуковое качество.
Это достигается при помощи аппаратуры для генерирования широкополосного растянутого аудиосигнала в соответствии с п.1, способа генерирования широкополосного растянутого аудиосигнала в соответствии с п.19 или компьютерной программы в соответствии с п.20.
Аппаратура для генерирования широкополосного растянутого аудиосигнала из входного сигнала состоит из генератора патчей для генерирования одного или более патчей сигналов из входного сигнала. Генератор патчей предназначен для временного растягивания сигналов поддиапазона, полученных от банка фильтров анализатора, и состоит из фазового регулятора для регулировки фаз сигналов поддиапазона, использующего фазовозависимую коррекцию канала фильтров.
Дальнейшее отличие данного изобретения состоит в том, что исключается негативное влияние на частотную характеристику, обычно вносимое устройствами типа фазовых вокодеров при широкополосном растягивании или другими устройствами.
Другое отличие данного изобретения состоит в том, что оптимизируется частотная характеристика одиночных патчей, которые, например, созданы при помощи фазовых вокодеров или подобными устройствами. В вариантах использования изобретения также возможно временное фазирование одиночных патчей, созданных, например, при помощи фазовых вокодеров или подобных устройств, но коррекция фазы внутри патча, т.е. внутри сигналов поддиапазона, обработанных при помощи одного и того же фактора транспозиции, может применяться с или без временной коррекции, которая справедлива для всех сигналов поддиапазона в патче, рассматриваемом как единое целое.
В данном изобретении используется новый способ оптимизации частотной характеристики и временного фазирования одиночных патчей, которые созданы при помощи фазовых вокодеров. Этот способ состоит из подбора фазовых коррекций транспонируемого поддиапазона при использовании комплексного модулируемого банка фильтров и введения дополнительной временной задержки в одиночные патчи, которые получены от фазовых вокодеров с разными коэффициентами транспонирования. Длительность дополнительной задержки, вносимой в определенный патч, зависит от использованного коэффициента транспонирования и может быть определена теоретически. Задержка отрегулирована таким образом, что прикладывая входной импульсный сигнал от Dirac, временной центр тяжести транспонированного Dirac импульса в каждом патче синхронизируется с той же временной позицией в спектрографическом изображении.
Существует много способов, которые выполняют транспонирование аудиосигнала при помощи единственного коэффициента транспонирования, как например фазовый вокодер. Если требуется скомбинировать несколько транспонированных сигналов, можно скорректировать временные задержки между разными выходными сигналами. Правильное вертикальное согласование между патчами полезно, но не обязательно в этих алгоритмах. Это не вредит, пока не рассматриваются переходные параметры. Проблема правильной синхронизации различных патчей не рассматривается в литературе, посвященной этой теме.
Транспонирование спектра при помощи фазовых вокодеров не гарантирует сохранение вертикальной когерентности переходных параметров. Более того, в полосах высокочастотных диапазонов возникают эхо-сигналы из-за примененного в фазовом вокодере способа наложения/добавления, как и различные временные задержки одиночных патчей, которые составляют суммирующий сигнал. Поэтому желательно синхронизировать патчи таким образом, чтобы широкополосная параметрическая постобработка могла использовать улучшенную вертикальную синхронизацию между патчами. Общий временной диапазон, покрывающий пред- и постэхо должен быть минимизирован.
Фазовый вокодер обычно используется для мультипликативной целой фазовой модификации выборок поддиапазонов в области анализа/синтеза в комплексных модулированных наборах фильтров. Эта процедура автоматически не гарантирует правильной синхронизации фаз в результативных выходных сигналах каждого синтезированного поддиапазона и это приводит к неравномерной частотной характеристике фазового вокодера. Этот артефакт выражается в изменяющейся во времени амплитуде медленного гармонического воздействия переменной частотой. В части аудиокачества для общего звучания недостатком является окрашивание выходного сигнала модуляционными эффектами.
Предпочтительные варианты выполнения настоящего изобретения обсуждаются ниже со ссылками на прилагаемые чертежи, в которых:
Фиг.1 показывает спектрограмму Дирак импульса, прошедшего низкочастотный фильтр;
Фиг.2 показывает спектрограмму современного уровня технологии транспонирования Дирак импульса с коэффициентами транспонирования 2, 3, и 4;
Фиг.3 показывает спектрограмму синхронизированного по времени транспонирования или Дирак импульс с коэффициентами транспонирования 2, 3, и 4;
Фиг.4 показывает спектрограмму синхронизированного по времени транспонирования Дирак импульса с коэффициентами транспонирования 2, 3 и 4 и регулируемой задержкой;
Фиг.5 показывает временную диаграмму транспонирования медленной гармонической переменной частоты с плохо отрегулированной фазой;
Фиг.6 показывает транспонирование медленного гармонического воздействия переменной частотой с улучшенной фазовой коррекцией;
Фиг.7 показывает транспонирование медленного гармонического воздействия при дальнейшем улучшении фазовой коррекции;
Фиг.8 показывает систему увеличения ширины полосы в соответствии с данным изобретением;
Фиг.9 показывает другой вариант примера применения обработки одиночного сигнала поддиапазона;
Фиг.10 показывает вариант, где показана нелинейная обработка поддиапазона и последующая регулировка формы огибающей в пространстве поддиапазона;
Фиг.11 показывает другой вариант нелинейной обработки поддиапазона на фиг.10;
Фиг.12 показывает различные варианты применения для выбора канала поддиапазона при фазовой коррекции;
Фиг.13 показывает применение регулятора фазы;
Фиг.14а показывает детали использования набора фильтров для анализа, позволяющих проводить независимую от коэффициента транспонирования фазовую корректировку; и
Фиг.14b показывает детали использования банка фильтров для анализа, требующих проведения зависимой от коэффициента транспонирования фазовой корректировки.
Данное изобретение обеспечивает различные виды устройств, способов или компьютерных программ для обработки аудиосигналов в контексте расширения полосы и в контексте другого аудиоприменения, которое не связано с расширением полосы.
Далее описанные и заявленные признаки могут быть полностью или частично объединены, но могут также использоваться отдельно друг от друга, так как отдельные аспекты уже обеспечивают преимущества в отношении восприятия качества, сложности вычислений и процессоров / памяти ресурсов при реализации в компьютерной системе или микропроцессоре.
Варианты исполнения используют временную синхронизацию различных гармонических патчей, созданных фазовыми вокодерами. Временная синхронизация выполняется на основе центра тяжести транспонированного Дирак импульса. Фиг.1 показывает спектрограмму Дирак импульса, после прохождения низкочастотного фильтра, который дает ограниченную полосу. Эти сигналы являются входными сигналами для транспонирования.
Транспонированием этого Дирак импульса при помощи фазового вокодера, вводятся частотно-селективные задержки в получаемые поддиапазоны. Длительность этих задержек зависит от используемого коэффициента транспонирования. Транспонирование Дирак импульсов с коэффициентами 2, 3 и 4 показано на фиг.2.
Частотно-селективные задержки компенсируются введением дополнительных индивидуальных временных задержек в каждый результирующий патч. Таким образом, каждый поддиапазон синхронизируется таким образом, что центр тяжести Дирак импульса в каждом патче расположен на одинаковой временной позиции по отношению к центру тяжести Дирак импульса в высшем патче. Синхронизация выполняется по отношению к наивысшему патчу, поскольку у него существует наибольшая временная задержка. При использовании компенсации задержки, в соответствии с данным изобретением, центр тяжести Дирак импульса располагается на той же временной отметке для всех патчей внутри спектрограммы. Такое представление полученных сигналов можно видеть на фиг.3. Это приводит к минимизации распределения всей энергии перехода.
Необходимо дополнительно компенсировать оставшуюся временную задержку между транспонированным участком высоких частот и исходным входным сигналом. С этой целью можно ввести временную задержку во входной сигнал, чтобы центры тяжести транспонированных Дирак импульсов, которые были синхронизированы с определенной временной отметкой ранее, совпадали с временной отметкой Дирак импульсов ограниченной полосы. Спектрограмма полученного сигнала показана на фиг.4.
Для применения описанного способа неважно, используется ли фазовый вокодер как основной компонент способа расширения полосы частот во временной области или внутри банка фильтров, таких как например, банк фильтров pQMF.
При использовании технологии SOLA, субъективное аудиокачество переходных фрагментов соединяется с эхо-эффектами из-за наложения/добавления, несмотря на то что критерий вертикальной когерентности выполнен. Возможно, легкие девиации в положениях центров тяжести в одиночных патчах, отличающиеся от действительного центра тяжести в наивысшем патче, лежат в диапазоне пред- или постмаскирования звука.
Результат плохой регулировки фазового вокодера в части частотной характеристики показан в выходном сигнале на фиг.5, который соответствует входному сигналу гармонической частоты с постоянной амплитудой. Как можно увидеть, есть сильные амплитудные изменения и даже взаимные компенсации в выходном сигнале. Выходной сигнал слегка улучшенного фазового вокодера показан на фиг.6.
Работа в фазовом вокодере, основанном на комплексном модулированном банке фильтров, проходит в виде мультипликативной фазовой модификации сэмплов поддиапазонов. Входная синусоида временной области, дающая очень хорошую точность в комплексных сигналах поддиапазонов, имеет следующую форму
где ω - частота синусоиды, n - индекс поддиапазона, k - индекс интервала времени поддиапазона, qA - временной шаг по банку фильтров анализатора, С - константа комплекса,
- частотная характеристика прототипа фильтра в банке фильтров, и θn - фазовая характеристика исследуемого банка фильтров, определенная при условии, что
становится реальной величиной. Для типового расчета банка фильтров QMF можно допустить, что она положительна. При фазовой модификации типичный результат имеет форму
где T - порядок транспонирования, a qS - временной шаг по банку фильтров анализатора. Поскольку банк фильтров синтеза обычно выбирается в зеркальном отображении по отношению к банку фильтров анализа, правильный синтез синусоиды требует, чтобы это последнее выражение соответствовало анализу поддиапазонов синусоиды. В случае неудачи это приводит к амплитудной модуляции, как показано на фиг.5.
Реализация данного изобретения состоит в использовании дополнительной фазовой корректировки, после модификации, основанной на
Это преобразует разнородные сигналы поддиапазона в сигналы с требуемой фазовой перегруппировкой по поддиапазону.
Для специфического примера случайно набранных QMF комплексных модулированных фильтров имеем
а фазовая корректировка по данному изобретению дана на основании
Выходной сигнал фазового вокодера с регулируемой по этому правилу фазой показан на фиг.7.
Если пара банка фильтров анализа/синтеза имеет большее распределение асимметричных фазовых вращений, тогда потребуется фазовая коррекция ψn, которая, при добавлении к анализируемому поддиапазону и имея знак минус до синтеза, приводит ситуацию к симметричному варианту. В этом случае фазовая коррекция по данному изобретению должна регулироваться по
Пример этого дан в 64 полосном QMF банке фильтров, используемом в MPEG стандарте по кодировке USAC на основании
где C - действительное число и может иметь значения от 2 до 3,5. Частные значения составляют 321/128 или 385/128.
Следовательно, для этой пары можно использовать
Далее, в специальном применении вышеописанной ситуации можно увидеть, что фазовая коррекция, которая является независимой для порядка транспонирования T, может быть включена в этап банка фильтров анализа. Поскольку коррекция до мультипликации фазового вокодера в T раз такой же коррекции после фазовой мультипликации, следующее разложение будет выгодным
Модуляция набора фильтров анализа модифицируется, чтобы добавить
фазы по сравнению со стандартизированной QMF парой набора фильтров, а фазовая коррекция по данному изобретению становится равной только второму условию,
Преимущество фазовой коррекции в том, что получается плоская частотная характеристика каждого вокодера, участвующая в создании выходного сигнала.
Предложенный способ обработки по данному изобретению подходит для всех аудиоприменений, которые расширяют полосу аудиосигналов при помощи временного растягивания фазовым вокодером и осуществляют субдискретизацию или воспроизведение увеличенного соотношения.
Фиг.8 показывает систему увеличения полосы в соответствии с одним из аспектов данного изобретения. Эта система состоит из декодера на сердечниках 80, генерирующего декодированный сигнал. Декодер 80 соединен с генератором патчей 82, который позднее будет описан более детально. Генератор патчей 82 содержит все признаки, указанные на фиг.8, кроме декодера 80, низкочастотного корректора 84 и выходного устройства 85. Генератор патчей предназначен для генерирования одного или более сигналов патчей из входного аудиосигнала 86, сигнал патча имеет центральную частоту патча, которая отличается от центральной частоты другого патча или от центральной частоты входного аудиосигнала. Генератор патчей состоит из первого блока 87а, второго блока 87b и третьего блока 87c, где по варианту, указанному на фиг.8, каждый индивидуальный блок генератора 87а, 87b, 87c имеет субдискретизатор 88а, 88b, 88c, QMF блок анализатора 89а, 89b, 89c, блок удлинения времени 90а, 90b, 90c и блок-корректор каналов патчей 91а, 91b, 91c. Выходы блоков с 91a по 91c и низкочастотный корректор 84 подаются на вход выходного блока 85, который выдает сигнал расширенной полосы. Этот сигнал может быть обработан другими модулями обработки, как модуль коррекции кривой (огибающей) или любыми другими модулями, известными при обработке увеличения полосы сигнала.
Коррекция патча выполняется таким образом, чтобы генератор патчей 82 выдавал один или более сигналов патчей, при этом расхождение во времени между входным аудиосигналом и одним или более патч-сигналами или разница во времени между разными патч-сигналами, по сравнению с обработкой без корректировки, была минимальной или вовсе устранена. По варианту на фиг.8, это снижение или устранение расхождения во времени достигается при помощи патч-корректоров с 91а по 91c. Как вариант или в дополнение патч-генератор 82 предназначен для фазовой коррекции каналов, зависимых от блока фильтров с функцией растяжения времени. Это показано на входе фазовых корректоров 92а, 92b, 92c.
Необходимо отметить, что реализация по фиг.8 означает, что каждый блок QMF анализатора, такой как блок 89а, выдает множество сигналов поддиапазонов. Функция растяжения времени должна выполняться для каждого индивидуального сигнала. Когда, например, 89а QMF анализатор выдает 32 сигнала поддиапазонов, тогда должны существовать 32 расширителя времени 90а. Однако достаточно иметь один патч-корректор 87а для всех сигналов с растянутым временем. Как будет описано ниже, фиг.9 показывает обработку в блоке удлинения времени для каждого индивидуального сигнала поддиапазона блоком QMF анализатора, такими как QMF блоки анализатора 89а, 89b, 89c.
При одиночной задержке для всех временных сигналов в процессе обработки достаточно одинаковой величины временного растяжения, а индивидуальная фазовая коррекция должна прикладываться к каждому сигналу поддиапазона, т.к. индивидуальная фазовая коррекция, хотя и является независимой от сигнала, зависит от номера канала поддиапазона банка фильтров или, говоря иначе, индекса поддиапазона сигнала поддиапазона, где индекс поддиапазона обозначает то же самое, что и номер канала в контексте этого описания.
Фиг.9 показывает другой вариант применения процесса обработки одиночного сигнала поддиапазона. Одиночный сигнал поддиапазона был подвергнут любому варианту децимации или до, или после фильтрации банком фильтров анализа, не показанном на фиг.9. Поэтому длительность одиночного сигнала поддиапазона короче, чем была до децимации. Одиночный сигнал поддиапазона является входным сигналом блока экстрактора 1802, который является идентичным с блоком экстрактора 201, но который может применяться иначе. Блок экстрактора 1802 на фиг.9 работает с использованием величины е отношения образец/блок. Эта величина может быть переменной или может быть фиксированной и показана на фиг.9 в виде стрелки, входящей в блок экстрактора 1802. На выходе блока экстрактора 1802 показано множество извлеченных блоков. Эти блоки в значительной степени перекрываются, поскольку величина е во много раз меньше, чем длина блока блока-экстрактора. Например, блок-экстрактор извлекает блоки 12 выборок. Первый блок включает выборки с 0 по 11, второй блок включает выборки с 1 по 12, третий блок включает выборки со 2 по 13 и т.д. В этом техническом решении значение e равно 1 и присутствует 11-кратное перекрытие.
Индивидуальные блоки подаются на вход окна 1802, для оконной обработки блоков с использованием оконной функции для каждого блока, кроме того, имеется фазовый вычислитель 1804, который вычисляет фазу каждого блока. Фазовый вычислитель 1804 может работать с индивидуальным блоком как до, так и после оконной обработки. Затем вычисляется величина регулировки p×k и она подается в регулятор фазы 1806. Регулятор фазы прикладывает величину регулировки к каждой выборке в блоке. Коэффициент k равен коэффициенту расширения полосы. Например, при коэффициенте расширения полосы 2, фаза p, вычисленная для блока, извлеченного блоком экстрактором 1802, умножается на коэффициент 2, и величина регулировки, используемая в каждом блоке регулятора фазы 1806, равна р умноженная на 2.
Согласно изобретению, одиночный сигнал поддиапазона является комплексом сигналов поддиапазона, а фаза блока может быть вычислена множеством различных путей. Один из них - взять выборку в середине или около середины блока и вычислить фазу этой комплексной выборки.
Хотя на фиг.9 показано, что регулятор фазы работает после оконной обработки, эти два блока взаимозаменяемы и регулировка фазы выполняется в блоках, извлеченных блоком экстрактором и после выполнения оконной обработки. Поскольку обе операции, т.е. оконная обработка и регулировка фазы, выполняются в действительных величинах или при умножении комплексных величин, эти две операции могут быть сведены в одну операцию с использованием комплексного коэффициента умножения, который, в свою очередь, является коэффициентом комплексного умножения регулировки фазы и коэффициента оконной обработки.
Блоки с отрегулированной фазой подаются на вход блока наложения/добавления и регулировки амплитуды 1808, где блоки, после оконной обработки и регулировки фазы, накладываются друг на друга и добавляются. Важно то, что величина отношения образец/блок в блоке 1808 отличается от величины, используемой в блоке экстрактора 1802. Значение отношения образец/блок в блоке 1808 больше, чем величина е, используемая в блоке 1800, таким образом, получают выходной сигнал с увеличенной длительностью из блока 1808. Обработанный в блоке 1808 сигнал поддиапазона имеет длительность больше, чем сигнал поддиапазона на входе блока 1800. При необходимости получить расширение полосы равное 2, используется величина соотношения образец/блок, которая в разы больше соответствующей величины в блоках 1800. Это дает в увеличении временного фактора в два раза. При необходимости использовать другие временные факторы, можно использовать другие соотношения образец/блок и получить требуемые временные длительности в выходных блоках 1808. В данном техническом решении только один образец с индексом m=0 будет модифицирован, чтобы получить k (или T) раз его фазы. В этом техническом решении это справедливо только для этого случая, а не для всего блока. Для других выборок модификация может быть другой, как показано на примере на фиг.13 в блоке 143.
Что касается вопроса наложения, желательна амплитудная коррекция, чтобы привести в соответствие вопрос разных наложений в блоках 1800 и 1808. Эта амплитудная коррекция, однако, может быть введена в коэффициент умножения регулятора окна/фазы, но коррекция амплитуды может быть выполнена после наложения/обработки.
В приведенном выше примере, при длине блока 12 и величине отношения образец/блок в блоке экстракции равной 1, значение отношения выборка/блок для блока 1808 будет равно 2, при расширении полосы на коэффициент 2. Это даст наложение пяти блоков. Если необходимо выполнить расширение полосы с коэффициентом 3, то соотношение выборка/блок, используемое в блоке 1808, будет равно 3 и будет происходить наложение трех блоков. Когда необходимо 4-кратное увеличение полосы, то блок 1808 должен работать с величиной отношения выборка/блок, равной 4, что все равно даст наложение более 2 блоков.
Коррекция фазы зависит от канала банка фильтров и является входным сигналом регулятора фазы. Операция одиночной коррекции фазы выполняется, когда величина коррекции фазы является комбинацией величины регулировки фазы, зависимой от сигнала, как определено в фазовом вычислителе и фазовой коррекцией, независящей от сигнала (но зависящей от номера канала в банке фильтров).
Фиг.8 показывает пример расширения полосы аппарата для генерирования аудиосигнала с расширенной полосой, имеющей большую полосу, чем оригинальный (исходный) сигнал декодера, где используются несколько QMF банков фильтров анализа с 89а по 89 с, а фиг.10 и фиг.11 показывают технические решения, где используется только один банк фильтров. В отношении фиг.8 необходимо отметить, что QMF фильтр 89в для кодера необходим только в том случае, если блок сведения 85 имеет банк фильтров синтеза. Однако если сведение проходит с низкочастотными сигналами во временной области, то поз.89в не требуется.
Блок сведения 85 может дополнительно иметь регулятор формы огибающей или процессор восстановления высокой частоты для обработки входного сигнала в блок восстановления высокой частоты, использующего переданные параметры восстановления высокой частоты. Эти параметры могут содержать параметры регулировки формы гибающей, параметры обратной фильтрации, параметры потерянных гармоник или другие параметры. Использование этих параметров, сами параметры и каким образом они используются для регулировки формы гибающей или, в общем виде, для генерирования расширенных сигналов поддиапазона описывается в ISO/IEC 14496-3: 2005(E), раздел 4.6.8, посвященный инструментарию дублирования спектральной полосы (SBR).
Блок сведения 85 может иметь банк фильтров синтеза и за ним процессор для обработки высокочастотных сигналов, с использованием высокочастотных параметров во временной области, а не в области банка фильтров, а процессор расположен до банка фильтров синтеза.
Что касается фиг.8, то функция децимации может быть выполнена после QMF анализа. В то же время функция увеличения временной составляющей, показанная с 92а по 92c для каждой ветви транспонирования, может выполняться в одну операцию для всех трех ветвей.
Фиг.10 показывает аппарат для генерирования расширенного аудиосигнала поддиапазона из низкочастотного входного сигнала 100 в соответствии с техническим решением. Устройство содержит банк фильтров анализа 101, нелинейный процессор поддиапазона 102a, 102b, регулятора формы огибающей 103 или, в общем виде, процессора восстановления высокой частоты, работающего на параметрах восстановления высокой частоты, как например вход на линии параметра 104. Нелинейные процессоры поддиапазона 102a, 102b на фиг. 10 или 11 являются патч-генераторами, одинаковыми с блоком 82 на фиг.8. Регулятор формы огибающей или, в общем виде, процессор восстановления высокой частоты обрабатывает индивидуальные сигналы поддиапазона каждого канала и направляет обработанные сигналы поддиапазона на вход банка фильтров 105. Банк фильтров 105 получает входные сигналы на низкочастотный вход, и эти сигналы являются низкочастотными сигналами поддиапазона декодера, генерированными, например, QMF банком-анализатором 89d, показанным на фиг.8. В зависимости от использования низкая частота может быть получена от выходных сигналов банка фильтров анализа 101 на фиг.10. Транспонированные сигналы поддиапазона подаются на высокочастотные каналы банка фильтров синтеза для выполнения восстановления высокой частоты.
Банк фильтров 105 выдает транспонированный выходной сигнал, который содержит расширение полосы с коэффициентами 2, 3 и 4, и выходной сигнал блока 105 больше не является ограниченным по ширине полосы на частоте раздела, т.е. сигнал кодера соответствует нижней частоте компонентов SBR генерированного сигнала.
В техническом решении на фиг.10 банк фильтров анализа выполняет двукратное квантование и имеет определенный шаг (ширину) поддиапазона 106. Банк фильтров синтеза 105 имеет шаг поддиапазона синтеза 107, который, в данном решении, в два раза превосходит размер шага анализа, что приводит к участию в процессе транспонирования, что будет описано в контексте фиг.11.
Фиг.11 показывает детальное использование технического решения с использованием нелинейного процессора поддиапазона 102a на фиг.10. Схема, показанная на фиг.1, получает на вход одиночный сигнал поддиапазона 108, который обрабатывается по трем «веткам». Верхняя ветвь 110a предназначена для транспонирования с коэффициентом 2. Средняя ветвь на фиг.11, обозначенная как 110b. предназначена для транспонирования с коэффициентом 3, а нижняя ветвь на фиг.11 предназначена для транспонирования с коэффициентом 4 и обозначена как 110с. Однако действительная транспозиция для ветви 110а, проводимая каждым элементом обработки на фиг.11, равна 1 (т.е. нет транспозиции). Действительная транспозиция для средней ветви 110b равна 1,5 и действительная транспозиция для ветви 110с равна 2. Это обозначено числами в скобках слева на фиг.11, где обозначены коэффициенты транспонирования Т. Транспонирование с коэффициентами 1,5 и 2 показывают первый шаг транспонирования, полученный при операции децимации в ветвях 110b, 110c, и увеличение временного фактора в процессоре наложения/добавления. Второй вклад, т.е. удвоение транспозиции, получают с помощью банка фильтров синтеза 105, который имеет шаг поддиапазонов синтеза 107, в два раза превышающий шаг поддиапазонов банка фильтров анализа.
Ветвь 110b, однако, имеет функцию децимации, чтобы получить транспонирование с коэффициентом 1,5. Благодаря тому что банк фильтров синтеза имеет шаг поддиапазона в два раза больше, чем банк фильтров анализа, коэффициент транспонирования 3 получают, как показано на фиг.11, слева от блока экстрактора во второй ветви 110b.
Аналогично, третья ветвь имеет функцию децимации с коэффициентом транспонирования 2 и окончательное участие различных шагов в банке фильтров анализа и банке фильтров синтеза дает коэффициент транспонирования 4 в третьей ветви 110с.
Каждая ветвь имеет блок экстрактора 120а, 120b, 120c и каждый из этих блоков экстракторов одинаков с блоком экстрактора 1802 на фиг.9. Каждая ветвь имеет фазовый вычислитель 122а, 122b и 122c, эти фазовые вычислители одинаковы с фазовым вычислителем 1804 на фиг.9. Каждая ветвь имеет регулятор фазы 124а, 124b, 124c и регуляторы фазы одинаковы с регулятором фазы 1806 на фиг.9. Каждая ветвь имеет блок оконной обработки 126а, 126b, 126c, где каждый блок одинаков с блоком оконной обработки 1802 на фиг.9. Блоки оконной обработки 126а, 126b, 126c могут также иметь функцию использования прямоугольного окна с функцией «дополнения нулями». Сигналы транспонирования или патчи из каждой ветки 110а, 110b, 110c, по техническому решению на фиг.11, попадают на вход сумматора 128, который добавляет содержимое каждой ветви к действующему сигналу поддиапазона для получения так называемых блоков транспонирования на выходе сумматора 128. Затем выполняется процедура 130 наложения/добавления, а блок наложения/добавления 130 одинаков с блоком наложения/добавления 1808 на фиг.9. Этот блок использует значение наложения/добавления 2*е, где е является значением наложения блок экстракторов 120а, 120b, 120c, и выходов наложения/добавления 130 транспонированного сигнала, который в техническом решении на фиг.11, является одиночным полосовым выходом канала k, т.е. для наблюдаемого в настоящее время полосового канала. Обработка, показанная на фиг.11, выполняется для каждого поддиапазона анализа или для определенной группы поддиапазонов анализа и, как показано на фиг.10, транспонированные сигналы поддиапазонов подаются на вход банка фильтров синтеза 105 после того, как проходят обработку в блоке 103 для получения конечного выходного сигнала транспонирования, показанного на фиг.10 на выходе бока 105.
В техническом решении блок экстрактор 120а первой ветви транспонирования 110а извлекает 10 выборок и затем выполняется преобразование этих 10 QMF выборок в полярные координаты. Выходной сигнал затем определяется, как показано на фиг.13, блоком 143, о чем будет сказано ниже. Этот выходной сигнал, генерированный регулятором фазы 124а, направляется на блок оконной обработки 126а, который удлиняет выходной сигнал, добавлением нулей к первому и последнему значениям блока, где данная операция эквивалентна (синтезу) оконной обработке с прямоугольным окном длиной 10. Блок экстрактора 120а в ветви 110а не производит операции децимации. Поэтому извлеченные блоком экстракции выборки преобразуются в блоки с тем же промежутком, с каким они были извлечены.
Однако для ветвей 110b и 110c наблюдается другая картина. Блок экстрактор 120b извлекает блок из 8 выборок поддиапазонов и распределяет эти 8 выборок поддиапазонов в извлеченном блоке с другими шагами поддиапазонов. Нечисловую выборку поддиапазонов для извлеченного блока получают путем интерполяции и таким образом полученные QMF выборки вместе с образцами интерполяции преобразуются в полярные координаты и обрабатываются в регуляторе фазы 124b, чтобы получить одинаковое выражение, как и в блоке 143 на фиг.13. Затем вновь проходит оконная обработка в блоке оконной обработки 126b с целью растянуть выходной сигнал блока при помощи регулятора фазы 124b путем добавления нулей к двум первым выборкам и к двум последним выборкам, и эта операция эквивалентна (синтезу) оконной обработке с прямоугольным окном длиной 8.
Блок экстрактора 120c предназначен для извлечения блока с удлиненной временной составляющей 6 полосовых выборок и выполняет операцию децимации с коэффициентом децимации 2, выполняет преобразование QMF выборок в полярные координаты и вновь выполняет операции в регуляторе фазы 124b, чтобы получить выражение, равное тому, что включено в блок 143, фиг.13, а выход вновь дополняется нулями, но сейчас для первых трех выборок поддиапазона и для трех последних выборок поддиапазона. Эта операция эквивалентна (синтезу) оконной обработке с прямоугольным окном длиной 6.
Выходы транспонирования каждой ветки сводятся для образования комбинированного QMF выхода сумматором 128, а затем комбинированные QMF выходы совмещаются при помощи наложения/добавления в блоке 130, где шаг по индексу в два раза больше, чем шаг по индексу блоков экстрактора 120а, 120b, 120c, как показано выше.
Различные технические решения для определения требуемых фазовых коррекций рассматриваются в контексте фиг.12. В техническом решении, показанном на 151, существует симметричная ситуация в паре банк фильтров анализа/синтеза и фазовая коррекция Δθn имеет первым членом уравнения 151а, зависящим от коэффициента транспонирования T, и второй член уравнения 151b, который зависит от числа каналов n или в рассматриваемой фиг.11, k.
В этом техническом решении регулятор фазы предназначен для выполнения коррекции фазы, используя величину Δθn, которая обозначена как Ω(k) на фиг.11, зависящей не только от канала банка фильтров в соответствии с 151b, но также может зависеть от коэффициента транспонирования, как показано в 151а. Важно, что коррекция фазы не зависит от текущего сигнала поддиапазона. Эта зависимость существует для фазовой коррекции при транспонировании в вокодере, как обсуждалось в контексте блоков 122а, 122b, 122b, но эта фазовая коррекция или «комплексная величина выходного усиления Ω(k)» не зависит от сигнала поддиапазона.
В другом техническом решении, показанном на 152 фиг.12, существует асимметричное распределение вращения фаз. Вращение фаз используется для сдвига входных выборок банка фильтров анализа по временной оси и также для сдвига выходных величин банка фильтров синтеза по временной оси. Значение вращения фаз обозначается как Ψn. Используемая фазовая коррекция при асимметричном распределении вращения фаз обозначается как Δθn, и опять существует член уравнения 152а, зависимый от коэффициента транспонирования, и член уравнения 152b, зависимый от канала поддиапазона.
Еще одно воплощение настоящего изобретения показано на 153 и имеет преимущество над решениями 151 и 152 в том, что фазовая коррекция Δθn или Ω(k), показанная на фиг.11, зависит только от канала поддиапазона, но теперь не зависит от коэффициента транспонирования. Это преимущество можно получить при специфическом применении вращения фаз в банке фильтра анализа, чтобы исключить зависимость от транспонирования при корректировке фазы. В определенном техническом решении при специфическом использовании банка фильтров это значение равно Δθn, показанному на фиг.12. Однако для других вариантов банка фильтров величина Δθn может меняться. Фиг.12 показывает постоянный коэффициент 385/128, но этот коэффициент может меняться от 2 до 4, в зависимости от ситуации. Кроме того, отмечено, что могут использоваться другие величины, кроме 385/128, и отклонения от этой величины при специфических технических решениях, для которых эта величина является оптимальной, будут выражаться в легкой зависимости от коэффициента транспонирования, что может быть проигнорировано до определенного предела.
Фиг.13 показывает последовательность шагов, выполняемых каждой ветвью транспонирования 110а, 110b, 110c. На этапе 140 выборка m для извлеченного блока определяется либо как чистое извлечение выборки, как в блоке 120а, или при выполнении децимации, как в блоках 120b, 120c, и, возможно, интерполяцией, как показано в блоке 120b. Затем, на этапе 141, вычисляется амплитуда r и фаза Φ каждой выборки. В блоке 142 вычислители фаз 122а, 122b, 122c на фиг.11 вычисляют определенную амплитуду и определенную фазу блока. В техническом решении амплитуда и фаза данных в середине извлеченного и потенциально подвергаемого децимации и интерполяции блока вычисляется как данные фазы для блока и как данные амплитуды для блока. Однако и другие данные блока могут быть взяты для определения фазы и амплитуды каждого блока. Даже средние данные по амплитуде и фазе каждого блока, определенные путем сложения амплитуд и фаз всех выборок в блоке и делением полученных значений на число выборок в блоке, могут быть использованы в качестве данных амплитуды и фазы в блоке. В техническом решении на фиг.13 предпочтительнее использовать значения амплитуды и фазы выборок в середине блока с индексом ноль в качестве значений амплитуды и фазы всего блока. Затем отрегулированная выборка рассчитывается регулятором фазы 124а, 124b, 124c с использованием коррекции фазы по данному изобретению Ω (являющееся комплексным числом) в качестве первого члена уравнения, используя изменение амплитуды в качестве второго члена уравнения (который может быть распределен), используя в качестве третьего члена уравнения значения фазы, зависящей от сигнала, вычисленные блоками 122а, 122b, 122c, и соответствующими (Т-1)·Φ (0), а в качестве четвертого члена уравнения используется действующая фаза рассматриваемого образца Φ(m), как обозначено в блоке 143.
Фиг.14а и фиг.14b показывают два различных модуляционных действия для банка фильтров анализа для технических решений на фиг.12. Фиг.14а показывает модуляцию для банка фильтров анализа, которая требует коррекции фазы, зависящей от коэффициента транспонирования. Эта модуляция банка фильтров соответствует техническому решению 153 на фиг.12.
Альтернативный вариант воплощения технического решения показан на фиг.14b, соответствует примеру реализации 152, в котором фазовая коррекция, зависящая от коэффициента транспонирования, применяется в виде асимметричного распределения вращения фазы. Фиг.14b, в частности, показывает специфическую модуляцию банка фильтров анализа, совпадающую с комплексным банком фильтров в ISO/IEC 14496-3, раздел 4.6.18.4.2, который включен сюда как справочные данные.
При сравнении фиг.14а и 14b становится ясно, количество фазовых вращений для вычисления значений косинуса и синуса различны в двух последних уравнениях на фиг.14b и последнем уравнении на фиг.14а.
Варианты реализации включают в себя устройство для генерирования расширенной полосы аудиосигнала из входного сигнала, включающее патч-генератор для генерирования одного или более сигналов патча из входного аудиосигнала, где патч-сигнал имеет центральную частоту, отличающуюся от центральной частоты другого патча или от центральной частоты входного аудиосигнала, где генератор патча предназначен для генерирования одного или более сигналов патча таким образом, что временное рассогласование между входным аудиосигналом и одним или более патч-сигналами или временное рассогласование между разными патч-сигналами уменьшается или совсем устраняется, или где патч-генератор предназначен для выполнения фазовой корректировки, зависящей от канала банка фильтров при выполнении увеличения временной составляющей.
В другом варианте, патч-генератор включает в себя множество патчеров, где каждый патчер имеет функцию децимации, функцию увеличения временной составляющей и корректор патча для выполнения временной коррекции в патч-сигналах для снижения или исключения временного рассогласования.
В другом примере патч-генератор предназначен для хранения временной задержки и выбран таким образом, что когда обрабатывается импульсноподобный сигнал, центры тяжести патч-сигналов, полученных в ходе обработки, размещаются один за другим во времени.
В другом примере временная задержка, используемая патч-генератором для снижения или устранения рассогласования, постоянно хранится и является независимой от обрабатываемого сигнала.
В другом варианте реализации решения расширитель временной составляющей имеет блок экстрактора, используемые значения экстракции, регулятор фазы/блок оконной обработки и блок наложения/добавления, имеющий величины наложения/добавления, отличающиеся от величин экстракции.
В другом техническом решении временная задержка, используемая для уменьшения или исключения рассогласования, зависит от величины экстракции, величины наложения/добавления или от обеих величин.
В другом варианте, блок расширения временной составляющей содержит блок экстрактора, блок оконной обработки/регулятор фазы и блок наложения/добавления по крайней мере для двух разных каналов, имеющих разные номера каналов банка фильтров анализа, где блок оконной обработки/регулятор фазы для каждого из по крайней мере двух каналов предназначен для выполнения регулировки фазы в каждом канале, регулировка фазы зависит от номера канала.
Возможен вариант, в котором регулятор фазы предназначен для выполнения регулировки фазы к образцам в блоке, регулировка фазы является комбинацией значений фазы, зависящих от величины увеличения временной составляющей и существующей фазы в блоке, и значения фазы, независимой от сигнала, но зависимой от номера канала.
Хотя некоторые аспекты рассматривались в контексте самого устройства, очевидно, что эти аспекты также представляют собой описание соответствующих способов, где блок или устройство соответствуют этапу способа или детали этапа. Аналогично, аспекты, описанные в контексте этапов способа, также представляют собой описание соответствующего блока или узла, или характеристики соответствующего устройства.
Кодированный аудиосигнал по настоящему изобретению может храниться на цифровых носителях или может передаваться через трансляционные среды или проводные трансляционные средства, как, например, интернет.
В зависимости от определенных требований применения, технические решения по данному изобретению могут быть выполнены в аппаратном и программном варианте. Использование может быть с применением цифровых носителей, например гибкий диск, DVD, CD, ROM, PROM, EPROM, EEPROM или FLASH память, содержащих на них электронно-читаемые управляющие сигналы, которые совместимы (или могут быть совместимы) с программируемой компьютерной системой, выполняющей описанный способ.
Некоторые технические решения по данному изобретению имеют носители данных с управляющими сигналами, считываемые электронным способом, которые совместимы с программируемой компьютерной системой, на которой выполняется один из описанных здесь способов.
В общем виде, технические решения по данному изобретению могут быть выполнены в виде компьютерного программного продукта с программным кодом, программный код является рабочим для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код, например, может храниться на носителе, считываемом машиной.
Другие технические решения содержат компьютерную программу для выполнения одного из способов, описанных здесь, размещенную на носителе, считываемом машиной.
Другими словами, техническое решение по данному изобретению является компьютерной программой с программным кодом для выполнения одного из способов, описанных здесь, когда компьютер выполняет программу.
Другое техническое решение по данному изобретению является носителем данных (или цифровым хранителем информации, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из способов, описанных здесь.
Другое техническое решение по данному изобретению является потоком данных или последовательностью сигналов, представляющих собой компьютерную программу для выполнения одного из описанных здесь способов. Поток данных или последовательность сигналов может быть, например, в форме, пригодной для передачи через средства коммуникации, например интернет.
Другое техническое решение включает средства обработки, например компьютер или программируемое логическое устройство, предназначенное или адаптированное для выполнения одного из способов, описанных здесь.
Дальнейшее воплощение включает компьютер с установленной компьютерной программой для выполнения одного из способов, описанных здесь.
В некоторых технических решениях, программируемое логическое устройство (например, программируемая вентильная матрица) может быть использовано для выполнения некоторых или всех функций, описанных здесь. В некоторых технических решениях это программируемое логическое устройство может быть объединено с микропроцессором для выполнения одного из описанных здесь способов. Говоря в общем, эти способы предпочтительнее выполнять на любом аппаратном комплексе.
Вышеописанные технические решения предназначены только для иллюстрации принципов настоящего изобретения. Понимается, что модификации и вариации исполнения и детали, описанные здесь, будут понятны другим специалистам в этой области. Поэтому мы ограничиваемся только объемом патентной заявки, а не специфическими деталями, данными в описаниях и пояснениях технических решений, данных здесь.
Список литературы
[1] Дж.Л. Фланаган и Р.М. Голден. Фазовый вокодер, Технический журнал Белл Систем, ноябрь 1966, стр.1394-1509
[2] Патент Соединенных Штатов 6549884 Ларош, Дж. и Долсон, М.: Переключение высоты тона у фазового вокодера.
[3] Дж. Ларош и М. Долсон, Новые устройства для переключения высоты тона, подстройки и других необычных эффектов в фазовых вокодерах. Труды совещания ИЭЭИ по устройствам преобразования сигналов для преобразования сигналов в аудио и акустические, Нью-Пальц, Нью-Йорк 1999.
[4] Фредерик Нагель, Саша Диш, Способ расширения полосы гармоник для аудиокодеков, ИКАССП, Тайпей, Тайвань, апрель 2009.
[5] Фредерик Нагель, Саша Диш и Николаус Реттельбах, Метод расширения полосы при помощи фазового вокодера с новым регулированием нестационарных состояний для аудиокодеков, 126-я Конвенция AES, Мюнхен, Германия, 7-10 мая, 2009.
Claims (20)
1. Устройство для генерирования расширенной полосы аудиосигнала из входного сигнала, включающее патч-генератор (82, 102а, 102b) для генерирования одного или более патч-сигналов из входного сигнала, в котором патч-сигнал имеет центральную частоту патча, отличающуюся от центральной частоты патча другого патча или от центральной частоты входного аудиосигнала, при этом патч-генератор (82, 102а, 102b) предназначен для удлинения временной составляющей (90а, 90b, 90c; 1808; 130) сигналов поддиапазона из банка фильтров анализа (101), и патч-генератор (82, 102а, 102b) включает в себя регулятор фазы (1806, 124а, 124b, 124c) для регулирования фаз полосовых сигналов с использованием фазовой коррекции (151, 152, 153), зависящей от канала банка фильтров.
2. Устройство по п.1, в котором регулятор фазы (124а, 124b, 124c, 1806) предназначен для выбора фазовой коррекции (151, 152, 153), чтобы изменения амплитуды сигнала, вносимые конструкцией банка фильтров (101, 105), были снижены или исключены.
3. Устройство по п.1, в котором регулятор фазы (124а, 124b, 124c, 1806) предназначен для применения фазовой коррекции (151, 152, 153), фазовая коррекция не зависит от сигнала поддиапазона.
4. Устройство по п.1, в котором регулятор фазы (124а, 124b, 124c, 1806) предназначен для использования фазовой коррекции, зависящей от сигнала и используемого коэффициента транспонирования (143).
5. Устройство по п.1, в котором патч-генератор (82, 102а, 102b) сконфигурирован для выполнения поблочной обработки и содержит блок экстрактора (1802, 120а, 120b, 120c) для извлечения последовательных блоков значений из полосового сигнала с использованием значения величины (е); регулятор фазы (124а, 124b, 124c, 1806) и процессор наложения/добавления (1808, 130), где этот процессор предназначен для использования значения блока (k·e), которое больше значения величины (е), и получения расширенной временной составляющей.
6. Устройство по п.5, в котором блок экстрактора (120b, 120c) дополнительно предназначен для выполнения операции децимации в зависимости от коэффициента транспозиции T и для выполнения интерполяции в случае нецелочисленной операции децимации.
7. Устройство по п.1, в котором регулятор фазы (124а, 124b, 124c, 1806) предназначен для применения фазовой коррекции (153), фазовая коррекция имеет вид:
πC(k+1/2),
где k обозначает канал фильтр банка, а C является действительным числом между 2 и 4.
πC(k+1/2),
где k обозначает канал фильтр банка, а C является действительным числом между 2 и 4.
8. Устройство по п.5, в котором патч-генератор (82, 102а, 102b) содержит узел оконной обработки (126а, 126b, 126c, 1802) для обработки полученного блока с использованием функции оконной обработки.
9. Устройство по п.1, которое предназначено для расширения полосы с использованием по крайней мере двух коэффициентов транспонирования T, где патч-генератор предназначен для первого коэффициента транспонирования для извлечения (120а, 120b), используя значение блока и не проводя децимацию или проводя первую децимацию, используя первый коэффициент децимации; регулировки фаз выборок в блоках выборок поддиапазона; добавления нулей в блоке с отрегулированной фазой для получения блока определенной длины и получения первого транспонированного сигнала; для второго коэффициента транспонирования для извлечения блока выборок поддиапазона с использованием значений блока и используя второй коэффициент децимации, который больше, чем первый коэффициент децимации, с которым первая децимация уже выполнена; регулировки фаз выборок блоков выборок поддиапазона; и добавления нулей в блоке с отрегулированной фазой для получения блока определенной длины и получения второго транспонированного сигнала; добавления (128) первого и второго транспонированного сигнала в форме «выборка за выборкой» для получения транспонированного блока; и наложения/добавления (130) последовательных транспонированных блоков, с использованием значений больше, чем значения блоков, которые были использованы при получении транспонированного сигнала поддиапазона.
10. Устройство по п.1, которое дополнительно содержит процессор восстановления высокой частоты (103) для использования параметров восстановления высокой частоты (104) в сигналах поддиапазона после того, как будет проведена фазовая коррекция сигналов поддиапазона, чтобы получить отрегулированные сигналы поддиапазона.
11. Устройство по п.1, которое дополнительно содержит банк фильтров синтеза (105), в котором шаг поддиапазона больше, чем шаг поддиапазона в банке фильтров анализа (101).
12. Устройство по п.1, в котором патч-генератор (82, 102а, 102b) имеет банк фильтров анализа (101) для генерирования сигналов поддиапазона из низкочастотных сигналов, где банк фильтров анализа (101) является квадратичным зеркальным банком фильтра QMF с фазовым вращением, и в котором корректировка фаз зависит от коэффициента транспонирования.
13. Устройство по п.1, в котором банк фильтров анализа (101) является QMF банком фильтров и предназначен для применения вращения фаз, чтобы фазовая коррекция (153) была независима от коэффициента транспонирования, использованного для генерирования одного или более сигналов патча.
14. Устройство по п.1, в котором патч-генератор имеет блок расширения временной составляющей (92а) и в котором блок расширения временной составляющей (92а) имеет блок экстрактора для извлечения предшествующего значения.
15. Устройство по п.1, в котором патч-генератор (82, 102а, 102b) включает блок расширения временной составляющей (92а), где блок расширения временной составляющей (92а) имеет блок экстрактора, блок оконной обработки или регулятор фазы и блок наложения/добавления для по крайней мере двух разных каналов, имеющих разные номера в банке фильтров анализа, блок оконной обработки или регулятор фаз для каждого по крайней мере из двух каналов предназначен для проведения регулировки фаз в каждом канале, а эта регулировка фаз зависит от номера канала.
16. Устройство по п.1, в котором регулятор фаз предназначен для применения регулировки фаз к значениям образцов в блоках образцов, где регулировка фаз является комбинацией фазового значения, которое зависит от величины расширения временной составляющей и действующей фазы блока, и значения фазы, не зависящей от сигнала, а зависящей от номера канала фазовой регулировки.
17. Устройство по п.1 в котором патч-генератор (82, 102а, 102b) предназначен для генерирования одного или более сигналов патчей, чтобы временное рассогласование между входным аудиосигналом и одним или более патч-сигналами или временное рассогласование между разными патч-сигналами снижено или устранено.
18. Устройство по п.1, в котором патч-генератор (82, 102а, 102b) содержит множество патчеров (87а, 87b, 87c, 110а, 110b, 110c), по крайней мере один имеет функцию децимации, функцию расширения временной составляющей и корректор патча для выполнения временной коррекции патч-сигналов для снижения или устранения временного рассогласования.
19. Способ генерирования расширенного полосового аудиосигнала из входного сигнала, включающий этапы генерирования (82, 102а, 102b) одного или более сигналов патчей из входного сигнала, где сигнал патча имеет центральную частоту патча, отличающуюся от центральной частоты другого патча или от центральной частоты входного аудиосигнала, при этом выполняется расширение временной составляющей (90а, 90b, 90c; 1808; 130) сигналов поддиапазона, поступающих от банка фильтров анализа (101), и где происходит регулировка фазы полосовых сигналов (1806, 124а, 124b, 124c), с использованием корректировки фазы (151, 152, 153), зависящей от канала банка фильтров.
20. Машиночитаемый носитель информации с записанной на него компьютерной программой для осуществления способа по п.19 при условии её выполнения с использованием вычислительной техники.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US31211810P | 2010-03-09 | 2010-03-09 | |
US61/312,118 | 2010-03-09 | ||
PCT/EP2011/053298 WO2011110494A1 (en) | 2010-03-09 | 2011-03-04 | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012142246A RU2012142246A (ru) | 2014-04-20 |
RU2596033C2 true RU2596033C2 (ru) | 2016-08-27 |
Family
ID=43829366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012142246/28A RU2596033C2 (ru) | 2010-03-09 | 2011-03-04 | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере |
Country Status (17)
Country | Link |
---|---|
US (2) | US9318127B2 (ru) |
EP (1) | EP2545551B1 (ru) |
JP (1) | JP5854520B2 (ru) |
KR (1) | KR101483157B1 (ru) |
CN (1) | CN102985970B (ru) |
AR (1) | AR080475A1 (ru) |
BR (1) | BR112012022745B1 (ru) |
CA (1) | CA2792449C (ru) |
ES (1) | ES2655085T3 (ru) |
MX (1) | MX2012010314A (ru) |
MY (1) | MY152376A (ru) |
PL (1) | PL2545551T3 (ru) |
PT (1) | PT2545551T (ru) |
RU (1) | RU2596033C2 (ru) |
SG (1) | SG183966A1 (ru) |
TW (1) | TWI425501B (ru) |
WO (1) | WO2011110494A1 (ru) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2596033C2 (ru) * | 2010-03-09 | 2016-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере |
BR112012022740B1 (pt) | 2010-03-09 | 2021-12-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparelho e método para processar um sinal de áudio utilizando alinhamento de borda de patch |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
IL313284B2 (en) * | 2010-09-16 | 2025-05-01 | Dolby Int Ab | Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication |
EP2631906A1 (en) | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
EP2709106A1 (en) * | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
KR20160087827A (ko) * | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
US9564141B2 (en) * | 2014-02-13 | 2017-02-07 | Qualcomm Incorporated | Harmonic bandwidth extension of audio signals |
EP2963649A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
MX371223B (es) | 2016-02-17 | 2020-01-09 | Fraunhofer Ges Forschung | Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios. |
TWI873683B (zh) | 2017-03-23 | 2025-02-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
WO2019145955A1 (en) | 2018-01-26 | 2019-08-01 | Hadasit Medical Research Services & Development Limited | Non-metallic magnetic resonance contrast agent |
TWI834582B (zh) | 2018-01-26 | 2024-03-01 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
IL310202B2 (en) | 2018-04-25 | 2024-12-01 | Dolby Int Ab | Integration of high frequency audio reconstruction techniques |
IL319703A (en) | 2018-04-25 | 2025-05-01 | Dolby Int Ab | Combining high-frequency reconstruction techniques with reduced post-processing delay |
CN110881157B (zh) * | 2018-09-06 | 2021-08-10 | 宏碁股份有限公司 | 正交基底修正的音效控制方法及音效输出装置 |
GB2579348A (en) * | 2018-11-16 | 2020-06-24 | Nokia Technologies Oy | Audio processing |
BR112022002100A2 (pt) * | 2019-08-08 | 2022-04-12 | Boomcloud 360 Inc | Bancos de filtros não lineares adaptáveis para extensão de faixa de frequência psicoacústica |
US11838732B2 (en) | 2021-07-15 | 2023-12-05 | Boomcloud 360 Inc. | Adaptive filterbanks using scale-dependent nonlinearity for psychoacoustic frequency range extension |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009095169A1 (en) * | 2008-01-31 | 2009-08-06 | Frauenhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for a bandwidth extension of an audio signal |
WO2010003543A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS55107313A (en) | 1979-02-08 | 1980-08-18 | Pioneer Electronic Corp | Adjuster for audio quality |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
US6766300B1 (en) | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6549884B1 (en) | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
JP4152192B2 (ja) | 2001-04-13 | 2008-09-17 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | オーディオ信号の高品質タイムスケーリング及びピッチスケーリング |
WO2003007480A1 (fr) | 2001-07-13 | 2003-01-23 | Matsushita Electric Industrial Co., Ltd. | Dispositif de decodage de signaux audio et dispositif de codage de signaux audio |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
EP1451812B1 (en) * | 2001-11-23 | 2006-06-21 | Koninklijke Philips Electronics N.V. | Audio signal bandwidth extension |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
JP4227772B2 (ja) | 2002-07-19 | 2009-02-18 | 日本電気株式会社 | オーディオ復号装置と復号方法およびプログラム |
JP4313993B2 (ja) | 2002-07-19 | 2009-08-12 | パナソニック株式会社 | オーディオ復号化装置およびオーディオ復号化方法 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100524065B1 (ko) | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
US7337108B2 (en) | 2003-09-10 | 2008-02-26 | Microsoft Corporation | System and method for providing high-quality stretching and compression of a digital audio signal |
WO2005040749A1 (ja) | 2003-10-23 | 2005-05-06 | Matsushita Electric Industrial Co., Ltd. | スペクトル符号化装置、スペクトル復号化装置、音響信号送信装置、音響信号受信装置、およびこれらの方法 |
JP4254479B2 (ja) | 2003-10-27 | 2009-04-15 | ヤマハ株式会社 | オーディオ帯域拡張再生装置 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
MX2007005103A (es) | 2004-11-02 | 2007-07-04 | Koninkl Philips Electronics Nv | Codificacion y decodificacion de senales de audio utilizando bancos de filtros de valor complejo. |
EP1814106B1 (en) * | 2005-01-14 | 2009-09-16 | Panasonic Corporation | Audio switching device and audio switching method |
JP4804532B2 (ja) * | 2005-04-15 | 2011-11-02 | ドルビー インターナショナル アクチボラゲット | 無相関信号の包絡線整形 |
JP2007017628A (ja) | 2005-07-06 | 2007-01-25 | Matsushita Electric Ind Co Ltd | 復号化装置 |
US7565289B2 (en) | 2005-09-30 | 2009-07-21 | Apple Inc. | Echo avoidance in audio time stretching |
JP4760278B2 (ja) | 2005-10-04 | 2011-08-31 | 株式会社ケンウッド | 補間装置、オーディオ再生装置、補間方法および補間プログラム |
DE602006012370D1 (de) | 2005-12-13 | 2010-04-01 | Nxp Bv | Einrichtung und verfahren zum verarbeiten eines audio-datenstroms |
FR2910743B1 (fr) | 2006-12-22 | 2009-02-20 | Thales Sa | Banque de filtres numeriques cascadable, et circuit de reception comportant une telle banque de filtre en cascade. |
RU2439720C1 (ru) | 2007-12-18 | 2012-01-10 | ЭлДжи ЭЛЕКТРОНИКС ИНК. | Способ и устройство для обработки звукового сигнала |
CN101471072B (zh) | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
BR122012006270B1 (pt) | 2008-03-10 | 2020-12-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | equipamento e método para a manipulação de um sinal de áudio tendo um evento transiente |
US9147902B2 (en) * | 2008-07-04 | 2015-09-29 | Guangdong Institute of Eco-Environmental and Soil Sciences | Microbial fuel cell stack |
AU2009267460B2 (en) | 2008-07-11 | 2013-01-10 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. | Apparatus and method for generating a bandwidth extended signal |
WO2010003544A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft Zur Förderung Der Angewandtern Forschung E.V. | An apparatus and a method for generating bandwidth extension output data |
EP2169670B1 (en) * | 2008-09-25 | 2016-07-20 | LG Electronics Inc. | An apparatus for processing an audio signal and method thereof |
US8258849B2 (en) * | 2008-09-25 | 2012-09-04 | Lg Electronics Inc. | Method and an apparatus for processing a signal |
BRPI0917762B1 (pt) | 2008-12-15 | 2020-09-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Codificador de áudio e decodificador de extensão de largura de banda |
WO2010086461A1 (en) * | 2009-01-28 | 2010-08-05 | Dolby International Ab | Improved harmonic transposition |
EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
KR101701759B1 (ko) * | 2009-09-18 | 2017-02-03 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 및 상기 방법을 수행하기 위한 컴퓨터 프로그램이 기록된 컴퓨터 판독가능 저장 매체 |
EP2704143B1 (en) * | 2009-10-21 | 2015-01-07 | Panasonic Intellectual Property Corporation of America | Apparatus, method and computer program for audio signal processing |
EP4542546A3 (en) * | 2009-10-21 | 2025-04-30 | Dolby International AB | Oversampling in a combined transposer filter bank |
US8321216B2 (en) | 2010-02-23 | 2012-11-27 | Broadcom Corporation | Time-warping of audio signals for packet loss concealment avoiding audible artifacts |
RU2596033C2 (ru) * | 2010-03-09 | 2016-08-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере |
-
2011
- 2011-03-04 RU RU2012142246/28A patent/RU2596033C2/ru not_active Application Discontinuation
- 2011-03-04 BR BR112012022745-9A patent/BR112012022745B1/pt active IP Right Grant
- 2011-03-04 CA CA2792449A patent/CA2792449C/en active Active
- 2011-03-04 ES ES11707156.3T patent/ES2655085T3/es active Active
- 2011-03-04 PT PT117071563T patent/PT2545551T/pt unknown
- 2011-03-04 CN CN201180023451.1A patent/CN102985970B/zh active Active
- 2011-03-04 KR KR1020127026336A patent/KR101483157B1/ko active Active
- 2011-03-04 MX MX2012010314A patent/MX2012010314A/es active IP Right Grant
- 2011-03-04 JP JP2012556460A patent/JP5854520B2/ja active Active
- 2011-03-04 EP EP11707156.3A patent/EP2545551B1/en active Active
- 2011-03-04 WO PCT/EP2011/053298 patent/WO2011110494A1/en active Application Filing
- 2011-03-04 SG SG2012066536A patent/SG183966A1/en unknown
- 2011-03-04 PL PL11707156T patent/PL2545551T3/pl unknown
- 2011-03-04 MY MYPI2012004004 patent/MY152376A/en unknown
- 2011-03-08 TW TW100107717A patent/TWI425501B/zh active
- 2011-03-09 AR ARP110100722A patent/AR080475A1/es active IP Right Grant
-
2012
- 2012-09-05 US US13/604,313 patent/US9318127B2/en active Active
-
2016
- 2016-03-16 US US15/071,569 patent/US9905235B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009095169A1 (en) * | 2008-01-31 | 2009-08-06 | Frauenhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Device and method for a bandwidth extension of an audio signal |
WO2010003543A1 (en) * | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for calculating bandwidth extension data using a spectral tilt controlling framing |
Non-Patent Citations (1)
Title |
---|
SASCHA DISCH. An amplitude and frequency modulation vocoder for audio signal processing. Proc/ of the 11th Int. Conference on Digital Audio Effects (DAFx-08), Espoo, Finland, September 1-4, 2008. JEAN LAROCHE, MARK DOLSON. New phase vocoder techniques for pitch-shifting, harmonizing and other exotic effects. Proc. 1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, New York, Oct. 17-20, 1999. * |
Also Published As
Publication number | Publication date |
---|---|
SG183966A1 (en) | 2012-10-30 |
TW201207844A (en) | 2012-02-16 |
MY152376A (en) | 2014-09-15 |
ES2655085T3 (es) | 2018-02-16 |
US9905235B2 (en) | 2018-02-27 |
PT2545551T (pt) | 2018-01-03 |
EP2545551A1 (en) | 2013-01-16 |
CA2792449A1 (en) | 2011-09-15 |
AU2011226206B2 (en) | 2013-12-19 |
CN102985970A (zh) | 2013-03-20 |
BR112012022745A2 (pt) | 2018-06-05 |
KR101483157B1 (ko) | 2015-01-15 |
JP2013521536A (ja) | 2013-06-10 |
KR20130007598A (ko) | 2013-01-18 |
US20160267917A1 (en) | 2016-09-15 |
AU2011226206A1 (en) | 2012-10-18 |
WO2011110494A1 (en) | 2011-09-15 |
PL2545551T3 (pl) | 2018-03-30 |
CN102985970B (zh) | 2014-11-05 |
MX2012010314A (es) | 2012-09-28 |
US20130058498A1 (en) | 2013-03-07 |
TWI425501B (zh) | 2014-02-01 |
BR112012022745B1 (pt) | 2020-11-10 |
AR080475A1 (es) | 2012-04-11 |
EP2545551B1 (en) | 2017-10-04 |
RU2012142246A (ru) | 2014-04-20 |
CA2792449C (en) | 2017-12-05 |
JP5854520B2 (ja) | 2016-02-09 |
US9318127B2 (en) | 2016-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2596033C2 (ru) | Устройство и способ получения улучшенной частотной характеристики и временного фазирования способом расширения полосы аудио сигналов в фазовом вокодере | |
US20250149055A1 (en) | Subband block based harmonic transposition | |
RU2586846C2 (ru) | Устройство и способ обработки входного звукового сигнала с помощью каскадированного банка фильтров | |
RU2582061C2 (ru) | Способ расширения ширины полосы, устройство расширения ширины полосы, программа, интегральная схема и устройство декодирования аудио | |
AU2011226206B9 (en) | Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FA92 | Acknowledgement of application withdrawn (lack of supplementary materials submitted) |
Effective date: 20160112 |
|
FZ9A | Application not withdrawn (correction of the notice of withdrawal) |
Effective date: 20160317 |