BR112019021377B1 - APPARATUS AND METHOD FOR PROCESSING AN INPUT AUDIO SIGNAL - Google Patents
APPARATUS AND METHOD FOR PROCESSING AN INPUT AUDIO SIGNAL Download PDFInfo
- Publication number
- BR112019021377B1 BR112019021377B1 BR112019021377-5A BR112019021377A BR112019021377B1 BR 112019021377 B1 BR112019021377 B1 BR 112019021377B1 BR 112019021377 A BR112019021377 A BR 112019021377A BR 112019021377 B1 BR112019021377 B1 BR 112019021377B1
- Authority
- BR
- Brazil
- Prior art keywords
- subjective
- audio intensity
- subjective audio
- audio signal
- input
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 148
- 238000012545 processing Methods 0.000 title claims abstract description 22
- 238000000034 method Methods 0.000 title claims description 51
- 238000012546 transfer Methods 0.000 claims abstract description 86
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 80
- 238000004590 computer program Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000010606 normalization Methods 0.000 description 7
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 230000003321 amplification Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 230000000644 propagated effect Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000036962 time dependent Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Abstract
Trata-se de um aparelho (1) para processar um sinal de áudio de entrada (100) que compreende um avaliador (10) para avaliar a intensidade subjetiva de áudio do sinal de áudio de entrada (100) para determinar a faixa da intensidade subjetiva de áudio (LRAin) e um valor de intensidade subjetiva de áudio real. Uma calculadora (11) determina uma função de transferência de compressor com base na faixa da intensidade subjetiva de áudio determinada (LRAin), com base em uma faixa de intensidade subjetiva de áudio (LRAdes) e com base no valor real da intensidade subjetiva de áudio determinada. A calculadora (11) determina ainda pelo menos um ganho de controle da faixa de intensidade subjetiva de áudio com base na função de transferência do compressor determinada. Um ajustador (12) fornece um sinal de áudio de saída (101) com base no sinal de áudio de entrada (100) e com base em pelo menos um ganho de controle da faixa de intensidade subjetiva de áudio determinada. A calculadora (11) está configurada para determinar a função de transferência do compressor de modo que a diferença entre a intensidade subjetiva de áudio média (μout) do sinal de áudio de saída (101) e uma intensidade subjetiva de áudio média (μin) do sinal de áudio de entrada (100) seja minimizada.(...).An apparatus (1) for processing an input audio signal (100) comprising an evaluator (10) for evaluating the subjective audio intensity of the input audio signal (100) to determine a subjective audio intensity range (LRAin) and an actual subjective audio intensity value. A calculator (11) determines a compressor transfer function based on the determined subjective audio intensity range (LRAin), based on a subjective audio intensity range (LRAdes), and based on the actual determined subjective audio intensity value. The calculator (11) further determines at least one subjective audio intensity range control gain based on the determined compressor transfer function. An adjuster (12) provides an output audio signal (101) based on the input audio signal (100) and based on at least one subjective audio intensity range control gain. The calculator (11) is configured to determine the compressor transfer function such that the difference between an average subjective audio intensity (μout) of the output audio signal (101) and an average subjective audio intensity (μin) of the input audio signal (100) is minimized.(...).
Description
[001] A invenção refere-se a um aparelho para processar um sinal de áudio deentrada. A invenção também se refere a um método correspondente e a um programa de computador.[001] The invention relates to an apparatus for processing an input audio signal. The invention also relates to a corresponding method and a computer program.
[002] A invenção refere-se ao campo de processamento de sinais áudio, mais especificamente a uma abordagem que controla a faixa de intensidade subjetiva de áudio de um sinal de áudio, isto é, ajusta a faixa de intensidade subjetiva de áudio de um sinal de áudio para combinar com uma faixa-alvo de intensidade subjetiva de áudio desejada. A faixa de intensidade subjetiva de áudio [1] é uma medida da dinâmica de um sinal de áudio. Conforme estabelecido em [1], no significado do presente pedido, a faixa de intensidade subjetiva de áudio quantifica a variação em uma variação temporal da medição da intensidade subjetiva de áudio. Desse modo, a faixa de intensidade subjetiva de áudio descreve a distribuição estatística dos valores instantâneos da intensidade subjetiva de áudio medida.[002] The invention relates to the field of audio signal processing, more specifically to an approach that controls the subjective audio intensity range of an audio signal, i.e., adjusts the subjective audio intensity range of an audio signal to match a desired subjective audio intensity target range. The subjective audio intensity range [1] is a measure of the dynamics of an audio signal. As set out in [1], within the meaning of the present application, the subjective audio intensity range quantifies the variation in a temporal variation of the subjective audio intensity measurement. Thus, the subjective audio intensity range describes the statistical distribution of the instantaneous values of the measured subjective audio intensity.
[003] Controlar a faixa de intensidade subjetiva de áudio é desejável para uma ampla faixa de cenários, por exemplo:• reprodução com dispositivos que têm restrições nos recursos do sistema de reprodução de áudio• reprodução em modos de visualização especiais, por exemplo, modo noturno• reprodução em ambientes com altos piso de ruídos ambientes• pré-processamento para normalização da intensidade subjetiva de áudio em tempo real[003] Controlling the subjective audio loudness range is desirable for a wide range of scenarios, for example: • playback with devices that have constraints on audio playback system capabilities • playback in special viewing modes, e.g. night mode • playback in environments with high ambient noise floors • pre-processing for normalizing subjective audio loudness in real time
[004] Um método que permite controlar a faixa de intensidade subjetiva de áudio de um sinal de áudio para atingir uma faixa-alvo de intensidade subjetiva de áudio é denominado Método de Controle de Faixa de Intensidade Subjetiva de Áudio (LRAC) aqui. Na literatura, a maioria dos métodos procura controlar a faixa dinâmica do sinal de áudio, isto é, Controle de Faixa Dinâmica (DRC). A definição da faixa de intensidade subjetiva de áudio é padronizada [1] considerando que a definição de faixa dinâmica às vezes difere. Naturalmente, controlar a faixa dinâmica está relacionado a controlar a faixa de intensidade subjetiva de áudio. Portanto, por uma questão de simplicidade ambos podem ser abordados como métodos LRAC.[004] A method that allows controlling the subjective audio loudness range of an audio signal to achieve a target subjective audio loudness range is called Subjective Audio Loudness Range Control (LRAC) method here. In the literature, most methods seek to control the dynamic range of the audio signal, i.e. Dynamic Range Control (DRC). The definition of subjective audio loudness range is standardized [1] whereas the definition of dynamic range sometimes differs. Naturally, controlling the dynamic range is related to controlling the subjective audio loudness range. Therefore, for the sake of simplicity both of them can be addressed as LRAC methods.
[005] Controle automático de ganho (AGC) representa métodos relacionados ao controle do nível geral de um sinal de áudio. Devido ao fato de que o ganho tipicamente varia com o tempo, isso normalmente leva a uma alteração na faixa dinâmica, isto é, a faixa dinâmica é normalmente reduzida. No entanto, a quantidade de alteração na faixa dinâmica não é previsível, isto é, a faixa dinâmica do sinal de saída é desconhecida e não pode ser controlada de uma maneira desejada.[005] Automatic Gain Control (AGC) represents methods related to controlling the overall level of an audio signal. Because the gain typically varies with time, this typically leads to a change in the dynamic range, i.e., the dynamic range is typically reduced. However, the amount of change in the dynamic range is not predictable, i.e., the dynamic range of the output signal is unknown and cannot be controlled in a desired manner.
[006] Naturalmente, o objetivo de aplicar um compressor com uma função de transferência pré-selecionada fixa (também conhecida como perfil) é para alterar a faixa de intensidade subjetiva de áudio do sinal de áudio. A seleção da função de transferência é com base em alguns critérios pré-definidos, por exemplo, modo de visualização. No entanto, aplicar uma função de transferência do compressor pré- definida também não pode garantir que a faixa-alvo de intensidade subjetiva de áudio é atingida na saída.[006] Naturally, the purpose of applying a compressor with a fixed pre-selected transfer function (also known as profile) is to change the subjective audio loudness range of the audio signal. The transfer function selection is based on some pre-defined criteria, e.g., visualization mode. However, applying a pre-defined compressor transfer function also cannot guarantee that the target subjective audio loudness range is achieved at the output.
[007] A fim de atingir uma faixa-alvo de intensidade subjetiva de áudio desejada, uma função de transferência que é única para o dado sinal de áudio é determinada. A função de transferência é então aplicada ao sinal de áudio para produzir o áudio de intensidade subjetiva de áudio controlada. Além disso, a função de transferência é projetada de modo a atingir a faixa-alvo de intensidade subjetiva de áudio desejada com degradação mínima da qualidade do sinal de áudio.[007] In order to achieve a desired subjective audio loudness target range, a transfer function that is unique to the given audio signal is determined. The transfer function is then applied to the audio signal to produce audio of controlled subjective audio loudness. Further, the transfer function is designed so as to achieve the desired subjective audio loudness target range with minimal degradation of the audio signal quality.
[008] No estado da técnica, diferentes métodos são conhecidos.[008] In the state of the art, different methods are known.
[009] Funções de transferência pré-definidas/fixas:As funções de transferência são pré-definidas e são selecionadas com base no conteúdo de reprodução esperado, por exemplo, filmes, notícias, música, ou no modo de audição, por exemplo, modo noturno.[009] Predefined/fixed transfer functions: The transfer functions are predefined and are selected based on the expected playback content, e.g. movies, news, music, or the listening mode, e.g. night mode.
[010] Funções de transferência com base em sinais de referência:Outros métodos [2] propõem usar uma combinação de um sinal de referência medido, por exemplo, o nível do piso de ruído de fundo no ambiente de audição, e uma configuração de controle de volume no dispositivo de reprodução.[010] Transfer functions based on reference signals: Other methods [2] propose to use a combination of a measured reference signal, e.g. the background noise floor level in the listening environment, and a volume control setting on the playback device.
[011] Funções de transferência com base em parâmetros:Aqui, a função de transferência é designada com base somente em parâmetros de entrada definidos pelo usuário.[011] Parameter-based transfer functions: Here, the transfer function is assigned based only on user-defined input parameters.
[012] Para o método proposto [3], o nível médio e a faixa dinâmica de um sinal de áudio de entrada são determinados. Com base no nível médio e em uma configuração da faixa dinâmica desejada do usuário, a função de transferência é computada e aplicada ao sinal de áudio de entrada.[012] For the proposed method [3], the average level and dynamic range of an input audio signal are determined. Based on the average level and a user's desired dynamic range setting, the transfer function is computed and applied to the input audio signal.
[013] A Figura 1 mostra a tolerância de faixa dinâmica desejada com base em controle deslizante e função de transferência correspondente. No eixo geométrico x do diagrama a intensidade subjetiva de áudio de entrada em [dB] e no eixo geométrico y a intensidade subjetiva de áudio de saída em [dB] é dada. O controle deslizante exemplificativo na esquerda permite configurar a “região de tolerância da faixa dinâmica” que afeta a forma da função de transferência. A região mais baixa da entrada da intensidade subjetiva de áudio alcança o limite superior do piso de ruído. Este é seguido por uma seção com saída constante da intensidade subjetiva de áudio. A região de tolerância da faixa dinâmica corresponde à faixa dinâmica desejada nesse caso. A porção linear da função de transferência é colocada no nível médio do sinal (deslocamento horizontal), que é dependente de tempo e seguida mais uma vez por uma seção com saída constante de intensidade subjetiva de áudio.[013] Figure 1 shows the desired dynamic range tolerance based on a slider and corresponding transfer function. On the x-axis of the diagram the subjective input audio intensity in [dB] and on the y-axis the subjective output audio intensity in [dB] are given. The exemplary slider on the left allows setting the “dynamic range tolerance region” which affects the shape of the transfer function. The lowest region of the subjective input audio intensity reaches the upper limit of the noise floor. This is followed by a section with constant output of the subjective audio intensity. The dynamic range tolerance region corresponds to the desired dynamic range in this case. The linear portion of the transfer function is placed at the average signal level (horizontal displacement), which is time dependent and followed once again by a section with constant output of the subjective audio intensity.
[014] A faixa dinâmica medida não é usada na computação da função de transferência, por exemplo, um controle dedicado da dinâmica ou faixa da intensidade subjetiva de áudio do sinal de áudio de entrada não é possível.[014] The measured dynamic range is not used in the computation of the transfer function, i.e. a dedicated control of the dynamics or range of the subjective audio intensity of the input audio signal is not possible.
[015] Em [4], a dinâmica propagada, que é o desvio médio absoluto da intensidade subjetiva de áudio média, é controlada. Um compressor específico com dois segmentos de linha é usado como mostrado na Figura 2 (intensidade subjetiva de áudio de saída vs. intensidade subjetiva de áudio de entrada). Os dois parâmetros a serem estimados são o limite do compressor (indicado por um ponto preto) e inclinação (isto é, o desvio da curva linear dado com uma linha tracejada). O limite é especificado pelo usuário como um percentil e convertido em dB usando o perfil dinâmico [dB versus percentil]. A inclinação é computada com base no pressuposto de que existe uma relação linear entre alterações na dinâmica propagada e alterações na inclinação. [015] In [4], the propagated dynamics, which is the mean absolute deviation from the mean subjective audio loudness, is controlled. A specific compressor with two line segments is used as shown in Figure 2 (output subjective audio loudness vs. input subjective audio loudness). The two parameters to be estimated are the compressor threshold (indicated by a black dot) and slope (i.e., the deviation from the linear curve given with a dashed line). The threshold is specified by the user as a percentile and converted to dB using the dynamics profile [dB versus percentile]. The slope is computed based on the assumption that there is a linear relationship between changes in propagated dynamics and changes in slope.
[016] Em que Sdes e Ddes são as inclinações desejadas e dinâmicas propagadas, respectivamente, e Den é a dinâmica propagada medida.[016] Where Sdes and Ddes are the desired slopes and propagated dynamics, respectively, and Den is the measured propagated dynamics.
[017] Normalmente, Smín = Dmín = 0, Smáx = 1 e Dmáx = Den, assim: [017] Typically, Smin = Dmin = 0, Smax = 1 and Dmax = Den, like this:
[018] A função de transferência é então adaptada por meio de um processo iterativo.[018] The transfer function is then adapted through an iterative process.
[019] Primeiro, a função de transferência é aplicada ao histograma de entrada dos dados de áudio ou para os dados de áudio a fim de determinar a dinâmica propagada atingida. A inclinação da função de transferência é então ajustada e o procedimento é repetido até a dinâmica propagada desejada ser atingida.[019] First, the transfer function is applied to the input histogram of the audio data or to the audio data to determine the achieved propagated dynamics. The slope of the transfer function is then adjusted and the procedure is repeated until the desired propagated dynamics are achieved.
[020] Existem duas desvantagens implícitas por essa abordagem para controle de faixa dinâmica:1) Somente a inclinação da função de transferência é determinada, mas não sua posição em relação à origem, isto é, o deslocamento, do plano de expansão dos pelos níveis de entrada/saída. Portanto, a faixa dos ganhos resultantes não pode ser prevista.2) O processo iterativo para obter a função de transferência final a partir do inicial é computado de modo muito complexo e pode não necessariamente levar ao melhor resultado, como a seleção da função de transferência inicial, com seu limite definido pelo usuário, limita as prosperidades das possíveis funções de transferência finais.[020] There are two disadvantages implied by this approach to dynamic range control: 1) Only the slope of the transfer function is determined, but not its position relative to the origin, i.e. the offset, of the expansion plane of the input/output levels. Therefore, the range of the resulting gains cannot be predicted. 2) The iterative process to obtain the final transfer function from the initial one is computationally very complex and may not necessarily lead to the best result, as the selection of the initial transfer function, with its user-defined threshold, limits the ranges of the possible final transfer functions.
[021] Um ganho de compensação é computado pela aplicação da função de transferência final ao histograma de entrada e subsequentemente aproximadamente a intensidade subjetiva de áudio de saída do mesmo.[021] A compensation gain is computed by applying the final transfer function to the input histogram and subsequently approximating the subjective audio intensity output thereof.
[022] O objetivo da invenção é fornecer um aparelho e um método para processar um sinal de áudio de entrada especialmente referente a intensidade subjetiva de áudio dos sinais de saída que não sofrem com as desvantagens do estado da técnica.[022] The object of the invention is to provide an apparatus and a method for processing an input audio signal especially regarding the subjective audio intensity of the output signals that do not suffer from the disadvantages of the prior art.
[023] O objetivo é alcançado por um aparelho para processar um sinal de áudio de entrada, que compreende um avaliador, uma calculadora e um ajustador. O avaliador é configurado para avaliar a intensidade subjetiva de áudio do sinal de áudio de entrada para determinar uma faixa de intensidade subjetiva de áudio e um valor real da intensidade subjetiva de áudio. A faixa de intensidade subjetiva de áudio é determinada em uma modalidade para todo o sinal de áudio de entrada e em uma modalidade diferente para um dado período de tempo (por exemplo, uma estrutura) de um sinal de áudio de entrada. O valor real da intensidade subjetiva de áudio é, por exemplo, valor momentâneo ou de curto prazo de intensidade subjetiva de áudio do sinal de áudio de entrada [6]. Deve estar claro que qualquer medida que indique ou forneça uma medida adequada do nível ou força de pelo menos um período de tempo do sinal de áudio de entrada, por exemplo, a força média, pode ser usada no lugar da medida da intensidade subjetiva de áudio real mencionada acima. A calculadora é configurada para determinar uma função de transferência do compressor com base na faixa de intensidade subjetiva de áudio determinada, com base em uma faixa-alvo de intensidade subjetiva de áudio e com base no valor real da intensidade subjetiva de áudio determinada. Em algumas modalidades a função de transferência do compressor é adicionalmente com base no valor do estatístico do momento da intensidade subjetiva de áudio determinada. O estatístico do momento é, por exemplo, a média do valor da intensidade subjetiva de áudio ou a intensidade subjetiva de áudio chaveada integrada da entrada de áudio de acordo com ITU-R BS.1770 [5]). A calculadora é configurada para determinar pelo menos uma ganho de controle da faixa de intensidade subjetiva de áudio com base na função de transferência do compressor determinada. O ajustador é configurado para fornecer um sinal de áudio de saída com base no sinal de áudio de entrada e com base em pelo menos uma ganho de controle da faixa de intensidade subjetiva de áudio determinada. Em uma modalidade diferente, a calculadora fornece uma ganho de controle da faixa de intensidade subjetiva de áudio para o ajustador para fornecer o sinal de áudio de saída.[023] The objective is achieved by an apparatus for processing an input audio signal, comprising an evaluator, a calculator and an adjuster. The evaluator is configured to evaluate the subjective audio intensity of the input audio signal to determine a subjective audio intensity range and an actual subjective audio intensity value. The subjective audio intensity range is determined in one embodiment for the entire input audio signal and in a different embodiment for a given time period (e.g., a frame) of an input audio signal. The actual subjective audio intensity value is, for example, a momentary or short-term subjective audio intensity value of the input audio signal [6]. It should be clear that any measure that indicates or provides an adequate measure of the level or strength of at least a time period of the input audio signal, for example, the average strength, may be used in place of the above-mentioned actual subjective audio intensity measure. The calculator is configured to determine a compressor transfer function based on the determined subjective audio loudness range, based on a target subjective audio loudness range, and based on the actual value of the determined subjective audio loudness. In some embodiments the compressor transfer function is additionally based on the value of the moment statistician of the determined subjective audio loudness. The moment statistician is, for example, the average of the subjective audio loudness value or the integrated keyed subjective audio loudness of the audio input according to ITU-R BS.1770 [5]). The calculator is configured to determine at least one subjective audio loudness range control gain based on the determined compressor transfer function. The adjuster is configured to provide an output audio signal based on the input audio signal and based on at least one subjective audio loudness range control gain. In a different embodiment, the calculator provides a subjective audio loudness range control gain to the adjuster for providing the output audio signal.
[024] Em uma modalidade, o avaliador é configurado para avaliar a intensidade subjetiva de áudio do sinal de áudio de entrada para determinar o valor estatístico do momento da intensidade subjetiva de áudio. Adicionalmente, a calculadora é configurada para determinar a função de transferência do compressor com base na faixa de intensidade subjetiva de áudio determinada, com base na faixa-alvo de intensidade subjetiva de áudio e com base na diferença entre o valor real de intensidade subjetiva de áudio determinada e valor estatístico do momento da intensidade subjetiva de áudio.[024] In one embodiment, the evaluator is configured to evaluate the subjective audio loudness of the input audio signal to determine the statistical value of the subjective audio loudness moment. Additionally, the calculator is configured to determine the compressor transfer function based on the determined subjective audio loudness range, based on the target subjective audio loudness range, and based on the difference between the determined actual subjective audio loudness value and the statistical value of the subjective audio loudness moment.
[025] Em uma modalidade diferente, a calculadora é configurada para determinar a função de transferência do compressor com base na curva e no deslocamento, a calculadora é configurada para determinar a curva com base na faixa de intensidade subjetiva de áudio determinada e na faixa-alvo de intensidade subjetiva de áudio, e a calculadora é configurada para determinar o deslocamento com base no valor estatístico do momento da intensidade subjetiva de áudio determinada.[025] In a different embodiment, the calculator is configured to determine the compressor transfer function based on the curve and the offset, the calculator is configured to determine the curve based on the determined subjective audio loudness range and the target subjective audio loudness range, and the calculator is configured to determine the offset based on the statistical value of the determined subjective audio loudness moment.
[026] De acordo com uma modalidade, a calculadora é configurada para determinar a função de transferência do compressor com base na inclinação e em um deslocamento, a calculadora é configurada para determinar a inclinação com base na faixa da intensidade subjetiva de áudio determinada e na faixa-alvo de intensidade subjetiva de áudio, e a calculadora é configurada para determinar o deslocamento com base no valor estatístico do momento da intensidade subjetiva de áudio determinada.[026] According to one embodiment, the calculator is configured to determine the compressor transfer function based on the slope and an offset, the calculator is configured to determine the slope based on the determined subjective audio intensity range and the target subjective audio intensity range, and the calculator is configured to determine the offset based on the statistical value of the determined subjective audio intensity moment.
[027] Em uma modalidade, a função de transferência do compressor determinada é válida para todo o sinal de áudio de entrada.[027] In one embodiment, the determined compressor transfer function is valid for the entire input audio signal.
[028] De acordo com uma modalidade, o avaliador é configurado para avaliar a intensidade subjetiva de áudio de todo o sinal de áudio de entrada.[028] According to one embodiment, the evaluator is configured to evaluate the subjective audio intensity of the entire input audio signal.
[029] Em uma modalidade, o avaliador é configurado para avaliar a intensidade subjetiva de áudio de pelo menos um período de tempo do sinal de áudio de entrada.[029] In one embodiment, the evaluator is configured to evaluate the subjective audio intensity of at least one time period of the input audio signal.
[030] De acordo com uma modalidade, o avaliador é configurado para determinar o valor da intensidade subjetiva de áudio momentânea ou de curto prazo como o valor real de intensidade subjetiva de áudio.[030] According to one embodiment, the evaluator is configured to determine the momentary or short-term subjective audio intensity value as the actual subjective audio intensity value.
[031] Em uma modalidade, o avaliador é configurado para determinar uma intensidade subjetiva de áudio média como o valor estatístico do momento da intensidade subjetiva de áudio.[031] In one embodiment, the evaluator is configured to determine an average subjective audio intensity as the statistical value of the subjective audio intensity moment.
[032] Em uma modalidade diferente, o avaliador é configurado para determinar uma intensidade subjetiva de áudio chaveada integrada como o valor estatístico do momento da intensidade subjetiva de áudio.[032] In a different embodiment, the evaluator is configured to determine an integrated keyed subjective audio intensity as the statistical value of the subjective audio intensity moment.
[033] De acordo com uma modalidade, a calculadora é configurada para determinar a função de transferência do compressor de modo que a intensidade subjetiva de áudio média do sinal de áudio de saída e a intensidade subjetiva de áudio média determinada do sinal de áudio de entrada são iguais.[033] According to one embodiment, the calculator is configured to determine the compressor transfer function such that the average subjective audio intensity of the output audio signal and the determined average subjective audio intensity of the input audio signal are equal.
[034] Em uma modalidade, a calculadora é configurada para fornecer o ajustador com o ganho de controle da faixa de intensidade subjetiva de áudio determinada.[034] In one embodiment, the calculator is configured to provide the adjuster with control gain for the determined subjective audio loudness range.
[035] Em uma modalidade, a calculadora é configurada para fornecer o ajustador com o ganho de controle da faixa de intensidade subjetiva de áudio determinada somente em caso do ganho de controle da faixa de intensidade subjetiva de áudio calculado ser menor ou igual ao valor máximo de ganho. De acordo com uma modalidade, quando o ganho de controle da faixa de intensidade subjetiva de áudio determinado é maior do que o valor máximo de ganho, a calculadora é configurada para fornecer o ajustador com o valor máximo de ganho. Em uma modalidade alternativa, quando o ganho de controle da faixa de intensidade subjetiva de áudio determinado é maior do que o valor máximo de ganho, a calculadora não fornece um ganho para o ajustador e o ajustador presume um valor máximo de ganho ou usa um ganho armazenado para tal situação.[035] In one embodiment, the calculator is configured to provide the adjuster with the determined subjective audio loudness range control gain only if the calculated subjective audio loudness range control gain is less than or equal to the maximum gain value. According to one embodiment, when the determined subjective audio loudness range control gain is greater than the maximum gain value, the calculator is configured to provide the adjuster with the maximum gain value. In an alternative embodiment, when the determined subjective audio loudness range control gain is greater than the maximum gain value, the calculator does not provide a gain to the adjuster and the adjuster assumes a maximum gain value or uses a stored gain for such a situation.
[036] Em uma modalidade adicional, a calculadora é configurada para determinar o ganho de controle da faixa de intensidade subjetiva de áudio com base na função de transferência do compressor determinada e com base em um valor máximo de ganho de modo que o ganho de controle da faixa de intensidade subjetiva de áudio determinado é menor ou igual ao valor máximo de ganho. Logo, a calculadora determina, por exemplo, o ganho de controle da faixa de intensidade subjetiva de áudio determinado a ser submetido ao ajustador pelo cálculo do valor de ganho mínimo realmente determinado e o valor máximo de ganho.[036] In a further embodiment, the calculator is configured to determine the control gain of the subjective audio loudness range based on the determined compressor transfer function and based on a maximum gain value such that the control gain of the determined subjective audio loudness range is less than or equal to the maximum gain value. Thus, the calculator determines, for example, the control gain of the determined subjective audio loudness range to be subjected to the adjuster by calculating the actually determined minimum gain value and the maximum gain value.
[037] De acordo com uma modalidade, o valor máximo de ganho é definido por uma entrada do usuário. Em uma modalidade alternativa, o valor máximo de ganho depende da diferença entre a faixa-alvo de intensidade subjetiva de áudio e a faixa de intensidade subjetiva de áudio determinada do sinal de áudio de entrada.[037] According to one embodiment, the maximum gain value is set by a user input. In an alternative embodiment, the maximum gain value depends on the difference between the target subjective audio loudness range and the determined subjective audio loudness range of the input audio signal.
[038] De acordo com uma modalidade, o aparelho compreende ainda uma interface de entrada configurada para receber um valor para a faixa-alvo de intensidade subjetiva de áudio. Logo, através da interface de entrada o usuário insere a faixa-alvo de intensidade subjetiva de áudio desejada.[038] According to one embodiment, the apparatus further comprises an input interface configured to receive a value for the target subjective audio intensity range. Then, through the input interface, the user inputs the desired target subjective audio intensity range.
[039] Algumas modalidades adicionais do aparelho e de acordo com o seguintemétodo:[039] Some additional embodiments of the apparatus and according to the following method:
[040] Em uma modalidade, o avaliador é configurado para avaliar uma intensidade subjetiva de áudio do sinal de áudio de entrada para determinar uma faixa de intensidade subjetiva de áudio e uma intensidade subjetiva de áudio média. A calculadora é configurada para calcular um valor de inclinação que é proporcional a uma razão entre uma faixa-alvo de intensidade subjetiva de áudio e uma faixa intensidade subjetiva de áudio determinada do sinal de áudio de entrada. A calculadora é configurada para calcular um valor de deslocamento que depende da intensidade subjetiva de áudio média determinada do sinal de áudio de entrada (em uma modalidade, o deslocamento depende da intensidade subjetiva de áudio média determinado vezes a diferença entre 1 e a inclinação). A calculadora é configurada para calcular a faixa de controle de dados da intensidade subjetiva de áudio com base em uma função de transferência linear que depende do valor de deslocamento calculado e do valor de inclinação calculado. Finalmente, o ajustador é configurado para fornecer um sinal de áudio de saída com base no sinal de áudio de entrada e com base na faixa de controle de dados da intensidade subjetiva de áudio.[040] In one embodiment, the evaluator is configured to evaluate a subjective audio intensity of the input audio signal to determine a subjective audio intensity range and an average subjective audio intensity. The calculator is configured to calculate a slope value that is proportional to a ratio of a target subjective audio intensity range to a determined subjective audio intensity range of the input audio signal. The calculator is configured to calculate an offset value that depends on the determined average subjective audio intensity of the input audio signal (in one embodiment, the offset depends on the determined average subjective audio intensity times the difference between 1 and the slope). The calculator is configured to calculate the subjective audio intensity data control range based on a linear transfer function that depends on the calculated offset value and the calculated slope value. Finally, the adjuster is configured to provide an output audio signal based on the input audio signal and based on the subjective audio intensity data control range.
[041] Em uma modalidade, a função de transferência linear é válida para todo osinal de áudio de entrada. Nessa modalidade, uma função de transferência linear é usada para todo o sinal de áudio de entrada, isto é, para todos os valores de intensidade subjetiva de áudio. Em uma modalidade, a função de transferência linear é válida para todo o sinal de áudio de entrada com exceção de valores muito alto e/ou baixos da intensidade subjetiva de áudio.[041] In one embodiment, the linear transfer function is valid for the entire input audio signal. In this embodiment, a linear transfer function is used for the entire input audio signal, i.e., for all subjective audio intensity values. In one embodiment, the linear transfer function is valid for the entire input audio signal with the exception of very high and/or low subjective audio intensity values.
[042] De acordo com uma modalidade, o avaliador é configurado para determinar a faixa de intensidade subjetiva de áudio e a intensidade subjetiva de áudio média para todo o sinal de áudio de entrada. Essa modalidade é especialmente relevante para o tratamento off-line do sinal de áudio de entrada.[042] According to one embodiment, the evaluator is configured to determine the subjective audio loudness range and the average subjective audio loudness for the entire input audio signal. This embodiment is especially relevant for offline processing of the input audio signal.
[043] Em uma modalidade, o avaliador é configurado para determinar a faixa de intensidade subjetiva de áudio e a intensidade subjetiva de áudio média de pelo menos uma parte do sinal de áudio de entrada.[043] In one embodiment, the evaluator is configured to determine the subjective audio loudness range and the average subjective audio loudness of at least a portion of the input audio signal.
[044] De acordo com uma modalidade, a calculadora para calcular o valor de inclinação como um produto de uma proporcionalidade constante vezes a razão entre a faixa-alvo de intensidade subjetiva de áudio e a faixa de intensidade subjetiva de áudio determinada do sinal de áudio de entrada. A faixa-alvo de intensidade subjetiva de áudio é inserida por um usuário e refere-se a faixa de intensidade subjetiva de áudio do sinal de áudio de saída, a faixa de intensidade subjetiva de áudio determinada é dada por uma faixa pelo sinal de áudio de entrada.[044] According to one embodiment, the calculator calculates the slope value as a product of a constant proportionality times the ratio of the target subjective audio intensity range to the determined subjective audio intensity range of the input audio signal. The target subjective audio intensity range is input by a user and refers to the subjective audio intensity range of the output audio signal, the determined subjective audio intensity range is given by a range of the input audio signal.
[045] Em uma modalidade, a proporcionalidade constante é definida para um. Logo, o valor de inclinação é dado pela razão entre a faixa-alvo de intensidade subjetiva de áudio e a faixa de intensidade subjetiva de áudio determinada.[045] In one embodiment, the proportionality constant is set to one. Thus, the slope value is given by the ratio of the target subjective audio intensity range to the determined subjective audio intensity range.
[046] De acordo com uma modalidade, a calculadora é configurada para calcular o valor de deslocamento de modo que a intensidade subjetiva de áudio média do sinal de áudio de saída e a intensidade subjetiva de áudio média determinada do sinal de áudio de entrada são iguais.[046] According to one embodiment, the calculator is configured to calculate the offset value such that the average subjective audio intensity of the output audio signal and the determined average subjective audio intensity of the input audio signal are equal.
[047] Em uma modalidade, a calculadora é configurada para calcular o valor de inclinação usando a seguinte fórmula: a = μen * (1 - b). O valor de deslocamento é dado por a, intensidade subjetiva de áudio média determinada do sinal de áudio de entrada indicado por μen, e b é calculado pelo valor de deslocamento.[047] In one embodiment, the calculator is configured to calculate the slope value using the following formula: a = μen * (1 - b). The offset value is given by a, the average subjective audio intensity determined from the input audio signal denoted by μen, and b is calculated from the offset value.
[048] De acordo com uma modalidade, a calculadora é configurada para fornecer um ganho de controle da faixa de intensidade subjetiva de áudio e o ajustador é configurada para aplicar o ganho de controle da faixa de intensidade subjetiva de áudio ao sinal de áudio de entrada.[048] According to one embodiment, the calculator is configured to provide a subjective audio loudness range control gain and the adjuster is configured to apply the subjective audio loudness range control gain to the input audio signal.
[049] Em uma modalidade, o avaliador é configurado para determinar um valor de entrada de intensidade subjetiva de áudio de uma estrutura do sinal de áudio de entrada que tem uma duração de curto prazo. A calculadora é configurada para fornecer um valor de saída de intensidade subjetiva de áudio de uma estrutura do sinal de áudio de saída correspondente à estrutura do sinal de áudio de entrada. Adicionalmente, a calculadora é configurada para calcular o valor de saída de intensidade subjetiva de áudio usando a seguinte fórmula: Nsaí(k) = a + b * Nen(k). Em que: Nsaí(k) é o valor de saída da intensidade subjetiva de áudio, a é o valor de deslocamento, b é o valor de inclinação, Nen(k) é o valor de entrada da intensidade subjetiva de áudio determinada da estrutura correspondente do sinal de áudio de entrada, e k é um índice da estrutura. A estrutura é, assim, uma parte do sinal de entrada do qual, por exemplo, a faixa de intensidade subjetiva de áudio e/ou a intensidade subjetiva de áudio média são/é determinada.[049] In one embodiment, the evaluator is configured to determine a subjective audio intensity input value from a frame of the input audio signal that has a short-term duration. The calculator is configured to provide a subjective audio intensity output value from a frame of the output audio signal corresponding to the frame of the input audio signal. Additionally, the calculator is configured to calculate the subjective audio intensity output value using the following formula: Nout(k) = a + b * Nen(k). Wherein: Nout(k) is the subjective audio intensity output value, a is the offset value, b is the slope value, Nen(k) is the subjective audio intensity input value determined from the corresponding frame of the input audio signal, and k is an index of the frame. The frame is thus a portion of the input signal from which, for example, the subjective audio intensity range and/or the average subjective audio intensity are/are determined.
[050] De acordo com uma modalidade, a calculadora é configurada para fornecer um ganho de controle da faixa de intensidade subjetiva de áudio enquanto a diferença entre o valor de intensidade subjetiva de áudio calculado da estrutura do sinal de áudio de saída e o valor da intensidade subjetiva de áudio determinada da estrutura correspondente do sinal de áudio de entrada.[050] According to one embodiment, the calculator is configured to provide a gain control of the subjective audio intensity range as the difference between the subjective audio intensity value calculated from the structure of the output audio signal and the subjective audio intensity value determined from the corresponding structure of the input audio signal.
[051] Em uma modalidade, a calculadora é configurada para fornecer um ganho de controle da faixa de intensidade subjetiva de áudio usando a seguinte fórmula: G(k) = a + (b - 1) * Nen(k), em que G(k) é o ganho de controle da faixa de intensidade subjetiva de áudio, a é o valor de deslocamento calculado, b é o valor de inclinação calculado, Nen(k) é o valor de entrada da intensidade subjetiva de áudio determinado de uma estrutura do sinal de áudio de entrada, e k é um índice da estrutura. O ganho de controle da faixa de intensidade subjetiva de áudio é, assim, um exemplo de faixa de controle de dados da intensidade subjetiva de áudio para ser usado pelo ajustador.[051] In one embodiment, the calculator is configured to provide a subjective audio loudness range control gain using the following formula: G(k) = a + (b - 1) * Nen(k), where G(k) is the subjective audio loudness range control gain, a is the calculated offset value, b is the calculated slope value, Nen(k) is the subjective audio loudness input value determined from a frame of the input audio signal, and k is an index of the frame. The subjective audio loudness range control gain is thus an example of a subjective audio loudness data control range for use by the adjuster.
[052] De acordo com uma modalidade, o ajustador é configurado para aplicar o ganho de controle da faixa de intensidade subjetiva de áudio ao sinal de áudio de entrada para fornecer o sinal de áudio de saída.[052] According to one embodiment, the adjuster is configured to apply the subjective audio loudness range control gain to the input audio signal to provide the output audio signal.
[053] Em uma modalidade, a calculadora é configurada para fornecer o ajustador com o ganho de controle da faixa de intensidade subjetiva de áudio calculado. De acordo com uma modalidade, o ganho de controle da faixa de intensidade subjetiva de áudio fornecido calculado é menor ou igual ao valor máximo de ganho.[053] In one embodiment, the calculator is configured to provide the adjuster with the calculated subjective audio loudness range control gain. According to one embodiment, the provided calculated subjective audio loudness range control gain is less than or equal to the maximum gain value.
[054] De acordo com uma modalidade, o valor máximo de ganho é definido por um usuário de entrada.[054] According to one embodiment, the maximum gain value is set by a user input.
[055] Em uma modalidade, o valor máximo de ganho depende da diferença entre a faixa-alvo de intensidade subjetiva de áudio e a faixa de intensidade subjetiva de áudio determinada do sinal de áudio de entrada.[055] In one embodiment, the maximum gain value depends on the difference between the target subjective audio loudness range and the determined subjective audio loudness range of the input audio signal.
[056] De acordo com uma modalidade, a calculadora é configurada para fornecer o ajustador com o ganho de controle da faixa de intensidade subjetiva de áudio calculado. O ganho de controle da faixa de intensidade subjetiva de áudio fornecido calculado é em uma modalidade maior ou igual ao valor mínimo de ganho.[056] According to one embodiment, the calculator is configured to provide the adjuster with the calculated subjective audio loudness range control gain. The provided calculated subjective audio loudness range control gain is in one embodiment greater than or equal to the minimum gain value.
[057] Em uma modalidade, o avaliador é configurado para determinar uma intensidade subjetiva de áudio integrada do sinal de áudio de entrada. Adicionalmente, a calculadora é configurada para calcular o valor do ganho de compensação com base na intensidade subjetiva de áudio integrada determinada do sinal de áudio de entrada e em uma intensidade subjetiva de áudio integrada alvo do sinal de saída. Finalmente, o ajustador é configurado para modificar a intensidade subjetiva de áudio do sinal de áudio de saída através da aplicação do valor do ganho de compensação.[057] In one embodiment, the evaluator is configured to determine an integrated subjective audio intensity of the input audio signal. Additionally, the calculator is configured to calculate a compensation gain value based on the determined integrated subjective audio intensity of the input audio signal and a target integrated subjective audio intensity of the output signal. Finally, the adjuster is configured to modify the subjective audio intensity of the output audio signal by applying the compensation gain value.
[058] De acordo com uma modalidade, o avaliador é configurado para determinar uma intensidade subjetiva de áudio integrada do sinal de áudio de entrada. A calculadora é configurada para calcular um valor do ganho de compensação com base no valor de deslocamento, o valor de inclinação, e a intensidade subjetiva de áudio integrada determinada. O ajustador é configurado para modificar a intensidade subjetiva de áudio do sinal de áudio de saída através da aplicação do valor do ganho de compensação.[058] According to one embodiment, the evaluator is configured to determine an integrated subjective audio intensity of the input audio signal. The calculator is configured to calculate a compensation gain value based on the offset value, the slope value, and the determined integrated subjective audio intensity. The adjuster is configured to modify the subjective audio intensity of the output audio signal by applying the compensation gain value.
[059] Em uma modalidade, a calculadora é configurada para calcular o valor do ganho de compensação usando a seguinte fórmula: Gmu = a + (b - 1) Ien, em que Gmu é o valor do ganho de compensação, a é o valor de inclinação, b é o valor de deslocamento, e Ien é a intensidade subjetiva de áudio integrada determinada do sinal de áudio de entrada.[059] In one embodiment, the calculator is configured to calculate the compensation gain value using the following formula: Gmu = a + (b - 1) Ien, where Gmu is the compensation gain value, a is the slope value, b is the offset value, and Ien is the subjective integrated audio intensity determined from the input audio signal.
[060] O objetivo também é alcançado através de um método para processar um sinal de áudio de entrada. A expressão sinal de áudio de entrada compreende sinais de áudio como também sinais de fala.[060] The object is also achieved by a method for processing an input audio signal. The term input audio signal comprises audio signals as well as speech signals.
[061] O método para processar um sinal de áudio de entrada compreende pelo menos as seguintes etapas: • avaliar uma intensidade subjetiva de áudio do sinal de áudio de entrada para determinar uma faixa de intensidade subjetiva de áudio e um valor real de intensidade subjetiva de áudio,• determinar uma função de transferência do compressor com base na faixa de intensidade subjetiva de áudio determinada, com base na faixa-alvo de intensidade subjetiva de áudio, com base no valor real de intensidade subjetiva de áudio determinado, e com base no valor estatístico do momento da intensidade subjetiva de áudio determinada,• determinar pelo menos um ganho de controle da faixa de intensidade subjetiva de áudio com base na função de transferência do compressor determinada, e• fornecer um sinal de áudio de saída com base no sinal de áudio de entrada e com base em pelo menos um ganho de controle da faixa de intensidade subjetiva de áudio determinado.[061] The method for processing an input audio signal comprises at least the following steps: • evaluating a subjective audio intensity of the input audio signal to determine a subjective audio intensity range and an actual subjective audio intensity value, • determining a compressor transfer function based on the determined subjective audio intensity range, based on the target subjective audio intensity range, based on the actual determined subjective audio intensity value, and based on the statistical moment value of the determined subjective audio intensity, • determining at least one control gain of the subjective audio intensity range based on the determined compressor transfer function, and • providing an output audio signal based on the input audio signal and based on at least one control gain of the determined subjective audio intensity range.
[062] Em uma modalidade diferente, as seguintes etapas são realizadas:• avaliar uma intensidade subjetiva de áudio do sinal de áudio de entrada para determinar uma faixa de intensidade subjetiva de áudio e uma intensidade subjetiva de áudio média,• calcular um valor de inclinação que é proporcional a uma razão entre uma faixa-alvo de intensidade subjetiva de áudio e a faixa de intensidade subjetiva de áudio determinada,• calcular um valor de deslocamento que depende na intensidade subjetiva de áudio média determinada,• calcular uma faixa de controle de dados da intensidade subjetiva de áudio com base na função de transferência linear que depende no valor de inclinação calculado e no valor de deslocamento calculado, e• fornecer um sinal de áudio de saída com base no sinal de áudio de entrada e com base na faixa de controle de dados da intensidade subjetiva de áudio.[062] In a different embodiment, the following steps are performed: • evaluating a subjective audio intensity of the input audio signal to determine a subjective audio intensity range and an average subjective audio intensity, • calculating a slope value that is proportional to a ratio of a target subjective audio intensity range to the determined subjective audio intensity range, • calculating an offset value that depends on the determined average subjective audio intensity, • calculating a subjective audio intensity data control range based on the linear transfer function that depends on the calculated slope value and the calculated offset value, and • providing an output audio signal based on the input audio signal and based on the subjective audio intensity data control range.
[063] As modalidades acima discutidas do aparelho também são válidas para o método.[063] The above discussed embodiments of the apparatus are also valid for the method.
[064] A invenção também se refere a um programa de computador para realizar, quando executado em um computador ou um processador, o método para processar um sinal de áudio de entrada.[064] The invention also relates to a computer program for performing, when executed on a computer or a processor, the method for processing an input audio signal.
[065] A invenção será explicada a seguir com relação aos desenhos anexos e as modalidades descritas nos desenhos em anexo, em que:A Figura 1 mostra uma função de transferência do estado da técnica LRAC,A Figura 2 mostra uma diferente função de transferência do estado da técnica LRAC,A Figura 3 mostra um diagrama de blocos de um aparelho para processar um sinal de áudio de entrada,A Figura 4 mostra um diagrama de blocos diferente das etapas do método para processar um sinal de áudio de entrada,A Figura 5 mostra uma função de transferência com inclinação (Figura 5 a)) e com inclinação e deslocamento (Figura 5 b)),A Figura 6 descreve (diagrama superior) de histograma de curto prazo intensidade subjetiva de áudio de um segmento de áudio de uma hora de um filme e (diagrama inferior) duas diferentes funções de transferência eA Figura 7 mostra um histograma exemplificativo, diferentes funções de transferência de acordo com o estado da técnica e uma função de transferência de acordo com a invenção.[065] The invention will be explained below with reference to the accompanying drawings and the embodiments described in the accompanying drawings, in which: Figure 1 shows a transfer function of the prior art LRAC, Figure 2 shows a different transfer function of the prior art LRAC, Figure 3 shows a block diagram of an apparatus for processing an input audio signal, Figure 4 shows a different block diagram of the steps of the method for processing an input audio signal, Figure 5 shows a transfer function with slope (Figure 5 a)) and with slope and offset (Figure 5 b)), Figure 6 depicts (top diagram) a histogram of short-term subjective audio intensity of a one-hour audio segment of a film and (bottom diagram) two different transfer functions and Figure 7 shows an exemplary histogram, different transfer functions according to the prior art and a transfer function according to the invention.
[066] As Figura 1 e 2 descrevem funções de transferência de acordo com o estado da técnica.[066] Figures 1 and 2 describe transfer functions according to the state of the art.
[067] A Figura 3 mostra uma modalidade exemplificativa de um aparelho 1 para processar um sinal de áudio de entrada 100 e para processar um sinal de áudio de saída 101. O avaliador 10 avalia nessa modalidade mostrada a intensidade subjetiva de áudio do sinal de áudio de entrada 100 a fim de determine uma faixa de intensidade subjetiva de áudio LRAen e uma intensidade subjetiva de áudio média μen do sinal de áudio de entrada 100. Nessa modalidade, o avaliador 10 também determina uma intensidade subjetiva de áudio integrada Ien do sinal de áudio de entrada 100 e o valor de entrada intensidade subjetiva de áudio Nen(k) para estruturas diferentes k do sinal de áudio de entrada 100.[067] Figure 3 shows an exemplary embodiment of an apparatus 1 for processing an input audio signal 100 and for processing an output audio signal 101. The evaluator 10 evaluates in this shown embodiment the subjective audio intensity of the input audio signal 100 in order to determine a subjective audio intensity range LRAen and an average subjective audio intensity μen of the input audio signal 100. In this embodiment, the evaluator 10 also determines an integrated subjective audio intensity Ien of the input audio signal 100 and the input subjective audio intensity value Nen(k) for different frames k of the input audio signal 100.
[068] Os valores determinados são submetidos à calculadora 11 que também se refere à uma faixa-alvo de intensidade subjetiva de áudio desejada LRAdes inserida por um usuário por uma interface de entrada 13.[068] The determined values are submitted to the calculator 11 which also refers to a target range of desired subjective audio intensity LRAdes entered by a user via an input interface 13.
[069] A calculadora 11 calcula a faixa de controle de dados da intensidade subjetiva de áudio a ser usada pelo ajustador 12 - isto é, ajustador da intensidade subjetiva de áudio - que age no sinal de áudio de entrada 100 e fornece o sinal de áudio de saída 101. Adicionalmente, a calculadora 11 fornece faixa de controle de dados intensidade subjetiva de áudio em forma de ganho de controle da faixa de intensidade subjetiva de áudio G e aqui também ganho de compensação Gmu. Este é o resultado da determinação da função de transferência do compressor.[069] The calculator 11 calculates the subjective audio intensity data control range to be used by the adjuster 12 - i.e. subjective audio intensity adjuster - which acts on the input audio signal 100 and provides the output audio signal 101. Additionally, the calculator 11 provides the subjective audio intensity data control range in the form of the subjective audio intensity range control gain G and here also compensation gain Gmu. This is the result of determining the transfer function of the compressor.
[070] O LRAC inventivo aplica-se nesta modalidade uma transformação linear ao sinal de áudio de entrada 100 a fim de alcançar a faixa de controle da intensidade subjetiva de áudio para o sinal de áudio de saída 101.[070] The inventive LRAC in this embodiment applies a linear transformation to the input audio signal 100 in order to achieve the subjective audio intensity control range for the output audio signal 101.
[071] Um diagrama de blocos de uma modalidade adicional do LRAC inventivo é mostrado na Figura 4.[071] A block diagram of a further embodiment of the inventive LRAC is shown in Figure 4.
[072] As etapas estão nessa modalidade:• Obter Áudio, isto é, o sinal de áudio de entrada, que é identificado no seguinte x.• Computação Momentânea da Intensidade subjetiva de áudio.• A computação momentânea da Intensidade subjetiva de áudio é usada para uma etapa: Computar ganho de compensação que depende de uma Intensidade subjetiva de áudio alvo definida por um usuário.• A computação momentânea da Intensidade subjetiva de áudio é também usada para uma etapa: Computar Intensidade subjetiva de áudio de curto prazo que é seguida por uma etapa: Determinar Função de transferência que depende de uma Faixa-alvo de intensidade subjetiva de áudio definida por um usuário.• A Função de transferência determinada é submetida à etapa acimamencionada: Computar ganho de compensação e para a próxima etapa de Computar Ganhos LRAC.• Os Ganhos LRAC e os Ganhos de Compensação são aplicados em uma próxima etapa ao Áudio, isto é, para o sinal de áudio de entrada.• Emitir o sinal de áudio de saída, que é indicado aqui y.[072] The steps are in this modality:• Obtain Audio, that is, the input audio signal, which is identified in the following x.• Momentary Computation of Subjective Audio Intensity.• The momentary computation of Subjective Audio Intensity is used for a step: Computing Compensation Gain that depends on a Target Subjective Audio Intensity defined by a user.• The momentary computation of Subjective Audio Intensity is also used for a step: Computing Short-Term Subjective Audio Intensity which is followed by a step: Determining Transfer Function that depends on a Target Subjective Audio Intensity Range defined by a user.• The determined Transfer Function is submitted to the above-mentioned step: Computing Compensation Gain and to the next step of Computing LRAC Gains.• The LRAC Gains and the Compensation Gains are applied in a next step to the Audio, that is, to the input audio signal.• Outputting the output audio signal, which is indicated here y.
[073] O sinal de áudio de saída y é obtido como [073] The output audio signal y is obtained as
[074] Em que g é o ganho aplicado ao sinal de áudio de entrada x a fim de controlar a faixa de intensidade subjetiva de áudio. O ganho é obtido com base na faixa de intensidade subjetiva de áudio da entrada do áudio LRAen, a faixa-alvo de intensidade subjetiva de áudio desejada LRAdes, e a medida sobre um período de tempo da intensidade subjetiva de áudio Nen, por exemplo, intensidade subjetiva de áudio de curto prazo ou momentânea. Essa também pode ser chamada de valor real de intensidade subjetiva de áudio que deve ser determinada pelo avaliador ou qualquer etapa que avalia a intensidade subjetiva de áudio do sinal de áudio de entrada. A medida da intensidade subjetiva de áudio Nen é normalmente variante no tempo. Em uma modalidade o ganho é adicionalmente obtido com base no valor estatístico do momento da intensidade subjetiva de áudio determinada. Valor estatístico do momento é, por exemplo, a média da intensidade subjetiva de áudio ou a intensidade subjetiva de áudio chaveada integrada da entrada de áudio de acordo com ITU-R BS.1770 [5]).[074] Where g is the gain applied to the input audio signal x in order to control the subjective audio intensity range. The gain is obtained based on the subjective audio intensity range of the audio input LRAen, the desired subjective audio intensity target range LRAdes, and the measurement over a period of time of the subjective audio intensity Nen, e.g., short-term or momentary subjective audio intensity. This may also be called the actual subjective audio intensity value that must be determined by the evaluator or any stage that evaluates the subjective audio intensity of the input audio signal. The subjective audio intensity measurement Nen is typically time-varying. In one embodiment the gain is additionally obtained based on the statistical moment value of the determined subjective audio intensity. The statistical moment value is, e.g., the average subjective audio intensity or the integrated keyed subjective audio intensity of the audio input according to ITU-R BS.1770 [5]).
[075] O ganho no dB é [075] The gain in dB is
[076] O ganho G é obtido em uma modalidade com base de uma função mapeada Q que é, com base na faixa intensidade subjetiva de áudio da entrada de áudio LRAen, a faixa-alvo de intensidade subjetiva de áudio desejada LRAdes, e a diferença ΔN entre medida estatística do momento da intensidade subjetiva de áudio e a medida da intensidade subjetiva de áudio: [076] The gain G is obtained in one embodiment based on a mapped function Q that is, based on the subjective audio intensity range of the audio input LRAen, the desired subjective audio intensity target range LRAdes, and the difference ΔN between the statistical measure of the subjective audio intensity moment and the subjective audio intensity measure:
[077] Em uma modalidade, a realização de ΔN é dada pela diferença entre a intensidade subjetiva de áudio média da entrada de áudio μen (ou alternativamente a intensidade subjetiva de áudio chaveada integrada da entrada de áudio de acordo com ITU-R BS.1770 [5]) e a medida da intensidade subjetiva de áudio de um período Nen, isto éΔN = μen - Nen.[077] In one embodiment, the realization of ΔN is given by the difference between the average subjective audio intensity of the audio input μen (or alternatively the integrated keyed subjective audio intensity of the audio input according to ITU-R BS.1770 [5]) and the measured subjective audio intensity of a period Nen, i.e. ΔN = μen - Nen.
[078] A medida da intensidade subjetiva de áudio do período Nen é um exemplo de um valor real de intensidade subjetiva de áudio de um período de tempo ou estrutura do sinal de áudio de entrada.[078] The subjective audio intensity measure of the Nen period is an example of a real subjective audio intensity value of a time period or frame of the input audio signal.
[079] A seguir, μen está em um exemplo a intensidade subjetiva de áudio média do sinal de áudio de entrada. Em diferente modalidade, μen se refere a intensidade subjetiva de áudio chaveada integrada de acordo com ITU-R BS.1770 [5] ou uma regra semelhante para determinar a longo prazo a medida da intensidade subjetiva de áudio. Geralmente, μen é um valor estatístico do momento da intensidade subjetiva de áudio do sinal de áudio de entrada.[079] In the following, μen is in one example the average subjective audio intensity of the input audio signal. In another embodiment, μen refers to the integrated keyed subjective audio intensity according to ITU-R BS.1770 [5] or a similar rule for determining the long-term subjective audio intensity measurement. Generally, μen is a statistical value of the moment of the subjective audio intensity of the input audio signal.
[080] Alternativamente, G é obtido com base nas funções mapeada a seguir que consiste na superposição de uma curva K e um deslocamento Kdeslocamento, em que a curva depende de LRAen e LRAdes e o deslocamento depende de μen: [080] Alternatively, G is obtained based on the following mapped functions consisting of the superposition of a curve K and a displacement Kdisplacement, where the curve depends on LRAen and LRAdes and the displacement depends on μen:
[081] Uma escolha adequada para a curva K é, por exemplo, uma função sigmoide. A equação (6) pode ser ainda restrita ao caso em que a curva K é especificada por uma inclinação S: [081] A suitable choice for the K-curve is, for example, a sigmoid function. Equation (6) can be further restricted to the case where the K-curve is specified by a slope S:
[082] Como pode ser visto, a função de mapeamento é determinada por uma inclinação S e um deslocamento Kdeslocamento.[082] As can be seen, the mapping function is determined by a slope S and an offset Koffset.
[083] Para evitar amplificação excessiva de sinais com valores de baixa intensidade subjetiva de áudio, o ganho G é subsequentemente restringido para obter o ganho final: [083] To avoid over-amplification of signals with low subjective audio intensity values, the gain G is subsequently restricted to obtain the final gain:
[084] em que Gmáx é o ganho máximo permitido. Esse ganho máximo pode serdefinido a priori, por exemplo, por um usuário ou determinado com base no sinal de áudio de entrada.[084] where Gmax is the maximum allowable gain. This maximum gain can be defined a priori, for example by a user, or determined based on the input audio signal.
[085] A seguir, modalidades para um LRAC off-line e um online são discutidas.[085] Next, modalities for an offline and an online LRAC are discussed.
[086] Na versão off-line, todo o sinal de áudio de entrada está disponível. Aqui,o LRAC inventivo é com base na aplicação de uma transformação linear para o sinal de áudio, em uma base quadro a quadro, a fim de alcançar a faixa de controle da intensidade subjetiva de áudio. Nesse caso, a curva é uma linha com uma inclinação determinada.[086] In the offline version, the entire input audio signal is available. Here, the inventive LRAC is based on applying a linear transformation to the audio signal, on a frame-by-frame basis, in order to achieve the control range of the subjective audio intensity. In this case, the curve is a line with a given slope.
[087] Algumas considerações teóricas serão discutidas.[087] Some theoretical considerations will be discussed.
[088] Dada uma variável aleatória distribuída normalmente w com padrão de desvio ow e média μw, a aplicação de uma função de transferência linear, com inclinação b e deslocamento a, resulta em uma variável aleatória distribuída normalmentez = a + bw, (9)[088] Given a normally distributed random variable w with standard deviation ow and mean μw, the application of a linear transfer function, with slope b and offset a, results in a normally distributed random variable z = a + bw, (9)
[089] A variável aleatória z tem um desvio padrão Oz = b Ow e média μz = a + b μw.[089] The random variable z has a standard deviation Oz = b Ow and mean μz = a + b μw.
[090] Duas suposições são feitas:[090] Two assumptions are made:
[091] 1) A medida da intensidade subjetiva de áudio Nen (isto é, o valor real deintensidade subjetiva de áudio determinado do sinal de áudio de entrada) é uma variável aleatória distribuída normalmente.[091] 1) The subjective audio intensity measure Nen (i.e., the actual subjective audio intensity value determined from the input audio signal) is a normally distributed random variable.
[092] 2) A razão do desvio padrão de entrada e saída é proporcional à razão daLRA de entrada e saída, isto é, [092] 2) The ratio of input to output standard deviation is proportional to the ratio of input to output LRA, i.e.,
[093] em que Ç é uma constante de proporcionalidade, que pode ser usada para compensar desvios do sinal de áudio para o modelo. Geralmente, a LRA é reduzida e, portanto, LRAz < LRAw.[093] where Ç is a proportionality constant, which can be used to compensate for deviations of the audio signal from the model. Generally, the LRA is reduced and therefore LRAz < LRAw.
[094] As etapas para determinar os Ganhos LRAC são como segue:[094] The steps to determine LRAC Gains are as follows:
[095] Primeiro, a medida de tempo dependente da intensidade subjetiva deáudio Nen (k) (k é o índice da estrutura de áudio), a média da intensidade subjetiva de áudio μen, e a entrada da faixa de intensidade subjetiva de áudio (LRA) LRAen são computadas a partir do sinal de áudio de entrada.[095] First, the time-dependent measure of subjective audio intensity Nen(k) (k is the audio structure index), the average subjective audio intensity μen, and the input subjective audio intensity range (LRA) LRAen are computed from the input audio signal.
[096] É escolhido: [096] It is chosen:
[097] Em uma modalidade ξ = 1 é definido.[097] In one embodiment ξ = 1 is defined.
[098] O ganho pode ser computado usando os dois seguintes métodos exemplificativos:Método 1com O termo de normalização β(k) é em uma modalidade variante de tempo. Em que Y > 0 é um valor real e o parâmetro Gmáx é definido em uma modalidade a priori por, por exemplo, um usuário ou é determinada com base no sinal de áudio de entrada, por exemplo.Gmáx = |LRAdes - LRAen|. (13) Portanto, nesse caso o ganho pode ser determinado por Em modalidades alternativas o parâmetro de normalização é omitido, istoé, β(k) = 1.[098] Gain can be computed using the following two exemplary methods:Method 1 with The normalization term β(k) is in a time-varying mode. Where Y > 0 is a real value and the parameter Gmax is defined in an a priori fashion by, for example, a user or is determined based on the input audio signal, for example.Gmax = |LRAdes - LRAen|. (13) Therefore, in this case the gain can be determined by In alternative embodiments the normalization parameter is omitted, i.e., β(k) = 1.
[099] Método 2[099] Method 2
[0100] Considerar equação (7), as funções S e Kdeslocamento podem ser definidas como [0100] Consider equation (7), the functions S and Kdisplacement can be defined as
[0101] e [0101] and
[0102] em quea = (1-b)μen.[0102] where a = (1-b)μen.
[0103] Isso garante que μsai = μen, isto é, a diferença entre a intensidade subjetiva de áudio integrada antes e depois da intensidade subjetiva de áudio processar é minimizada.[0103] This ensures that μsai = μen, i.e. the difference between the integrated subjective audio intensity before and after the subjective audio intensity processing is minimized.
[0104] Portanto, nesse caso o ganho pode ser determinado por [0104] Therefore, in this case the gain can be determined by
[0105] Com a escolha de a = (1 - b)μen e b = LRAdes/LRAen a equação acima pode alternativamente ser expressada por [0105] By choosing a = (1 - b)μen and b = LRAdes/LRAen the above equation can alternatively be expressed by
[0106] que corresponde a uma função de mapeamento que depende da razão de entrada e saída LRA e a diferença ΔN(k) entre a intensidade subjetiva de áudio média μen e o valor real de intensidade subjetiva de áudio (por exemplo, a medida da intensidade subjetiva de áudio de curto prazo ou momentânea) do sinal de áudio de entrada.[0106] which corresponds to a mapping function that depends on the input and output ratio LRA and the difference ΔN(k) between the average subjective audio intensity μen and the actual subjective audio intensity value (e.g., the short-term or momentary subjective audio intensity measure) of the input audio signal.
[0107] O valor do ganho determinado pode então ser restringido a um valor máximo desejado:Aplicar o ganho de controle da faixa de intensidade subjetiva de áudiosdeterminadaO sinal de saída da estrutura é dado por em que A fim de reduzir mais a alteração da intensidade subjetiva de áudio integrada devido à processamento de LRAC, um ganho de compensação é computado em uma modalidade pela aplicação da transformação diretamente à entrada da intensidade subjetiva de áudio integrada Ien como, por exemplo, emGmu = (b - 1)Ien + a. (22)O ganho é então aplicado ao sinal de áudio y. aaplicação desse ganho de compensação normalmente resulta em um desvio da intensidade subjetiva de áudio integrada de menos do que 2 LU. Em uma modalidade adicional, pela aplicação da transformação, a saída de curto prazo da intensidade subjetiva de áudio é dada por[0107] The determined gain value can then be restricted to a desired maximum value: Apply the gain control of the subjective intensity range of determined audiosThe output signal of the structure is given by in which In order to further reduce the change in the integrated subjective audio intensity due to LRAC processing, a compensation gain is computed in one embodiment by applying the transform directly to the integrated subjective audio intensity input Ien as, for example, inGmu = (b - 1)Ien + a. (22)The gain is then applied to the audio signal y. Application of this compensation gain typically results in a deviation of the integrated subjective audio intensity of less than 2 LU. In a further embodiment, by applying the transform, the short-term output of the subjective audio intensity is given by
[0108] Nsaí(k) = a + b Nen(k)[0108] Nsaí(k) = a + b Nen(k)
[0109] em que k é um índice de estrutura.[0109] where k is a structure index.
[0110] Com base no que foi dito anteriormente, ganhos LRAC são computados: Os ganhos LRAC, em dB, são computados comoG(k) = Nsaí(k) - Nen(k) = a + (b - 1) Nen(k).[0110] Based on the above, LRAC gains are computed: LRAC gains, in dB, are computed asG(k) = Nout(k) - Nen(k) = a + (b - 1) Nen(k).
[0111] Para evitar a amplificação excessiva dos sinais com baixos valores da intensidade subjetiva de áudio de curto prazo, o ganho é subsequentemente restringido em uma modalidade como segue:G(k) = mín(G(k), Gmáx),Em que Gmáx é o ganho máximo permitido. Esse ganho máximo é definido - dependendo da modalidade - a priori ou determinado com base no sinal de áudio, por exemplo,Gmáx = |LRAdes - LRAen|.[0111] To avoid excessive amplification of signals with low values of the short-term subjective audio intensity, the gain is subsequently restricted in one embodiment as follows:G(k) = min(G(k), Gmax),where Gmax is the maximum allowable gain. This maximum gain is defined - depending on the embodiment - a priori or determined on the basis of the audio signal, e.g.,Gmax = |LRAdes - LRAen|.
[0112] A fim de reduzir mais a alteração na intensidade subjetiva de áudio integrada devido ao processamento de LRAC, um ganho de compensação é computado em uma modalidade pela aplicação da transformação diretamente à entrada da intensidade subjetiva de áudio integrada Ien como em[0112] In order to further reduce the change in the integrated subjective audio intensity due to LRAC processing, a compensation gain is computed in one embodiment by applying the transformation directly to the integrated subjective audio intensity input Ien as in
[0113] Gmu = a + (b - 1) Ien.[0113] Gmu = a + (b - 1) Ien.
[0114] Esse ganho de compensação Gmu é então aplicado ao sinal de áudio.[0114] This compensation gain Gmu is then applied to the audio signal.
[0115] Alguns aspectos do processamento off-line são como segue:Uma função de transferência linear é computada com uma inclinação b e um deslocamento a determinados a partir de uma análise estatística do sinal de áudio como descrito na Figura 5. Os ganhos da faixa de controle da intensidade subjetiva de áudio (LRAC) são computados com base nessa função de transferência.[0115] Some aspects of the off-line processing are as follows: A linear transfer function is computed with a slope b and an offset a determined from a statistical analysis of the audio signal as described in Figure 5. Subjective audio loudness control range (LRAC) gains are computed based on this transfer function.
[0116] A inclinação b da função de transferência linear é uma função da entrada LRA e o alvo desejado LRA definido por um usuário. Computar e aplicar ganhos LRAC, com base em uma função de transferência que é dependente somente da inclinação como descrito na Figura 5 a) para o sinal de áudio de entrada, alcançaria o efeito desejado de controlar o LRA. No entanto, isso levaria a uma diferença significante entre a entrada e saída da intensidade subjetiva de áudio. Além disso, isso levaria a amplificações extremamente altas dos segmentos com baixos níveis de intensidade subjetiva de áudio e amplificação dos segmentos com altos níveis de intensidade subjetiva de áudio que podem levar a corte ou artefatos de modulação indesejada no sinal de áudio de entrada processado.[0116] The slope b of the linear transfer function is a function of the input LRA and the desired target LRA defined by a user. Computing and applying LRAC gains, based on a transfer function that is dependent only on the slope as described in Figure 5 a) to the input audio signal, would achieve the desired effect of controlling the LRA. However, this would lead to a significant difference between the input and output subjective audio loudness. Furthermore, this would lead to extremely high amplifications of the segments with low subjective audio loudness levels and amplification of the segments with high subjective audio loudness levels which may lead to clipping or unwanted modulation artifacts in the processed input audio signal.
[0117] A combinação da inclinação b e deslocamento a leva a uma função de transferência como descrito na Figura 5 b). Os ganhos finais LRAC são determinados a partir dessa função de transferência. O deslocamento a garante que a distribuição média da intensidade subjetiva de áudio é mantida e, portanto, a diferença resultante entre a entrada e saída da intensidade subjetiva de áudio é pequena. Além disso, isso reduz automaticamente o ganho aplicado aos segmentos com baixos níveis de intensidade subjetiva de áudio e evita amplificação de segmentos com altos níveis de intensidade subjetiva de áudio, assim, evitando o corte e modulação.[0117] The combination of the slope b and offset a leads to a transfer function as depicted in Figure 5 b). The final LRAC gains are determined from this transfer function. The offset a ensures that the mean subjective audio loudness distribution is maintained and therefore the resulting difference between the input and output subjective audio loudness is small. Furthermore, this automatically reduces the gain applied to segments with low subjective audio loudness levels and avoids amplification of segments with high subjective audio loudness levels, thus avoiding clipping and modulation.
[0118] Restrição subsequente dos ganhos LRAC determinados em algumas modalidades é uma etapa de pós-processamento que garante que o baixo nível de áudio tal como ruído de fundo não seja amplificado excessivamente. Devido ao deslocamento a, os ganhos obtidos permanecem em uma faixa razoável desde o início e um ganho máximo adequado pode ser definido a priori.[0118] Subsequent restriction of the determined LRAC gains in some embodiments is a post-processing step that ensures that low level audio such as background noise is not amplified excessively. Due to the offset a, the obtained gains remain in a reasonable range from the beginning and a suitable maximum gain can be defined a priori.
[0119] Um histograma exemplificativo dos valores da intensidade subjetiva de áudio de curto prazo de um trecho do áudio de um filme e funções de ganho correspondentes a diferentes LRAs desejados são descritas na Figura 6. Mostrados são um histograma da intensidade subjetiva de áudio de curto prazo de uma hora de segmentos de áudio de um filme com um LRA de 22.8 LU (linha superior). Também são mostradas funções de transferência para dois LRAs desejados de 10 LU e 15 LU, respectivamente (linha inferior).[0119] An exemplary histogram of short-term subjective audio intensity values of a movie audio segment and gain functions corresponding to different desired LRAs are depicted in Figure 6. Shown is a histogram of short-term subjective audio intensity of one hour of movie audio segments with an LRA of 22.8 LU (top row). Also shown are transfer functions for two desired LRAs of 10 LU and 15 LU, respectively (bottom row).
[0120] Em uma modalidade o ganho de normalização de uma intensidade subjetiva de áudio é computado:[0120] In one embodiment the normalization gain of a subjective audio intensity is computed:
[0121] A aplicação do método inventivo LRAC pode levar a uma alteração na intensidade subjetiva de áudio integrada do áudio. Um ganho pode ser computado a fim de alcançar uma intensidade subjetiva de áudio alvo desejada integrada.[0121] Application of the inventive LRAC method may lead to a change in the integrated subjective audio intensity of the audio. A gain may be computed in order to achieve a desired target integrated subjective audio intensity.
[0122] Se a intensidade subjetiva de áudio alvo desejada é escolhida para ser igual à entrada da intensidade subjetiva de áudio, um ganho de normalização pode ser obtido pela computação da diferença entre a entrada medida da intensidade subjetiva de áudio integrada Ien e a saída medida ou estimada da intensidade subjetiva de áudio integrada. A saída da intensidade subjetiva de áudio integrada pode ser estimada usando os valores de saída momentânea da intensidade subjetiva de áudio que são obtidos a partir da aplicação da transformação para os valores de entrada momentânea da intensidade subjetiva de áudio. Caso contrário, o ganho de normalização é computado a partir da diferença entre a saída estimada ou medida da intensidade subjetiva de áudio integrada e a intensidade subjetiva de áudio alvo desejada integrada.[0122] If the desired target subjective audio intensity is chosen to be equal to the subjective audio intensity input, a normalization gain may be obtained by computing the difference between the measured integrated subjective audio intensity input I and the measured or estimated integrated subjective audio intensity output. The integrated subjective audio intensity output may be estimated using the momentary subjective audio intensity output values that are obtained from applying the transform to the momentary subjective audio intensity input values. Otherwise, the normalization gain is computed from the difference between the estimated or measured integrated subjective audio intensity output and the desired target integrated subjective audio intensity.
[0123] Um LRAC online pode ser derivado a partir da versão off-line. A versão online considera segmentos temporais do sinal de áudio para a entrada LRA e estimativa da intensidade subjetiva de áudio média em vez de todo o sinal de áudio. Nesse caso, os parâmetros tornam-se dependentes do tempo, isto é, a(k) = (1-b(k))μen(k), que garante que o momento estatístico da entrada da intensidade subjetiva de áudio seja igual ao momento estatístico de saída da intensidade subjetiva de áudio correspondente, por exemplo, os valores da intensidade subjetiva de áudio média: μsai(k) = μen(k). Adicionalmente, [0123] An online LRAC can be derived from the offline version. The online version considers temporal segments of the audio signal for the LRA input and estimation of the average subjective audio intensity instead of the entire audio signal. In this case, the parameters become time-dependent, i.e., a(k) = (1-b(k))μen(k), which ensures that the statistical moment of the input subjective audio intensity is equal to the statistical moment of the output of the corresponding subjective audio intensity, i.e., the average subjective audio intensity values: μsai(k) = μen(k). Additionally,
[0124] Os dois métodos online são, portanto:Método 1A função Q é definida comocom e em que Y > 0 um valor real e o parâmetro Gmáx(k) é definido em uma modalidade como um parâmetro definido pelo usuário independente do tempo Gmáx(k) = Gmáx ou este é um parâmetro de sinal dependente Gmáx(k) = |LRAdes - LRAen(k)|.[0124] The two online methods are therefore:Method 1The Q function is defined as with and where Y > 0 is a real value and the parameter Gmax(k) is defined in one embodiment as a time-independent user-defined parameter Gmax(k) = Gmax or it is a signal-dependent parameter Gmax(k) = |LRAdes - LRAen(k)|.
[0125] Portanto, nesse caso o ganho pode ser determinado por [0125] Therefore, in this case the gain can be determined by
[0126] Método 2[0126] Method 2
[0127] As funções S e Kdeslocamento(μen(k)) são definidas como [0127] The functions S and Kdisplacement(μen(k)) are defined as
[0128] e [0128] and
[0129] O ganho LRAC é então computado como[0129] The LRAC gain is then computed as
[0130] [0130]
[0131] Para evitar amplificação excessiva o ganho é subsequentementerestringido como segue:Em uma modalidade adicional, os parâmetros de transformação sãocomputados como e que garante que μsaí(k) = μen(k).[0131] To avoid excessive amplification the gain is subsequently restricted as follows: In a further embodiment, the transformation parameters are computed as and which guarantees that μsaí(k) = μen(k).
[0132] Aplicando a transformação, a saída da intensidade subjetiva de áudio decurto prazo é dada por:Nsaí(k) = a(k) + b(k)Nen(k).[0132] Applying the transformation, the short-term subjective audio intensity output is given by:Nout(k) = a(k) + b(k)Nen(k).
[0133] O ganho LRAC é então computado como[0133] The LRAC gain is then computed as
[0134] G(k) = Nsaí(k) − Nen(k) = a(k) + (b(k) − 1)Nen(k)[0134] G(k) = Nsaí(k) − Nen(k) = a(k) + (b(k) − 1)Nen(k)
[0135] Para evitar amplificação excessiva de sinais com baixos valores daintensidade subjetiva de áudio de curto prazo, o ganho é subsequentementerestringido em uma modalidade como segue:G(k) = mín(G(k), Gmáx(k)).[0135] To avoid excessive amplification of signals with low short-term subjective audio intensity values, the gain is subsequently constrained in an embodiment as follows: G(k) = min(G(k), Gmax(k)).
[0136] em que Gmáx(k) é uma modalidade, um parâmetro fixo, definido pelo usuário independente do tempo, Gmáx(k) = Gmáx e é em uma modalidade diferente, um parâmetro de sinal dependente Gmáx(k) = |LRAdes - LRAen(k)|. Portanto, o LRAC online considera segmentos temporais do sinal de áudio de entrada em vez de toda a duração do sinal de áudio de entrada.[0136] where Gmax(k) is a modality, a fixed, time-independent, user-defined parameter, Gmax(k) = Gmax and is in a different modality, a signal-dependent parameter Gmax(k) = |LRAdes - LRAen(k)|. Therefore, online LRAC considers temporal segments of the input audio signal rather than the entire duration of the input audio signal.
[0137] Uma modalidade do método inventivo compreende as seguintes etapas:1) Receber um sinal de áudio de entrada.2) Computar os valores da intensidade subjetiva de áudio momentânea ou de curto prazo - como exemplos do valor real de intensidade subjetiva de áudio - para uma sequência de estruturas de áudio.3) Determinar a faixa de entrada da intensidade subjetiva de áudio (LRA) do conjunto de valores da intensidade subjetiva de áudio computados momentâneos ou de curto prazo.4) Determinar uma função de transferência do compressor com base em uma inclinação b e um deslocamento a. Determinar a inclinação b da entrada LRA e o LRA alvo desejado, e o deslocamento a dos valores estatísticos do momento da intensidade subjetiva de áudio.Alternativamente: Determinar uma função de transferência do compressor com base na entrada LRA, o LRA desejado e a diferença entre os valores da intensidade subjetiva de áudio momentânea ou de curto prazo e um valor estatístico do momento da intensidade subjetiva de áudio.Alternativamente: Determinar uma função de transferência do compressor com base em uma curva e um deslocamento. Determinar a curva a partir da entrada LRA e o LRA desejado, e o deslocamento do valor estatístico do momento da intensidade subjetiva de áudio.5) Computar ganhos LRAC variantes de tempo com base na função de transferência do compressor determinada.6) Determinar um sinal de áudio de saída através da aplicação de ganhos de LRAC às amostras de áudio do sinal de áudio de entrada.[0137] One embodiment of the inventive method comprises the following steps: 1) Receiving an input audio signal. 2) Computing momentary or short-term subjective audio loudness values - as examples of the actual subjective audio loudness value - for a sequence of audio frames. 3) Determining the input subjective audio loudness range (LRA) from the set of computed momentary or short-term subjective audio loudness values. 4) Determining a compressor transfer function based on a slope b and an offset a. Determining the slope b from the LRA input and the desired target LRA, and the offset a from statistical values of the subjective audio loudness moment. Alternatively: Determining a compressor transfer function based on the LRA input, the desired LRA, and the difference between the momentary or short-term subjective audio loudness values and a statistical value of the subjective audio loudness moment. Alternatively: Determining a compressor transfer function based on a slope and an offset. Determine the curve from the input LRA and the desired LRA, and the statistical offset of the subjective audio intensity moment.5) Compute time-varying LRAC gains based on the determined compressor transfer function.6) Determine an output audio signal by applying LRAC gains to the audio samples of the input audio signal.
[0138] Em uma modalidade, as seguintes etapas são dadas: Determinar uma função de transferência do compressor com base em uma inclinação e um deslocamento. Determinar a inclinação da entrada LRA e o LRA desejado, e o deslocamento dos valores da intensidade subjetiva de áudio momentânea ou de curto prazo computados.[0138] In one embodiment, the following steps are given: Determining a compressor transfer function based on a slope and an offset. Determining the slope of the LRA input and the desired LRA, and the offset from the computed momentary or short-term subjective audio intensity values.
[0139] Uma modalidade compreende a etapa: Determinar o ponto limite da função de transferência do compressor abaixo sendo que a função de transferência tem uma inclinação do que a inclinação determinada da entrada e saída LRA desejada. Isso corresponde à implementação de uma restrição no ganho mínimo do compressor.[0139] One embodiment comprises the step: Determining the limit point of the compressor transfer function below which the transfer function has a slope greater than the determined slope of the desired LRA input and output. This corresponds to implementing a constraint on the minimum compressor gain.
[0140] Uma modalidade adicional compreende a etapa: Determinar ou definir (de maneira heurística) um ganho máximo restringido a ser aplicado aos ganhos LRAC computados.[0140] An additional embodiment comprises the step: Determining or defining (in a heuristical manner) a constrained maximum gain to be applied to the computed LRAC gains.
[0141] Em uma outra modalidade, as seguintes etapas são incluídas: Computar um ganho de controle da intensidade subjetiva de áudio para obter uma intensidade subjetiva de áudio alvo desejada do sinal de saída com base nos valores de intensidade subjetiva de áudio momentânea e os ganhos LRAC. Determinar um sinal de áudio de saída através da aplicação dos ganhos LRAC e o ganho de controle da intensidade subjetiva de áudio (ou a combinação de ambos) às amostras de áudio do sinal de áudio de entrada.[0141] In another embodiment, the following steps are included: Computing a subjective audio loudness control gain to obtain a desired target subjective audio loudness of the output signal based on the momentary subjective audio loudness values and the LRAC gains. Determining an output audio signal by applying the LRAC gains and the subjective audio loudness control gain (or a combination of both) to audio samples of the input audio signal.
[0142] Na Figura 7, um histograma exemplificativo é mostrado no diagrama superior. O diagrama do meio mostra funções de transferência para o método de controle dinâmico de propagação para o estado da técnica [4]. O diagrama inferior dá uma função de transferência de acordo com a invenção. As funções de transferência são mostradas em diagramas com a entrada da intensidade subjetiva de áudio no eixo x e a saída da intensidade subjetiva de áudio no eixo y. Está marcado em todos os três diagramas a intensidade subjetiva de áudio média.[0142] In Figure 7, an exemplary histogram is shown in the upper diagram. The middle diagram shows transfer functions for the dynamic propagation control method for the prior art [4]. The lower diagram gives a transfer function according to the invention. The transfer functions are shown in diagrams with the subjective audio intensity input on the x-axis and the subjective audio intensity output on the y-axis. The average subjective audio intensity is marked on all three diagrams.
[0143] O método proposto em [4] requer dois parâmetros, isto é, o ponto limite e inclinação. O ponto limite (marcado por pontos e setas) é um parâmetro de usuário definido que é selecionado como um percentil da distribuição da intensidade subjetiva de áudio. Isso significa que o valor limite em dB altera para diferentes tipos de entrada de áudio. No entanto, se o ponto limite escolhido estiver próximo da média, isso pode levar a artefatos no áudio devido à parte não-linear da função de transferência. Além disso, se um limite alto for selecionado, então uma inclinação maior será necessária para alcançar a dinâmica de propagação desejada. No entanto, a inclinação é computada com base na entrada e dinâmica de propagação desejada e não depende do ponto limite escolhido. As considerações acima mostram que isso pode não ser suficiente dependendo do limite selecionado. É por isso que uma computação iterativa da inclinação é necessária.[0143] The method proposed in [4] requires two parameters, namely, the threshold point and the slope. The threshold point (marked by dots and arrows) is a user-defined parameter that is selected as a percentile of the subjective audio loudness distribution. This means that the threshold value in dB changes for different types of audio input. However, if the chosen threshold point is close to the mean, this may lead to artifacts in the audio due to the nonlinear part of the transfer function. Furthermore, if a high threshold is selected, then a larger slope will be required to achieve the desired propagation dynamics. However, the slope is computed based on the input and desired propagation dynamics and does not depend on the chosen threshold point. The above considerations show that this may not be sufficient depending on the selected threshold. This is why an iterative computation of the slope is necessary.
[0144] A invenção proposta não requer o processamento do usuário ou da iteração determine a função de transferência apropriada. Todos os parâmetros necessários são automaticamente determinados a partir do sinal de entrada e do LRA desejado LRA.[0144] The proposed invention does not require user processing or iteration to determine the appropriate transfer function. All necessary parameters are automatically determined from the input signal and the desired LRA.
[0145] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é claro que esses aspectos também representam uma descrição de um método correspondente, em que um bloco ou dispositivo correspondem a uma etapa do método ou uma característica de uma etapa do método. De maneira análoga, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco correspondente ou item ou característica de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou usando) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades, alguma ou mais das mais importantes etapas do método podem ser executadas por tal aparelho.[0145] Although some aspects have been described in the context of an apparatus, it is clear that these aspects also represent a description of a corresponding method, wherein a block or device corresponds to a method step or a feature of a method step. Analogously, aspects described in the context of a method step also represent a description of a corresponding block or item or feature of a corresponding apparatus. Some or all of the method steps may be performed by (or using) a hardware apparatus, such as a microprocessor, a programmable computer, or an electronic circuit. In some embodiments, some or more of the major method steps may be performed by such an apparatus.
[0146] O sinal inventivo transmitido ou codificado pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão tal como um meio de transmissão sem fio ou um meio de transmissão com fio tal como a Internet.[0146] The transmitted or encoded inventive signal may be stored on a digital storage medium or may be transmitted on a transmission medium such as a wireless transmission medium or a wired transmission medium such as the Internet.
[0147] Dependendo de certas exigências de implementação, modalidades da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada usando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, um ROM, um PROM, e EPROM, um EEPROM ou uma memória FLASH, que têm sinais de controle legíveis eletronicamente armazenados no mesmo, que cooperam (ou são capazes de cooperar) com um sistema de computador programável, de modo que o respectivo método é realizado. Portanto, o meio digital de armazenamento pode ser lido por computador.[0147] Depending on certain implementation requirements, embodiments of the invention may be implemented in hardware or in software. The implementation may be carried out using a digital storage medium, for example, a floppy disk, a DVD, a Blu-Ray, a CD, a ROM, a PROM, and EPROM, an EEPROM or a FLASH memory, which have electronically readable control signals stored therein, which cooperate (or are capable of cooperating) with a programmable computer system, so that the respective method is carried out. Therefore, the digital storage medium is computer-readable.
[0148] Algumas modalidades de acordo com a invenção compreendem um suporte de dados que têm sinais de controle legíveis eletronicamente, que são capazes de cooperar com o sistema de computador programável, de modo que um dos métodos descritos no presente documento é realizado.[0148] Some embodiments according to the invention comprise a data carrier having electronically readable control signals, which are capable of cooperating with the programmable computer system, so that one of the methods described herein is realized.
[0149] Geralmente, modalidades da presente invenção podem ser implementadas como um produto de programa de computador com uma programação, a programação que é operativa para realizar um dos métodos quando o produto de programa de computador executa em um computador. A programação pode, por exemplo, ser armazenada em um suporte legível por máquina.[0149] Generally, embodiments of the present invention may be implemented as a computer program product having programming, the programming being operative to perform one of the methods when the computer program product executes on a computer. The programming may, for example, be stored on a machine-readable medium.
[0150] Outras modalidades compreendem o programa de computador para realizar um dos métodos descritos no presente documento, armazenados em um suporte legível por máquina.[0150] Other embodiments comprise the computer program for performing one of the methods described herein, stored in a machine-readable medium.
[0151] Em outras palavras, uma modalidade do método inventivo, é, portanto, um programa de computador que tem uma programação para realizar um dos métodos descritos no presente documento, quando o programa de computador executa em um computador.[0151] In other words, an embodiment of the inventive method is therefore a computer program that has programming to perform one of the methods described in this document, when the computer program executes on a computer.
[0152] Uma modalidade adicional do método inventivo, é, portanto, um suporte de dados (ou um meio de armazenamento não-transitório tal como um meio de armazenamento digital, ou um meio legível por computador) que compreende, gravado no mesmo, o programa de computador para realizar um dos métodos descritos no presente documento. O suporte de dados, o meio de armazenamento digital ou o meio de gravação são normalmente tangíveis e/ou não-transitórios.[0152] A further embodiment of the inventive method is therefore a data carrier (or a non-transitory storage medium such as a digital storage medium, or a computer-readable medium) comprising, recorded thereon, the computer program for carrying out one of the methods described herein. The data carrier, the digital storage medium or the recording medium is typically tangible and/or non-transitory.
[0153] Uma modalidade adicional do método da invenção, é, portanto, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos descritos no presente documento. O fluxo de dados ou a sequência de sinais podem, por exemplo, ser configurados para ser transferido por meio uma conexão de comunicação de dados, por exemplo por meio da internet.[0153] A further embodiment of the method of the invention is therefore a data stream or a sequence of signals representing the computer program for carrying out one of the methods described herein. The data stream or the sequence of signals may, for example, be configured to be transferred via a data communications connection, for example via the Internet.
[0154] Uma modalidade adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo programável lógico, configurado para, ou adaptado para, realizar um dos métodos descritos no presente documento.[0154] An additional embodiment comprises a processing means, e.g., a computer or a programmable logic device, configured to, or adapted to, perform one of the methods described herein.
[0155] Uma modalidade adicional compreende um computador que tem o programa de computador instalado no mesmo para realizar um dos métodos descritos no presente documento.[0155] An additional embodiment comprises a computer having computer software installed thereon to perform one of the methods described herein.
[0156] Uma modalidade adicional, de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletronicamente ou visualmente) um programa de computador para realizar um dos métodos descritos no presente documento a receber. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou afins. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivos para transferir o programa de computador para o receptor.[0156] A further embodiment according to the invention comprises an apparatus or a system configured to transfer (e.g., electronically or visually) a computer program for performing one of the methods described herein to a receiver. The receiver may, for example, be a computer, a mobile device, a memory device or the like. The apparatus or system may, for example, comprise a file server for transferring the computer program to the receiver.
[0157] Em algumas modalidades, um dispositivo programável lógico (por exemplo, uma matriz de portas programável em campo) pode ser usada para realizar algumas ou todas as funcionalidades dos métodos descritos no presente documento. Em algumas modalidades, uma matriz de portas programável em campo pode cooperar com um microprocessador a fim de realizar um dos métodos descritos no presente documento. Geralmente, os métodos são preferencialmente realizados por qualquer aparelho de hardware.[0157] In some embodiments, a programmable logic device (e.g., a field-programmable gate array) may be used to perform some or all of the functionality of the methods described herein. In some embodiments, a field-programmable gate array may cooperate with a microprocessor to perform one of the methods described herein. Generally, the methods are preferably performed by any hardware apparatus.
[0158] As modalidades acima descritas são meramente ilustrativas para os princípios da presente invenção. Deve ser entendido que modificações e variações das disposições e os detalhes descritos no presente documento serão aparentes para outros versados na técnica. Nessa intenção, portanto, ser limitado somente pelo escopo das reivindicações iminentes de patentes e não pelos detalhes específicos apresentados à título descritivo e explicativo das modalidades no presente documento.REFERÊNCIAS[1] EBU Tech Doc 3342 Loudenss Range: A Descriptor to supplement Loudness Normalization in accordance with EBU R 128 (2016)[2] US 8.229.125 B2[3] US 2014/0369527 A1[4] US 7.848.531 B1[5] ITU-R, Recommendation ITU-R BS.1770-3. Algorithm to measure audio programme loudness and true-peak audio level, 08/2012.[6] EBU Tech Doc 3341 Loudness Metering: ‘EBU Mode’ metering to supplement loudness normalization in accordance with EBU R 128[0158] The above-described embodiments are merely illustrative of the principles of the present invention. It should be understood that modifications and variations of the arrangements and details described herein will be apparent to others skilled in the art. In this intent, therefore, one should be limited only by the scope of the implied patent claims and not by the specific details set forth by way of description and explanation of the embodiments herein.REFERENCES[1] EBU Tech Doc 3342 Loudness Range: A Descriptor to supplement Loudness Normalization in accordance with EBU R 128 (2016)[2] US 8,229,125 B2[3] US 2014/0369527 A1[4] US 7,848,531 B1[5] ITU-R, Recommendation ITU-R BS.1770-3. Algorithm to measure audio program loudness and true-peak audio level, 08/2012.[6] EBU Tech Doc 3341 Loudness Metering: ‘EBU Mode’ metering to supplement loudness normalization in accordance with EBU R 128
Claims (14)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17166448.5 | 2017-04-13 | ||
EP17166448.5A EP3389183A1 (en) | 2017-04-13 | 2017-04-13 | Apparatus for processing an input audio signal and corresponding method |
PCT/EP2018/025106 WO2018188812A1 (en) | 2017-04-13 | 2018-04-10 | Apparatus for processing an input audio signal and corresponding method |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112019021377A2 BR112019021377A2 (en) | 2020-05-05 |
BR112019021377B1 true BR112019021377B1 (en) | 2025-02-11 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10886883B2 (en) | Apparatus for processing an input audio signal and corresponding method | |
CN110798626B (en) | Automatic exposure adjusting method, system and equipment | |
EP3369175B1 (en) | Object-based audio signal balancing | |
TWI440301B (en) | Hierarchical control path with constraints for audio dynamics processing | |
CN110637271B (en) | Systems and methods for intelligent adjustment of immersive multimedia workloads in portable computing devices | |
US20150347858A1 (en) | Controlling multiple photographic adjustments with a single control | |
US8965756B2 (en) | Automatic equalization of coloration in speech recordings | |
US10419684B2 (en) | Apparatus and method for adjusting camera exposure | |
CN104882145B (en) | It is clustered using the audio object of the time change of audio object | |
BR112019021377B1 (en) | APPARATUS AND METHOD FOR PROCESSING AN INPUT AUDIO SIGNAL | |
RU2683489C1 (en) | Device and method of processing of audio signal for modification of stereoscopic image of stereosignal | |
US20090080671A1 (en) | Method and device for controlling a noise producing component | |
Verani | Aggregate consequences of dynamic credit relationships | |
HK40019024B (en) | Apparatus for processing an input audio signal and corresponding method | |
HK40019024A (en) | Apparatus for processing an input audio signal and corresponding method | |
EP3168740A1 (en) | Automatic audio level adjustment during media item presentation | |
US20170302241A1 (en) | Management of broadcast audio loudness | |
CN113238854B (en) | Method, device and equipment for automatically adjusting thread number and readable medium | |
US10991383B2 (en) | Method of measuring sound level of audio content and device therefor | |
US10171054B1 (en) | Audio adjustment based on dynamic and static rules | |
Yu et al. | Adaptive sign error control | |
CN113708952B (en) | Method and device for guaranteeing web service connection stability | |
CN119065449B (en) | Output power control method, program product, electronic device, and storage medium | |
KR101741614B1 (en) | LD Budget-based Audio LD Automatic Control Method and System | |
Monden et al. | Kurtosis and Skewness Adjustment for Software Effort Estimation |