JP4932917B2 - 音声復号装置、音声復号方法、及び音声復号プログラム - Google Patents
音声復号装置、音声復号方法、及び音声復号プログラム Download PDFInfo
- Publication number
- JP4932917B2 JP4932917B2 JP2010004419A JP2010004419A JP4932917B2 JP 4932917 B2 JP4932917 B2 JP 4932917B2 JP 2010004419 A JP2010004419 A JP 2010004419A JP 2010004419 A JP2010004419 A JP 2010004419A JP 4932917 B2 JP4932917 B2 JP 4932917B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- unit
- time envelope
- linear prediction
- envelope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Description
図1は、第1の実施形態に係る音声符号化装置11の構成を示す図である。音声符号化装置11は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置11の内蔵メモリに格納された所定のコンピュータプログラム(例えば、図2のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声符号化装置11を統括的に制御する。音声符号化装置11の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。
1.時間スロットrにおける信号の短時間電力p(r)を次の数式(4)によって取得する。
2.p(r)を平滑化したエンベロープpenv(r)を次の数式(5)によって取得する。ただしαは0<α<1を満たす定数である。
3.p(r)とpenv(r)とを用いてT(r)を次の数式(6)に従って取得する。ただしβは定数である。
以上に示した方法は電力の変化に基づく信号変化検出の単純な例であり、他のもっと洗練された方法により信号変化検出を行ってもよい。また、信号変化検出部2eは省略してもよい。
さらに、信号変化検出部2eの出力T(r)が得られる場合には、強度の調整は次の数式(8)に従って行ってもよい。
この線形予測逆フィルタ処理は、低周波側の係数から高周波側の係数に向かって行われてもよいし、その逆でもよい。線形予測逆フィルタ処理は、後段において時間エンベロープ変形を行う前に高周波成分の時間エンベロープを一旦平坦化しておくための処理であり、線形予測逆フィルタ部2iは省略されてもよい。また、高周波生成部2gからの出力に対して高周波成分への線形予測分析と逆フィルタ処理を行うかわりに、後述する高周波調整部2jからの出力に対して高周波線形予測分析部2hによる線形予測分析と線形予測逆フィルタ部2iによる逆フィルタ処理とを行ってもよい。さらに、線形予測逆フィルタ処理に用いる線形予測係数は、aexp(n,r)ではなく、adec(n,r)又はaadj(n,r)であってもよい。また、線形予測逆フィルタ処理に用いられる線形予測係数は、aexp(n,r)に対してフィルタ強度調整を行って取得される線形予測係数aexp,adj(n,r)であってもよい。強度調整は、aadj(n,r)を取得する際と同様、例えば、次の数式(10)に従って行われる。
この線形予測合成フィルタ処理によって、線形予測フィルタ部2kは、SBRに基づいて生成された高周波成分の時間エンベロープを変形する。
図5は、第1の実施形態に係る音声符号化装置の変形例(音声符号化装置11a)の構成を示す図である。音声符号化装置11aは、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置11aの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置11aを統括的に制御する。音声符号化装置11aの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。
第1の実施形態の変形例2の音声符号化装置(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の変形例2の音声符号化装置の内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって変形例2の音声符号化装置を統括的に制御する。変形例2の音声符号化装置の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。
図6は、第2の実施形態に係る音声符号化装置12の構成を示す図である。音声符号化装置12は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置12の内蔵メモリに格納された所定のコンピュータプログラム(例えば、図7のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声符号化装置12を統括的に制御する。音声符号化装置12の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。
ただし、ri0は線形予測係数が伝送されている時間スロット{ri}のうちrに最も近いものとする。また、δは0<δ<1を満たす定数である。
図10は、第3の実施形態に係る音声符号化装置13の構成を示す図である。音声符号化装置13は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置13の内蔵メモリに格納された所定のコンピュータプログラム(例えば、図11のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声符号化装置13を統括的に制御する。音声符号化装置13の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。
ただし、
上記の数式におけるs(i)はbi≦r<bi+1を満たすi番目のSBRエンベロープ内におけるe(r)の変化の大きさを示すパラメータであり、時間エンベロープの変化が大きいほどe(r)は大きい値をとる。上記の数式(20)及び(21)は、s(i)の算出方法の一例であり、例えばe(r)のSMF(Spectral Flatness Measure)や、最大値と最小値の比等、を用いてs(i)を取得してもよい。この後、s(i)は量子化され、ビットストリーム多重化部1g3に伝送される。
ただし、
である。
図14は、第4の実施形態に係る音声復号装置24の構成を示す図である。音声復号装置24は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24の内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声復号装置24を統括的に制御する。音声復号装置24の通信装置は、音声符号化装置11又は音声符号化装置13から出力される符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。
を取得した後に、所定のテーブルを用いて、この数式(29)に示す平均値をs(i)に変換することによって行ってもよい。また、時間エンベロープ補助情報がs(i)の場合、補助情報変換部2wは、s(i)をK(r)に変換する。補助情報変換部2wは、この変換を、例えば所定のテーブルを用いてs(i)をK(r)に変換することによって行ってもよい。ただし、iとrはbi≦r<bi+1の関係を満たすよう対応づけられるものとする。
第1の実施形態の音声復号装置21において、音声復号装置21の線形予測フィルタ部2kは、自動利得制御処理を含むことができる。この自動利得制御処理は、線形予測フィルタ部2kの出力のQMF領域の信号の電力を入力されたQMF領域の信号電力に合わせる処理である。利得制御後のQMF領域信号qsyn,pow(n,r)は、一般的には、次式により実現される。
ここで、P0(r),P1(r)はそれぞれ以下の数式(31)及び数式(32)で表される。
この自動利得制御処理により、線形予測フィルタ部2kの出力信号の高周波成分の電力は線形予測フィルタ処理前と等しい値に調整される。その結果、SBRに基づいて生成された高周波成分の時間エンベロープを変形した線形予測フィルタ部2kの出力信号において、高周波調整部2jにおいて行われた高周波信号の電力の調整の効果が保たれる。なお、この自動利得制御処理は,QMF領域の信号の任意の周波数範囲に対して個別に行うことも可能である。個々の周波数範囲に対する処理は、それぞれ、数式(30)、数式(31)、数式(32)のnをある周波数範囲に限定することで実現できる。例えばi番目の周波数範囲はFi≦n<Fi+1と表すことができる(この場合のiは、QMF領域の信号の任意の周波数範囲の番号を示すインデックスである)。Fiは周波数範囲の境界を示し、“MPEG4 AAC”のSBRにおいて規定されるエンベロープスケールファクタの周波数境界テーブルであることが望ましい。周波数境界テーブルは“MPEG4 AAC”のSBRの規定に従い、高周波生成部2gにおいて決定される。この自動利得制御処理により、線形予測フィルタ部2kの出力信号の高周波成分の任意の周波数範囲内の電力は線形予測フィルタ処理前と等しい値に調整される。その結果、SBRに基づいて生成された高周波成分の時間エンベロープを変形した線形予測フィルタ部2kの出力信号で、高周波調整部2jにおいて行われた高周波信号の電力の調整の効果が周波数範囲の単位で保たれる。また、第1の実施形態の本変形例3と同様の変更を第4の実施形態における線形予測フィルタ部2kに加えてもよい。
第3の実施形態の音声符号化装置13におけるエンベロープ形状パラメータ算出部1nは、以下のような処理で実現することもできる。エンベロープ形状パラメータ算出部1nは、符号化フレーム内のSBRエンベロープのの各々について、次の数式(33)に従ってエンベロープ形状パラメータs(i)(0≦i<Ne)を取得する。
ただし、
はe(r)のSBRエンベロープ内での平均値であり、その算出方法は数式(21)に従う。ただし、SBRエンベロープとは、bi≦r<bi+1を満たす時間範囲を示す。また、{bi}は、SBR補助情報に情報として含まれている、SBRエンベロープの時間境界であり、任意の時間範囲、任意の周波数範囲の平均信号エネルギーを表すSBRエンベロープスケールファクタが対象とする時間範囲の境界である。また、min(・)はbi≦r<bi+1の範囲における最小値を表す。従って、この場合には、エンベロープ形状パラメータs(i)は、調整後の時間エンベロープ情報のSBRエンベロープ内での最小値と平均値の比率を指示するパラメータである。また、第3の実施形態の音声復号装置23におけるエンベロープ形状調整部2sは、以下のような処理で実現することもできる。エンベロープ形状調整部2sは、s(i)を用いてe(r)を調整し、調整後の時間エンベロープ情報eadj(r)を取得する。調整の方法は次の数式(35)又は数式(36)に従う。
数式35は、調整後の時間エンベロープ情報eadj(r)のSBRエンベロープ内での最小値と平均値の比率が、エンベロープ形状パラメータs(i)の値と等しくなるようエンベロープ形状を調整するものである。また、上記した第3の実施形態の本変形例1と同様の変更を第4の実施形態に加えてもよい。
時間エンベロープ変形部2vは、数式(28)に代わり、次の数式を利用することもできる。数式(37)に示すとおり、eadj,scaled(r)は、qadj(k,r)とqenvadj(k,r)のSBRエンベロープ内での電力が等しくなるよう調整後の時間エンベロープ情報eadj(r)の利得を制御したものである。また、数式(38)に示すとおり、第3の実施形態の本変形例2では、eadj(r)ではなくeadj,scaled(r)をQMF領域の信号qadj(k,r)に乗算してqenvadj(k,r)を得る。従って、時間エンベロープ変形部2vは、SBRエンベロープ内での信号電力が時間エンベロープの変形の前と後で等しくなるようにQMF領域の信号qadj(k,r)の時間エンベロープの変形を行うことができる。ただし、SBRエンベロープとは、bi≦r<bi+1を満たす時間範囲を示す。また、{bi}は、SBR補助情報に情報として含まれている、SBRエンベロープの時間境界であり、任意の時間範囲、任意の周波数範囲の平均信号エネルギーを表すSBRエンベロープスケールファクタが対象とする時間範囲の境界である。また、本発明の実施例中における用語“SBRエンベロープ”は、“ISO/IEC 14496-3”に規定される“MPEG4 AAC”における用語“SBRエンベロープ時間セグメント”に相当し、実施例全体を通して“SBRエンベロープ”は“SBRエンベロープ時間セグメント”と同一の内容を意味する。
また、上記した第3の実施形態の本変形例2と同様の変更を第4の実施形態に加えてもよい。
数式(19)は下記の数式(39)であってもよい。
第4の実施形態の変形例1の音声復号装置24a(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24aの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声復号装置24aを統括的に制御する。音声復号装置24aの通信装置は、音声符号化装置11又は音声符号化装置13から出力される符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24aは、機能的には、音声復号装置24のビットストリーム分離部2a3に代わり、ビットストリーム分離部2a4(不図示)を備え、さらに、補助情報変換部2wに代わり、時間エンベロープ補助情報生成部2y(不図示)を備える。ビットストリーム分離部2a4は、多重化ビットストリームを、SBR補助情報と、符号化ビットストリームとに分離する。時間エンベロープ補助情報生成部2yは、符号化ビットストリームおよびSBR補助情報に含まれる情報に基づいて、時間エンベロープ補助情報を生成する。
第4の実施形態の変形例2の音声復号装置24b(図15参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24bの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声復号装置24bを統括的に制御する。音声復号装置24bの通信装置は、音声符号化装置11又は音声符号化装置13から出力される符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24bは、図15に示すとおり、高周波調整部2jにかえて、一次高周波調整部2j1と二次高周波調整部2j2とを備える。
第4の実施形態の変形例3の音声復号装置24c(図16参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24cの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図17のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24cを統括的に制御する。音声復号装置24cの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24cは、図16に示すとおり、高周波調整部2jにかえて、一次高周波調整部2j3と二次高周波調整部2j4とを備え、さらに線形予測フィルタ部2kと時間エンベロープ変形部2vに代えて個別信号成分調整部2z1,2z2,2z3を備える(個別信号成分調整部は、時間エンベロープ変形手段に相当する)。
第1の実施形態の変形例4の音声符号化装置11b(図44)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置11bの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置11bを統括的に制御する。音声符号化装置11bの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置11bは、音声符号化装置11の線形予測分析部1eにかえて線形予測分析部1e1を備え、時間スロット選択部1pをさらに備える。
ただし、Mは高周波生成部2gによって生成される高周波成分の下限周波数kxより高い周波数の範囲を表す値であり、さらには高周波生成部2gによって生成される高周波成分の周波数範囲をkx<=k<kx+Mのように表してもよい。また、所定の値Pexp,Thは時間スロットrを含む所定の時間幅のPexp(r)の平均値でもよい。さらに所定の時間幅はSBRエンベロープでもよい。
について
が正の値から負の値に変わる時間スロットrの高周波成分のQMF領域の信号電力をピークとしてもよい。信号電力の移動平均値
は、例えば次の式で求めることができる。
ただし、cは平均値を求める範囲を定める所定の値である。また信号電力のピークは、前記の方法で求めてもよく、異なる方法により求めてもよい。
第1の実施形態の変形例5の音声符号化装置11c(図45)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置11cの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置11cを統括的に制御する。音声符号化装置11cの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置11cは、変形例4の音声符号化装置11bの時間スロット選択部1p、及びビットストリーム多重化部1gにかえて、時間スロット選択部1p1、及びビットストリーム多重化部1g4を備える。
第1の実施形態の変形例6の音声符号化装置11d(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置11dの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置11dを統括的に制御する。音声符号化装置11dの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置11dは、変形例1の音声符号化装置11aの短時間電力算出部1iにかえて、図示しない短時間電力算出部1i1を備え、時間スロット選択部1p2をさらに備える。
第1の実施形態の変形例7の音声符号化装置11e(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置11eの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置11eを統括的に制御する。音声符号化装置11eの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置11eは、変形例6の音声符号化装置11dの時間スロット選択部1p2にかえて、図示しない時間スロット選択部1p3を備える。さらに、ビットストリーム多重化部1g1にかえて、時間スロット選択部1p3からの出力をさらに受けるビットストリーム多重化部を備える。時間スロット選択部1p3は、第1の実施形態の変形例6に記載の時間スロット選択部1p2と同様に時間スロットを選択し、時間スロット選択情報をビットストリーム多重化部へ送る。
第1の実施形態の変形例8の音声符号化装置(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の変形例8の音声符号化装置の内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって変形例8の音声符号化装置を統括的に制御する。変形例8の音声符号化装置の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。変形例8の音声符号化装置は、変形例2に記載の音声符号化装置に加え、時間スロット選択部1pをさらに備える。
第1の実施形態の変形例9の音声符号化装置(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の変形例9の音声符号化装置の内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって変形例9の音声符号化装置を統括的に制御する。変形例9の音声符号化装置の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。変形例9の音声符号化装置は、変形例8に記載の音声符号化装置の時間スロット選択部1pにかえて、時間スロット選択部1p1を備える。さらに、変形例8に記載のビットストリーム多重化部にかえて、変形例8に記載のビットストリーム多重化部への入力に加えて時間スロット選択部1p1からの出力をさらに受けるビットストリーム多重化部を備える。
第2の実施形態の変形例1の音声符号化装置12a(図46)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置12aの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置12aを統括的に制御する。音声符号化装置12aの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置12aは、音声符号化装置12の線形予測分析部1eにかえて、線形予測分析部1e1を備え、時間スロット選択部1pをさらに備える。
第2の実施形態の変形例2の音声符号化装置12b(図47)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置12bの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置11bを統括的に制御する。音声符号化装置12bの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置12bは、変形例1の音声符号化装置12aの時間スロット選択部1p、及びビットストリーム多重化部1g2にかえて、時間スロット選択部1p1、及びビットストリーム多重化部1g5を備える。ビットストリーム多重化部1g5は、ビットストリーム多重化部1g2と同様に、コアコーデック符号化部1cで算出された符号化ビットストリームと、SBR符号化部1dで算出されたSBR補助情報と、線形予測係数量子化部1kから与えられた量子化後の線形予測係数に対応する時間スロットのインデックスとを多重化し、さらに時間スロット選択部1p1から受け取る時間スロット選択情報をビットストリームに多重化し、多重化ビットストリームを、音声符号化装置12bの通信装置を介して出力する。
エンベロープ形状調整部2sは、前記第3の実施形態の変形例3に記載のとおり、調整後の時間エンベロープeadj(r)が例えば数式(28),数式(37)及び(38)のとおり、QMFサブバンドサンプルへ乗算されるゲイン係数であることを鑑み、eadj(r)を所定の値eadj,Th(r)により以下のように制限することが望ましい。
第4の実施形態の音声符号化装置14(図48)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置14の内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置14を統括的に制御する。音声符号化装置14の通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置14は、第1の実施形態の変形例4の音声符号化装置11bのビットストリーム多重化部1gにかえて、ビットストリーム多重化部1g7を備え、さらに音声符号化装置13の時間エンベロープ算出部1m、及びエンベロープ形状パラメータ算出部1nを備える。
第4の実施形態の変形例4の音声符号化装置14a(図49)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置14aの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置14aを統括的に制御する。音声符号化装置14aの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置14aは、第4の実施形態の音声符号化装置14の線形予測分析部1eにかえて、線形予測分析部1e1を備え、時間スロット選択部1pをさらに備える。
第4の実施形態の変形例5の音声復号装置24e(図28参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24eの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図29のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24eを統括的に制御する。音声復号装置24eの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24eは、図28に示すとおり、変形例5においては、第1の実施形態と同様に第4の実施形態の全体を通して省略可能である、変形例4に記載の音声復号装置24dの高周波線形予測分析部2h1と、線形予測逆フィルタ部2i1を省略し、音声復号装置24dの時間スロット選択部3a、及び時間エンベロープ変形部2vにかえて、時間スロット選択部3a2、及び時間エンベロープ変形部2v1を備える。さらに、第4の実施形態の全体を通して処理順序を入れ替え可能である線形予測フィルタ部2k3の線形予測合成フィルタ処理と時間エンベロープ変形部2v1での時間エンベロープの変形処理の順序を入れ替える。
でのそれらの平均値である数式(24)の
もあわせて時間スロット選択情報としてもよい。ただし、
である。
でのそれらの平均値である
もあわせて時間スロット選択情報としてもよい。ただし、
である。さらに時間スロット選択情報としては、数式(23)、数式(35)、数式(36)のeadj(r)またはその算出過程にて平方根演算をしない|eadj(r)|2でもよく、さらにある複数時間スロット区間(例えばSBRエンベロープ)
でのそれらの平均値である
もあわせて時間スロット選択情報としてもよい。ただし、
である。さらに時間スロット選択情報としては、数式(37)のeadj,scaled(r)またはその算出過程にて平方根演算をしない|eadj,scaled(r)|2でもよく、さらにある複数時間スロット区間(例えばSBRエンベロープ)
でのそれらの平均値である
もあわせて時間スロット選択情報としてもよい。ただし、
である。さらに時間スロット選択情報としては、時間エンベロープが変形された高周波成分に対応するQMF領域信号の時間スロットrの信号電力Penvadj(r)またはそれの平方根演算をした信号振幅値
でもよく、さらにある複数時間スロット区間(例えばSBRエンベロープ)
でのそれらの平均値である
もあわせて時間スロット選択情報としてもよい。ただし、
である。ただし、Mは高周波生成部2gによって生成される高周波成分の下限周波数kxより高い周波数の範囲を表す値であり、さらには高周波生成部2gによって生成される高周波成分の周波数範囲をkx≦k<kx+Mのように表してもよい。
第4の実施形態の変形例6の音声復号装置24f(図30参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24fの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図29のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24fを統括的に制御する。音声復号装置24fの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24fは、図30に示すとおり、変形例6においては、第1の実施形態と同様に第4の実施形態の全体を通して省略可能である、変形例4に記載の音声復号装置24dの信号変化検出部2e1と、高周波線形予測分析部2h1と、線形予測逆フィルタ部2i1を省略し、音声復号装置24dの時間スロット選択部3a、及び時間エンベロープ変形部2vにかえて、時間スロット選択部3a2、及び時間エンベロープ変形部2v1を備える。さらに、第4の実施形態の全体を通して処理順序を入れ替え可能である線形予測フィルタ部2k3の線形予測合成フィルタ処理と時間エンベロープ変形部2v1での時間エンベロープの変形処理の順序を入れ替える。
第4の実施形態の変形例7の音声符号化装置14b(図50)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声符号化装置14bの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声符号化装置14bを統括的に制御する。音声符号化装置14bの通信装置は、符号化の対象となる音声信号を外部から受信し、更に、符号化された多重化ビットストリームを外部に出力する。音声符号化装置14bは、変形例4の音声符号化装置14aのビットストリーム多重化部1g7、及び時間スロット選択部1pにかえて、ビットストリーム多重化部1g6、および時間スロット選択部1p1を備える。
第4の実施形態の変形例8の音声復号装置24h(図33参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24hの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図34のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24hを統括的に制御する。音声復号装置24hの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24hは、図33に示すとおり、変形例2の音声復号装置24bの低周波線形予測分析部2d、信号変化検出部2e、高周波線形予測分析部2h、線形予測逆フィルタ部2i、及び線形予測フィルタ部2kにかえて、低周波線形予測分析部2d1、信号変化検出部2e1、高周波線形予測分析部2h1、線形予測逆フィルタ部2i1、及び線形予測フィルタ部2k3を備え、時間スロット選択部3aをさらに備える。一次高周波調整部2j1は、第4の実施形態の変形例2における一次高周波調整部2j1と同様に、前記“MPEG-4 AAC”のSBRにおける”HF Adjustment“ステップにある処理のいずれか一つ以上を行う(ステップSm1の処理)。二次高周波調整部2j2は、第4の実施形態の変形例2における二次高周波調整部2j2と同様に、前記“MPEG-4 AAC”のSBRにおける”HF Adjustment“ステップにある処理のいずれか一つ以上を行う(ステップSm2の処理)。二次高周波調整部2j2で行う処理は、前記“MPEG-4 AAC”のSBRにおける”HF Adjustment“ステップにある処理のうち、一次高周波調整部2j1で行われなかった処理とすることが望ましい。
第4の実施形態の変形例9の音声復号装置24i(図35参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24iの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図36のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24iを統括的に制御する。音声復号装置24iの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24iは、図35に示すとおり、第1の実施形態と同様に第4の実施形態の全体を通して省略可能である、変形例8の音声復号装置24hの高周波線形予測分析部2h1、及び線形予測逆フィルタ部2i1を省略し、変形例8の音声復号装置24hの時間エンベロープ変形部2v、及び時間スロット選択部3aにかえて、時間エンベロープ変形部2v1、及び時間スロット選択部3a2を備える。さらに、第4の実施形態の全体を通して処理順序を入れ替え可能である線形予測フィルタ部2k3の線形予測合成フィルタ処理と時間エンベロープ変形部2v1での時間エンベロープの変形処理の順序を入れ替える。
第4の実施形態の変形例10の音声復号装置24j(図37参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24jの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図36のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24jを統括的に制御する。音声復号装置24jの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24jは、図37に示すとおり、第1の実施形態と同様に第4の実施形態の全体を通して省略可能である、変形例8の音声復号装置24hの信号変化検出部2e1、高周波線形予測分析部2h1、及び線形予測逆フィルタ部2i1を省略し、変形例8の音声復号装置24hの時間エンベロープ変形部2v、及び時間スロット選択部3aにかえて、時間エンベロープ変形部2v1、及び時間スロット選択部3a2を備える。さらに、第4の実施形態の全体を通して処理順序を入れ替え可能である線形予測フィルタ部2k3の線形予測合成フィルタ処理と時間エンベロープ変形部2v1での時間エンベロープの変形処理の順序を入れ替える。
第4の実施形態の変形例11の音声復号装置24k(図38参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24kの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図39のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24kを統括的に制御する。音声復号装置24kの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24kは、図38に示すとおり、変形例8の音声復号装置24hのビットストリーム分離部2a3、及び時間スロット選択部3aにかえて、ビットストリーム分離部2a7、及び時間スロット選択部3a1を備える。
第4の実施形態の変形例12の音声復号装置24q(図40参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24qの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図41のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24qを統括的に制御する。音声復号装置24qの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24qは、図40に示すとおり、変形例3の音声復号装置24cの低周波線形予測分析部2d、信号変化検出部2e、高周波線形予測分析部2h、線形予測逆フィルタ部2i、及び個別信号成分調整部2z1,2z2,2z3にかえて、低周波線形予測分析部2d1、信号変化検出部2e1、高周波線形予測分析部2h1、線形予測逆フィルタ部2i1、及び個別信号成分調整部2z4,2z5,2z6を備え(個別信号成分調整部は、時間エンベロープ変形手段に相当する)、時間スロット選択部3aをさらに備える。
第4の実施形態の変形例13の音声復号装置24m(図42参照)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24mの内蔵メモリに格納された所定のコンピュータプログラム(例えば、図43のフローチャートに示す処理を行うためのコンピュータプログラム)をRAMにロードして実行することによって音声復号装置24mを統括的に制御する。音声復号装置24mの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24mは、図42に示すとおり、変形例12の音声復号装置24qのビットストリーム分離部2a3、及び時間スロット選択部3aにかえて、ビットストリーム分離部2a7、及び時間スロット選択部3a1を備える。
第4の実施形態の変形例14の音声復号装置24n(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24nの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声復号装置24nを統括的に制御する。音声復号装置24nの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24nは、機能的には、変形例1の音声復号装置24aの低周波線形予測分析部2d、信号変化検出部2e、高周波線形予測分析部2h、線形予測逆フィルタ部2i、及び線形予測フィルタ部2kにかえて、低周波線形予測分析部2d1、信号変化検出部2e1、高周波線形予測分析部2h1、線形予測逆フィルタ部2i1、及び線形予測フィルタ部2k3を備え、時間スロット選択部3aをさらに備える。
第4の実施形態の変形例15の音声復号装置24p(不図示)は、物理的には図示しないCPU、ROM、RAM及び通信装置等を備え、このCPUは、ROM等の音声復号装置24pの内蔵メモリに格納された所定のコンピュータプログラムをRAMにロードして実行することによって音声復号装置24pを統括的に制御する。音声復号装置24pの通信装置は、符号化された多重化ビットストリームを受信し、更に、復号した音声信号を外部に出力する。音声復号装置24pは、機能的には、変形例14の音声復号装置24nの時間スロット選択部3aにかえて、時間スロット選択部3a1を備える。さらに、ビットストリーム分離部2a4にかえて、ビットストリーム分離部2a8(不図示)を備える。
Claims (8)
- 符号化された音声信号を復号する音声復号装置であって、
前記符号化された音声信号を含む外部からのビットストリームを、符号化ビットストリームと時間エンベロープ補助情報とに分離するビットストリーム分離手段と、
前記ビットストリーム分離手段によって分離された前記符号化ビットストリームを復号して低周波成分を得るコア復号手段と、
前記コア復号手段によって得られた前記低周波成分を周波数領域に変換する周波数変換手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を低周波帯域から高周波帯域に複写することによって高周波成分を生成する高周波生成手段と、
前記高周波生成手段によって生成された前記高周波成分を調整して、調整された高周波成分を生成する高周波調整手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を分析して時間エンベロープ情報を取得する低周波時間エンベロープ分析手段と、
前記時間エンベロープ補助情報を、前記時間エンベロープ情報を調整するためのパラメータに変換する補助情報変換手段と、
前記低周波時間エンベロープ分析手段によって取得された前記時間エンベロープ情報を調整して、調整された時間エンベロープ情報を生成する時間エンベロープ調整手段であり、該時間エンベロープ情報の調整に前記パラメータを用いる、該時間エンベロープ調整手段と、
前記調整された時間エンベロープ情報を用いて、前記調整された高周波成分の時間エンベロープを変形する時間エンベロープ変形手段と、
を備える、音声復号装置。 - 符号化された音声信号を復号する音声復号装置であって、
前記符号化された音声信号を含む外部からのビットストリームを復号して低周波成分を得るコア復号手段と、
前記コア復号手段によって得られた前記低周波成分を周波数領域に変換する周波数変換手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を低周波帯域から高周波帯域に複写することによって高周波成分を生成する高周波生成手段と、
前記高周波生成手段によって生成された前記高周波成分を調整して、調整された高周波成分を生成する高周波調整手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を分析して時間エンベロープ情報を取得する低周波時間エンベロープ分析手段と、
前記ビットストリームを分析して前記時間エンベロープ情報を調整するためのパラメータを生成する時間エンベロープ補助情報生成部と、
前記低周波時間エンベロープ分析手段によって取得された前記時間エンベロープ情報を調整して、調整された時間エンベロープ情報を生成する時間エンベロープ調整手段であり、該時間エンベロープ情報の調整に前記パラメータを用いる、該時間エンベロープ調整手段と、
前記調整された時間エンベロープ情報を用いて、前記調整された高周波成分の時間エンベロープを変形する時間エンベロープ変形手段と、
を備える、音声復号装置。 - 前記高周波調整手段は“ISO/IEC 14496-3”に規定される“MPEG4 AAC”における“HF adjustment”に準拠した動作をする、請求項1又は2に記載の音声復号装置。
- 前記調整された前記高周波成分は、前記高周波生成手段によって生成された前記高周波成分に基づく複写信号成分、及びノイズ信号成分を含む、請求項1〜3の何れか一項に記載の音声復号装置。
- 符号化された音声信号を復号する音声復号装置を用いた音声復号方法であって、
前記音声復号装置が、前記符号化された音声信号を含む外部からのビットストリームを、符号化ビットストリームと時間エンベロープ補助情報とに分離するビットストリーム分離ステップと、
前記音声復号装置が、前記ビットストリーム分離ステップにおいて分離した前記符号化ビットストリームを復号して低周波成分を得るコア復号ステップと、
前記音声復号装置が、前記コア復号ステップにおいて得た前記低周波成分を周波数領域に変換する周波数変換ステップと、
前記音声復号装置が、前記周波数変換ステップにおいて周波数領域に変換した前記低周波成分を低周波帯域から高周波帯域に複写することによって高周波成分を生成する高周波生成ステップと、
前記音声復号装置が、前記高周波生成ステップにおいて生成した前記高周波成分を調整して、調整された高周波成分を生成する高周波調整ステップと、
前記音声復号装置が、前記周波数変換ステップにおいて周波数領域に変換した前記低周波成分を分析して時間エンベロープ情報を取得する低周波時間エンベロープ分析ステップと、
前記音声復号装置が、前記時間エンベロープ補助情報を、前記時間エンベロープ情報を調整するためのパラメータに変換する補助情報変換ステップと、
前記音声復号装置が、前記低周波時間エンベロープ分析ステップにおいて取得した前記時間エンベロープ情報を調整して、調整された時間エンベロープ情報を生成する時間エンベロープ調整ステップであり、該時間エンベロープ情報の調整に前記パラメータを用いる、該時間エンベロープ調整ステップと、
前記音声復号装置が、前記調整された時間エンベロープ情報を用いて、前記調整された高周波成分の時間エンベロープを変形する時間エンベロープ変形ステップと、
を含む音声復号方法。 - 符号化された音声信号を復号する音声復号装置を用いた音声復号方法であって、
前記音声復号装置が、前記符号化された音声信号を含む外部からのビットストリームを復号して低周波成分を得るコア復号ステップと、
前記音声復号装置が、前記コア復号ステップにおいて得た前記低周波成分を周波数領域に変換する周波数変換ステップと、
前記音声復号装置が、前記周波数変換ステップにおいて周波数領域に変換した前記低周波成分を低周波帯域から高周波帯域に複写することによって高周波成分を生成する高周波生成ステップと、
前記音声復号装置が、前記高周波生成ステップにおいて生成した前記高周波成分を調整して、調整された高周波成分を生成する高周波調整ステップと、
前記音声復号装置が、前記周波数変換ステップにおいて周波数領域に変換された前記低周波成分を分析して時間エンベロープ情報を取得する低周波時間エンベロープ分析ステップと、
前記音声復号装置が、前記ビットストリームを分析して前記時間エンベロープ情報を調整するためのパラメータを生成する時間エンベロープ補助情報生成ステップと、
前記音声復号装置が、前記低周波時間エンベロープ分析ステップにおいて取得した前記時間エンベロープ情報を調整して、調整された時間エンベロープ情報を生成する時間エンベロープ調整ステップであり、該時間エンベロープ情報の調整に前記パラメータを用いる、該時間エンベロープ調整ステップと、
前記音声復号装置が、前記調整された時間エンベロープ情報を用いて、前記調整された高周波成分の時間エンベロープを変形する時間エンベロープ変形ステップと、
を含む音声復号方法。 - 符号化された音声信号を復号するために、コンピュータ装置を、
前記符号化された音声信号を含む外部からのビットストリームを、符号化ビットストリームと時間エンベロープ補助情報とに分離するビットストリーム分離手段と、
前記ビットストリーム分離手段によって分離された前記符号化ビットストリームを復号して低周波成分を得るコア復号手段と、
前記コア復号手段によって得られた前記低周波成分を周波数領域に変換する周波数変換手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を低周波帯域から高周波帯域に複写することによって高周波成分を生成する高周波生成手段と、
前記高周波生成手段によって生成された前記高周波成分を調整して、調整された高周波成分を生成する高周波調整手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を分析して時間エンベロープ情報を取得する低周波時間エンベロープ分析手段と、
前記時間エンベロープ補助情報を、前記時間エンベロープ情報を調整するためのパラメータに変換する補助情報変換手段と、
前記低周波時間エンベロープ分析手段によって取得された前記時間エンベロープ情報を調整して、調整された時間エンベロープ情報を生成する時間エンベロープ調整手段であり、該時間エンベロープ情報の調整に前記パラメータを用いる、該時間エンベロープ調整手段と、
前記調整された時間エンベロープ情報を用いて、前記調整された高周波成分の時間エンベロープを変形する時間エンベロープ変形手段と、
として機能させる音声復号プログラム。 - 符号化された音声信号を復号するために、コンピュータ装置を、
前記符号化された音声信号を含む外部からのビットストリームを復号して低周波成分を得るコア復号手段と、
前記コア復号手段によって得られた前記低周波成分を周波数領域に変換する周波数変換手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を低周波帯域から高周波帯域に複写することによって高周波成分を生成する高周波生成手段と、
前記高周波生成手段によって生成された前記高周波成分を調整して、調整された高周波成分を生成する高周波調整手段と、
前記周波数変換手段によって周波数領域に変換された前記低周波成分を分析して時間エンベロープ情報を取得する低周波時間エンベロープ分析手段と、
前記ビットストリームを分析して前記時間エンベロープ情報を調整するためのパラメータを生成する時間エンベロープ補助情報生成部と、
前記低周波時間エンベロープ分析手段によって取得された前記時間エンベロープ情報を調整して、調整された時間エンベロープ情報を生成する時間エンベロープ調整手段であり、該時間エンベロープ情報の調整に前記パラメータを用いる、該時間エンベロープ調整手段と、
前記調整された時間エンベロープ情報を用いて、前記調整された高周波成分の時間エンベロープを変形する時間エンベロープ変形手段と、
として機能させる音声復号プログラム。
Priority Applications (69)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010004419A JP4932917B2 (ja) | 2009-04-03 | 2010-01-12 | 音声復号装置、音声復号方法、及び音声復号プログラム |
| TW101124698A TWI479480B (zh) | 2009-04-03 | 2010-04-02 | A sound coding apparatus, a voice decoding apparatus, a speech coding method, a speech decoding method, a recording medium recording a sound coding program and a voice decoding program |
| DK12171613.8T DK2503548T3 (da) | 2009-04-03 | 2010-04-02 | Indretning til afkodning af tale, fremgangsmåde til afkodning af tale og program til afkodning af tale |
| CN201210240811.XA CN102737640B (zh) | 2009-04-03 | 2010-04-02 | 语音解码装置及语音解码方法 |
| RU2012130462/08A RU2498420C1 (ru) | 2009-04-03 | 2010-04-02 | Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи |
| ES12171613T ES2428316T3 (es) | 2009-04-03 | 2010-04-02 | Dispositivo de descodificación de habla, método de descodificación de habla y programa de descodificación de habla |
| BR122012021663-1A BR122012021663B1 (pt) | 2009-04-03 | 2010-04-02 | dispositivos e métodos de decodificação de voz |
| EP12171612.0A EP2503547B1 (en) | 2009-04-03 | 2010-04-02 | Speech Decoding Device, Speech Decoding Method, and Speech Decoding Program |
| SI201030335T SI2503548T1 (sl) | 2009-04-03 | 2010-04-02 | Naprava za dekodiranje govora, postopek za dekodirianje govora in program za dekodiranje govora |
| ES10758890.7T ES2453165T3 (es) | 2009-04-03 | 2010-04-02 | Dispositivo de codificación de habla, dispositivo de descodificación de habla, método de codificación de habla, método de descodificaión de habla, programa de codificación de habla y programa de descodificación de habla |
| EP12171603.9A EP2509072B1 (en) | 2009-04-03 | 2010-04-02 | Speech decoding device, speech decoding method, and speech decoding program |
| BR122012021669-0A BR122012021669B1 (pt) | 2009-04-03 | 2010-04-02 | dispositivos e métodos de decodificação de voz e memórias capazes de serem lidas por computador |
| BR122012021665-8A BR122012021665B1 (pt) | 2009-04-03 | 2010-04-02 | dispositivos e métodos de decodificação de voz |
| EP12171613.8A EP2503548B1 (en) | 2009-04-03 | 2010-04-02 | Speech decoding device, speech decoding method, and speech decoding program |
| CN201210240805.4A CN102779523B (zh) | 2009-04-03 | 2010-04-02 | 语音编码装置及编码方法、语音解码装置及解码方法 |
| KR1020127016467A KR101172326B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 |
| ES12171597.3T ES2586766T3 (es) | 2009-04-03 | 2010-04-02 | Dispositivo de decodificación de habla, método de decodificación de habla y programa de decodificación de habla |
| CN2010800145937A CN102379004B (zh) | 2009-04-03 | 2010-04-02 | 语音编码装置、语音解码装置、语音编码方法、语音解码方法 |
| TW101124696A TWI479479B (zh) | 2009-04-03 | 2010-04-02 | A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded |
| KR1020117023208A KR101172325B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 |
| BRPI1015049-8A BRPI1015049B1 (pt) | 2009-04-03 | 2010-04-02 | dispositivos e métodos de decodificação de voz |
| EP10758890.7A EP2416316B1 (en) | 2009-04-03 | 2010-04-02 | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
| KR1020167032541A KR101702415B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 부호화 장치 및 음성 부호화 방법 |
| PCT/JP2010/056077 WO2010114123A1 (ja) | 2009-04-03 | 2010-04-02 | 音声符号化装置、音声復号装置、音声符号化方法、音声復号方法、音声符号化プログラム及び音声復号プログラム |
| PT121716039T PT2509072T (pt) | 2009-04-03 | 2010-04-02 | Dispositivo de codificação de voz, dispositivo de descodificação de voz, método de codificação de voz, método de descodificação de voz, programa de codificação de voz e programa de descodificação de voz |
| MX2011010349A MX2011010349A (es) | 2009-04-03 | 2010-04-02 | Dispositivo de codificacion de habla, dispoitivo para descodificacion de habla, metodo de codificacion de habla, metodo para descodificacion de habla, programa de codificacion de habla y programa para descodificacion de habla. |
| KR1020127016476A KR101530295B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 |
| TW101124695A TWI478150B (zh) | 2009-04-03 | 2010-04-02 | A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded |
| PT107588907T PT2416316E (pt) | 2009-04-03 | 2010-04-02 | Dispositivo de codificação de voz, dispositivo de descodificação de voz, método de codificação de voz, método de descodificação de voz, programa de codificação de voz e programa de descodificação de voz |
| BR122012021668-2A BR122012021668B1 (pt) | 2009-04-03 | 2010-04-02 | Dispositivos e métodos de decodificação de voz |
| AU2010232219A AU2010232219B8 (en) | 2009-04-03 | 2010-04-02 | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
| ES12171603.9T ES2610363T3 (es) | 2009-04-03 | 2010-04-02 | Dispositivo de decodificación del habla, procedimiento de decodificación del habla y programa de decodificación del habla |
| CA2844438A CA2844438C (en) | 2009-04-03 | 2010-04-02 | Speech decoder utilizing temporal envelope shaping and high band generation and adjustment |
| RU2012130472/08A RU2498422C1 (ru) | 2009-04-03 | 2010-04-02 | Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи |
| KR1020127016478A KR101702412B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 복호 장치 |
| PL12171597T PL2503546T4 (pl) | 2009-04-03 | 2010-04-02 | Urządzenie dekodujące mowę, metoda dekodowania mowy i program dekodujący mowę |
| CA2844635A CA2844635C (en) | 2009-04-03 | 2010-04-02 | Speech decoder utilizing temporal envelope shaping and high band generation and adjustment |
| CN201210241157.4A CN102779520B (zh) | 2009-04-03 | 2010-04-02 | 语音解码装置及语音解码方法 |
| RU2011144573/08A RU2498421C2 (ru) | 2009-04-03 | 2010-04-02 | Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи |
| PT121716138T PT2503548E (pt) | 2009-04-03 | 2010-04-02 | Dispositivo de descodificação de voz, método de descodificação de voz e programa de descodificação de voz |
| EP12171597.3A EP2503546B1 (en) | 2009-04-03 | 2010-04-02 | Speech decoding device, speech decoding method, and speech decoding program |
| SG2011070927A SG174975A1 (en) | 2009-04-03 | 2010-04-02 | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
| DK12171603.9T DK2509072T3 (en) | 2009-04-03 | 2010-04-02 | Taleafkodningsindretning, taleafkodningsfremgangsmåde and taleafkodningsprogram |
| KR1020127016475A KR101530294B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 |
| KR1020127016477A KR101530296B1 (ko) | 2009-04-03 | 2010-04-02 | 음성 복호 장치, 음성 복호 방법, 및 음성 복호 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체 |
| CN201210240795.4A CN102779522B (zh) | 2009-04-03 | 2010-04-02 | 语音解码装置及语音解码方法 |
| PL12171613T PL2503548T3 (pl) | 2009-04-03 | 2010-04-02 | Urządzenie do dekodowania mowy, sposób dekodowania mowy, oraz program do dekodowania mowy |
| CA2844441A CA2844441C (en) | 2009-04-03 | 2010-04-02 | Speech decoder utilizing temporal envelope shaping and high band generation and adjustment |
| TW101124694A TWI384461B (zh) | 2009-04-03 | 2010-04-02 | A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded |
| TW101124697A TWI476763B (zh) | 2009-04-03 | 2010-04-02 | A sound decoding apparatus, a sound decoding method, and a recording medium on which a voice decoding program is recorded |
| TW099110498A TW201126515A (en) | 2009-04-03 | 2010-04-02 | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
| CA2757440A CA2757440C (en) | 2009-04-03 | 2010-04-02 | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
| SG10201401582VA SG10201401582VA (en) | 2009-04-03 | 2010-04-02 | Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program |
| ES12171612.0T ES2587853T3 (es) | 2009-04-03 | 2010-04-02 | Dispositivo de decodificación de habla, método de decodificación de habla y programa de decodificación de habla |
| CN201210240328.1A CN102779521B (zh) | 2009-04-03 | 2010-04-02 | 语音解码装置及语音解码方法 |
| US13/243,015 US8655649B2 (en) | 2009-04-03 | 2011-09-23 | Speech encoding/decoding device |
| PH12012501119A PH12012501119B1 (en) | 2009-04-03 | 2012-06-05 | Speech decoding device, speech decoding method and speech decoding program |
| PH12012501117A PH12012501117B1 (en) | 2009-04-03 | 2012-06-05 | Speech decoding device, speech decoding method and speech decoding program |
| PH12012501118A PH12012501118B1 (en) | 2009-04-03 | 2012-06-05 | Speech decoding device, speech decoding method and speech decoding program |
| PH12012501116A PH12012501116B1 (en) | 2009-04-03 | 2012-06-05 | Speech decoding device, speech decoding method and speech decoding program |
| RU2012130466/08A RU2595914C2 (ru) | 2009-04-03 | 2012-07-17 | Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи |
| RU2012130461/08A RU2595951C2 (ru) | 2009-04-03 | 2012-07-17 | Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи |
| RU2012130470/08A RU2595915C2 (ru) | 2009-04-03 | 2012-07-17 | Устройство кодирования речи, устройство декодирования речи, способ кодирования речи, способ декодирования речи, программа кодирования речи и программа декодирования речи |
| US13/749,294 US9064500B2 (en) | 2009-04-03 | 2013-01-24 | Speech decoding system with temporal envelop shaping and high-band generation |
| HRP20130841AT HRP20130841T1 (hr) | 2009-04-03 | 2013-09-10 | Naprava za dekodiranje govora, postupak dekodiranja govora, te program za dekodiranje govora |
| CY20131100813T CY1114412T1 (el) | 2009-04-03 | 2013-09-18 | Διαταξη κωδικοποιησης της ομιλιας, μεθοδος κωδικοποιησης της ομιλιας και προγραμμα κωδικοποιησης της ομιλιας |
| US14/152,540 US9460734B2 (en) | 2009-04-03 | 2014-01-10 | Speech decoder with high-band generation and temporal envelope shaping |
| US15/240,767 US9779744B2 (en) | 2009-04-03 | 2016-08-18 | Speech decoder with high-band generation and temporal envelope shaping |
| US15/240,746 US10366696B2 (en) | 2009-04-03 | 2016-08-18 | Speech decoder with high-band generation and temporal envelope shaping |
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009091396 | 2009-04-03 | ||
| JP2009091396 | 2009-04-03 | ||
| JP2009146831 | 2009-06-19 | ||
| JP2009146831 | 2009-06-19 | ||
| JP2009162238 | 2009-07-08 | ||
| JP2009162238 | 2009-07-08 | ||
| JP2010004419A JP4932917B2 (ja) | 2009-04-03 | 2010-01-12 | 音声復号装置、音声復号方法、及び音声復号プログラム |
Related Child Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011271559A Division JP4921611B2 (ja) | 2009-04-03 | 2011-12-12 | 音声復号装置、音声復号方法、及び音声復号プログラム |
| JP2012030289A Division JP5320475B2 (ja) | 2009-04-03 | 2012-02-15 | 音声復号装置、音声復号方法、及び音声復号プログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2011034046A JP2011034046A (ja) | 2011-02-17 |
| JP2011034046A5 JP2011034046A5 (ja) | 2012-02-02 |
| JP4932917B2 true JP4932917B2 (ja) | 2012-05-16 |
Family
ID=42828407
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010004419A Active JP4932917B2 (ja) | 2009-04-03 | 2010-01-12 | 音声復号装置、音声復号方法、及び音声復号プログラム |
Country Status (21)
| Country | Link |
|---|---|
| US (5) | US8655649B2 (ja) |
| EP (5) | EP2416316B1 (ja) |
| JP (1) | JP4932917B2 (ja) |
| KR (7) | KR101530295B1 (ja) |
| CN (6) | CN102737640B (ja) |
| AU (1) | AU2010232219B8 (ja) |
| BR (1) | BRPI1015049B1 (ja) |
| CA (4) | CA2844441C (ja) |
| CY (1) | CY1114412T1 (ja) |
| DK (2) | DK2509072T3 (ja) |
| ES (5) | ES2587853T3 (ja) |
| HR (1) | HRP20130841T1 (ja) |
| MX (1) | MX2011010349A (ja) |
| PH (4) | PH12012501117B1 (ja) |
| PL (2) | PL2503546T4 (ja) |
| PT (3) | PT2509072T (ja) |
| RU (6) | RU2498421C2 (ja) |
| SG (2) | SG174975A1 (ja) |
| SI (1) | SI2503548T1 (ja) |
| TW (6) | TWI476763B (ja) |
| WO (1) | WO2010114123A1 (ja) |
Families Citing this family (63)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
| CN102576539B (zh) * | 2009-10-20 | 2016-08-03 | 松下电器(美国)知识产权公司 | 编码装置、通信终端装置、基站装置以及编码方法 |
| EP3779979B1 (en) * | 2010-04-13 | 2023-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoding method for processing stereo audio signals using a variable prediction direction |
| CA2823175C (en) * | 2010-12-29 | 2016-07-26 | Ki-Hyun Choo | Apparatus and method for encoding/decoding for high-frequency bandwidth extension |
| EP2677519B1 (en) * | 2011-02-18 | 2019-08-14 | Ntt Docomo, Inc. | Speech decoder, speech encoder, speech decoding method, speech encoding method, speech decoding program, and speech encoding program |
| WO2013068587A2 (en) * | 2011-11-11 | 2013-05-16 | Dolby International Ab | Upsampling using oversampled sbr |
| JP6200034B2 (ja) * | 2012-04-27 | 2017-09-20 | 株式会社Nttドコモ | 音声復号装置 |
| JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
| CN102737647A (zh) * | 2012-07-23 | 2012-10-17 | 武汉大学 | 双声道音频音质增强编解码方法及装置 |
| EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
| CN103730125B (zh) * | 2012-10-12 | 2016-12-21 | 华为技术有限公司 | 一种回声抵消方法和设备 |
| CN105551497B (zh) | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
| CN110047499B (zh) | 2013-01-29 | 2023-08-29 | 弗劳恩霍夫应用研究促进协会 | 低复杂度音调自适应音频信号量化 |
| PT2951825T (pt) | 2013-01-29 | 2022-02-02 | Fraunhofer Ges Forschung | Aparelho e método para geração de um sinal aprimorado em frequência utilizando suavização temporal de sub-bandas |
| US9711156B2 (en) * | 2013-02-08 | 2017-07-18 | Qualcomm Incorporated | Systems and methods of performing filtering for gain determination |
| KR102148407B1 (ko) * | 2013-02-27 | 2020-08-27 | 한국전자통신연구원 | 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법 |
| TWI477789B (zh) * | 2013-04-03 | 2015-03-21 | Tatung Co | 資訊擷取裝置及其發送頻率調整方法 |
| CN108806704B (zh) | 2013-04-19 | 2023-06-06 | 韩国电子通信研究院 | 多信道音频信号处理装置及方法 |
| JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
| FR3008533A1 (fr) | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
| TR201815212T4 (tr) * | 2013-07-18 | 2018-11-21 | Nippon Telegraph & Telephone | Doğrusal tahmin analiz cihazı, yöntemi, programı ve depolama ortamı. |
| EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
| US9319819B2 (en) * | 2013-07-25 | 2016-04-19 | Etri | Binaural rendering method and apparatus for decoding multi channel audio |
| WO2015017223A1 (en) * | 2013-07-29 | 2015-02-05 | Dolby Laboratories Licensing Corporation | System and method for reducing temporal artifacts for transient signals in a decorrelator circuit |
| CN108172239B (zh) | 2013-09-26 | 2021-01-12 | 华为技术有限公司 | 频带扩展的方法及装置 |
| CN105761723B (zh) | 2013-09-26 | 2019-01-15 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
| MY187944A (en) | 2013-10-18 | 2021-10-30 | Fraunhofer Ges Forschung | Concept for encoding an audio signal and decoding an audio signal using deterministic and noise like information |
| SG11201603000SA (en) | 2013-10-18 | 2016-05-30 | Fraunhofer Ges Forschung | Concept for encoding an audio signal and decoding an audio signal using speech related spectral shaping information |
| TR201802303T4 (tr) * | 2013-10-31 | 2018-03-21 | Fraunhofer Ges Forschung | Frekans alanında zamansal ön şekillendirilmiş gürültü eklenmesiyle ses bant genişliği uzatma. |
| JP6345780B2 (ja) * | 2013-11-22 | 2018-06-20 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | ハイバンドコーディングにおける選択的位相補償 |
| EP4407609A3 (en) | 2013-12-02 | 2024-08-21 | Top Quality Telephony, Llc | A computer-readable storage medium and a computer software product |
| US10163447B2 (en) * | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
| MX361028B (es) * | 2014-02-28 | 2018-11-26 | Fraunhofer Ges Forschung | Dispositivo de decodificación, dispositivo de codificación, método de decodificación, método de codificación, dispositivo de terminal y dispositivo de estación de base. |
| JP6035270B2 (ja) | 2014-03-24 | 2016-11-30 | 株式会社Nttドコモ | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム |
| EP4583105A3 (en) * | 2014-04-25 | 2025-08-13 | Ntt Docomo, Inc. | Linear prediction coefficient conversion device and linear prediction coefficient conversion method |
| KR101860139B1 (ko) * | 2014-05-01 | 2018-05-23 | 니폰 덴신 덴와 가부시끼가이샤 | 주기성 통합 포락 계열 생성 장치, 주기성 통합 포락 계열 생성 방법, 주기성 통합 포락 계열 생성 프로그램, 기록매체 |
| EP3182412B1 (en) * | 2014-08-15 | 2023-06-07 | Samsung Electronics Co., Ltd. | Sound quality improving method and device, sound decoding method and device, and multimedia device employing same |
| US9659564B2 (en) * | 2014-10-24 | 2017-05-23 | Sestek Ses Ve Iletisim Bilgisayar Teknolojileri Sanayi Ticaret Anonim Sirketi | Speaker verification based on acoustic behavioral characteristics of the speaker |
| US9455732B2 (en) * | 2014-12-19 | 2016-09-27 | Stmicroelectronics S.R.L. | Method and device for analog-to-digital conversion of signals, corresponding apparatus |
| WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| MX2017012957A (es) * | 2015-04-10 | 2018-02-01 | Thomson Licensing | Metodo y dispositivo para codificar multiples señales de audio, y metodo y dispositivo para decodificar una mezcla de multiples señales de audio con separacion mejorada. |
| SG11201808684TA (en) | 2016-04-12 | 2018-11-29 | Fraunhofer Ges Forschung | Audio encoder for encoding an audio signal, method for encoding an audio signal and computer program under consideration of a detected peak spectral region in an upper frequency band |
| US11817115B2 (en) * | 2016-05-11 | 2023-11-14 | Cerence Operating Company | Enhanced de-esser for in-car communication systems |
| DE102017204181A1 (de) | 2017-03-14 | 2018-09-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sender zum Emittieren von Signalen und Empfänger zum Empfangen von Signalen |
| EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
| EP3382700A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
| EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| KR102773347B1 (ko) * | 2018-02-27 | 2025-02-25 | 제탄 시스템즈 인코포레이티드 | 이종 데이터를 위한 확장 가능한 변환 처리 유닛 |
| US10810455B2 (en) | 2018-03-05 | 2020-10-20 | Nvidia Corp. | Spatio-temporal image metric for rendered animations |
| CN109243485B (zh) * | 2018-09-13 | 2021-08-13 | 广州酷狗计算机科技有限公司 | 恢复高频信号的方法和装置 |
| KR102603621B1 (ko) * | 2019-01-08 | 2023-11-16 | 엘지전자 주식회사 | 신호 처리 장치 및 이를 구비하는 영상표시장치 |
| EP3786948A1 (en) | 2019-08-28 | 2021-03-03 | Fraunhofer Gesellschaft zur Förderung der Angewand | Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar |
| CN113192523B (zh) * | 2020-01-13 | 2024-07-16 | 华为技术有限公司 | 一种音频编解码方法和音频编解码设备 |
| JP6872056B2 (ja) * | 2020-04-09 | 2021-05-19 | 株式会社Nttドコモ | 音声復号装置および音声復号方法 |
| CN113190508B (zh) * | 2021-04-26 | 2023-05-05 | 重庆市规划和自然资源信息中心 | 一种面向管理的自然语言识别方法 |
Family Cites Families (43)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2256293C2 (ru) * | 1997-06-10 | 2005-07-10 | Коудинг Технолоджиз Аб | Усовершенствование исходного кодирования с использованием дублирования спектральной полосы |
| SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| DE19747132C2 (de) | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
| US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
| SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
| SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
| US8782254B2 (en) * | 2001-06-28 | 2014-07-15 | Oracle America, Inc. | Differentiated quality of service context assignment and propagation |
| CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
| ATE288617T1 (de) * | 2001-11-29 | 2005-02-15 | Coding Tech Ab | Wiederherstellung von hochfrequenzkomponenten |
| US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
| US7555434B2 (en) * | 2002-07-19 | 2009-06-30 | Nec Corporation | Audio decoding device, decoding method, and program |
| ES2259158T3 (es) * | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
| ATE354160T1 (de) * | 2003-10-30 | 2007-03-15 | Koninkl Philips Electronics Nv | Audiosignalcodierung oder -decodierung |
| US7668711B2 (en) * | 2004-04-23 | 2010-02-23 | Panasonic Corporation | Coding equipment |
| TWI498882B (zh) * | 2004-08-25 | 2015-09-01 | Dolby Lab Licensing Corp | 音訊解碼器 |
| US7720230B2 (en) | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
| US7045799B1 (en) | 2004-11-19 | 2006-05-16 | Varian Semiconductor Equipment Associates, Inc. | Weakening focusing effect of acceleration-deceleration column of ion implanter |
| CA2602804C (en) | 2005-04-01 | 2013-12-24 | Qualcomm Incorporated | Systems, methods, and apparatus for highband burst suppression |
| WO2006108543A1 (en) | 2005-04-15 | 2006-10-19 | Coding Technologies Ab | Temporal envelope shaping of decorrelated signal |
| WO2006116024A2 (en) * | 2005-04-22 | 2006-11-02 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor attenuation |
| JP4339820B2 (ja) * | 2005-05-30 | 2009-10-07 | 太陽誘電株式会社 | 光情報記録装置および方法および信号処理回路 |
| US20070006716A1 (en) * | 2005-07-07 | 2007-01-11 | Ryan Salmond | On-board electric guitar tuner |
| DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
| CN101223820B (zh) | 2005-07-15 | 2011-05-04 | 松下电器产业株式会社 | 信号处理装置 |
| US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
| CN101405792B (zh) | 2006-03-20 | 2012-09-05 | 法国电信公司 | 用于在音频解码器中对信号进行后处理的方法 |
| KR100791846B1 (ko) * | 2006-06-21 | 2008-01-07 | 주식회사 대우일렉트로닉스 | 오디오 복호기 |
| US9454974B2 (en) * | 2006-07-31 | 2016-09-27 | Qualcomm Incorporated | Systems, methods, and apparatus for gain factor limiting |
| CN101140759B (zh) * | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
| DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
| JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
| EP2571024B1 (en) * | 2007-08-27 | 2014-10-22 | Telefonaktiebolaget L M Ericsson AB (Publ) | Adaptive transition frequency between noise fill and bandwidth extension |
| WO2009059632A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
| KR101413968B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화, 복호화 방법 및 장치 |
| KR101413967B1 (ko) | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
| US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
| KR101475724B1 (ko) * | 2008-06-09 | 2014-12-30 | 삼성전자주식회사 | 오디오 신호 품질 향상 장치 및 방법 |
| KR20100007018A (ko) * | 2008-07-11 | 2010-01-22 | 에스앤티대우(주) | 피스톤밸브 어셈블리 및 이를 포함하는 연속 감쇠력 가변형댐퍼 |
| US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
| US8352279B2 (en) * | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
| US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
| JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
| US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
-
2010
- 2010-01-12 JP JP2010004419A patent/JP4932917B2/ja active Active
- 2010-04-02 CA CA2844441A patent/CA2844441C/en active Active
- 2010-04-02 EP EP10758890.7A patent/EP2416316B1/en active Active
- 2010-04-02 RU RU2011144573/08A patent/RU2498421C2/ru active
- 2010-04-02 CA CA2844438A patent/CA2844438C/en active Active
- 2010-04-02 CN CN201210240811.XA patent/CN102737640B/zh active Active
- 2010-04-02 DK DK12171603.9T patent/DK2509072T3/en active
- 2010-04-02 ES ES12171612.0T patent/ES2587853T3/es active Active
- 2010-04-02 BR BRPI1015049-8A patent/BRPI1015049B1/pt active IP Right Grant
- 2010-04-02 RU RU2012130462/08A patent/RU2498420C1/ru active
- 2010-04-02 KR KR1020127016476A patent/KR101530295B1/ko active Active
- 2010-04-02 MX MX2011010349A patent/MX2011010349A/es active IP Right Grant
- 2010-04-02 EP EP12171612.0A patent/EP2503547B1/en active Active
- 2010-04-02 EP EP12171603.9A patent/EP2509072B1/en active Active
- 2010-04-02 EP EP12171597.3A patent/EP2503546B1/en active Active
- 2010-04-02 DK DK12171613.8T patent/DK2503548T3/da active
- 2010-04-02 EP EP12171613.8A patent/EP2503548B1/en active Active
- 2010-04-02 SI SI201030335T patent/SI2503548T1/sl unknown
- 2010-04-02 AU AU2010232219A patent/AU2010232219B8/en active Active
- 2010-04-02 TW TW101124697A patent/TWI476763B/zh active
- 2010-04-02 KR KR1020127016478A patent/KR101702412B1/ko active Active
- 2010-04-02 PL PL12171597T patent/PL2503546T4/pl unknown
- 2010-04-02 CA CA2844635A patent/CA2844635C/en active Active
- 2010-04-02 TW TW101124696A patent/TWI479479B/zh active
- 2010-04-02 CN CN201210240328.1A patent/CN102779521B/zh active Active
- 2010-04-02 CN CN201210241157.4A patent/CN102779520B/zh active Active
- 2010-04-02 TW TW101124698A patent/TWI479480B/zh active
- 2010-04-02 SG SG2011070927A patent/SG174975A1/en unknown
- 2010-04-02 ES ES12171613T patent/ES2428316T3/es active Active
- 2010-04-02 KR KR1020127016475A patent/KR101530294B1/ko active Active
- 2010-04-02 RU RU2012130472/08A patent/RU2498422C1/ru active
- 2010-04-02 CN CN201210240805.4A patent/CN102779523B/zh active Active
- 2010-04-02 PT PT121716039T patent/PT2509072T/pt unknown
- 2010-04-02 PT PT107588907T patent/PT2416316E/pt unknown
- 2010-04-02 PT PT121716138T patent/PT2503548E/pt unknown
- 2010-04-02 ES ES12171597.3T patent/ES2586766T3/es active Active
- 2010-04-02 CN CN201210240795.4A patent/CN102779522B/zh active Active
- 2010-04-02 SG SG10201401582VA patent/SG10201401582VA/en unknown
- 2010-04-02 KR KR1020127016467A patent/KR101172326B1/ko active Active
- 2010-04-02 KR KR1020167032541A patent/KR101702415B1/ko active Active
- 2010-04-02 PL PL12171613T patent/PL2503548T3/pl unknown
- 2010-04-02 KR KR1020127016477A patent/KR101530296B1/ko active Active
- 2010-04-02 ES ES12171603.9T patent/ES2610363T3/es active Active
- 2010-04-02 TW TW099110498A patent/TW201126515A/zh unknown
- 2010-04-02 ES ES10758890.7T patent/ES2453165T3/es active Active
- 2010-04-02 CN CN2010800145937A patent/CN102379004B/zh active Active
- 2010-04-02 KR KR1020117023208A patent/KR101172325B1/ko active Active
- 2010-04-02 TW TW101124694A patent/TWI384461B/zh active
- 2010-04-02 WO PCT/JP2010/056077 patent/WO2010114123A1/ja active Application Filing
- 2010-04-02 CA CA2757440A patent/CA2757440C/en active Active
- 2010-04-02 TW TW101124695A patent/TWI478150B/zh active
-
2011
- 2011-09-23 US US13/243,015 patent/US8655649B2/en active Active
-
2012
- 2012-06-05 PH PH12012501117A patent/PH12012501117B1/en unknown
- 2012-06-05 PH PH12012501116A patent/PH12012501116B1/en unknown
- 2012-06-05 PH PH12012501119A patent/PH12012501119B1/en unknown
- 2012-06-05 PH PH12012501118A patent/PH12012501118B1/en unknown
- 2012-07-17 RU RU2012130461/08A patent/RU2595951C2/ru active
- 2012-07-17 RU RU2012130466/08A patent/RU2595914C2/ru active
- 2012-07-17 RU RU2012130470/08A patent/RU2595915C2/ru active
-
2013
- 2013-01-24 US US13/749,294 patent/US9064500B2/en active Active
- 2013-09-10 HR HRP20130841AT patent/HRP20130841T1/hr unknown
- 2013-09-18 CY CY20131100813T patent/CY1114412T1/el unknown
-
2014
- 2014-01-10 US US14/152,540 patent/US9460734B2/en active Active
-
2016
- 2016-08-18 US US15/240,746 patent/US10366696B2/en active Active
- 2016-08-18 US US15/240,767 patent/US9779744B2/en active Active
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4932917B2 (ja) | 音声復号装置、音声復号方法、及び音声復号プログラム | |
| JP5588547B2 (ja) | 音声復号装置、音声復号方法、及び音声復号プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111212 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111212 |
|
| A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20111212 |
|
| TRDD | Decision of grant or rejection written | ||
| A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20120112 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120215 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4932917 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150224 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |