+

WO2003010752A1 - Speech bandwidth extension apparatus and speech bandwidth extension method - Google Patents

Speech bandwidth extension apparatus and speech bandwidth extension method Download PDF

Info

Publication number
WO2003010752A1
WO2003010752A1 PCT/JP2002/007605 JP0207605W WO03010752A1 WO 2003010752 A1 WO2003010752 A1 WO 2003010752A1 JP 0207605 W JP0207605 W JP 0207605W WO 03010752 A1 WO03010752 A1 WO 03010752A1
Authority
WO
WIPO (PCT)
Prior art keywords
circuit
signal
frequency
band
sound source
Prior art date
Application number
PCT/JP2002/007605
Other languages
English (en)
French (fr)
Inventor
Kazunori Ozawa
Original Assignee
Nec Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nec Corporation filed Critical Nec Corporation
Priority to US10/484,936 priority Critical patent/US20040243402A1/en
Priority to KR1020047000794A priority patent/KR100615480B1/ko
Priority to CA002455059A priority patent/CA2455059A1/en
Priority to EP02751723A priority patent/EP1420389A4/en
Publication of WO2003010752A1 publication Critical patent/WO2003010752A1/ja
Priority to HK05102460A priority patent/HK1069247A1/xx

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • G10L2015/025Phonemes, fenemes or fenones being the recognition units

Definitions

  • the present invention relates to an audio band extending apparatus, and more particularly to an audio band extending apparatus that extends a decoded reproduction frequency band of an audio signal encoded at a low bit rate and improves audible sound quality.
  • an audio band extension method a method in which an audio signal coded at a low bit rate is extended on a receiving side without transmitting auxiliary information related to the band extension from a transmitting side to extend a frequency band.
  • a paper entitled "Wi deb and ext en si on oftele phone seechusi ng hi dd en mar kov mod el" by P. Jax and P. Vary et al. Proc. I EEE Speech Cod i ng Works hop, pp. 133-135, 2000.).
  • HMM Hidden Markov Model 1
  • the above-described conventional voice band extending apparatus has a problem that a large number of voice databases must be referred to in order to determine the parameters of the HMM model.
  • a large amount of computation is required for searching by the HMM model in order to perform the frequency band extension processing on the receiving side in real time.
  • the input reproduced audio signal is divided into frames, the frequency of the spectral parameter obtained for each frame is shifted, and the resultant is combined with the band-expanded linear prediction coefficient.
  • the above object is achieved by forming a synthetic filter and reproducing the band-extended audio signal using the sound source signal passed through the synthetic filter.
  • An audio band extending apparatus includes a spectrum parameter calculation circuit for receiving a decoded reproduced audio signal and calculating a spectrum parameter representing a spectrum characteristic, and the spectrum parameter calculation circuit.
  • a coefficient calculation circuit for obtaining an expanded filter coefficient in the frequency band after shifting the frequency of the signal to a higher frequency, a voiced Z unvoiced discrimination circuit that receives the reproduced audio signal and outputs voiced Z unvoiced discrimination information and a pitch period, A gain adjustment circuit that outputs a gain based on the voiced Z unvoiced discrimination information, an adaptive codebook circuit that receives the pitch period and generates an adaptive code vector based on a past sound source signal, and generates a band-limited noise signal.
  • a noise generation circuit and a gain circuit that inputs the adaptive code vector and the noise signal and provides an appropriate gain to at least one of the noise generation circuit
  • a first adder for adding the output of the gain circuit to output a sound source signal, and a sound source signal having a frequency band extended by passing the sound source signal through a synthetic filter configured using the filter coefficient.
  • a synthesis filter circuit for outputting, a sampling frequency conversion circuit for inputting the reproduced audio signal and outputting a signal converted at a predetermined sampling frequency, an output of the sampled frequency conversion circuit and the synthesis filter
  • a second adder for adding the output of the circuit and outputting a reproduced audio signal whose band has been extended.
  • the audio band extending apparatus of the present invention is provided with a spectrum parameter calculation circuit that inputs a decoded reproduced audio signal and calculates a spectrum parameter representing a spectrum characteristic, and the spectrum parameter calculation circuit.
  • a coefficient calculating circuit for obtaining an expanded filter coefficient in the frequency band after shifting the frequency of the signal to a higher frequency, a voiced / unvoiced discriminating circuit for inputting the reproduced voice signal and outputting voiced / unvoiced discrimination information,
  • a gain adjustment circuit that outputs a gain based on the discrimination information, a noise generation circuit that generates a band-limited noise signal, a gain circuit that inputs the noise signal and outputs a sound source signal having an appropriate gain,
  • a synthesis filter circuit for outputting a sound source signal having a frequency band extended by passing a sound source signal through a synthesis filter configured using the filter coefficient; Sampling that inputs an audio signal and outputs a signal converted at a predetermined sampling frequency It is characterized by comprising a frequency conversion circuit, and an add
  • the spectrum parameter overnight calculation circuit divides the reproduced audio signal into frames, and then calculates and outputs a predetermined order of the spectrum parameters each representing a spectrum characteristic for each frame. It is characterized by:
  • the coefficient calculation circuit is characterized in that the frequency of the spectral parameter is shifted to a higher frequency, and then the frequency is converted into a predetermined order filter coefficient (linear prediction coefficient) and output. .
  • the adaptive codebook circuit is characterized in that the adaptive codebook circuit inputs the pitch period and outputs an adaptive code vector in the adaptive codebook for each frame based on a past sound source signal.
  • the noise generation circuit is characterized in that a frequency band is limited, an average amplitude is normalized at a predetermined level, and a noise signal having a time length equal to a frame length is output.
  • the audio band extension method of the present invention is an audio band extension method for extending the frequency band of a decoded reproduced audio signal, wherein the input reproduced audio signal is divided into frames, and the audio band is obtained for each frame. After shifting the frequency of the vector parameter to a higher frequency, it is converted to an expanded filter coefficient (linear prediction coefficient) in the frequency band, and an adaptive code base based on a noise signal with a time length equal to the frame length and a past sound source signal is used.
  • the sound source signal obtained by adding the sound source signal is passed through a synthesis filter constituted by the filter coefficients to obtain a sound source signal having an extended frequency band, and the reproduced sound signal is converted into a signal converted at a sampling frequency having a high frequency component. It is characterized by adding an extended sound source signal and reproducing an audio signal having an extended frequency band.
  • FIG. 1 is a block diagram showing one embodiment of the voice band extending apparatus of the present invention.
  • FIG. 2 is a block diagram showing another embodiment of the voice band extending apparatus of the present invention.
  • FIG. 3 is a block diagram showing another embodiment of the voice band extending apparatus of the present invention.
  • FIG. 1 is a block diagram showing one embodiment of a voice band extending apparatus according to the present invention.
  • a decoded reproduction audio signal is input, and a spectrum parameter calculation circuit 100 for calculating a spectrum parameter representing a spectrum characteristic, and a spectrum parameter calculation circuit 100 are provided.
  • a gain adjustment circuit 210 that outputs a gain based on voiced / unvoiced discrimination information, an adaptive codebook circuit 110 that receives a pitch period and generates an adaptive code vector based on a past sound source signal, and a band-limited noise signal.
  • a noise generation circuit 120 a gain circuit 140 that receives an adaptive code vector and a noise signal and applies an appropriate gain to at least one of the noise generation circuit 120, and a gain circuit 14
  • An adder 160 that adds the output of 0 to output a sound source signal
  • a synthesis filter circuit 170 that outputs the sound source signal having a frequency band extended by passing the sound source signal through a synthesis filter configured using filter coefficients
  • a sampling frequency conversion circuit 180 for inputting an audio signal and outputting a signal converted at a predetermined sampling frequency, and adding an output of the sampling frequency conversion circuit 180 and an output of the synthesis filter circuit 170 to obtain a bandwidth. It comprises an adder 190 for outputting an extended reproduction signal.
  • the operation of the voice band extending apparatus of the present embodiment will be described in detail with reference to FIG.
  • the expansion of the frequency band is assumed to extend the frequency band of the input reproduced audio signal from 4 kHz to 5 kHz or 7 kHz.
  • the well-known LPC (Linear Predictive Coding) analysis, Burg analysis, and the like can be used to calculate the spectrum parameters. You. In the present embodiment, Burg analysis is used. The details of the Burg analysis are described in Nakagomi's book entitled “Signal Analysis and System Identification” (Corona Publishing Co., Ltd., 1988), pp. 82-87, and the description is omitted.
  • the coefficient calculation circuit 130 receives the LSP parameters output from the spectrum parameter calculation circuit 100, converts the LSP parameters into coefficients of a signal whose frequency band has been expanded, and outputs the converted coefficients to the synthesis filter circuit 170.
  • a known method such as a method of simply shifting the frequency of the LSP parameter to a higher frequency, a nonlinear conversion method, or a linear conversion method can be used.
  • the frequency of the LSP parameter is shifted to a higher frequency, and then converted to a linear prediction coefficient (filler coefficient) of a predetermined order M.
  • the voiced / unvoiced determination circuit 200 receives the decoded reproduced voice signal and determines whether the signal for each frame is voiced or unvoiced. Hereinafter, a specific determination method will be described. If the maximum value of the normalized autocorrelation function D (T) is larger than a predetermined threshold, the signal for each frame is determined to be a voiced portion, and if smaller, the signal is determined to be an unvoiced portion. For the reproduced audio signal X (n), the normalized autocorrelation function D (T) up to a predetermined delay time m is calculated according to the following equation (1). The determined voiced / unvoiced determination information is output to the gain adjustment circuit 210.
  • the signal of each voiced frame is output to the adaptive codebook circuit 110 with the value of T that maximizes the normalized autocorrelation function D (T) as the pitch period T.
  • N is the number of samples for calculating the normalized autocorrelation.
  • the gain adjustment circuit 210 inputs the voiced / unvoiced discrimination information from the voiced / unvoiced discrimination circuit 200, and adjusts the gain of the adaptive codebook signal and the gain of the noise signal according to the voiced or unvoiced part. Output to circuit 140.
  • the adaptive codebook circuit 110 receives the pitch period of the adaptive codebook from the voiced / unvoiced discriminating circuit 200 and generates and outputs an adaptive code vector.
  • the adaptive codebook circuit 110 also generates an adaptive codebook component based on past sound source signals.
  • the noise generation circuit 120 generates a noise signal having a time length equal to the frame length while the frequency band is limited and the average amplitude is normalized at a predetermined level. Output to Here, white noise is used as an example of the noise signal, but a noise signal having another statistical distribution can also be used.
  • the gain circuit 1400 receives the gain of the adaptive codebook signal and the gain of the noise signal output from the gain adjustment circuit 210 and inputs the adaptive code vector and the adaptive codebook output from the adaptive codebook circuit 110. After multiplying at least one of the noise signals output from the noise generation circuit 120 by an appropriate gain, each signal is output to the adder 160.
  • the adder 160 outputs the sound source signal obtained by adding the two types of signals output from the gain circuit 140 to the synthesis filter circuit 170 and the adaptive codebook circuit 110.
  • the synthesis filter circuit 170 is composed of a synthesis filter by inputting the linear prediction coefficient (filter coefficient) of order M output from the coefficient calculation circuit 130.
  • the synthesis filter circuit 170 inputs the sound source signal output from the adder 160 and outputs a sound source signal whose frequency band is extended.
  • the sampling frequency conversion circuit 180 inputs the reproduced audio signal, and outputs a signal converted by a predetermined integral multiple of the sampling frequency.
  • the signal generated by the transformation maintains the components before frequency extension.
  • the adder 190 adds the sound source signal output from the synthesizing filter circuit 170 to the signal output from the sampling frequency conversion circuit 180, and generates a reproduced audio signal having an expanded frequency band. Form and output.
  • the input reproduced audio signal is divided into frames, and the spectrum parameters obtained for each frame or the frequency of the LSP parameter is shifted to a higher frequency, and then the frequency band is extended.
  • To the calculated filter coefficients (linear prediction coefficients) and adds a noise signal with a time length equal to the frame length and an adaptive code vector based on the past sound source signal to the synthesis filter composed of these filter coefficients.
  • the expanded sound source signal is converted into a sound source signal with an expanded frequency band, and the expanded sound source signal is added to the input reproduced audio signal to a signal converted at a sampling frequency with a higher frequency component, thereby expanding the frequency band. It is not necessary to receive the information for band extension from the transmitting side because the reproduced audio signal is reproduced. Necessary to carry out a large amount of calculation based on the HMM is eliminated. Furthermore, since white noise is used as the sound source information, it can be processed very easily.
  • FIG. 2 is a block diagram showing another embodiment of the voice band extending apparatus of the present invention.
  • Components having the same numbers as those in FIG. 1 perform the same operations as those in FIG.
  • a gain adjustment circuit 310 inputs voiced Z unvoiced discrimination information from a voiced / unvoiced discrimination circuit 200 and converts a signal for adjusting the gain of the noise signal according to whether the voiced or unvoiced part is a gain circuit. Output to 300.
  • the gain circuit 300 inputs the gain of the noise signal output from the gain adjustment circuit 310, and synthesizes a signal obtained by multiplying the noise signal output from the noise generation circuit 120 by the gain. Output to 0.
  • the adaptive codebook circuit 110 shown in FIG. 1 is used to generate a periodic component included in a vowel or the like of an audio signal. Since it is generally said that the vowel signal does not extend to a high frequency, the vowel signal can be omitted in the voice band extending apparatus. Therefore, the amount of data processing can be reduced by removing the adaptive codebook circuit 110.
  • FIG. 3 is a block diagram showing another embodiment of the voice band extending apparatus of the present invention.
  • the voice band extending apparatus includes a demultiplexer 505, a gain decoding circuit 510, an adaptive codebook circuit 520, and a sound source.
  • Signal restoration circuit 540, spectral parameter overnight decoding circuit 570, adder 550, synthesis filter circuit 560, gain codebook 380, tone generator codebook 3 5 1 Is arranged in the preceding stage.
  • the spectrum parameter overnight decoding circuit 570 also has the operation of the spectrum parameter overnight calculation circuit 100 shown in FIG. This simplifies the configuration. Components having the same numbers as those in FIG. 1 perform the same operations, and thus description thereof will be omitted.
  • a demultiplexer 505 extracts, from a received signal, an index indicating a multiplexed gain code vector as audio information, an index indicating a delay of an adaptive codebook, information on a sound source signal, and information on a sound source code base. The parameters of the vector index and the spectrum parameter are separated and output.
  • the gain decoding circuit 510 receives an index indicating a gain code vector, reads a gain code vector from the gain codebook 380 according to the index, and outputs the read gain code vector.
  • the adaptive codebook circuit 520 inputs an index indicating the delay of the adaptive codebook, generates an adaptive code vector, and adds the adaptive code vector to the gain code vector output from the gain decoding circuit 510. An adaptive code vector multiplied by the adaptive codebook gain is output. Further, an adaptive codebook component is generated based on the past driving sound source signal.
  • the sound source signal restoration circuit 540 generates a sound source pulse using the sound source code vector index received from the demultiplexer 505, the sound source signal information, and the polarity code vector read from the sound source codebook 351. Then, the sound source pulse is output to the adder 550.
  • the adder 550 uses the adaptive code vector output from the adaptive codebook circuit 520 and the excitation pulse output from the excitation signal restoring circuit 540, and uses the following equation (2) 2) A driving sound source signal V (n) is generated based on 2), and the driving sound source signal V (n) is output to the adaptive codebook circuit 520 and the synthesis filter circuit 560.
  • the spectrum parameter decoding circuit 570 inputs the spectrum parameter decoding index, decodes the spectrum parameter decoding, converts it into a linear prediction coefficient, and synthesizes the composite filter circuit 560 and coefficient calculation. Output to circuit 130.
  • the synthesis filter circuit 560 inputs the linear prediction coefficient ai output from the spectral parameter overnight decoding circuit 570 and the driving excitation signal V (n) output from the adder 550, and The reproduced signal X (n) is calculated and output according to the equation (3) shown in the equation (3).
  • the decoded reproduced audio signal is divided into frames, and the frequency of the spectral parameter obtained for each frame is increased.
  • the HMM is used as an example when transforming spectral parameters into frequency-band extended parameters by calculating the filter coefficients (linear prediction coefficients) extended to the frequency band and the frequency band. Since the conventional method is not used, the amount of calculation can be reduced.
  • noise signal white noise
  • processing can be performed very easily with a small amount of information.
  • the reproduced audio signal is added to a signal obtained by converting the reproduced audio signal at a sampling frequency having a high frequency component as a sound source signal having an expanded frequency band by passing through a synthesis filter configured by filter coefficients having an expanded frequency band.
  • a synthesis filter configured by filter coefficients having an expanded frequency band.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

明 細 書 音声帯域拡張装置および音声帯域拡張方法 技術分野
本発明は音声帯域拡張装置に関し、特に低いビットレートで符号化された音声信 号の復号化後の再生周波数帯域を拡張し、聴感的な音質を改善する音声帯域拡張装 置に関する。
背景技術
従来、 音声帯域拡張方式として、 低ビットレートで符号化された音声信号を、 送 信側から帯域拡張に関する補助情報を伝送することなく、受信側で再生する周波数 帯域を拡張させる方式が知られている。 例えば、 P. J axおよび P. Va r y氏 らによる" Wi d e b and e x t en s i on o f t e l e phone s e e c h u s i ng h i dd e n ma r kov mod e l と題し 7こ 論文 (P r o c. I EEE Sp e e c h Cod i ng Wo r k s hop, p p. 133 - 135, 2000.) が知られている。
この従来方式は、広帯域音声のスぺクトル包絡やフィルタ係数の HMM (H i d d e n Ma r kov Mo d e 1 ) によるモデル化を行うため、予めオフライン で多量の音声データベースに基いて HMMモデルのパラメ一夕を決定しておく必 要があった。 また、受信側でリアルタイムに周波数帯域の拡張処理を行うためには、 HMMモデルによる検索に多くの演算量が必要であった。
上述した従来の音声帯域拡張装置は、 HMMモデルのパラメ一夕を決定するため には、多量の音声データベースを参照しなければならないという問題点が生ずる。 また、 受信側でリアルタイムに周波数帯域の拡張処理を行うためには、 HMMモデ ルによる検索に多くの演算量が必要になるという欠点がある。
本発明の目的は、送信側から補助情報を受信することなく、 比較的少ない演算量 で、周波数帯域の拡張された良好な音質の音声が得られる音声帯域拡張装置を提供 することにある。入力された再生音声信号をフレームに分割し、 フレーム毎に求め たスぺクトルパラメ一夕の周波数をシフトし、且つ帯域拡張した線形予測係数で合 成フィル夕を構成し、合成フィル夕を通した音源信号を用いて帯域拡張された音声 信号に再生することにより、 上記目的が達成される。
発明の開示
本発明の音声帯域拡張装置は、 復号化された再生音声信号を入力し、 スぺクトル 特性を表すスぺクトルパラメ一夕を計算するスぺクトルパラメ一夕計算回路と、前 記スぺクトルパラメ一夕の周波数を高い周波数にシフトしたのち周波数帯域の拡 張されたフィルタ係数を求める係数計算回路と、前記再生音声信号を入力し有声 Z 無声判別情報およびピッチ周期を出力する有声 Z無声判別回路と、前記有声 Z無声 判別情報に基づいてゲインを出力するゲイン調整回路と、前記ピッチ周期を入力し 過去の音源信号にもとづき適応コードベクトルを発生する適応コードブック回路 と、帯域制限された雑音信号を発生する雑音発生回路と、前記適応コードべクトル と前記雑音信号とを入力し少なくとも一方に適切なゲインを与えるゲイン回路と、 前記ゲイン回路の出力を加算して音源信号を出力する第 1の加算器と、前記音源信 号を前記フィル夕係数を用いて構成した合成フィル夕に通して周波数帯域の拡張 された音源信号を出力する合成フィルタ回路と、前記再生音声信号を入力し予め定 められた標本化周波数で変換した信号を出力する標本化周波数変換回路と、前記標 本化周波数変換回路の出力と前記合成フィル夕回路の出力とを加算して帯域拡張 された再生音声信号を出力する第 2の加算器と、より構成されることを特徴として いる。
また、 本発明の音声帯域拡張装置は、 復号化された再生音声信号を入力し、 スぺ クトル特性を表すスぺクトルパラメータを計算するスぺクトルパラメータ計算回 路と、前記スぺクトルパラメ一夕の周波数を高い周波数にシフトしたのち周波数帯 域の拡張されたフィルタ係数を求める係数計算回路と、前記再生音声信号を入力し 有声 無声判別情報を出力する有声/無声判別回路と、前記有声 Z無声判別情報に 基づいてゲインを出力するゲイン調整回路と、帯域制限された雑音信号を発生する 雑音発生回路と、前記雑音信号を入力し適切なゲインを与えた音源信号を出力する ゲイン回路と、前記音源信号を前記フィル夕係数を用いて構成した合成フィル夕に 通して周波数帯域の拡張された音源信号を出力する合成フィルタ回路と、前記再生 音声信号を入力し予め定められた標本化周波数で変換した信号を出力する標本化 周波数変換回路と、前記標本化周波数変換回路の出力と前記合成フィルタ回路の出 力とを加算して帯域拡張された再生音声信号を出力する加算器と、より構成される ことを特徴としている。
また、 前記スペクトルパラメ一夕計算回路は、前記再生音声信号をフレームに分 割した後、フレーム毎にスぺクトル特性を表す前記スぺクトルパラメ一夕を予め定 められた次数計算して出力することを特徴としている。
また、 前記係数計算回路は、 前記スぺクトルパラメ一夕の周波数を高い周波数に シフトさせたのち、 予め定められた次数のフィル夕係数 (線形予測係数) に変換し て出力することを特徴としている。
また、 適応コードブック回路は、 前記ピッチ周期を入力し、 フレーム毎に過去の 音源信号を基に適応コードブックにおける適応コードべクトルを出力することを 特徴としている。
また、 前記雑音発生回路は、 周波数帯域が制限され、 平均振幅が予め定められた レベルで正規化され、且つフレーム長に等しい時間長の雑音信号を出力することを 特徴としている。
また、本発明の音声帯域拡張方法は、復号化された再生音声信号の周波数帯域を 拡張する音声帯域拡張方法であつて、入力された再生音声信号をフレームに分割し、 フレーム毎に求めたスぺクトルパラメータの周波数を高い周波数にシフトさせた のち周波数帯域の拡張されたフィル夕係数 (線形予測係数) に変換し、 フレーム長 に等しい時間長の雑音信号と過去の音源信号にもとづく適応コードべクトルとを 加算した音源信号を前記フィル夕係数により構成された合成フィルタに通して周 波数帯域の拡張された音源信号とし、前記再生音声信号を周波数成分の高い標本化 周波数で変換した信号に前記拡張された音源信号を加算して、周波数帯域の拡張さ れた音声信号を再生することを特徴としている。
図面の簡単な説明
図 1は、本発明の音声帯域拡張装置の一つの実施の形態を示すプロック図である。 図 2は、本発明の音声帯域拡張装置の他の実施の形態を示すブロック図である。 図 3は、本発明の音声帯域拡張装置の他の実施の形態を示すブロック図である。 発明を実施するための最良の形態
次に、 本発明の実施の形態について図面を参照して説明する。 図 1は、 本発明の 音声帯域拡張装置の一つの実施の形態を示すブロック図である。
図 1に示す本実施の形態は、復号化された再生音声信号を入力し、スぺクトル特 性を表すスぺクトルパラメ一夕を計算するスぺクトルパラメ一夕計算回路 100 と、スぺクトルパラメ一夕の周波数を高い周波数にシフトしたのち周波数帯域の拡 張されたフィル夕係数を求める係数計算回路 130と、再生音声信号を入力し有声 ノ無声判別情報およびピッチ周期を出力する有声 無声判別回路 200と、有声 無声判別情報に基づいてゲインを出力するゲイン調整回路 210と、ピッチ周期を 入力し過去の音源信号にもとづき適応コードべクトルを発生する適応コードブッ ク回路 110と、帯域制限された雑音信号を発生する雑音発生回路 120と、適応 コードべクトルと雑音信号とを入力し少なくとも一方に適切なゲインを与えるゲ ィン回路 140と、ゲイン回路 140の出力を加算して音源信号を出力する加算器 160と、音源信号をフィルタ係数を用いて構成した合成フィルタに通して周波数 帯域の拡張された音源信号を出力する合成フィルタ回路 170と、再生音声信号を 入力して予め定められた標本化周波数で変換した信号を出力する標本化周波数変 換回路 180と、標本化周波数変換回路 180の出力と合成フィルタ回路 170の 出力とを加算して帯域拡張された再生信号を出力する加算器 190とより構成さ れている。
次に、本実施の形態の音声帯域拡張装置の動作について図 1を参照して詳細に説 明する。 以下の説明において、 周波数帯域の拡張は、 入力された再生音声信号の周 波数帯域を 4 kHzから 5 kHzあるいは 7 k H zに拡張することを想定してい る。
図 1を参照すると、 スぺクトルパラメータ計算回路 100は、復号化された再生 音声信号を入力し、 フレームに分割 (例えば 10ms) し、 この後、 フレーム毎に スぺクトル特性を表すスぺクトルパラメ一夕を予め定められた次数(例えば P= 1 0次) 計算して係数計算回路 130へ出力する。
ここで、 スぺクトルパラメ一夕の計算には、 周知の LP C (L i ne a r P r e d i c t i ve Cod i ng)分析や、 Bu r g分析などを用いることができ る。本実施の形態では、 Bu r g分析を用いることとする。 Bu r g分析の詳細に ついては、 中溝著による "信号解析とシステム同定" と題した単行本 (コロナ社 1 988年刊) の 82〜87頁等に記載されているので説明は省略する。
さらに、スぺクトルパラメ一夕計算回路 100は、 Bu r g法により計算された 線形予測係数 a i (i = l、 〜P) を量子化や補間に適した LSPパラメ一夕に変 換したものとして出力する。
ここで、線形予測係数から LSPパラメ一夕への変換については、菅村ほかによ る "線スペクトル対 (LSP) 音声分析合成方式による音声情報圧縮" と題した論 文 (電子通信学会論文誌、 J 64— A、 p . 599— 606、 1981年) を参 照することができる。
係数計算回路 130は、スぺクトルパラメータ計算回路 100から出力された L SPパラメ一夕を入力し、周波数帯域の拡張された信号の係数に変換して合成フィ ル夕回路 170へ出力する。 この変換には、 例えば、 LSPパラメータの周波数を 単純に高い周波数へシフトさせる手法、非線形変換手法、 または線形変換手法など の周知の方法を用いることができる。 尚、 ここでは LSPパラメータの全部または 一部を使用して、 LSPパラメータの周波数を高い周波数にシフトさせた上で、予 め定められた次数 Mの線形予測係数 (フィル夕係数) に変換する。
有声 無声判別回路 200は、復号化された再生音声信号を入力し、 フレーム毎 の信号が有声であるのか無声であるのかを判別する。以下、具体的な判別方法につ いて述べる。正規化自己相関関数 D (T) の最大値が予め定められたしきい値より 大きければ前記フレーム毎の信号は有声部分であり、小さければ無声部分であると 判別される。 再生音声信号 X (n) に対して、 予め定められた遅れ時間 mまでの正 規化自己相関関数 D (T) は以下に示す数式 (1) に従って計算される。 判別され た有声 無声判別情報はゲイン調整回路 210へ出力される。 また、有声部分のフ レーム毎の信号は、 正規化自己相関関数 D (T) を最大化する Tの値をピッチ周期 Tとして適応コードブック回路 1 10へ出力される。 尚、 前記数式 (1) において Nは正規化自己相関を計算するためのサンプル数である。 D(T) = [¾x(n)x(n - T)] /[ X2 (n - T)] ( i ) n=0 n=0
ゲイン調整回路 2 1 0は、有声/無声判別回路 2 0 0から有声 無声判別情報を 入力し、有声部分か無声部分かに応じて、適応コードブック信号のゲインと雑音信 号のゲインとをゲイン回路 1 4 0へ出力する。
適応コードブック回路 1 1 0は、有声/無声判別回路 2 0 0から適応コードブッ クのピッチ周期を入力し、適応コードべクトルを生成し出力する。適応コードブッ ク回路 1 1 0は、 過去の音源信号にもとづき適応コードブック成分も生成する。 雑音発生回路 1 2 0は、周波数帯域が制限された上で、平均振幅が予め定められ たレベルで正規化され、且つフレーム長に等しい時間長の雑音信号を発生し、ゲイ ン回路 1 4 0へ出力する。 ここで、 雑音信号としては、 一例として白色雑音を用い るが、 他の統計分布を有する雑音信号を使用することもできる。
ゲイン回路 1 4 0は、ゲイン調整回路 2 1 0から出力された適応コードブック信 号のゲインと雑音信号のゲインとを入力し、適応コードブック回路 1 1 0から出力 された適応コードべクトルおよび雑音発生回路 1 2 0から出力された雑音信号の 少なくとも一方に適切なゲインを乗じた後、それぞれの信号を加算器 1 6 0へ出力 する。
加算器 1 6 0は、ゲイン回路 1 4 0から出力された 2種類の信号を加算した音源 信号を合成フィル夕回路 1 7 0および適応コードブック回路 1 1 0へ出力する。 合成フィル夕回路 1 7 0は、係数計算回路 1 3 0から出力された次数 Mの線形予 測係数(フィル夕係数) を入力して合成フィルタから構成される。 合成フィルタ回 路 1 7 0は、加算器 1 6 0から出力された音源信号を入力して周波数帯域の拡張さ れた音源信号を出力する。
標本化周波数変換回路 1 8 0は、再生音声信号を入力し、予め定められた整数倍 の標本化周波数により変換された信号を出力する。変換によって生成された信号は、 周波数拡張前の成分を維持する。
加算器 1 9 0は、標本化周波数変換回路 1 8 0から出力された信号に、合成フィ ルタ回路 1 7 0から出力された音源信号を加算し、周波数帯域の拡張された再生音 声信号を形成して出力する。 本実施の形態によれば、入力された再生音声信号をフレームに分割し、 フレーム 毎に求めたスぺクトルパラメータ、あるいは L S Pパラメ一夕の周波数を高い周波 数にシフトさせたのち周波数帯域の拡張されたフィル夕係数(線形予測係数) に変 換し、 このフィルタ係数により構成された合成フィルタに、 フレーム長に等しい時 間長の雑音信号と過去の音源信号にもとづく適応コードべクトルとを加算した音 源信号を通して周波数帯域の拡張された音源信号とし、この拡張された音源信号を 入力された再生音声信号を周波数成分の高い標本化周波数で変換した信号に加算 することにより、周波数帯域の拡張された音声信号を再生することとしているので、 送信側から帯域拡張のための情報を受信する必要がなく、 また、従来手法のように HMMに基づく多量の演算を行う必要がなくなる。 さらに、音源情報として白色雑 音などを使用しているので、 きわめて容易に処理することができる。
次に、 本発明の他の実施の形態について説明する。 図 2は、 本発明の音声帯域拡 張装置の他の実施の形態を示すブロック図である。図 1と同一の番号を付した構成 要素は、 図 1と同一の動作をするので、 説明を省略する。
図 2において、ゲイン調整回路 3 1 0は、有声 無声判別回路 2 0 0から有声 Z 無声判別情報を入力し、有声部分か無声部分かに応じて、雑音信号のゲインを調整 する信号をゲイン回路 3 0 0へ出力する。
ゲイン回路 3 0 0は、ゲイン調整回路 3 1 0から出力された雑音信号のゲインを 入力し、雑音発生回路 1 2 0から出力された雑音信号にゲインを乗じた信号を合成 フィル夕回路 1 7 0へ出力する。
ここで、 図 1に示した適応コードブック回路 1 1 0は、音声信号の母音などに含 まれる周期的成分を発生させるために用いられている。そして、 この母音信号は、 一般に高い周波数まで延びていないと言われているので、音声帯域拡張装置では省 略することも可能である。 したがって、適応コードブック回路 1 1 0を取り外すこ とにより、 データ処理量を低減することができる。
次に、 本発明のさらに他の実施の形態について説明する。 図 3は、 本発明の音声 帯域拡張装置の他の実施の形態を示すブロック図である。
前記他の実施の形態に係る音声帯域拡張装置は、 図 3に示すように、デマルチプ レクサ 5 0 5と、 ゲイン復号回路 5 1 0と、 適応コードブック回路 5 2 0と、 音源 信号復元回路 5 4 0と、 スぺクトルパラメ一夕復号回路 5 7 0と、加算器 5 5 0と、 合成フィル夕回路 5 6 0と、 ゲインコードブック 3 8 0と、音源コードブック 3 5 1からなる音声復号器を前段に配置した構成としている。
ここで、 スぺクトルパラメ一夕復号回路 5 7 0は、 図 1に示すスぺクトルパラメ 一夕計算回路 1 0 0の動作を兼ね備える。 これにより、構成が簡略化されている。 また、 図 1と同一の番号を付した構成要素は、 同一の動作をするので、 ここでの説 明を省略する。
図 3において、 デマルチプレクサ 5 0 5は、 受信した信号から、 音声情報として の多重化されたゲインコードべクトルを示すィンデクス、適応コードブックの遅延 を示すインデクス、音源信号の情報、並びに音源コードべクトルのインデクスおよ びスぺクトルパラメ一夕のインデクスの各パラメータを分離して出力する。
ゲイン復号回路 5 1 0は、 ゲインコードべクトルを示すインデクスを入力し、 ゲ インコードブック 3 8 0からインデクスに応じてゲインコードべクトルを読み出 し、 読み出したゲインコードベクトルを出力する。
適応コードブック回路 5 2 0は、適応コードブックの遅延を示すィンデクスを入 力して適応コードべクトルを生成し、その適応コードべクトルにゲイン復号回路 5 1 0から出力されたゲインコードべクトルによる適応コードブックのゲインを乗 じた適応コードべクトルを出力する。 また、過去の駆動音源信号にもとづき適応コ 一ドブック成分が生成される。
音源信号復元回路 5 4 0は、デマルチプレクサ 5 0 5から受け取った音源コード ベクトルのインデクス、音源信号の情報および音源コードブック 3 5 1から読み出 した極性コードべクトルとを用いて音源パルスを生成し、その音源パルスを加算器 5 5 0へ出力する。
加算器 5 5 0は、適応コードブック回路 5 2 0から出力された適応コードべクト ルと音源信号復元回路 5 4 0から出力された音源パルスとを用いて、以下の数 2に 示す数式(2 )にもとづき駆動音源信号 V ( n )を生成し、その駆動音源信号 V ( n ) を適応コードブック回路 5 2 0と合成フィル夕回路 5 6 0へ出力する。 M
v(n) = yS't v(n - T) + G't 29'ik S(n - mj) ( 2 )
i=1
スぺクトルパラメ一タ復号回路 5 7 0は、スぺクトルパラメ一夕のインデクスを 入力してスぺクトルパラメ一夕を復号し、線形予測係数に変換して合成フィル夕回 路 5 6 0および係数計算回路 1 3 0へ出力する。
合成フィルタ回路 5 6 0は、スぺクトルパラメ一夕復号回路 5 7 0から出力され た線形予測係数 a iと加算器 5 5 0から出力された駆動音源信号 V ( n ) とを入力 し、 以下の数 3に示す数式 (3 ) に従い再生信号 X ( n ) を計算し出力する。
10
x(n) = v(n) - ^ ajX(n - j) ( 3 )
i=1
産業上の利用可能性
以上説明したように、本発明の音声帯域拡張装置及び音声帯域拡張方法によれば、 復号化された再生音声信号をフレームに分割し、フレーム毎に求めたスぺクトルパ ラメ一夕の周波数を高い周波数にシフトし、且つ周波数帯域の拡張されたフィル夕 係数 (線形予測係数) を求めることにより、 スペクトルパラメ一夕を周波数帯域の 拡張されたパラメ一夕に変換する際に、 HMMを例とする従来手法を用いることが ないので、 演算量を少なくすることができる。
また、 フレーム長に等しい時間長の雑音信号 (白色雑音) と過去の音源信号にも とづく適応コードベクトルとを加算した音源信号に用いることにより、少ない情報 量できわめて容易に処理することができる。
また、周波数帯域の拡張されたフィルタ係数により構成された合成フィルタに通 すことで周波数帯域の拡張された音源信号として、再生音声信号を周波数成分の高 い標本化周波数で変換した信号に加算することにより、周波数帯域の拡張された音 声信号を再生することとしているので、送信側から帯域拡張化処理を行うために必 要な情報を受信することなく、 聴感的な音質を改善することができる。

Claims

請求の範囲
1 . 復号化された再生音声信号を入力し、 スペクトル特性を表すスペクトルパラ メータを計算するスぺクトルパラメータ計算回路と、
前記スぺクトルパラメ一夕の周波数を高い周波数にシフトしたのち周波数帯域 の拡張されたフィル夕係数を求める係数計算回路と、
前記再生音声信号を入力し有声/無声判別情報およびピッチ周期を出力する有 声 無声判別回路と、
前記有声ノ無声判別情報に基づいてゲインを出力するゲイン調整回路と、 前記ピッチ周期を入力し過去の音源信号にもとづき適応コードべクトルを発生 する適応コードブック回路と、
帯域制限された雑音信号を発生する雑音発生回路と、
前記適応コードべクトルと前記雑音信号とを入力し少なくとも一方に適切なゲ インを与えるゲイン回路と、
前記ゲイン回路の出力を加算して音源信号を出力する第 1の加算器と、前記音源 信号を前記フィルタ係数を用いて構成した合成フィル夕に通して周波数帯域の拡 張された音源信号を出力する合成フィルタ回路と、
前記再生音声信号を入力し予め定められた標本化周波数で変換した信号を出力 する標本化周波数変換回路と、前記標本化周波数変換回路の出力と前記合成フィル 夕回路の出力とを加算して帯域拡張された再生音声信号を出力する第 2の加算器 と、 から構成されることを特徴とする音声帯域拡張装置。
2 . 復号化された再生音声信号を入力し、 スぺクトル特性を表すスぺクトルパラ メータを計算するスぺクトルパラメータ計算回路と、
前記スぺクトルパラメータの周波数を高い周波数にシフトしたのち周波数帯域 の拡張されたフィルタ係数を求める係数計算回路と、
前記再生音声信号を入力し有声 無声判別情報を出力する有声/無声判別回路 と、
前記有声 無声判別情報に基づいてゲインを出力するゲイン調整回路と、 帯域制限された雑音信号を発生する雑音発生回路と、 前記雑音信号を入力し適切なゲインを与えた音源信号を出力するゲイン回路と、 前記音源信号を前記フィルタ係数を用いて構成した合成フィルタに通して周波 数帯域の拡張された音源信号を出力する合成フィルタ回路と、
前記再生音声信号を入力し予め定められた標本化周波数で変換した信号を出力 する標本化周波数変換回路と、
前記標本化周波数変換回路の出力と前記合成フィルタ回路の出力とを加算して 帯域拡張された再生音声信号を出力する加算器と、から構成されることを特徴とす る音声帯域拡張装置。
3 . 前記スペクトルパラメータ計算回路は、 前記再生音声信号をフレームに分割 した後、フレーム毎にスぺクトル特性を表す前記スぺクトルパラメ一夕を予め定め られた次数計算して出力することを特徴とする請求の範囲第 1項又は第 2項に記 載の音声帯域拡張装置。
4 . 前記係数計算回路は、 前記スペクトルパラメ一夕の周波数を高い周波数にシ フトさせたのち、 予め定められた次数のフィル夕係数 (線形予測係数) に変換して 出力することを特徴とする請求の範囲第 1項、第 2項又は第 3項に記載の音声帯域
5 . 適応コードブック回路は、 前記ピッチ周期を入力し、 フレーム毎に過去の音 源信号を基に適応コードブックにおける適応コードべクトルを出力することを特 徴とする請求の範囲第 1項、 第 3項又は第 4項に記載の音声帯域拡張装置。
6 . 前記雑音発生回路は、 周波数帯域が制限され、 平均振幅が予め定められたレ ベルで正規化され、且つフレーム長に等しい時間長の雑音信号を出力することを特 徴とする請求の範囲第 1項、 第 2項、 第 3項、 第 4項又は第 5項に記載の音声帯域
7 .復号化された再生音声信号の周波数帯域を拡張する音声帯域拡張方法であつ て、
入力された再生音声信号をフレームに分割し、
フレーム毎に求めたスぺクトルパラメータの周波数を高い周波数にシフトさせ たのち周波数帯域の拡張されたフィルタ係数 (線形予測係数) に変換し、
フレーム長に等しい時間長の雑音信号と過去の音源信号にもとづく適応コード べクトルとを加算した音源信号を前記フィル夕係数により構成された合成フィル 夕に通して周波数帯域の拡張された音源信号とし、
前記再生音声信号を周波数成分の高い標本化周波数で変換した信号に前記拡張 された音源信号を加算して、周波数帯域の拡張された音声信号を再生することを特 徴とする音声帯域拡張方法。
PCT/JP2002/007605 2001-07-26 2002-07-26 Speech bandwidth extension apparatus and speech bandwidth extension method WO2003010752A1 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US10/484,936 US20040243402A1 (en) 2001-07-26 2002-07-26 Speech bandwidth extension apparatus and speech bandwidth extension method
KR1020047000794A KR100615480B1 (ko) 2001-07-26 2002-07-26 음성 대역 확장 장치 및 음성 대역 확장 방법
CA002455059A CA2455059A1 (en) 2001-07-26 2002-07-26 Speech bandwidth extension apparatus and speech bandwidth extension method
EP02751723A EP1420389A4 (en) 2001-07-26 2002-07-26 LANGUAGE BANDWIDTH EXPANSION DEVICE AND METHOD
HK05102460A HK1069247A1 (en) 2001-07-26 2005-03-22 Speech bandwidth extension apparatus and speech bandwidth extension method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001-226751 2001-07-26
JP2001226751A JP2003044098A (ja) 2001-07-26 2001-07-26 音声帯域拡張装置及び音声帯域拡張方法

Publications (1)

Publication Number Publication Date
WO2003010752A1 true WO2003010752A1 (en) 2003-02-06

Family

ID=19059514

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/007605 WO2003010752A1 (en) 2001-07-26 2002-07-26 Speech bandwidth extension apparatus and speech bandwidth extension method

Country Status (8)

Country Link
US (1) US20040243402A1 (ja)
EP (1) EP1420389A4 (ja)
JP (1) JP2003044098A (ja)
KR (1) KR100615480B1 (ja)
CN (1) CN1270292C (ja)
CA (1) CA2455059A1 (ja)
HK (1) HK1069247A1 (ja)
WO (1) WO2003010752A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
CN105761724A (zh) * 2012-03-01 2016-07-13 华为技术有限公司 一种语音频信号处理方法和装置
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4433668B2 (ja) 2002-10-31 2010-03-17 日本電気株式会社 帯域拡張装置及び方法
CN101800049B (zh) * 2003-09-16 2012-05-23 松下电器产业株式会社 编码装置和译码装置
ATE429698T1 (de) * 2004-09-17 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten tonsignalen
US7930176B2 (en) * 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
JP5055759B2 (ja) * 2005-12-16 2012-10-24 沖電気工業株式会社 帯域変換信号生成器及び帯域拡張装置
WO2007087824A1 (de) * 2006-01-31 2007-08-09 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und anordnungen zur audiosignalkodierung
KR100905585B1 (ko) * 2007-03-02 2009-07-02 삼성전자주식회사 음성신호의 대역폭 확장 제어 방법 및 장치
US9177569B2 (en) * 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
JP2009180972A (ja) * 2008-01-31 2009-08-13 Panasonic Corp オーディオレジューム再生装置及びオーディオレジューム再生方法
EP2169670B1 (en) * 2008-09-25 2016-07-20 LG Electronics Inc. An apparatus for processing an audio signal and method thereof
CN101436407B (zh) * 2008-12-22 2011-08-24 西安电子科技大学 音频编解码方法
JP5493655B2 (ja) * 2009-09-29 2014-05-14 沖電気工業株式会社 音声帯域拡張装置および音声帯域拡張プログラム
US8484020B2 (en) * 2009-10-23 2013-07-09 Qualcomm Incorporated Determining an upperband signal from a narrowband signal
CA2800208C (en) * 2010-05-25 2016-05-17 Nokia Corporation A bandwidth extender
US9313334B2 (en) 2010-06-17 2016-04-12 Telefonaktiebolaget Lm Ericsson (Publ) Bandwidth extension in a multipoint conference unit
JP5596618B2 (ja) * 2011-05-17 2014-09-24 日本電信電話株式会社 擬似広帯域音声信号生成装置、擬似広帯域音声信号生成方法、及びそのプログラム
CN103988090A (zh) * 2011-11-24 2014-08-13 丰田自动车株式会社 声源检测装置
CN103295578B (zh) 2012-03-01 2016-05-18 华为技术有限公司 一种语音频信号处理方法和装置
US9258428B2 (en) 2012-12-18 2016-02-09 Cisco Technology, Inc. Audio bandwidth extension for conferencing
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
CN104217727B (zh) * 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
KR101701623B1 (ko) * 2015-07-09 2017-02-13 라인 가부시키가이샤 VoIP 통화음성 대역폭 감소를 은닉하는 시스템 및 방법
CN107924686B (zh) * 2015-09-16 2022-07-26 株式会社东芝 语音处理装置、语音处理方法以及存储介质
CN105513590A (zh) * 2015-11-23 2016-04-20 百度在线网络技术(北京)有限公司 语音识别的方法和装置
KR20240079548A (ko) 2022-11-29 2024-06-05 주식회사 포스코 마찰유동접합장치, 마찰유동접합방법, 및 마찰유동접합체

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09120297A (ja) * 1995-06-07 1997-05-06 At & T Ipm Corp フレーム消失の間のコードブック利得減衰
JPH09120298A (ja) * 1995-06-07 1997-05-06 At & T Ipm Corp フレーム消失の間の音声復号に使用する音声の有声/無声分類
JPH09190197A (ja) * 1995-06-07 1997-07-22 At & T Ipm Corp フレーム消失の間のピッチ遅れ修正方法
JPH1049200A (ja) * 1996-08-08 1998-02-20 Fujitsu Ltd 音声情報圧縮蓄積方法及び装置
JPH10107641A (ja) * 1996-09-26 1998-04-24 Toshiba Corp 聴覚特性を利用した音声符号化方法、ゲイン制御方法およびゲイン符号化/復号化方法
JPH10143199A (ja) * 1996-11-15 1998-05-29 Nippon Telegr & Teleph Corp <Ntt> 音声符号化方法および復号化方法
WO2000025305A1 (en) * 1998-10-27 2000-05-04 Voiceage Corporation High frequency content recovering method and device for over-sampled synthesized wideband signal

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2225321T3 (es) * 1991-06-11 2005-03-16 Qualcomm Incorporated Aparaato y procedimiento para el enmascaramiento de errores en tramas de datos.
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
JP3684751B2 (ja) * 1997-03-28 2005-08-17 ソニー株式会社 信号符号化方法及び装置
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6993480B1 (en) * 1998-11-03 2006-01-31 Srs Labs, Inc. Voice intelligibility enhancement system
KR20010101422A (ko) * 1999-11-10 2001-11-14 요트.게.아. 롤페즈 매핑 매트릭스에 의한 광대역 음성 합성
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09120297A (ja) * 1995-06-07 1997-05-06 At & T Ipm Corp フレーム消失の間のコードブック利得減衰
JPH09120298A (ja) * 1995-06-07 1997-05-06 At & T Ipm Corp フレーム消失の間の音声復号に使用する音声の有声/無声分類
JPH09190197A (ja) * 1995-06-07 1997-07-22 At & T Ipm Corp フレーム消失の間のピッチ遅れ修正方法
JPH1049200A (ja) * 1996-08-08 1998-02-20 Fujitsu Ltd 音声情報圧縮蓄積方法及び装置
JPH10107641A (ja) * 1996-09-26 1998-04-24 Toshiba Corp 聴覚特性を利用した音声符号化方法、ゲイン制御方法およびゲイン符号化/復号化方法
JPH10143199A (ja) * 1996-11-15 1998-05-29 Nippon Telegr & Teleph Corp <Ntt> 音声符号化方法および復号化方法
WO2000025305A1 (en) * 1998-10-27 2000-05-04 Voiceage Corporation High frequency content recovering method and device for over-sampled synthesized wideband signal

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1420389A4 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
USRE49801E1 (en) 2008-07-11 2024-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
CN105761724A (zh) * 2012-03-01 2016-07-13 华为技术有限公司 一种语音频信号处理方法和装置
CN105761724B (zh) * 2012-03-01 2021-02-09 华为技术有限公司 一种语音频信号处理方法和装置

Also Published As

Publication number Publication date
JP2003044098A (ja) 2003-02-14
CN1535459A (zh) 2004-10-06
US20040243402A1 (en) 2004-12-02
EP1420389A4 (en) 2005-11-02
EP1420389A1 (en) 2004-05-19
KR100615480B1 (ko) 2006-08-25
KR20040028932A (ko) 2004-04-03
CA2455059A1 (en) 2003-02-06
HK1069247A1 (en) 2005-05-13
CN1270292C (zh) 2006-08-16

Similar Documents

Publication Publication Date Title
WO2003010752A1 (en) Speech bandwidth extension apparatus and speech bandwidth extension method
JP4132109B2 (ja) 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
JPH10124089A (ja) 音声信号処理装置及び方法、並びに、音声帯域幅拡張装置及び方法
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP2615548B2 (ja) 高能率音声符号化方式とその装置
US7486719B2 (en) Transcoder and code conversion method
JP4433668B2 (ja) 帯域拡張装置及び方法
JP3050978B2 (ja) 音声符号化方法
JP3268750B2 (ja) 音声合成方法及びシステム
JPH0258100A (ja) 音声符号化復号化方法及び音声符号化装置並びに音声復号化装置
JP4826580B2 (ja) 音声信号の再生方法及び装置
JP3515216B2 (ja) 音声符号化装置
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3006790B2 (ja) 音声符号化復号化方法及びその装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3515215B2 (ja) 音声符号化装置
JPS58188000A (ja) 音声認識合成装置
JP2000099094A (ja) 時系列信号処理装置
JPH09258796A (ja) 音声合成方法
JPH043878B2 (ja)
JPH11184499A (ja) 音声符号化方法および音声符号化方法
JPH10105200A (ja) 音声符号化/復号化方法
JPS62207036A (ja) 音声符号化方式とその装置
JP2000200097A (ja) 音声符号化装置、音声復号化装置及び音声符号化復号化装置

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU BR CA CN KR NO SG

Kind code of ref document: A1

Designated state(s): AU BR CA CN KR NO SG US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT DE DK ES FI FR GB IT NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 1020047000794

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 20028147456

Country of ref document: CN

WWE Wipo information: entry into national phase

Ref document number: 2002751723

Country of ref document: EP

Ref document number: 2455059

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2002355319

Country of ref document: AU

WWP Wipo information: published in national office

Ref document number: 2002751723

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10484936

Country of ref document: US

点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载