JP2004246824A - Voice document search method and apparatus, and voice document search program - Google Patents
Voice document search method and apparatus, and voice document search program Download PDFInfo
- Publication number
- JP2004246824A JP2004246824A JP2003038781A JP2003038781A JP2004246824A JP 2004246824 A JP2004246824 A JP 2004246824A JP 2003038781 A JP2003038781 A JP 2003038781A JP 2003038781 A JP2003038781 A JP 2003038781A JP 2004246824 A JP2004246824 A JP 2004246824A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- document
- extended
- word
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【課題】音声認識の誤りの検索精度に対する影響を低減し、かつ、当該音声ドキュメントにおける話題に関連したキーによる検索をも可能にする音声ドキュメントに対する記述を生成する。
【解決手段】本発明は、入力された音声ドキュメントに対して音声認識処理を施し、文字化された音声認識結果を認識信頼度と共に取得し、拡張キー単語抽出条件と音声認識結果を照合して拡張キー単語を抽出し、抽出された拡張キー単語と拡張単語抽出条件を照合し、その結果得られた条件に基づいて外部データベースを検索し、拡張単語を抽出し、拡張単語と音声認識結果に拡張単語を埋め込むことにより、音声ドキュメントを生成する。
【選択図】 図1A description is provided for a speech document that reduces the effect of speech recognition errors on search accuracy and that also enables a search using a key related to a topic in the speech document.
The present invention performs a voice recognition process on an input voice document, obtains a transcribed voice recognition result together with a recognition reliability, and compares an expanded key word extraction condition with the voice recognition result. The extended key words are extracted, the extracted extended key words are compared with the extended word extraction conditions, an external database is searched based on the obtained conditions, the extended words are extracted, and the extended words and the speech recognition results are extracted. A speech document is generated by embedding the expanded words.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、音声ドキュメント検索方法及び装置及び音声ドキュメント検索プログラムに係り、特に、録画・録音された音声コンテンツに対して音声認識を適用することにより文字化を行い、その内容を言語によるキーにより検索する音声ドキュメント検索方法及び装置及び音声ドキュメント検索プログラムに関する。
【0002】
【従来の技術】
音声コンテンツに対して音声認識を適用することにより文字化を行い、その内容を言語によるキーによる検索を可能とするための検索システムの研究開発が行われている(例えば、非特許文献1参照)。音声認識の適用においては、認識誤りが発生することが避けられないため、認識誤りの影響を抑えるための工夫が必要となる。自動的にこれを行う方法として、認識対象の音声コンテンツとは異なる外部データベースを参照することにより、音声コンテンツを拡張する方法が提案されている(例えば、非特許文献2参照)。
【0003】
一方、音声認識の研究開発においては、音声認識システム自身がその出力である音声認識結果に信頼度を付与する試みがなされている(例えば、非特許文献3参照)。
【0004】
【非特許文献1】
「マルチメディア情報の解析と統合」有木康雄、人工知能学会情報統合研究会,SIG−CII−2000−Nov, 2000.
【0005】
【非特許文献2】
”Document Expansion for Speech Retrieval”, Amit Singhal, Fernando Pereira, Proceedings of ACM SIGIR, pages 34−41, Berkeley, CA, USA, August 1999.
【0006】
【非特許文献3】
「音声認識精度向上のための信頼度尺度の比較」緒方淳、有木康雄、電子情報通信学会技術研究報告(音声研究会SP2000−94)、pp.113−118(2000年12月)
【0007】
【発明が解決しようとする課題】
しかしながら、上記従来の外部データベースを参照して、音声コンテンツを拡張する方法においては、音声認識結果の全体そのものを質問要求と見做して、類似文書検索の手法による関連する外部データベースを検索し、上位にランクされた音声ドキュメントから拡張単語を抽出している。即ち、この手法においては、音声認識結果に含まれる単語を同一のものとして扱っており、認識の精度についての考慮は行われていない。
【0008】
従って、場合によっては、誤った認識である可能性の高い部分をキーとした外部データベースの検索が行われる可能性があり、結果として抽出される拡張単語には、検索対象とした音声コンテンツと関連性の少ないものが含まれる可能性が高くなる。
【0009】
本発明は、上記の点に鑑みなされたもので、音声認識の誤りの検索精度に対する影響を低減し、かつ、当該音声コンテンツにおける話題に関連したキーによる検索をも可能にする音声コンテンツに対するコンテンツの内容記述ドキュメントを生成する音声ドキュメント検索方法及び装置及び音声ドキュメント検索プログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
図1は、本発明の原理を説明するための図である。
【0011】
本発明は、録画・録音された音声トラックを含む音声コンテンツを言語によるキーにより検索する音声ドキュメント検索方法において、
検索対象となる前記音声コンテンツを記憶媒体にから読み出して音声ドキュメント検索装置に入力し(ステップ1)、
音声ドキュメント検索装置において、
入力された音声コンテンツに対して音声認識処理を施し、文字化された音声認識結果を認識信頼度と共に取得し(ステップ2)、
予め記憶媒体に記憶されている拡張キー単語抽出条件と音声認識結果とを照合することにより、音声認識結果を拡張するための検索におけるキーとなる拡張キー単語を抽出し(ステップ3)、
抽出された拡張キー単語と予め記憶手段に記憶されている拡張単語抽出条件とを照合し、その結果得られた条件に基づいて、関連文書を蓄積する外部データベースを検索することにより得られた関連文書集合から音声認識結果を拡張するための拡張単語を取得し(ステップ4)、
拡張単語と音声認識結果に拡張単語を埋め込むことにより、検索対象の音声コンテンツの音声内容記述ドキュメントファイルを生成し(ステップ5)、
音声内容記述ドキュメントファイルを出力する(ステップ6)。
【0012】
図2は、本発明の原理構成図である。
【0013】
本発明は、録画・録音された音声トラックを含む音声コンテンツを言語によるキーにより検索する音声ドキュメント検索装置100であって、
音声ドキュメント検索装置100の外部に設けられ、関連文書を格納する外部データベース1000を検索する関連情報検索手段600と、
検索対象となる音声コンテンツを入力する入力手段200と、
入力手段200で入力された音声コンテンツに対して音声認識処理を適用することにより文字化された音声認識結果を認識信頼度と共に得る音声認識手段300と、
予め定められた拡張キー単語抽出条件に従って、音声認識結果を拡張するための検索におけるキーとなる拡張キー単語を抽出する拡張キー単語抽出手段400と、
抽出された拡張キー単語を用いて予め定められた拡張単語抽出条件に従って、関連情報検索手段600により外部データベース1000を検索して得られた関連文書集合から、音声認識結果を拡張する単語である拡張単語を取得する拡張単語抽出手段500と、
音声認識結果に拡張単語を埋め込み、検索対象となる音声コンテンツの音声内容を記述することにより、音声内容記述ドキュメントファイルを生成する音声ドキュメント記述生成手段700と、
生成された音声内容記述ドキュメントファイルを出力する出力手段800と、を有する。
【0014】
本発明は、録画・録音された音声トラックを含む音声コンテンツを言語によるキーにより検索する音声ドキュメント検索プログラムであって、
検索対象となる音声コンテンツを入力する入力ステップと、
入力ステップで入力された音声コンテンツに対して音声認識処理を適用することにより文字化された音声認識結果を認識信頼度と共に得る音声認識ステップと、
予め定められた拡張キー単語抽出条件に従って、音声認識結果を拡張するための検索におけるキーとなる拡張キー単語を抽出する拡張キー単語抽出ステップと、
抽出された拡張キー単語を用いて予め定められた拡張単語抽出条件を、音声ドキュメント検索装置の外部に設けられ、関連文書を蓄積する外部データベースを検索する関連情報検索手段に渡すことにより得られた関連文書集合から、音声認識結果を拡張する単語である拡張単語を取得する拡張単語抽出ステップと、
音声認識結果に拡張単語を埋め込み、検索対象の音声コンテンツの内容を記述することにより音声内容記述ドキュメントファイルを生成する音声ドキュメント記述生成ステップと、
生成された音声内容記述ドキュメントファイルを出力する出力ステップと、をコンピュータの制御手段に実行させる。
【0015】
上記のように、本発明では、音声認識装置が自らの認識結果に対して出力する信頼度を利用して、精度よく認識されたと判定される部分から外部データベース検索のキーとなる語を抽出することを可能とし、質の良い拡張単語を外部データから得ることが可能となる。
【0016】
【発明の実施の形態】
以下、図面と共に本発明の実施の形態を説明する。
【0017】
図3は、本発明の一実施の形態における音声ドキュメント検索装置の構成を示す。
【0018】
同図に示す音声ドキュメント検索システム100は、入力部200、音声認識部300、拡張キー単語抽出部400、拡張キー単語抽出条件テーブル410、拡張単語抽出部500、拡張単語抽出条件テーブル510、関連情報検索部600、音声ドキュメント記述生成部700、出力部800から構成される。
【0019】
なお、当該音声ドキュメント検索装置100の外部に外部データベース1000が設けられているものとする。
【0020】
また、上記の拡張キー単語抽出条件テーブル410、拡張単語抽出条件テーブル510は、ハードディスク等の記憶手段に格納されているものとする。
【0021】
入力部200は、検索対象となる録画・録音された音声トラックを含む音声コンテンツを入力する。入力される音声コンテンツは、ディジタル信号で表現され、ハードディスク等の記憶媒体に格納されているものとし、入力部200では、ハードディスク等から当該音声コンテンツを読み出して入力するものとする。
【0022】
音声認識部300は、入力部200でから入力された音声コンテンツに対して、既存の音声認識装置による音声認識処理を適用して文字化(例えば、XML言語)された音声認識結果に音声信頼度を付与して出力する。なお、音声信頼度に関しては、既存の方法を用いるものとする。例えば、「音声認識精度向上のための信頼度尺度の比較」緒方淳、有木康雄、電子情報通信学会技術研究報告(音声研究会SP2000−94)、pp.113−118(2000年12月)を参照されたい。
【0023】
拡張キー単語抽出条件テーブル410は、拡張キー単語抽出部400によって参照されるテーブルであり、品詞と認識信頼度に関する条件が設定される。
【0024】
拡張キー単語抽出部400は、拡張キー単語抽出条件テーブル410に格納されている予め定められた拡張キー単語抽出条件に従って、音声認識部300から出力された音声認識結果を拡張するための検索におけるキーとなる単語を抽出する。
【0025】
拡張単語抽出条件テーブル510には、拡張単語抽出部500によって参照されるテーブルであり、拡張単語抽出条件として外部データベース識別子、日付制約条件、最大抽出対象文書数、最大抽出単語数が設定される。
【0026】
拡張単語抽出部500は、拡張キー単語抽出部400において抽出された拡張キー単語を用いて、拡張単語抽出条件テーブル510に格納されている予め定められた拡張単語抽出条件に従って関連情報検索部600に対して、外部データベース1000を検索することを指示し、関連情報検索部600から取得した音声認識結果を拡張する単語である拡張単語を取得する。このとき、拡張単語抽出部500は、関連情報検索部600に対して、単語集合と外部データベース1000の識別子、文書日付の制約、最大文書数等を含む指示を与えるものとする。
【0027】
関連情報検索部600は、拡張単語抽出部500からの指示により外部データベース1000を検索する検索エンジンである。
【0028】
音声ドキュメント記述生成部700は、音声認識部300から取得した音声認識結果と、拡張単語抽出部500から取得した拡張単語から、検索対象の音声コンテンツの内容を記述する音声ドキュメント記述ファイル900を生成する。
【0029】
出力部800は、音声ドキュメント記述生成部700において生成された音声ドキュメント記述ファイル900を読み込んで、当該音声ドキュメント検索装置100に後続するシステムに出力する。
【0030】
なお、上記の音声ドキュメント記述生成部700において、音声ドキュメント記述ファイル900を生成する代わりに、生成された音声ドキュメントを出力部800に出力し、出力部800は、この音声ドキュメントを表示手段に表示するようにしてもよい。
【0031】
次に、上記の構成における動作を説明する。なお、本発明では、録画・録音されたディジタル形式の音声コンテンツを検索し、検索されたコンテンツ記述などをXML、HTMLなどのスクリプト言語形式で取得して、コンテンツに含まれるテキスト情報を表示可能にするものとする。
【0032】
図4は、本発明の一実施の形態における音声ドキュメント検索処理のフローチャートである。
【0033】
ステップ101) 入力部200において、検索対象の音声コンテンツデータを入力する。
【0034】
ステップ102) 音声認識部300において、入力された音声コンテンツデータを音声認識し、音声認識結果を信頼度とからなる音声ドキュメントを拡張キー単語抽出部400に出力する。
【0035】
ステップ103) 拡張キー単語抽出部400が、取得した音声コンテンツの音声認識結果と拡張キー単語抽出条件テーブル410の拡張キー単語抽出条件とを照合し、当該条件と合致する単語集合を拡張キー単語として抽出し、拡張単語抽出部500に出力する。
【0036】
ステップ104) 拡張単語抽出部500において、拡張キー単語抽出部400から取得した単語集合に基づいて、拡張単語抽出条件テーブル510を検索し、当該拡張単語抽出条件テーブル510に指定されている外部データベース100の識別子、文書の日付に対する制約、最大文書数を取得し、これらを関連情報検索部600に渡すことで、外部データベース1000の検索を指示する。
【0037】
ステップ105) 関連情報検索部600は拡張単語抽出部500から渡された指示の外部データベース100の識別子、文書の日付に対する制約、最大文書数に基づいて、外部データベース1000を検索し、条件に適合する関連文書集合を取得し、拡張単語抽出部500に返却する。
【0038】
ステップ106) 拡張単語抽出部500は取得した関連文書集合から指定された最大抽出単語数の拡張単語を抽出し、音声ドキュメント記述生成部700に出力する。
【0039】
ステップ107) 音声ドキュメント記述生成部700は、音声認識部300から得られた音声認識結果に、拡張単語抽出部500で抽出された拡張単語を埋め込んで、音声ドキュンメント内容記述データを生成し、音声ドキュメント記述ファイル900に書き込む。または、ファイルを生成せずに生成した音声ドキュメント記述データを出力部800に出力するようにしてもよい。
【0040】
ステップ108) 出力部800では、音声ドキュメント記述ファイル900を読み込んで、当該システムに後続するシステムに対して出力する。または、音声ドキュメント記述生成部700から取得した音声ドキュメントをディスプレイ装置等の表示手段に出力してもよい。
【0041】
【実施例】
以下、図面と共に本発明の実施例を説明する。
【0042】
以下、具体例を用いて、本発明の音声ドキュメント検索システムの動作を説明する。
【0043】
なお、以下の例では、外部データベース1000は、検索サイト等に設けられているデータベースであるものとする。
【0044】
図5は、本発明の一実施例における音声認識部により文字化された音声ドキュメントの一部を示す。同図に示す音声ドキュメントは、入力部200から入力され、音声認識部300により音声認識され、文字化されたものである。
【0045】
ここで実際の発声は、
『昨夜からの寒波の訪れで、北海道は大雪となり、新千歳空港発の便など交通機関が大幅に乱れました』
であったとするが、音声認識の誤りのために、
『咲く世からの寒波の訪れで北海道は大雪となら新地都政空港発の便など交通機関が大ハブに乱れまして』
のように文字化されたものである。
【0046】
図5の音声認識部300の出力は、XML言語によって構造化されている。即ち、音声ドキュメントdocは、発声単位であるphraseの集合として表現される。各発話単位は、そこに含まれる単語wordの集合として表現される。各発話単位、及び、そこに含まれる各単語に対しては、その開始時刻と終了時刻がそれぞれbegin,endという属性を用いて記録される。さらに、各単語に対しては、音声認識により文字化された単語表記が、XML要素の内容部分に記録されるだけでなく、概単語の品詞情報と音声認識の信頼度がそれぞれpos,confという属性を用いて記録される。なお、図5に例示した音声認識結果は、本発明の説明に必要な概念を例示するためのものであり、XMLのタグ構造を含めて、このデータ形式に限る必要はない。また、音声認識部300としては、このような情報を出力可能な任意の音声認識装置を適用することが可能である。
【0047】
図6は、本発明の一実施例の拡張キー単語抽出条件テーブルのエントリ例を示す。同図に示す拡張キー単語抽出条件テーブル410は、予め設定する拡張キー単語抽出条件を格納する。
【0048】
同図に示す例には、品詞と認識信頼度に関する三通りの条件が設定されている。同図の例のように、音声認識の信頼度を考慮することにより、正しく認識されている可能性の高い単語を抽出する。また、名詞や動詞などの品詞を有する単語を抽出することにより、拡張単語抽出部500、関連情報検索部600によって、関連する文書を外部データベース700から検索する際に、キーワードとなり得る単語を抽出する。なお、これらの条件は、音声認識部300に適用する音声認識装置に応じて経験的に設定する。
【0049】
拡張キー単語抽出部400は、図5に示すような音声認識結果を図6に示すような拡張キー単語抽出条件と照合し、拡張キー単語を抽出する。図5、図6の例に対しては、以下に示す5つの拡張キー単語(カッコ内は品詞と認識信頼度)が抽出される。
【0050】
『寒波(名詞,250),訪れ(名詞,250),北海道(固有名詞,150),交通機関(名詞,250),乱れ(動詞,300)』
上記のように抽出された拡張キー単語は、拡張単語抽出部500へと転送される。
【0051】
図7は、本発明の一実施例の拡張単語抽出テーブルのエントリ例を示す。同図に示す拡張単語抽出テーブル510は、予め設定する拡張単語抽出条件を格納する。同図に示すように、拡張単語抽出条件は、4つのエントリからなる。第1のエントリは、関連情報検索部600が検索対象とすべき外部データベース700の識別子である。図7の例では、インターネット上に存在するニュース検索サイト(foo−news.com) が指定されている。第2のエントリは、検索対象とする文書の日付に対する制約である。同図の例では、「2003年1月2日から2003年1月4日」の日付を有する文書のみを拡張単語抽出の対象とすることが指定されている。第3のエントリは、拡張単語を抽出する対象となる文書の最大数を指定する。通常のインターネットのサイト検索やデータベース検索においては、検索要求に対する適合度順に複数の文書が返却されるため、この上位から指定された数の文書を拡張単語抽出の対象とする。同図の例では、上位2件の文書のみを拡張単語の対象とすることが指定されている。第4のエントリは、実際に抽出する拡張単語の最大数を指定する。同図の例では、最大5つの拡張単語を抽出することが指定されている。
【0052】
拡張単語抽出部500から関連情報検索部600へは、拡張キー単語抽出部400から転送されてきた単語集合と、拡張単語抽出条件テーブル510に指定されている外部データベース700の識別子、文書の日付に対する制約、及び最大文書数が転送される。
【0053】
関連情報検索部600は、転送されてきた情報に基づいて外部データベース700から関連文書の検索を行う。ここで、転送されてきた単語集合が検索要求のキーワードとして用いられる。ここでは、
「寒波、訪れ、北海道、交通機関、乱れ」
という単語集合による検索要求によってニュース検索サイト(foo−news.com) を検索したところ、指定された条件に適合する文書の中で上位の適合度を持つ2件の関連文書として以下のような内容を持つ文書が検索されたものとする。
【0054】
・適合度第1位の文書:
『日本海側の強い寒波に伴う悪天候により、昨夜から交通機関に大きな影響が出た。特に北海道では荒れ模様の天気となり、空の便に多くの欠航便が出た。このため、新千歳空港では、乗客があふれる騒ぎとなった。』
・適合度第2位の文書:
『第1級の寒波の訪れにより、日本列島の天候は大荒れとなった。北日本を中心に交通機関が混乱した。』
関連情報検索部600は、上記のような検索された関連文書集合の内容を拡張単語抽出部500へと返却する。
【0055】
拡張単語抽出部500は、上記のように転送されてきた関連文書集合から指定された最大抽出単語数の拡張単語を抽出する。関連文書集合からの拡張単語抽出の処理としては、情報検索の分野における重要語抽出の手法を適用することができる。例えば、関連文書集合に含まれる各単語に対しては、tf*idf法(「情報と言語処理」,徳永建伸、東京大学出版会,1999.)を適用した以下の式によりスコアを計算し、この値が上位のものから指定された最大抽出単語数の単語を拡張単語として抽出すればよい。
【0056】
【数1】
ここで、wi は、関連文書集合に含まれるi番目の単語、tfifは、wi の関連文書jにおける頻度、idfi は検索対象の文書集合におけるwi の文書逆頻度を表す。
【0057】
なお、検索対象の外部データベース700がインターネット上の検索サイトなどである場合は、関連文書集合に含まれる単語集合を求めることが必要となる。この場合、既存技術として広く用いられている技術である形態素解析を適用すればよい。また、検索対象のデータベースが物理的・論理的に離れた場所に存在する場合には、idfi の値を求めることが困難であることが多い。この場合は、検索対象と同様の性質を持つ既存のデータコーパスなどの文書集合における値で代用してもよい。
【0058】
本発明では、適当はidfi を仮定することにより、以下の5つの拡張単語が抽出されたものとする(カッコ内は式1により計算されたスコアとする)。
【0059】
新千歳空港(140),欠航便(130),北海道(110),寒波(100),交通機関(80)
上記のように抽出された拡張単語集合は、音声認識部300が出力した音声認識結果とともに音声ドキュメント記述生成部700へと転送される。
【0060】
音声ドキュメント記述生成部700は、音声認識結果であるXML形式のデータに、転送されてきた拡張単語集合を埋め込むことにより、処理対象である音声ドキュメントの内容を記述するXML形式のデータを生成する。
【0061】
図8は、本発明の一実施例における生成されたXML形式の音声ドキュメント記述データの例である。
【0062】
同図に示す音声ドキュメント記述データは、図5に示した音声認識結果に対して、上記の拡張単語を埋め込むことにより、音声ドキュメント記述生成部700が生成したものである。
【0063】
図8においては、“additional−words”というタグにより拡張単語集合が表現され、“award ”というタグにより各拡張単語が表現されている。また、拡張単語を抽出する際に計算されたスコアの値が“award ”タグにおける“score ”という属性により記録されている。このようなデータ形式は、生成される音声ドキュメント記述データを説明するためのものであり、図示されている形式に限らない。
【0064】
図8に示す音声ドキュメント記述データにおいては、図5の音声認識結果データにおいて正しく認識されていた「北海道」、「寒波」、「交通機関」が拡張単語としても抽出されていることから、当該音声ドキュメントにおける重要な単語であることが認識されている。また、当該音声ドキュメントにおいては発声されていない「欠航便」が拡張単語として抽出されている。これは、この単語が実際には発声されていないにも関わらず関連する単語として重要であることを示しており、検索時にも有用に用いられる可能性がある。さらに、当該音声ドキュメントに対する音声認識において「新地 都政 空港」として誤認識されていた「新千歳空港」が拡張単語として抽出されており、これは結果として、音声認識の誤りを補正する効果を持つ。
【0065】
上記のように生成された音声ドキュメント記述データを音声ドキュメント自身の代わりとして用いることにより、音声ドキュメントに対して言語によるキーによって検索することが可能となる。また、この検索処理において、XMLの文書構造を扱うことのできるXML検索エンジンを用いれば、拡張単語を検索対象に含めるかどうかを検索条件に指定するなどの高度な検索が可能となる。
【0066】
さらに、図8に示したように、音声ドキュメント記述データに発声時間が記録されていれば、その音声ドキュメントの該当部分のみを再生するような音声ドキュメントアクセスも可能となる。
【0067】
なお、上記の処理は、計算機上のCPU等の制御手段で行われ、検索結果をディスプレイなどの表示手段で表示するものとする。
【0068】
また、上記の動作をプログラムとして構築し、当該プログラムをネットワークの通信回線や、フレキシブルディスクやCD−ROM等の記憶媒体から計算機上にインストールして、CPU等の制御手段に実行させることも可能である。
【0069】
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
【0070】
【発明の効果】
上述のように、本発明によれば、音声認識を適用することにより、録画・録音され記憶手段に記憶されている音声ドキュメントの内容を言語によるキーにより検索する音声ドキュメント検索システムを実現することができ、特に、正しく認識され単語から重要語を抽出したり、検索対象に含まれていないが検索に有用な単語を抽出したり、誤って音声認識された単語を補正したりすることにより、検索精度を高めることができる。
【図面の簡単な説明】
【図1】本発明の原理を説明するための図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施の形態における音声ドキュメント検索装置の構成図である。
【図4】本発明の一実施の形態における音声ドキュメント検索処理のフローチャートである。
【図5】本発明の一実施例における音声認識部により文字化された音声ドキュメントの一部である。
【図6】本発明の一実施例の拡張キー単語抽出条件テーブルのエントリの例である。
【図7】本発明の一実施例の拡張単語抽出条件テーブルのエントリの例である。
【図8】本発明の一実施例における生成されたXML形式の音声ドキュメント記述データの例である。
【符号の説明】
100 音声ドキュメント検索装置
200 入力手段、入力部
300 音声認識手段、音声認識部
400 拡張キー抽出手段、拡張キー抽出部
500 拡張単語抽出手段、拡張単語抽出部
600 関連情報検索手段、関連情報検索部
700 音声ドキュメント記述生成手段、音声ドキュメント生成部
800 出力手段、出力部
900 音声ドキュメント記述ファイル
1000 外部データベース[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a voice document search method and apparatus, and a voice document search program, and more particularly to characterizing a recorded voice content by applying voice recognition to the voice content, and searching for the content by a language key. The present invention relates to a voice document search method and apparatus, and a voice document search program.
[0002]
[Prior art]
Research and development of a search system for performing character recognition by applying voice recognition to voice content and enabling the content to be searched for using a key in a language have been performed (for example, see Non-Patent Document 1). . In the application of speech recognition, occurrence of a recognition error is inevitable. Therefore, a device for suppressing the influence of the recognition error is required. As a method for automatically performing this, there has been proposed a method of extending audio content by referring to an external database different from the audio content to be recognized (for example, see Non-Patent Document 2).
[0003]
On the other hand, in the research and development of speech recognition, an attempt has been made for the speech recognition system itself to give reliability to a speech recognition result output from the speech recognition system (for example, see Non-Patent Document 3).
[0004]
[Non-patent document 1]
"Analysis and Integration of Multimedia Information" Yasuo Ariki, Artificial Intelligence Society Information Integration Study Group, SIG-CII-2000-Nov, 2000.
[0005]
[Non-patent document 2]
"Document Expansion for Speech Retrieval", Amit Singhal, Fernando Pereira, Proceedings of ACM SIGIR, pages 34-41, Berkeley, CA, USA, 19A., USA.
[0006]
[Non-Patent Document 3]
"Comparison of Reliability Measures for Improving Speech Recognition Accuracy" Jun Ogata, Yasuo Ariki, IEICE Technical Report (Speech Research Group SP2000-94), pg. 113-118 (December 2000)
[0007]
[Problems to be solved by the invention]
However, in the method of expanding the voice content with reference to the above-mentioned conventional external database, the entire voice recognition result itself is regarded as a question request, and a related external database is searched by a similar document search method. Extended words are extracted from the top ranked voice documents. That is, in this method, words included in the speech recognition result are treated as the same word, and no consideration is given to recognition accuracy.
[0008]
Therefore, in some cases, a search of the external database may be performed using a key that is likely to be erroneously recognized as a key. It is more likely that items with low probability are included.
[0009]
SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and reduces the influence of a speech recognition error on search accuracy, and enables a content search for a speech content that enables a search using a key related to a topic in the speech content. An object of the present invention is to provide an audio document search method and apparatus for generating a content description document and an audio document search program.
[0010]
[Means for Solving the Problems]
FIG. 1 is a diagram for explaining the principle of the present invention.
[0011]
The present invention relates to an audio document search method for searching audio content including a recorded audio track by a key in a language,
The audio content to be searched is read out from a storage medium and input to an audio document search device (step 1).
In a voice document search device,
A voice recognition process is performed on the input voice content, and a character recognition voice recognition result is obtained together with the recognition reliability (step 2).
By comparing the extended key word extraction condition stored in the storage medium in advance with the speech recognition result, an extended key word as a key in a search for extending the speech recognition result is extracted (step 3).
The extracted expanded key words are compared with the expanded word extraction conditions stored in the storage means in advance, and based on the conditions obtained as a result, a search is performed for an external database that stores related documents. An extended word for extending the speech recognition result is obtained from the document set (step 4),
By embedding the expanded word in the expanded word and the voice recognition result, a voice content description document file of the voice content to be searched is generated (step 5).
An audio content description document file is output (step 6).
[0012]
FIG. 2 is a diagram illustrating the principle of the present invention.
[0013]
The present invention is an audio
A related
Input means 200 for inputting audio content to be searched;
A
Extended key word extraction means 400 for extracting an extended key word that is a key in a search for extending a speech recognition result according to a predetermined extended key word extraction condition;
An extension, which is a word for extending a speech recognition result from a set of related documents obtained by searching the
Voice document description generating means 700 for generating a voice content description document file by embedding an expanded word in the voice recognition result and describing the voice content of the voice content to be searched;
Output means 800 for outputting the generated audio content description document file.
[0014]
The present invention is an audio document search program for searching audio content including a recorded audio track by a key in a language,
An input step of inputting audio content to be searched;
A voice recognition step of obtaining a characterized voice recognition result along with recognition reliability by applying voice recognition processing to voice content input in the input step;
An extended key word extraction step of extracting an extended key word that is a key in a search for extending a speech recognition result according to a predetermined extended key word extraction condition;
A predetermined extended word extraction condition using the extracted extended key word is obtained by passing the condition to a related information search unit that is provided outside the voice document search device and searches an external database that stores related documents. An extended word extraction step of acquiring an extended word that is a word that extends the speech recognition result from the related document set;
A voice document description generating step of generating a voice content description document file by embedding an expanded word in the voice recognition result and describing the content of the voice content to be searched;
And an output step of outputting the generated audio content description document file.
[0015]
As described above, in the present invention, a key word of an external database search is extracted from a portion determined to be accurately recognized using a reliability output by the voice recognition device with respect to its own recognition result. This makes it possible to obtain high-quality extended words from external data.
[0016]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0017]
FIG. 3 shows a configuration of a voice document search device according to an embodiment of the present invention.
[0018]
The speech
[0019]
It is assumed that an
[0020]
The above-mentioned extended key word extraction condition table 410 and extended word extraction condition table 510 are stored in a storage unit such as a hard disk.
[0021]
The
[0022]
The
[0023]
The extended key word extraction condition table 410 is a table referred to by the extended key
[0024]
The expanded key
[0025]
The extended word extraction condition table 510 is a table referred to by the extended
[0026]
The extended
[0027]
The related
[0028]
The voice document
[0029]
The
[0030]
Note that the audio document
[0031]
Next, the operation in the above configuration will be described. According to the present invention, it is possible to search for recorded digital audio content, obtain a description of the searched content in a script language format such as XML or HTML, and display text information included in the content. It shall be.
[0032]
FIG. 4 is a flowchart of a voice document search process according to one embodiment of the present invention.
[0033]
Step 101) The
[0034]
Step 102) The
[0035]
Step 103) The extended key
[0036]
Step 104) The extended
[0037]
Step 105) The related
[0038]
Step 106) The expanded
[0039]
Step 107) The voice document
[0040]
Step 108) The
[0041]
【Example】
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0042]
Hereinafter, the operation of the voice document search system of the present invention will be described using a specific example.
[0043]
In the following example, it is assumed that the
[0044]
FIG. 5 shows a part of a voice document transcribed by the voice recognition unit in one embodiment of the present invention. The voice document shown in FIG. 3 is input from the
[0045]
The actual utterance here is
"The cold weather from last night caused heavy snowfall in Hokkaido, and transportation was greatly disrupted, including flights from New Chitose Airport."
But due to a speech recognition error,
`` If the cold weather comes from the blooming world and Hokkaido is heavy snow, transportation such as flights from Shinchi Metropolitan Airport is disrupted by a large hub ''
It is a characterized like.
[0046]
The output of the
[0047]
FIG. 6 shows an example of entries in the extended key word extraction condition table according to one embodiment of the present invention. The extended key word extraction condition table 410 shown in FIG. 8 stores preset extended key word extraction conditions.
[0048]
In the example shown in the figure, three conditions regarding the part of speech and the recognition reliability are set. As in the example shown in FIG. 7, words that are likely to be correctly recognized are extracted by considering the reliability of speech recognition. Further, by extracting a word having a part of speech such as a noun or a verb, a word that can be a keyword when the related document is searched from the
[0049]
The extended key
[0050]
"Cold wave (noun, 250), visit (noun, 250), Hokkaido (proper noun, 150), transportation (noun, 250), turbulence (verb, 300)"
The extended key words extracted as described above are transferred to the extended
[0051]
FIG. 7 shows an example of entries in the extended word extraction table according to one embodiment of the present invention. The extended word extraction table 510 shown in FIG. 9 stores preset extended word extraction conditions. As shown in the figure, the extended word extraction condition includes four entries. The first entry is an identifier of the
[0052]
The extended
[0053]
The related
"Cold waves, visits, Hokkaido, transportation, turbulence"
When a news search site (foo-news.com) was searched according to a search request based on the word set, the following content was found as two related documents having the highest relevance among documents meeting the specified conditions. It is assumed that a document having is searched.
[0054]
・ The document with the highest relevance:
“The bad weather associated with the strong cold weather on the Sea of Japan side has had a major impact on transportation since last night. Especially in Hokkaido, the weather was rough and there were many canceled flights on empty flights. As a result, passengers were noisy at New Chitose Airport. 』
・ The document with the second highest conformance:
"The arrival of the first-class cold weather has severely affected the Japanese archipelago. Transportation was confused, especially in northern Japan. 』
The related
[0055]
The expanded
[0056]
(Equation 1)
Here, wi is the i-th word included in the related document set, tfif is the frequency of wi in the related document j, and idfi is the inverse frequency of wi in the search target document set.
[0057]
When the
[0058]
In the present invention, it is assumed that the following five expanded words are extracted by appropriately assuming idfi (the score in parentheses is the score calculated by Expression 1).
[0059]
New Chitose Airport (140), Canceled flight (130), Hokkaido (110), Cold wave (100), Transportation (80)
The expanded word set extracted as described above is transferred to the voice document
[0060]
The voice document
[0061]
FIG. 8 is an example of generated audio document description data in XML format according to an embodiment of the present invention.
[0062]
The voice document description data shown in FIG. 6 is generated by the voice document
[0063]
In FIG. 8, an extended word set is represented by a tag "additional-words", and each extended word is represented by a tag "award". Also, the score value calculated when extracting the extended word is recorded by the attribute “score” in the “award” tag. Such a data format is for explaining the generated audio document description data, and is not limited to the illustrated format.
[0064]
In the voice document description data shown in FIG. 8, “Hokkaido”, “Cold Wave”, and “Transportation” that were correctly recognized in the voice recognition result data of FIG. 5 are also extracted as extended words. It is recognized as an important word in the document. In addition, in the voice document, “unsubscribed flights” that have not been uttered are extracted as extended words. This indicates that this word is important as a related word even though it is not actually uttered, and may be usefully used during a search. Furthermore, “New Chitose Airport”, which was erroneously recognized as “Shinchi Metropolitan Airport” in voice recognition for the voice document, is extracted as an expanded word, and as a result, it has the effect of correcting errors in voice recognition.
[0065]
By using the audio document description data generated as described above in place of the audio document itself, it is possible to search the audio document by a key in a language. Also, in this search processing, if an XML search engine that can handle the XML document structure is used, it is possible to perform an advanced search such as designating whether to include an expanded word in a search target as a search condition.
[0066]
Further, as shown in FIG. 8, if the utterance time is recorded in the voice document description data, the voice document can be accessed such that only the corresponding portion of the voice document is reproduced.
[0067]
The above processing is performed by a control unit such as a CPU on a computer, and the search result is displayed on a display unit such as a display.
[0068]
Further, it is also possible to construct the above operation as a program, install the program on a computer from a communication line of a network or a storage medium such as a flexible disk or a CD-ROM, and execute the program by a control means such as a CPU. is there.
[0069]
Note that the present invention is not limited to the above-described embodiments and examples, and various modifications and applications are possible within the scope of the claims.
[0070]
【The invention's effect】
As described above, according to the present invention, by applying voice recognition, it is possible to realize a voice document search system that searches for the content of a voice document recorded and recorded and stored in a storage unit using a language key. In particular, by extracting key words from correctly recognized words, extracting words that are not included in the search target but useful for searching, and correcting words that are incorrectly recognized by speech. Accuracy can be increased.
[Brief description of the drawings]
FIG. 1 is a diagram for explaining the principle of the present invention.
FIG. 2 is a principle configuration diagram of the present invention.
FIG. 3 is a configuration diagram of a voice document search device according to an embodiment of the present invention.
FIG. 4 is a flowchart of a voice document search process according to one embodiment of the present invention.
FIG. 5 is a part of a voice document transcribed by a voice recognition unit in one embodiment of the present invention.
FIG. 6 is an example of an entry of an extended key word extraction condition table according to an embodiment of the present invention.
FIG. 7 is an example of an entry of an extended word extraction condition table according to an embodiment of the present invention.
FIG. 8 is an example of generated audio document description data in XML format according to an embodiment of the present invention.
[Explanation of symbols]
100 Voice document search device
200 input means, input section
300 Voice recognition means, voice recognition unit
400 Extended key extracting means, extended key extracting section
500 Extended word extraction means, extended word extraction unit
600 Related information search means, related information search unit
700 Voice document description generation means, voice document generation unit
800 output means, output section
900 Voice document description file
1000 external database
Claims (3)
検索対象となる前記音声コンテンツを記憶媒体にから読み出して音声ドキュメント検索装置に入力し、
前記音声ドキュメント検索装置において、
入力された前記音声コンテンツに対して音声認識処理を施し、文字化された音声認識結果を認識信頼度と共に取得し、
予め記憶媒体に記憶されている拡張キー単語抽出条件と前記音声認識結果とを照合することにより、前記音声認識結果を拡張するための検索におけるキーとなる拡張キー単語を抽出し、
抽出された前記拡張キー単語と予め記憶媒体に記憶されている拡張単語抽出条件とを照合し、その結果得られた条件に基づいて、関連文書集合を蓄積する外部データベースを検索することにより得られた関連文書集合から音声認識結果を拡張するための拡張単語を取得し、
前記拡張単語と前記音声認識結果に前記拡張単語を埋め込むことにより、検索対象の前記音声コンテンツの音声内容記述ドキュメントファイルを生成し、
前記音声内容記述ドキュメントファイルを出力することを特徴とする音声ドキュメント検索方法。An audio document search method for searching audio content including a recorded audio track by a key in a language,
The audio content to be searched is read from a storage medium and input to an audio document search device,
In the voice document search device,
Performing a voice recognition process on the input voice content, to obtain a characterized voice recognition result together with the recognition reliability,
By comparing an expanded key word extraction condition stored in a storage medium in advance with the voice recognition result, an expanded key word serving as a key in a search for expanding the voice recognition result is extracted,
The extracted expanded key words are compared with expanded word extraction conditions stored in a storage medium in advance, and are obtained by searching an external database that accumulates related document sets based on the conditions obtained as a result. Extended words for extending the speech recognition result from the related document set
By embedding the expanded word in the expanded word and the voice recognition result, a voice content description document file of the voice content to be searched is generated,
A voice document search method, comprising outputting the voice content description document file.
前記音声ドキュメント検索装置の外部に設けられ、関連文書を蓄積するる外部データベースを検索する関連情報検索手段と、
検索対象となる前記音声コンテンツを入力する入力手段と、
前記入力手段で入力された前記音声コンテンツに対して音声認識処理を適用することにより文字化された音声認識結果を認識信頼度と共に得る音声認識手段と、
予め定められた拡張キー単語抽出条件に従って、音声認識結果を拡張するための検索におけるキーとなる拡張キー単語を抽出する拡張キー単語抽出手段と、
抽出された前記拡張キー単語を用いて予め定められた拡張単語抽出条件に従って、前記関連情報検索手段により前記外部データベースを検索して得られた関連文書集合から、前記音声認識結果を拡張する単語である拡張単語を取得する拡張単語抽出手段と、
前記音声認識結果に前記拡張単語を埋め込み、検索対象の前記音声コンテンツの内容を記述した音声内容記述ドキュメントファイルを生成する音声ドキュメント記述生成手段と、
生成された前記音声内容記述ドキュメント記述ファイルを出力する出力手段と、を有することを特徴とする音声ドキュメント検索システム。An audio document search device for searching audio content including a recorded audio track by a key in a language,
A related information search unit provided outside the voice document search device and searching an external database that stores related documents;
Input means for inputting the audio content to be searched;
Voice recognition means for obtaining a characterized voice recognition result together with recognition reliability by applying voice recognition processing to the voice content input by the input means,
Extended key word extraction means for extracting an extended key word that is a key in a search for extending a speech recognition result according to a predetermined extended key word extraction condition;
A word for expanding the speech recognition result from a related document set obtained by searching the external database by the related information search means according to a predetermined expanded word extraction condition using the extracted expanded key word. Extended word extracting means for acquiring an extended word;
Voice document description generating means for embedding the extended word in the voice recognition result and generating a voice content description document file describing the content of the voice content to be searched;
Output means for outputting the generated audio content description document description file.
検索対象となる前記音声コンテンツを入力する入力ステップと、
前記入力ステップで入力された前記音声コンテンツに対して音声認識処理を適用することにより文字化された音声認識結果を認識信頼度と共に得る音声認識ステップと、
予め定められた拡張キー単語抽出条件に従って、音声認識結果を拡張するための検索におけるキーとなる拡張キー単語を抽出する拡張キー単語抽出ステップと、
抽出された前記拡張キー単語を用いて予め定められた拡張単語抽出条件を、音声ドキュメント検索装置の外部に設けられ、関連文書を蓄積する外部データベースを検索する関連情報検索手段に渡すことにより得られた関連文書集合から前記音声認識結果を拡張する単語である拡張単語を取得する拡張単語抽出ステップと、
前記音声認識結果に前記拡張単語を埋め込みむことにより、検索対象の前記音声コンテンツの音声内容記述ドキュメントファイルを生成する音声ドキュメント記述生成ステップと、
生成された前記音声内容記述ドキュメントファイルを出力する出力ステップと、をコンピュータの制御手段に実行させることを特徴とする音声ドキュメント検索プログラム。An audio document search program for searching audio content including a recorded audio track by a key in a language,
An input step of inputting the audio content to be searched;
A voice recognition step of obtaining a transcribed voice recognition result together with recognition reliability by applying voice recognition processing to the voice content input in the input step,
An extended key word extraction step of extracting an extended key word that is a key in a search for extending a speech recognition result according to a predetermined extended key word extraction condition;
An extended word extraction condition predetermined using the extracted extended key word is obtained by passing the condition to a related information search unit provided outside the voice document search device and searching an external database that stores related documents. An extended word extraction step of acquiring an extended word that is a word for extending the speech recognition result from the related document set,
A voice document description generating step of generating a voice content description document file of the voice content to be searched by embedding the extended word in the voice recognition result;
An output step of outputting the generated audio content description document file, and a control unit of a computer for executing the audio document search program.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003038781A JP2004246824A (en) | 2003-02-17 | 2003-02-17 | Voice document search method and apparatus, and voice document search program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003038781A JP2004246824A (en) | 2003-02-17 | 2003-02-17 | Voice document search method and apparatus, and voice document search program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004246824A true JP2004246824A (en) | 2004-09-02 |
Family
ID=33023207
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003038781A Pending JP2004246824A (en) | 2003-02-17 | 2003-02-17 | Voice document search method and apparatus, and voice document search program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004246824A (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8140530B2 (en) | 2006-08-03 | 2012-03-20 | Nec Corporation | Similarity calculation device and information search device |
| JP2017182457A (en) * | 2016-03-30 | 2017-10-05 | 株式会社アドバンスト・メディア | Information processing system, server, terminal device, information processing method, and program |
| CN108255841A (en) * | 2016-12-28 | 2018-07-06 | 北京新唐思创教育科技有限公司 | Method and device for searching questions |
| US10817551B2 (en) | 2017-04-25 | 2020-10-27 | Panasonic Intellectual Property Management Co., Ltd. | Method for expanding word, word expanding apparatus, and non-transitory computer-readable recording medium |
-
2003
- 2003-02-17 JP JP2003038781A patent/JP2004246824A/en active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8140530B2 (en) | 2006-08-03 | 2012-03-20 | Nec Corporation | Similarity calculation device and information search device |
| JP2017182457A (en) * | 2016-03-30 | 2017-10-05 | 株式会社アドバンスト・メディア | Information processing system, server, terminal device, information processing method, and program |
| CN108255841A (en) * | 2016-12-28 | 2018-07-06 | 北京新唐思创教育科技有限公司 | Method and device for searching questions |
| US10817551B2 (en) | 2017-04-25 | 2020-10-27 | Panasonic Intellectual Property Management Co., Ltd. | Method for expanding word, word expanding apparatus, and non-transitory computer-readable recording medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11978439B2 (en) | Generating topic-specific language models | |
| JP5257071B2 (en) | Similarity calculation device and information retrieval device | |
| US9330661B2 (en) | Accuracy improvement of spoken queries transcription using co-occurrence information | |
| JP4997601B2 (en) | WEB site system for voice data search | |
| US7089188B2 (en) | Method to expand inputs for word or document searching | |
| US7272558B1 (en) | Speech recognition training method for audio and video file indexing on a search engine | |
| US8090738B2 (en) | Multi-modal search wildcards | |
| US7310601B2 (en) | Speech recognition apparatus and speech recognition method | |
| US20090292685A1 (en) | Video search re-ranking via multi-graph propagation | |
| US20090030894A1 (en) | Spoken Document Retrieval using Multiple Speech Transcription Indices | |
| JP2004005600A (en) | Method and system for indexing and retrieving document stored in database | |
| WO2003010754A1 (en) | Speech input search system | |
| JP2004133880A (en) | Method for constructing dynamic vocabulary for speech recognizer used in database for indexed document | |
| JP2010157241A (en) | Method and system for correcting ocr result, and computer-readable recording medium | |
| JP4171323B2 (en) | Recognition error correction method, apparatus, and program | |
| JP4065346B2 (en) | Method for expanding keyword using co-occurrence between words, and computer-readable recording medium recording program for causing computer to execute each step of the method | |
| JP2004318510A (en) | Bilingual information creation device, bilingual information creating program, bilingual information creating method, bilingual information searching device, bilingual information searching program, and bilingual information searching method | |
| JP2004246824A (en) | Voice document search method and apparatus, and voice document search program | |
| JPH08129554A (en) | Relation expression extracting device and retrieval device for relation expression | |
| JP5523929B2 (en) | Text summarization apparatus, text summarization method, and text summarization program | |
| JP2002092017A (en) | Concept dictionary extension method and apparatus, and recording medium recording concept dictionary extension program | |
| JP2004086307A (en) | Information search device, information registration device, information search method, and computer-readable program | |
| JP2001243230A (en) | Similarity determination method | |
| JP2002215672A (en) | Search expression expansion method, search system, and search expression expansion computer program | |
| JP2000020551A (en) | Voice data search device and storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050114 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071129 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071211 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080408 |