JPH0750483B2 - 文書画像追加情報の蓄積方法 - Google Patents
文書画像追加情報の蓄積方法Info
- Publication number
- JPH0750483B2 JPH0750483B2 JP60108122A JP10812285A JPH0750483B2 JP H0750483 B2 JPH0750483 B2 JP H0750483B2 JP 60108122 A JP60108122 A JP 60108122A JP 10812285 A JP10812285 A JP 10812285A JP H0750483 B2 JPH0750483 B2 JP H0750483B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- memo
- information
- document
- additional information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32106—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
- H04N1/32112—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate computer file, document page or paper sheet, e.g. a fax cover sheet
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3245—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of image modifying data, e.g. handwritten addenda, highlights or augmented reality information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3274—Storage or retrieval of prestored additional information
- H04N2201/3277—The additional information being stored in the same storage device as the image data
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Description
【発明の詳細な説明】 [発明の利用分野] 本発明は電子的な文書画像の蓄積に関し、とくに検索な
どに用いる追加情報の蓄積方法に関する。
どに用いる追加情報の蓄積方法に関する。
[発明の背景] 近年、大容量光デイスクを利用した文書画像フアイル・
システム(電子フアイル)が、新しい文書管理の手段と
して注目を集めている。光デイスクは容量が大きく、画
像データの記録が可能なので、帳票,設計図,契約書そ
の他の文書画像情報を蓄積することができる。しかし、
検索方法としては、文書名,分類コード,キーワードな
どの指定による、比較的簡単なものが開発されているに
すぎない(例えば、「日経コンピユータ」1983.12.26,
第62〜64頁参照)。
システム(電子フアイル)が、新しい文書管理の手段と
して注目を集めている。光デイスクは容量が大きく、画
像データの記録が可能なので、帳票,設計図,契約書そ
の他の文書画像情報を蓄積することができる。しかし、
検索方法としては、文書名,分類コード,キーワードな
どの指定による、比較的簡単なものが開発されているに
すぎない(例えば、「日経コンピユータ」1983.12.26,
第62〜64頁参照)。
このため検索者が上記文書名等の情報を忘却したり曖昧
である場合には、文書画像データ自身をフアイルから1
件単位に続出し表示して、目的のデータを深索せざるを
得ないので、検索時間が膨大となる問題があつた。
である場合には、文書画像データ自身をフアイルから1
件単位に続出し表示して、目的のデータを深索せざるを
得ないので、検索時間が膨大となる問題があつた。
また、特開昭59−135576号公報には、文書画像を入力す
るとともにその文書画像上のけい光ペンによるマークを
カラー識別により検出し、マーク部分及びその周辺領域
を切り分けてその中の文字列を切り出し、文書の要約情
報として蓄積する装置が示される。この要約情報を検索
にを用いれば検索時間の短縮化がはかれる。
るとともにその文書画像上のけい光ペンによるマークを
カラー識別により検出し、マーク部分及びその周辺領域
を切り分けてその中の文字列を切り出し、文書の要約情
報として蓄積する装置が示される。この要約情報を検索
にを用いれば検索時間の短縮化がはかれる。
[発明の目的] 上記従来技術では、カラー識別により原画像とマークを
分離する必要があるので、カラー画像入力手段が必須構
成であった。また、マークと原画像とを別のセンサで検
出する場合に両者の検出位置の対応関係に特に注意が払
われていなかった。
分離する必要があるので、カラー画像入力手段が必須構
成であった。また、マークと原画像とを別のセンサで検
出する場合に両者の検出位置の対応関係に特に注意が払
われていなかった。
そこで、本発明の目的は、簡便な白黒画像入力手段を用
いても原文書上に付加されたマークまたは手書きメモ等
の追記情報を正確に抽出でき、抽出情報の蓄積が可能な
文書画像追加情報の蓄積方法を提供するにある [発明の概要] 本発明による文書画像検索情報の蓄積方法では手書メモ
情報を文書検索時に利用するために、まず原文書画像デ
ータとは別に原文書画像に手書メモ情報を追加したメモ
付文書画像データを入力し、原文書画像データとの位置
合わせを行つて照合し不一致部分として手書メモ情報の
みを抽出する。このように、原文書画像と追記情報が付
加された文書画像との比較照合により追記情報を抽出す
るには、両画像の正確な位置合わせが不可欠である。そ
こで、ファイル装置に蓄積済の原文書の内容に位置合わ
せ用の追加情報を付加したものを参照用の第1の画像デ
ータとして保持するとともに、その複写を出力し、この
複写に手書きメモ等の追記を行うようにした。追記済の
複写を読み込んで第2の画像データとし、先の第1の画
像データと比較照合する際に両画像データ上には位置合
わせ用の追加情報があるので正確な位置合わせが可能で
ある。
いても原文書上に付加されたマークまたは手書きメモ等
の追記情報を正確に抽出でき、抽出情報の蓄積が可能な
文書画像追加情報の蓄積方法を提供するにある [発明の概要] 本発明による文書画像検索情報の蓄積方法では手書メモ
情報を文書検索時に利用するために、まず原文書画像デ
ータとは別に原文書画像に手書メモ情報を追加したメモ
付文書画像データを入力し、原文書画像データとの位置
合わせを行つて照合し不一致部分として手書メモ情報の
みを抽出する。このように、原文書画像と追記情報が付
加された文書画像との比較照合により追記情報を抽出す
るには、両画像の正確な位置合わせが不可欠である。そ
こで、ファイル装置に蓄積済の原文書の内容に位置合わ
せ用の追加情報を付加したものを参照用の第1の画像デ
ータとして保持するとともに、その複写を出力し、この
複写に手書きメモ等の追記を行うようにした。追記済の
複写を読み込んで第2の画像データとし、先の第1の画
像データと比較照合する際に両画像データ上には位置合
わせ用の追加情報があるので正確な位置合わせが可能で
ある。
また、本発明の文書画像検索システムでは、文書画像を
蓄積するためのファイルと、上記文書画像ファイル中の
文書画像と対応して、予め分類された複数種類の検索用
画像情報を蓄積するための2次情報ファイルと、検索条
件に該当する上記文書画像ファイル中の文書画像に関す
る参考情報として、上記2次情報ファイルから、ユーザ
が指定した種類に該当する検索用画像情報を読み出し、
表示画面に表示するよう動作する制御手段とを備え、上
記2次情報ファイルが、少なくとも、検索対象となる文
書画像から抽出された部分画像と、検索対象となる文書
画像に関連する追記情報とを含むことを特徴とする。
蓄積するためのファイルと、上記文書画像ファイル中の
文書画像と対応して、予め分類された複数種類の検索用
画像情報を蓄積するための2次情報ファイルと、検索条
件に該当する上記文書画像ファイル中の文書画像に関す
る参考情報として、上記2次情報ファイルから、ユーザ
が指定した種類に該当する検索用画像情報を読み出し、
表示画面に表示するよう動作する制御手段とを備え、上
記2次情報ファイルが、少なくとも、検索対象となる文
書画像から抽出された部分画像と、検索対象となる文書
画像に関連する追記情報とを含むことを特徴とする。
[発明の実施例] 以下、本発明を実施例により詳細に説明する。第1図は
本発明が適用された文書画像情報検索システムの一例を
示したもので、図中、1はマイクロプロセツサ(CPU),
2は主メモリ(MM),3はキーボード(KB),4はイメージ
・スキヤナ(IS),5はフアイル装置(FD),6はビツトマ
ツプ・メモリ(BM),7はイメージ・プロセツサ(IP),8
はテイスプレイ制御部(DC)9はCRTデイスプレイ,10は
プリンタ(PR)である。
本発明が適用された文書画像情報検索システムの一例を
示したもので、図中、1はマイクロプロセツサ(CPU),
2は主メモリ(MM),3はキーボード(KB),4はイメージ
・スキヤナ(IS),5はフアイル装置(FD),6はビツトマ
ツプ・メモリ(BM),7はイメージ・プロセツサ(IP),8
はテイスプレイ制御部(DC)9はCRTデイスプレイ,10は
プリンタ(PR)である。
まずメモ付文書画像データ(以下メモ付画像と略す)か
らメモ部分のみを抽出する処理について説明する。第2
図はメモ抽出過程を模式的に描いた図である。まず原画
像の原紙11をIS4からBM6に取込み、原画像12を得る。次
に後述の位置合わせのための矩形外枠を、CPU1の指令に
よりIP7が原画像12上に書込み、枠付画像13を作成し、P
R10上に枠付画像の原紙14として出力する。次に原紙14
に紙面上でメモ(一例として下線)を追記してメモ付画
像の原紙15を作成し、さらにこれをIS4からBM6の枠付画
像13が格納されているのとは別に領域に取込みメモ付画
像16を得る。通常のイメージスキヤナでは、紙面を傾き
なく画像することは困難であり、またPR10とIS4は一般
には画素密度が異なるため、メモ付画像16を、傾きと大
きさを枠付画像13と合致する様たとえば矩形枠を利用し
て正規化して、正規化画像17を得る。次に枠付画像13と
正規化画像17のマツチングを行い、不一致部分のみを残
した差分画像18を得る。差分画像には、メモ情報以外
に、枠付画像13をPR10およびIS4を通したことによる原
画像自身の劣化情報も含まれるため、最後に差分画像18
から劣化情報を除去し、メモ情報のみを残してメモ画像
19を得る。以上の処理は、全体の制御をCPU1が行い、個
々の画像処理については、CPU1の指令によりIP7が行
う。以下IP7による各画像処理方法について詳細に説明
する。
らメモ部分のみを抽出する処理について説明する。第2
図はメモ抽出過程を模式的に描いた図である。まず原画
像の原紙11をIS4からBM6に取込み、原画像12を得る。次
に後述の位置合わせのための矩形外枠を、CPU1の指令に
よりIP7が原画像12上に書込み、枠付画像13を作成し、P
R10上に枠付画像の原紙14として出力する。次に原紙14
に紙面上でメモ(一例として下線)を追記してメモ付画
像の原紙15を作成し、さらにこれをIS4からBM6の枠付画
像13が格納されているのとは別に領域に取込みメモ付画
像16を得る。通常のイメージスキヤナでは、紙面を傾き
なく画像することは困難であり、またPR10とIS4は一般
には画素密度が異なるため、メモ付画像16を、傾きと大
きさを枠付画像13と合致する様たとえば矩形枠を利用し
て正規化して、正規化画像17を得る。次に枠付画像13と
正規化画像17のマツチングを行い、不一致部分のみを残
した差分画像18を得る。差分画像には、メモ情報以外
に、枠付画像13をPR10およびIS4を通したことによる原
画像自身の劣化情報も含まれるため、最後に差分画像18
から劣化情報を除去し、メモ情報のみを残してメモ画像
19を得る。以上の処理は、全体の制御をCPU1が行い、個
々の画像処理については、CPU1の指令によりIP7が行
う。以下IP7による各画像処理方法について詳細に説明
する。
まず原画像12から枠付画像13を作成する処理について説
明する。線をBM6上に描くには、線の要素パターンを順
次上下または左右方向に定義していけばよい。ここでは
さらに後述の正規化処理のために、外枠の外側部分に存
在する黒画素を白画素に変換する処理も行なう。
明する。線をBM6上に描くには、線の要素パターンを順
次上下または左右方向に定義していけばよい。ここでは
さらに後述の正規化処理のために、外枠の外側部分に存
在する黒画素を白画素に変換する処理も行なう。
次にメモ付画像16から正規化画像17を作成する正規化処
理について説明する。本正規化処理は外枠を構成する4
本の直線を検出して外枠の傾きと大きさを求めるステツ
プと、この傾きと大きさを枠付画像13のそれと一致させ
る様にメモ付画像全体を座標変換するステツプから構成
する。まず外枠の傾きと大きさを求めるステツプで、外
枠を構成する直線を求める処理について説明する。直線
を求めるアルゴリズムは従来から種々提案されている
が、ここではHough変換の手法を用いた方法について説
明する。以下一例として外枠の左側の縦線を求める処理
について説明する。第3図は左側の縦線を求めるプログ
ラムのフローチヤートの一例である。図中、 が求める直線を表わし、γはその原点からの距離, はその傾きを表わす。本アルゴリズムの概要は、まず処
理22〜24で直線上の1点の候補を探索し、次に処理25〜
29でこの点を通るすべての直線として、γ=xsinθ+yc
osθにおけるγとθの組を求め、処理22〜31を繰返すこ
とにより、頻度が最大となるγとθが、最も多くの直線
上の候補点を通る直線のパラメータとして求めるもので
ある。以下同様にして他の直線の方程式を求める。さら
に4本の直線の方程式の4つの交点として、外枠の左
上,右上,左下,右下の各角点を求め、それぞれ左上角
点を原点とする新しい座標系に関して(0,0),(M1,
N1),(M2,N2),(M1+M2,N1+N2)とする。次にメモ
付画像16全体を変換するステツプについて説明する。枠
付画像13の4つの角点を(0,0),(m,0),(0,n),
(m,n)とすると、この変換は と表わすことができる。ここに(x,y)はメモ付画像16
の画素の座標、(X,Y)は正規化画像17の(x,y)に対応
する画素の座標である。この式による変換は、実際には
上式と同値な式 によつて(x,y)の格子点に対応する(x,y)を求め、一
般には(x,y)は画素の存在する格子点にはならないの
で周囲の格子点の論理和等で補間して濃度を求めて、こ
れを(x,y)の濃度とすることによつて実現する。以上
は位置合わせ用の記号として4本の線分から構成する外
枠を利用する実施例について説明したが、これ以外に
も、4隅に特徴点を付してマツチングをとる方法,記号
は特に付加せず原文書の特徴部分によりマツチングをと
る方法等がか考えられる。また以上はPR10とIS4の画素
密度の差異による歪みは、線形であることを前提とした
が、たとえばIS4がラインセンサをモータで駆動するタ
イプの装置であると、駆動速度が一定ではないことによ
り非線形の歪みが生じる場合がある。この場合には、例
えば第7図にように複数の平行線により間隔の変化を検
出し、これをもとに小領域単位に、上で述べたのと同様
の変換を施すことによつて正規化画像を得ることができ
る。
理について説明する。本正規化処理は外枠を構成する4
本の直線を検出して外枠の傾きと大きさを求めるステツ
プと、この傾きと大きさを枠付画像13のそれと一致させ
る様にメモ付画像全体を座標変換するステツプから構成
する。まず外枠の傾きと大きさを求めるステツプで、外
枠を構成する直線を求める処理について説明する。直線
を求めるアルゴリズムは従来から種々提案されている
が、ここではHough変換の手法を用いた方法について説
明する。以下一例として外枠の左側の縦線を求める処理
について説明する。第3図は左側の縦線を求めるプログ
ラムのフローチヤートの一例である。図中、 が求める直線を表わし、γはその原点からの距離, はその傾きを表わす。本アルゴリズムの概要は、まず処
理22〜24で直線上の1点の候補を探索し、次に処理25〜
29でこの点を通るすべての直線として、γ=xsinθ+yc
osθにおけるγとθの組を求め、処理22〜31を繰返すこ
とにより、頻度が最大となるγとθが、最も多くの直線
上の候補点を通る直線のパラメータとして求めるもので
ある。以下同様にして他の直線の方程式を求める。さら
に4本の直線の方程式の4つの交点として、外枠の左
上,右上,左下,右下の各角点を求め、それぞれ左上角
点を原点とする新しい座標系に関して(0,0),(M1,
N1),(M2,N2),(M1+M2,N1+N2)とする。次にメモ
付画像16全体を変換するステツプについて説明する。枠
付画像13の4つの角点を(0,0),(m,0),(0,n),
(m,n)とすると、この変換は と表わすことができる。ここに(x,y)はメモ付画像16
の画素の座標、(X,Y)は正規化画像17の(x,y)に対応
する画素の座標である。この式による変換は、実際には
上式と同値な式 によつて(x,y)の格子点に対応する(x,y)を求め、一
般には(x,y)は画素の存在する格子点にはならないの
で周囲の格子点の論理和等で補間して濃度を求めて、こ
れを(x,y)の濃度とすることによつて実現する。以上
は位置合わせ用の記号として4本の線分から構成する外
枠を利用する実施例について説明したが、これ以外に
も、4隅に特徴点を付してマツチングをとる方法,記号
は特に付加せず原文書の特徴部分によりマツチングをと
る方法等がか考えられる。また以上はPR10とIS4の画素
密度の差異による歪みは、線形であることを前提とした
が、たとえばIS4がラインセンサをモータで駆動するタ
イプの装置であると、駆動速度が一定ではないことによ
り非線形の歪みが生じる場合がある。この場合には、例
えば第7図にように複数の平行線により間隔の変化を検
出し、これをもとに小領域単位に、上で述べたのと同様
の変換を施すことによつて正規化画像を得ることができ
る。
次に枠付画像13と正規化画像17から差分画像18を作成す
る処理について説明する。差分画像18は、枠付画像13と
正規化画像17を画素単位に比較して不一致部分を黒,一
致部分を白とすることによつて簡単に作成することもで
きるが、ここではさらにメモ情報とこれ以外の雑音とを
切分けるために、以下の方法で作成する。枠付画像13を
(x,y),正規化画像17をg(x,y)とする。ここに
(x,y),g(x,y)は点(x,y)における画素の濃度を表
わし、ここでは2値画像を仮定し、黒画素の場合は1,白
画素の場合は0とする。まず、枠付画像13の黒領域を膨
張する。膨張は、 ′(x,y) =(x,y)∨(x+1,y) ∨(x,y+1)∨(x+1,y+1) をすべてのx,yについて行うことにより実現する。次に
正規化画像17が黒画素の領域で膨張した枠付画像が白黒
画素の領域を求める。この処理は、 をすべてのx,yについて行うことにより実現する。この
方法が前述の不一致部から差分画像を得る単純な方法に
比べて秀れている点は、まず前者の膨張の処理により、
メモ情報以外の情報で、PR10とIS4を介したことにより
本来の領域からハミ出した部分を取除くことができ、後
者の処理により逆にPR10とIS4を介したことにより本来
の領域が欠落した部分を差分画像として検出しないよう
にすることができる点である。なおこの例では膨張処理
は近傍4画素の論理和をとつたが、これをさらに9画
素,16画素,等と拡張することも同様にして可能であ
る。また対象とするメモの種類によつては、膨張の処理
を省略することも可能である。
る処理について説明する。差分画像18は、枠付画像13と
正規化画像17を画素単位に比較して不一致部分を黒,一
致部分を白とすることによつて簡単に作成することもで
きるが、ここではさらにメモ情報とこれ以外の雑音とを
切分けるために、以下の方法で作成する。枠付画像13を
(x,y),正規化画像17をg(x,y)とする。ここに
(x,y),g(x,y)は点(x,y)における画素の濃度を表
わし、ここでは2値画像を仮定し、黒画素の場合は1,白
画素の場合は0とする。まず、枠付画像13の黒領域を膨
張する。膨張は、 ′(x,y) =(x,y)∨(x+1,y) ∨(x,y+1)∨(x+1,y+1) をすべてのx,yについて行うことにより実現する。次に
正規化画像17が黒画素の領域で膨張した枠付画像が白黒
画素の領域を求める。この処理は、 をすべてのx,yについて行うことにより実現する。この
方法が前述の不一致部から差分画像を得る単純な方法に
比べて秀れている点は、まず前者の膨張の処理により、
メモ情報以外の情報で、PR10とIS4を介したことにより
本来の領域からハミ出した部分を取除くことができ、後
者の処理により逆にPR10とIS4を介したことにより本来
の領域が欠落した部分を差分画像として検出しないよう
にすることができる点である。なおこの例では膨張処理
は近傍4画素の論理和をとつたが、これをさらに9画
素,16画素,等と拡張することも同様にして可能であ
る。また対象とするメモの種類によつては、膨張の処理
を省略することも可能である。
最後に差分画像18からメモ画像19を作成する処理につい
て説明する。本処理は雑音付のメモ情報から雑音を除去
する処理である。ここでは、メモ情報に比べて雑音は綿
巾が小さいと仮定して、収縮の変換により雑音を除去
し、膨張の変換によりメモ情報の綿巾を復元する。差分
画像18をh(x,y)とする。まず差分画像18の黒領域を
収縮する。収縮は、 h′(x,y) =h(x,y)∧h(x+1,y) ∧h(x,y+1)∧h(x+1,y+1) をすべてのx,yについて行うことにより実現する。次に
収縮画像h′(x,y)の黒領域を膨張する。膨張は前述
の′(x,y)と同様にして行う。なお雑音の線巾の大
きさにより、上例のように近傍4画素の論理和、または
論理積ではなく、9画素,16画素等と拡張することもで
きる。また差分画像を求める処理において、枠付画像13
の膨張処理により稀にメモ情報に途切れ等の欠陥が生じ
る場合があるが、これを本収縮膨張処理に先立つて、膨
張およびそ後に収縮変換を行うことによるこの欠陥を補
間することもできる。
て説明する。本処理は雑音付のメモ情報から雑音を除去
する処理である。ここでは、メモ情報に比べて雑音は綿
巾が小さいと仮定して、収縮の変換により雑音を除去
し、膨張の変換によりメモ情報の綿巾を復元する。差分
画像18をh(x,y)とする。まず差分画像18の黒領域を
収縮する。収縮は、 h′(x,y) =h(x,y)∧h(x+1,y) ∧h(x,y+1)∧h(x+1,y+1) をすべてのx,yについて行うことにより実現する。次に
収縮画像h′(x,y)の黒領域を膨張する。膨張は前述
の′(x,y)と同様にして行う。なお雑音の線巾の大
きさにより、上例のように近傍4画素の論理和、または
論理積ではなく、9画素,16画素等と拡張することもで
きる。また差分画像を求める処理において、枠付画像13
の膨張処理により稀にメモ情報に途切れ等の欠陥が生じ
る場合があるが、これを本収縮膨張処理に先立つて、膨
張およびそ後に収縮変換を行うことによるこの欠陥を補
間することもできる。
以上でメモ付画像からメモ部分のみを抽出する処理の説
明を終り、次に抽出したメモ情報の種類を判別して、そ
の種類に応じて検索用2次情報を作成する処理について
説明する。第4図はメモ分類過程の一例を模式的に描い
た図である。図中、(a)はメモ付画像16,(b)はメ
モ画像19,(c)は(b)で黒画素が連続した領域単位
に切出して、外接矩形を求めた領域分割画像,(d)は
メモ分類の結果である。ここでは、簡単のためメモの種
類として、下線,囲み,およびにそれ以外の注釈の3種
類を考えて、これらのメモとメモではないが前記の差分
画像18からメモ画像19を得るときに除去しきれなかつた
雑音の分類方法について説明する。
明を終り、次に抽出したメモ情報の種類を判別して、そ
の種類に応じて検索用2次情報を作成する処理について
説明する。第4図はメモ分類過程の一例を模式的に描い
た図である。図中、(a)はメモ付画像16,(b)はメ
モ画像19,(c)は(b)で黒画素が連続した領域単位
に切出して、外接矩形を求めた領域分割画像,(d)は
メモ分類の結果である。ここでは、簡単のためメモの種
類として、下線,囲み,およびにそれ以外の注釈の3種
類を考えて、これらのメモとメモではないが前記の差分
画像18からメモ画像19を得るときに除去しきれなかつた
雑音の分類方法について説明する。
まずメモ画像(b)から領域分割画像(c)を作成する
処理について説明する。ここでは黒画素が連続した領域
の単位に画像を分割し、各々の領域にメモNo.を付す
る。連続した領域の切出しは、従来種々のアルゴリズム
が提案されているが、例えば電子通信学会編の長尾真氏
によるパターン情報処理(1983年)と題する文献の84ペ
ージにあるラベル付けアルゴリズムによつても実現でき
る。ここでそれぞれの領域に付されたラベル1〜6をメ
モNo.として表(d)の欄40に対応させる。このとき領
域の最上端,下端の座標より領域の縦長さを計算して表
(d)の欄41に、最左右、右端の座標より横長さを計算
して欄42に書込む。
処理について説明する。ここでは黒画素が連続した領域
の単位に画像を分割し、各々の領域にメモNo.を付す
る。連続した領域の切出しは、従来種々のアルゴリズム
が提案されているが、例えば電子通信学会編の長尾真氏
によるパターン情報処理(1983年)と題する文献の84ペ
ージにあるラベル付けアルゴリズムによつても実現でき
る。ここでそれぞれの領域に付されたラベル1〜6をメ
モNo.として表(d)の欄40に対応させる。このとき領
域の最上端,下端の座標より領域の縦長さを計算して表
(d)の欄41に、最左右、右端の座標より横長さを計算
して欄42に書込む。
次にメモの分類方法について説明する。前記の領域分割
により求めた各領域の位置情報をもとに、メモ分類に必
要な各種のパラメータを計算して、この判別を行う。こ
こでは一例として欄43〜45のパラメータを計算する。欄
43は領域の横長さ/縦長さで定義され、領域の縦横比を
表すパラメータである。下線はこの値が他に比べて大と
なるので下線とこれ以外のメモを分離できる。欄44は領
域の横長さ+縦長さで定義され、領域の大きさを表すパ
ラメータである。雑音はこの値が他に比べて小となるの
で、雑音とメモを分離できる。欄45は領域に対応する位
置の原画像12の黒画素数の領域面積に対する割合であ
る。囲みは対応する領域に原画像が存在するので大きな
値をもち、これ以外のメモでは小さな値となるので、囲
みとそれ以外のメモを分離できる。第5図に以上のパラ
メータを用いてメモを分類するためのプログラムのフロ
ーチヤートの一例を示す。図中、θ43〜θ45はそれぞれ
欄43〜45のパラメータの上記分離の閾値を表わす。なお
ここでは、メモとして下線,囲み,注釈の3種類のみ考
えればよかつたが、メモの種類によつて各種のパラメー
タが考えられ、例えば面積,空間周波数の大小等、全く
同じ考え方で利用できる。
により求めた各領域の位置情報をもとに、メモ分類に必
要な各種のパラメータを計算して、この判別を行う。こ
こでは一例として欄43〜45のパラメータを計算する。欄
43は領域の横長さ/縦長さで定義され、領域の縦横比を
表すパラメータである。下線はこの値が他に比べて大と
なるので下線とこれ以外のメモを分離できる。欄44は領
域の横長さ+縦長さで定義され、領域の大きさを表すパ
ラメータである。雑音はこの値が他に比べて小となるの
で、雑音とメモを分離できる。欄45は領域に対応する位
置の原画像12の黒画素数の領域面積に対する割合であ
る。囲みは対応する領域に原画像が存在するので大きな
値をもち、これ以外のメモでは小さな値となるので、囲
みとそれ以外のメモを分離できる。第5図に以上のパラ
メータを用いてメモを分類するためのプログラムのフロ
ーチヤートの一例を示す。図中、θ43〜θ45はそれぞれ
欄43〜45のパラメータの上記分離の閾値を表わす。なお
ここでは、メモとして下線,囲み,注釈の3種類のみ考
えればよかつたが、メモの種類によつて各種のパラメー
タが考えられ、例えば面積,空間周波数の大小等、全く
同じ考え方で利用できる。
最後に上で求めた領域の種類に応じて検索用2次情報を
作成する処理の一例について説明する。まず下線は、重
要なキーワードの下に付した記号と想定して、その上方
の文字列を切出して検索用2次情報としてFD5に格納す
る。上方の文字列は、下線領域の底辺を底辺とする矩形
上で、原画像12を横方向に投影することによつて行の切
れ目を求めて最下行として検出する。囲みは図No.を表
わす記号と想定して、領域内の数字を認識する。認識は
従来OCR装置で用いられてきた種々のアルゴリズムを適
用することが可能であるし、また簡単に、前述の電子通
信学会編の文献の98ページにあるパターンマツチングの
手法を用いてもよい。認識結果は、例えば既に同一出願
人が出願した文書画像情報の検索方式(特願昭59−1832
7号)で述べたように、本文から図No.へのポインタと先
にFD5に格納する。注釈は、前記の領域分割アルゴリズ
ムでは文字単位に切出されるため、ここでは隣接する領
域の統合を行う。統合はまず、注釈領域を膨張し、重な
りが生じた領域は同一の領域と見做すことによつて行
い、結果は統合された領域を単位としてFD5に格納す
る。なお以上の説明では、たとえば下線は切出し,囲み
は認識と限定したが、これを下線は認識,囲みは切出し
等定義することも勿論全く同様にして可能である。また
図No.を認識する例について説明したが、参考文献のNo.
を認識して、文献の末尾から対応する文献名を切出して
登録/表示することも可能である。さらに合類結果が、
不正確な場合に備えて対話処理による修正機能を設ける
こともできる。
作成する処理の一例について説明する。まず下線は、重
要なキーワードの下に付した記号と想定して、その上方
の文字列を切出して検索用2次情報としてFD5に格納す
る。上方の文字列は、下線領域の底辺を底辺とする矩形
上で、原画像12を横方向に投影することによつて行の切
れ目を求めて最下行として検出する。囲みは図No.を表
わす記号と想定して、領域内の数字を認識する。認識は
従来OCR装置で用いられてきた種々のアルゴリズムを適
用することが可能であるし、また簡単に、前述の電子通
信学会編の文献の98ページにあるパターンマツチングの
手法を用いてもよい。認識結果は、例えば既に同一出願
人が出願した文書画像情報の検索方式(特願昭59−1832
7号)で述べたように、本文から図No.へのポインタと先
にFD5に格納する。注釈は、前記の領域分割アルゴリズ
ムでは文字単位に切出されるため、ここでは隣接する領
域の統合を行う。統合はまず、注釈領域を膨張し、重な
りが生じた領域は同一の領域と見做すことによつて行
い、結果は統合された領域を単位としてFD5に格納す
る。なお以上の説明では、たとえば下線は切出し,囲み
は認識と限定したが、これを下線は認識,囲みは切出し
等定義することも勿論全く同様にして可能である。また
図No.を認識する例について説明したが、参考文献のNo.
を認識して、文献の末尾から対応する文献名を切出して
登録/表示することも可能である。さらに合類結果が、
不正確な場合に備えて対話処理による修正機能を設ける
こともできる。
以上で領索用2次情報を作成する処理の説明を終り、最
後にこれらの情報の検索処理での利用方法の一例につい
て説明する。第6図は検索処理の流れの一例を示す画面
フロー図である。図中50は通常の検索画面で、分類コー
ドを指定した結果である。このとき文書名またはその他
の番号の情報等が曖昧であるとき、下線部のみ表示の指
示を出すと、同図51のように文書単位に下線部のみが表
示される。また図のみ表示,注釈のみ表示の指示によ
り、同図52または53のように表示される。さらに図No.
については、認識されて本文との対応がついているた
め、検索後に本文と図を対比させて表示する等、前記の
既出願の検索方式のような利用が可能である。また複数
種類のメモを同時に一覧表等の形式で検索時に表示する
ことも勿論できる。
後にこれらの情報の検索処理での利用方法の一例につい
て説明する。第6図は検索処理の流れの一例を示す画面
フロー図である。図中50は通常の検索画面で、分類コー
ドを指定した結果である。このとき文書名またはその他
の番号の情報等が曖昧であるとき、下線部のみ表示の指
示を出すと、同図51のように文書単位に下線部のみが表
示される。また図のみ表示,注釈のみ表示の指示によ
り、同図52または53のように表示される。さらに図No.
については、認識されて本文との対応がついているた
め、検索後に本文と図を対比させて表示する等、前記の
既出願の検索方式のような利用が可能である。また複数
種類のメモを同時に一覧表等の形式で検索時に表示する
ことも勿論できる。
[発明の効果] このように、本発明では保持された原文書画像データ
と、手書きメモ等の追記がなされた文書画像とを位置合
わせして比較照合し、追記情報を抽出するので、追記部
分と原文書との分離にカラー識別を用いる必要がなく、
通常のイメージスキャナを適用できる。さらに矩形外枠
などの位置合わせ用追加情報の自動付与、参照によりに
プリンタでの画像出力、イメージスキャナでの画像入力
の際に生じる画像の傾きや拡大縮小にもかかわらず追記
情報の抽出を常に正確に行うことができる。
と、手書きメモ等の追記がなされた文書画像とを位置合
わせして比較照合し、追記情報を抽出するので、追記部
分と原文書との分離にカラー識別を用いる必要がなく、
通常のイメージスキャナを適用できる。さらに矩形外枠
などの位置合わせ用追加情報の自動付与、参照によりに
プリンタでの画像出力、イメージスキャナでの画像入力
の際に生じる画像の傾きや拡大縮小にもかかわらず追記
情報の抽出を常に正確に行うことができる。
第1図は本発明が適用される情報検索システムの一例を
示すブロツクダイアグラム、第2図は本発明におけるメ
モ抽出過程を示す処理の模式図、第3図は本発明による
線抽出処理のフローチヤート、第4図は本発明によるメ
モ分類過程を示す処理の模式図、第5図は本発明による
メモ分類処理のフローチヤート、第6図は本発明による
検索処理の画面のフローを示す図、第7図は本発明一実
施例の位置合せよう記号の説明図である。 1……マイクロプロセツサ、2……主メモリ、3……キ
ーボード、4……イメージスキヤナ、5……フアイル装
置、6……ビツトマツプメモリ、7……イメージプロセ
ツサ、8……デイスプレイ制御部、9……デイスプレ
イ、10……プリンタ、12……原画像、19……メモ画像。
示すブロツクダイアグラム、第2図は本発明におけるメ
モ抽出過程を示す処理の模式図、第3図は本発明による
線抽出処理のフローチヤート、第4図は本発明によるメ
モ分類過程を示す処理の模式図、第5図は本発明による
メモ分類処理のフローチヤート、第6図は本発明による
検索処理の画面のフローを示す図、第7図は本発明一実
施例の位置合せよう記号の説明図である。 1……マイクロプロセツサ、2……主メモリ、3……キ
ーボード、4……イメージスキヤナ、5……フアイル装
置、6……ビツトマツプメモリ、7……イメージプロセ
ツサ、8……デイスプレイ制御部、9……デイスプレ
イ、10……プリンタ、12……原画像、19……メモ画像。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 樋野 匡利 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 野村 訓弘 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内
Claims (1)
- 【請求項1】ファイル装置に蓄積済の原文書の内容に第
1の追加情報を付加した第1の画像を形成して保持し、
該第1の画像の複写を出力し、該複写に第2の追加情報
が付加された文書を入力して第2の画像とし、保持され
た前記第1の画像における前記第1の追加情報と前記第
2の画像における前記第1の追加情報とを位置合わせに
用いて前記第1の画像と前記第2の画像を比較処理する
ことによって前記第2の追加情報を抽出し、抽出した第
2の追加情報をファイル装置に蓄積する文書画像追加情
報の蓄積方法。
Priority Applications (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60108122A JPH0750483B2 (ja) | 1985-05-22 | 1985-05-22 | 文書画像追加情報の蓄積方法 |
| US06/863,242 US4748678A (en) | 1985-05-22 | 1986-05-14 | Method of storing and retrieving image data |
| DE3650554T DE3650554T2 (de) | 1985-05-22 | 1986-05-21 | Speicherungs- und Wiederauffindungsverfahren für Bilddaten |
| EP86106907A EP0202671B1 (en) | 1985-05-22 | 1986-05-21 | Method of storing and retrieving image data |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP60108122A JPH0750483B2 (ja) | 1985-05-22 | 1985-05-22 | 文書画像追加情報の蓄積方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61267177A JPS61267177A (ja) | 1986-11-26 |
| JPH0750483B2 true JPH0750483B2 (ja) | 1995-05-31 |
Family
ID=14476482
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP60108122A Expired - Lifetime JPH0750483B2 (ja) | 1985-05-22 | 1985-05-22 | 文書画像追加情報の蓄積方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US4748678A (ja) |
| EP (1) | EP0202671B1 (ja) |
| JP (1) | JPH0750483B2 (ja) |
| DE (1) | DE3650554T2 (ja) |
Families Citing this family (98)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2047821A1 (en) * | 1990-09-17 | 1992-03-18 | Wayne A. Buchar | Electronic filing system recognizing highlighted original to establish classification and retrieval |
| US5265242A (en) * | 1985-08-23 | 1993-11-23 | Hiromichi Fujisawa | Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates |
| US5172245A (en) * | 1986-10-17 | 1992-12-15 | Sharp Kabushiki Kaisha | Electronic information retrieval apparatus for image information using primary and secondary menus |
| US4907283A (en) * | 1987-03-13 | 1990-03-06 | Canon Kabushiki Kaisha | Image processing apparatus |
| US4803643A (en) * | 1987-08-10 | 1989-02-07 | Oclc Online Computer Library Center Incorporated | System and method for creating memory-retained, formatted pages of text, tabulation, and graphic data |
| US4985930A (en) * | 1987-09-24 | 1991-01-15 | Hitachi, Ltd. | Image data filing system and image data correcting method |
| JPS6482286A (en) * | 1987-09-25 | 1989-03-28 | Toshiba Corp | Image inclination detector |
| JP3020500B2 (ja) * | 1988-01-29 | 2000-03-15 | 株式会社日立製作所 | メモ情報を持つデータベースシステム及びメモ情報の管理方法 |
| JPH01261745A (ja) * | 1988-04-08 | 1989-10-18 | Internatl Business Mach Corp <Ibm> | データ・ベース・レコードのトランザクシヨンの回復方法 |
| US4901365A (en) * | 1988-12-19 | 1990-02-13 | Ncr Corporation | Method of searching binary images to find search regions in which straight lines may be found |
| US5140650A (en) * | 1989-02-02 | 1992-08-18 | International Business Machines Corporation | Computer-implemented method for automatic extraction of data from printed forms |
| DE69028643T2 (de) * | 1989-02-09 | 1997-02-20 | Canon Kk | Elektronisches Dateispeicherungssystem und Methode zum Auslesen von Bilddateninformation |
| US5280574A (en) * | 1989-05-26 | 1994-01-18 | Hitachi, Ltd. | Text document management method adapted for generating plural text documents derived from the same original text document |
| JP2940676B2 (ja) * | 1989-06-16 | 1999-08-25 | 株式会社リコー | ファクシミリ装置 |
| IL91220A (en) * | 1989-08-04 | 1995-03-30 | Ibm Israel | Compression of information |
| US5093911A (en) * | 1989-09-14 | 1992-03-03 | International Business Machines Corporation | Storage and retrieval system |
| DE59010737D1 (de) * | 1989-10-24 | 1997-08-21 | Horst Froesel | Verfahren zur mindestens teilweisen Umsetzung von Bilddaten in Text mit Vorbereitung für nachfolgende Speicherung oder Weiterverarbeitung |
| US5191525A (en) * | 1990-01-16 | 1993-03-02 | Digital Image Systems, Corporation | System and method for extraction of data from documents for subsequent processing |
| GB9003744D0 (en) * | 1990-02-20 | 1990-04-18 | Eden Design Group Ltd | Tamper proof handwritten information recording device and electronic mail network |
| US5146552A (en) * | 1990-02-28 | 1992-09-08 | International Business Machines Corporation | Method for associating annotation with electronically published material |
| JPH0424768A (ja) * | 1990-05-15 | 1992-01-28 | Ricoh Co Ltd | 画像ファイリング装置の登録・検索方法 |
| US5396588A (en) * | 1990-07-03 | 1995-03-07 | Froessl; Horst | Data processing using digitized images |
| US5444840A (en) * | 1990-06-12 | 1995-08-22 | Froessl; Horst | Multiple image font processing |
| US5109439A (en) * | 1990-06-12 | 1992-04-28 | Horst Froessl | Mass document storage and retrieval system |
| JP3026585B2 (ja) * | 1990-07-12 | 2000-03-27 | 旭光学工業株式会社 | 静止画再生装置 |
| US5546572A (en) * | 1991-08-28 | 1996-08-13 | Hitachi, Ltd. | Method for retrieving database of image information |
| US5926565A (en) * | 1991-10-28 | 1999-07-20 | Froessl; Horst | Computer method for processing records with images and multiple fonts |
| CA2078423C (en) * | 1991-11-19 | 1997-01-14 | Per-Kristian Halvorsen | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information |
| US5568566A (en) * | 1991-11-25 | 1996-10-22 | Kabushiki Kaisha Toshiba | Drawing processing apparatus |
| US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
| US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
| US5305396A (en) * | 1992-04-17 | 1994-04-19 | International Business Machines Corporation | Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms |
| JPH064642A (ja) * | 1992-04-20 | 1994-01-14 | Hitachi Ltd | イメージデータ管理システム |
| US5235654A (en) * | 1992-04-30 | 1993-08-10 | International Business Machines Corporation | Advanced data capture architecture data processing system and method for scanned images of document forms |
| US5555388A (en) * | 1992-08-20 | 1996-09-10 | Borland International, Inc. | Multi-user system and methods providing improved file management by reading |
| JP3093493B2 (ja) * | 1992-11-16 | 2000-10-03 | キヤノン株式会社 | 画像記憶検索装置 |
| JP3055126B2 (ja) * | 1993-03-25 | 2000-06-26 | キヤノン株式会社 | 画像情報処理装置の制御方法 |
| EP0625757B1 (en) * | 1993-05-07 | 2000-08-23 | Canon Kabushiki Kaisha | Selective document retrieval method and system |
| US5526520A (en) * | 1993-09-21 | 1996-06-11 | Krause; Gary M. | Method to organize and manipulate blueprint documents using hypermedia links from a primary document to recall related secondary documents |
| US5428694A (en) * | 1993-10-14 | 1995-06-27 | International Business Machines Corporation | Data processing system and method for forms definition, recognition and verification of scanned images of document forms |
| US5555325A (en) * | 1993-10-22 | 1996-09-10 | Lockheed Martin Federal Systems, Inc. | Data capture variable priority method and system for managing varying processing capacities |
| US5394487A (en) * | 1993-10-27 | 1995-02-28 | International Business Machines Corporation | Forms recognition management system and method |
| US5521991A (en) * | 1993-10-29 | 1996-05-28 | International Business Machines Corporation | Method and system for fast forms recognition of document form images |
| DE69516751T2 (de) * | 1994-04-15 | 2000-10-05 | Canon Kk | Bildvorverarbeitung für Zeichenerkennungsanlage |
| US5664183A (en) * | 1994-04-19 | 1997-09-02 | International Business Machines Corporation | Application of groupware to ISO 9000 registration via facilitated work sessions |
| US5502637A (en) * | 1994-06-15 | 1996-03-26 | Thomson Shared Services, Inc. | Investment research delivery system |
| JPH09270902A (ja) * | 1996-01-31 | 1997-10-14 | Ricoh Co Ltd | 画像ファイリング方法および画像ファイリング装置 |
| US5832474A (en) * | 1996-02-26 | 1998-11-03 | Matsushita Electric Industrial Co., Ltd. | Document search and retrieval system with partial match searching of user-drawn annotations |
| US6910184B1 (en) * | 1997-07-25 | 2005-06-21 | Ricoh Company, Ltd. | Document information management system |
| US5905991A (en) * | 1997-08-21 | 1999-05-18 | Reynolds; Mark L | System and method providing navigation between documents by creating associations based on bridges between combinations of document elements and software |
| EP0977129A1 (en) * | 1998-07-30 | 2000-02-02 | Infopoint Systems Research & Development Ltd. | Development of multi-media systems |
| US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
| JP3708768B2 (ja) | 1999-11-22 | 2005-10-19 | シャープ株式会社 | 読取り装置及びデータ処理システム |
| US7042594B1 (en) | 2000-03-07 | 2006-05-09 | Hewlett-Packard Development Company, L.P. | System and method for saving handwriting as an annotation in a scanned document |
| DE10105951B4 (de) * | 2000-03-07 | 2006-04-06 | Hewlett-Packard Development Co., L.P., Houston | System und Verfahren zum Speichern einer Handschrift als eine Anmerkung in einem gescanten Dokument |
| GB2362056B (en) * | 2001-02-09 | 2004-05-26 | Hewlett Packard Co | System and method for saving handwriting as an annotation in a scanned document |
| EP1182503A1 (en) * | 2000-08-17 | 2002-02-27 | Eastman Kodak Company | A kit for use in organizing images |
| US6909805B2 (en) * | 2001-01-31 | 2005-06-21 | Matsushita Electric Industrial Co., Ltd. | Detecting and utilizing add-on information from a scanned document image |
| JP2002278984A (ja) * | 2001-03-22 | 2002-09-27 | Fujitsu Ltd | 文書管理装置 |
| JP2003115039A (ja) * | 2001-07-11 | 2003-04-18 | Ricoh Co Ltd | 文書ファイリング装置、文書ファイリング方法、プログラムおよび記憶媒体 |
| JP4154156B2 (ja) * | 2002-02-08 | 2008-09-24 | ソニーマニュファクチュアリングシステムズ株式会社 | 欠陥分類検査装置 |
| US20030193582A1 (en) * | 2002-03-29 | 2003-10-16 | Fuji Photo Film Co., Ltd. | Method for storing an image, method and system for retrieving a registered image and method for performing image processing on a registered image |
| JP4251629B2 (ja) * | 2003-01-31 | 2009-04-08 | キヤノン株式会社 | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 |
| US7391917B2 (en) * | 2003-02-13 | 2008-06-24 | Canon Kabushiki Kaisha | Image processing method |
| US8442331B2 (en) | 2004-02-15 | 2013-05-14 | Google Inc. | Capturing text from rendered documents using supplemental information |
| US7707039B2 (en) * | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
| US20060136629A1 (en) * | 2004-08-18 | 2006-06-22 | King Martin T | Scanner having connected and unconnected operational behaviors |
| US10635723B2 (en) | 2004-02-15 | 2020-04-28 | Google Llc | Search engines and systems with handheld document data capture devices |
| US7812860B2 (en) | 2004-04-01 | 2010-10-12 | Exbiblio B.V. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
| US8146156B2 (en) | 2004-04-01 | 2012-03-27 | Google Inc. | Archive of text captures from rendered documents |
| US20060098900A1 (en) | 2004-09-27 | 2006-05-11 | King Martin T | Secure data gathering from rendered documents |
| US20060081714A1 (en) | 2004-08-23 | 2006-04-20 | King Martin T | Portable scanning device |
| US8081849B2 (en) | 2004-12-03 | 2011-12-20 | Google Inc. | Portable scanning and memory device |
| US7990556B2 (en) | 2004-12-03 | 2011-08-02 | Google Inc. | Association of a portable scanner with input/output and storage devices |
| US7894670B2 (en) | 2004-04-01 | 2011-02-22 | Exbiblio B.V. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
| US9116890B2 (en) | 2004-04-01 | 2015-08-25 | Google Inc. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
| US9008447B2 (en) | 2004-04-01 | 2015-04-14 | Google Inc. | Method and system for character recognition |
| US9143638B2 (en) | 2004-04-01 | 2015-09-22 | Google Inc. | Data capture from rendered documents using handheld device |
| US8713418B2 (en) | 2004-04-12 | 2014-04-29 | Google Inc. | Adding value to a rendered document |
| US8874504B2 (en) | 2004-12-03 | 2014-10-28 | Google Inc. | Processing techniques for visual capture data from a rendered document |
| US8489624B2 (en) | 2004-05-17 | 2013-07-16 | Google, Inc. | Processing techniques for text capture from a rendered document |
| US8620083B2 (en) | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
| US7668404B2 (en) * | 2004-06-30 | 2010-02-23 | Lexmark International, Inc. | Method and system of deskewing an image using monochrome conversion to separate foreground from background |
| US8346620B2 (en) | 2004-07-19 | 2013-01-01 | Google Inc. | Automatic modification of web pages |
| JP4784299B2 (ja) * | 2005-12-22 | 2011-10-05 | 富士ゼロックス株式会社 | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム |
| EP2067119A2 (en) * | 2006-09-08 | 2009-06-10 | Exbiblio B.V. | Optical scanners, such as hand-held optical scanners |
| US8396331B2 (en) * | 2007-02-26 | 2013-03-12 | Microsoft Corporation | Generating a multi-use vocabulary based on image data |
| DE202010018601U1 (de) | 2009-02-18 | 2018-04-30 | Google LLC (n.d.Ges.d. Staates Delaware) | Automatisches Erfassen von Informationen, wie etwa Erfassen von Informationen unter Verwendung einer dokumentenerkennenden Vorrichtung |
| CN102349087B (zh) | 2009-03-12 | 2015-05-06 | 谷歌公司 | 自动提供与捕获的信息例如实时捕获的信息关联的内容 |
| US8447066B2 (en) | 2009-03-12 | 2013-05-21 | Google Inc. | Performing actions based on capturing information from rendered documents, such as documents under copyright |
| US9081799B2 (en) | 2009-12-04 | 2015-07-14 | Google Inc. | Using gestalt information to identify locations in printed information |
| US9323784B2 (en) | 2009-12-09 | 2016-04-26 | Google Inc. | Image search using text-based elements within the contents of images |
| JP5035443B2 (ja) * | 2011-04-06 | 2012-09-26 | 富士ゼロックス株式会社 | 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム |
| US8996350B1 (en) | 2011-11-02 | 2015-03-31 | Dub Software Group, Inc. | System and method for automatic document management |
| US8687886B2 (en) | 2011-12-29 | 2014-04-01 | Konica Minolta Laboratory U.S.A., Inc. | Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features |
| JP6578858B2 (ja) * | 2015-09-30 | 2019-09-25 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
| JP6868186B2 (ja) * | 2017-03-24 | 2021-05-12 | 富士フイルムビジネスイノベーション株式会社 | 検索情報生成装置、画像処理装置、検索情報生成プログラム |
| TWI681661B (zh) * | 2018-03-26 | 2020-01-01 | 虹光精密工業股份有限公司 | 影像輸出裝置、多功能事務機、影像處理模組以及相關的影像輸出方法 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4300123A (en) * | 1979-01-02 | 1981-11-10 | Westinghouse Electric Corp. | Optical reading system |
| US4408181A (en) * | 1979-04-10 | 1983-10-04 | Tokyo Shibaura Denki Kabushiki Kaisha | Document data filing/retrieval system |
| EP0027594B1 (de) * | 1979-10-23 | 1984-05-09 | Scantron GmbH & Co. Elektronische Lesegeräte KG | Verfahren und Vorrichtung zum Identifizieren von Gegenständen |
| DE3175959D1 (en) * | 1980-10-31 | 1987-04-09 | Toshiba Kk | Document information filing system with a single display device |
| US4538182A (en) * | 1981-05-11 | 1985-08-27 | Canon Kabushiki Kaisha | Image processing apparatus |
| JPS59128661A (ja) * | 1983-01-14 | 1984-07-24 | Fuji Xerox Co Ltd | 画像フアイル装置 |
| JPS59135576A (ja) * | 1983-01-21 | 1984-08-03 | Nippon Telegr & Teleph Corp <Ntt> | ドキユメント情報登録検索装置 |
| JPS59183458A (ja) * | 1983-04-01 | 1984-10-18 | Hitachi Ltd | 画像検索方式 |
| US4553261A (en) * | 1983-05-31 | 1985-11-12 | Horst Froessl | Document and data handling and retrieval system |
| JPS603056A (ja) * | 1983-06-21 | 1985-01-09 | Toshiba Corp | 情報整理装置 |
| JPS6077271A (ja) * | 1983-10-03 | 1985-05-01 | Fuji Xerox Co Ltd | 画像フアイル装置 |
-
1985
- 1985-05-22 JP JP60108122A patent/JPH0750483B2/ja not_active Expired - Lifetime
-
1986
- 1986-05-14 US US06/863,242 patent/US4748678A/en not_active Expired - Lifetime
- 1986-05-21 EP EP86106907A patent/EP0202671B1/en not_active Expired - Lifetime
- 1986-05-21 DE DE3650554T patent/DE3650554T2/de not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| EP0202671A3 (en) | 1989-10-11 |
| EP0202671A2 (en) | 1986-11-26 |
| DE3650554T2 (de) | 1997-02-20 |
| US4748678A (en) | 1988-05-31 |
| EP0202671B1 (en) | 1996-08-14 |
| JPS61267177A (ja) | 1986-11-26 |
| DE3650554D1 (de) | 1996-09-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0750483B2 (ja) | 文書画像追加情報の蓄積方法 | |
| US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
| US7801358B2 (en) | Methods and systems for analyzing data in media material having layout | |
| JP4181892B2 (ja) | 画像処理方法 | |
| JP5659563B2 (ja) | 識別方法、識別装置およびコンピュータプログラム | |
| US8824798B2 (en) | Information processing device, computer readable medium storing information processing program, and information processing method | |
| EP3940589B1 (en) | Layout analysis method, electronic device and computer program product | |
| JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
| JPH05282423A (ja) | 文書画像を復号することなく文書内の単語の出現頻度を調べるための方法 | |
| JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
| KR19990036515A (ko) | 문자 인식/수정 방법 및 장치 | |
| JPH0314184A (ja) | 文書画像再配置ファイリング装置 | |
| CN111626145A (zh) | 一种简捷有效的残缺表格识别及跨页拼接方法 | |
| CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
| US20080244384A1 (en) | Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus | |
| JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
| CN119169647B (zh) | 一种版式文档的处理方法、装置及设备 | |
| CN119337817A (zh) | 一种适用于rag的基于渲染过程的pdf元素提取方法 | |
| JP3285686B2 (ja) | 領域分割方法 | |
| US5854860A (en) | Image filing apparatus having a character recognition function | |
| JP4518212B2 (ja) | 画像処理装置及びプログラム | |
| JP4517822B2 (ja) | 画像処理装置及びプログラム | |
| JPH08153110A (ja) | 文書ファイリング装置及び方法 | |
| JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
| JPH0327471A (ja) | 画像登録方式 |