CN100458773C - 信息处理装置和信息处理方法 - Google Patents

信息处理装置和信息处理方法 Download PDF

Info

Publication number
CN100458773C
CN100458773C CNB2004100366688A CN200410036668A CN100458773C CN 100458773 C CN100458773 C CN 100458773C CN B2004100366688 A CNB2004100366688 A CN B2004100366688A CN 200410036668 A CN200410036668 A CN 200410036668A CN 100458773 C CN100458773 C CN 100458773C
Authority
CN
China
Prior art keywords
similar degree
document image
vector data
data
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100366688A
Other languages
English (en)
Other versions
CN1542655A (zh
Inventor
江口贵巳
鵜泽充
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN1542655A publication Critical patent/CN1542655A/zh
Application granted granted Critical
Publication of CN100458773C publication Critical patent/CN100458773C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99948Application of database or data structure, e.g. distributed, multimedia, or image

Abstract

本发明提供一种信息处理装置和信息处理装置、以及存储媒体、程序。通过根据布局信息而对各属性的检索结果适应性地估计检索结果,从而更正确地检索原始文档。为了实现该目的,用于检索类似于所输入的文档图象之图象数据的信息处理方法,其特征在于,包含:按每种属性将所述输入的文档图象分割为多个区域的步骤(步骤S402);为每个所述被分割的区域,利用适合于所述属性的检索步骤,计算出类似度的步骤;以及,对每个所述被分割的区域,对所计算出的类似度进行加权,从而计算出总类似度的步骤(步骤S406)。

Description

信息处理装置和信息处理方法
发明领域
本发明涉及一种检索技术,用于从数据库中检索出与由扫描仪等输入装置读取的图象类似的图象数据。
背景技术
近年来,在呼吁环境问题的进程中,办公室中的无纸化快速发展。其中,提出了一种装置,用于通过扫描来读取在文件夹(binder)中收集的纸文档或散发资料(例如请参见专利第3017851号公报)。
但是,在上述检索装置中,由于一律要对所有图象执行所谓利用位图进行比较的方法,因此,要考虑检索效率或检索精度随着文档图象内容的不同而恶化的情况。因此,本申请人考虑了具有以下检索方法(将这种检索称为“复合检索”)的一种文件管理系统:当检索原始文档时,在从原始文档和扫描读取的图象中分别计算出文本、照片、线条等每个属性的特征量之后,综合判断文本的一致程度、照片图象的一致程度、使用各属性的布局(layout)信息的布局一致程度等多种一致程度。
在这种文件管理系统中处理的文件,从文本属性多的文件到照片、线条属性多的文件,遍及各个方面,每个文件的布局(文件内容)大不相同。于是,在上述文件管理系统中,由于在执行综合判断时,一律要估计每个属性的检索结果,因此,存在在混杂有布局大不相同的文件的环境中,不能得到充分的检索精度的问题。为了整理多种文件,提高文件的再利用性,不仅要对全部文件进行综合判断,而且在文件仅有一部分不一致时也必须进行检索。即便在引用照片等的情况中,对某一部分一致的文档进行检索的需求也是显著的。例如,在同一文档的作者不同时,在必须针对各个部分适当征收版税等情况下这种检索是必不可少的。
发明内容
本发明是鉴于上述问题而作出的,目的在于通过适应性地估计各属性的检索结果,来实现更正确的原始文档的检索。
本发明的目的在于即便在仅有文件的一部分不一致的情况下也进行检索,使得重复数据的整理容易,从而实现有效的文件管理。
为了实现上述目的,本发明的信息处理装置具有以下结构,即,一种信息处理装置,用于检索类似于所输入的文档图象的图象数据,其特征在于具有:分割单元,用于根据每种属性将所述输入的文档图象分割为多个区域;类似度计算单元,对每个所述分割成的区域,使用适于所述属性的检索单元来计算类似度;总类似度计算单元,根据所述输入的文档图象中的所述分割而成的各区域的占有率,对按照每个所述分割成的区域计算出的类似度进行加权,从而计算出总类似度;以及布局类似度计算单元,计算所述输入的文档图象与比较对象的图象数据的布局类似度,该布局类似度计算单元还用于执行控制,以便对于所计算出的布局类似度等于或大于规定阈值的所述比较对象图象数据,执行在所述类似度计算单元以及所述总类似度计算单元中执行的处理,而对于所计算出的布局类似度低于规定阈值的所述比较对象图象数据,不执行在所述类似度计算单元以及所述总类似度计算单元中执行的处理。
根据本发明,通过适应性地估计各属性的检索结果,从而能够实现更正确的原始文档的检索。
即便在仅有文件的一部分不一致的情况下也进行检索,使得重复数据的整理容易,从而能够实现有效的文件管理。
通过以下结合附图所作的说明,本发明的其它特点以及优点将更加明显,在整个附图中,相同的字符表示相同或相似的部分。
附图说明
插入说明书并构成说明书一部分的附图说明了本发明的实施例,并与描述部分一起用于解释本发明的原理。
图1图示了实现有关本发明的信息处理方法的图象处理系统的结构。
图2是MFP 100的结构图。
图3是表示检索用索引生成处理的流程的流程图。
图4是显示类似原始检索处理以及登录处理的流程的流程图。
图5A和5B图示了输入原稿的一个例子。
图6是显示指示字信息检测处理的流程的流程图。
图7是检测指示字信息时使用的输入原稿的一个例子。
图8是一张流程图,显示了根据指示字信息来执行文件检索情况下的处理流程。
图9图示了对图5所示的输入原稿进行块选择的结果。
图10是一张流程图,显示了根据类似度来执行文件检索处理情况下的处理流程。
图11是一张流程图,显示了根据类似度来执行文件检索处理的块比较处理的细节。
图12是一张流程图,显示了块比较处理的块内比较处理的细节。
图13图示了DAOF的数据结构。
图14是一张流程图,显示了变换为应用数据的变换处理。
图15是一张流程图,显示了文档结构树生成处理。
图16A和16B图示了文档结构树的结构。
图17是一张流程图,显示了指示字信息嵌入处理。
图18是一张流程图,显示了第4实施例的文件检索处理。
图19是一张用于指定检索选项的用户界面画面。
具体实施方式
以下,将按照附图来详细说明本发明的最佳实施例。
第1实施例
以下,说明本发明的第1实施例。图1图示了实现本发明的信息处理方法的图象处理系统的结构。如该图所示,在本实施例中,构筑在办公室10和办公室20通过因特网104而连接的环境下、实现本发明的信息处理方法的图象处理系统。
在办公室10内构筑的LAN 107中,分别连接有MFP 100、控制MFP 100的管理PC 101、客户PC(具有外部存储单元)102-1、文件管理服务器106-1及其数据库105-1、计费服务器110、以及代理服务器103-1。同样,在办公室20内构筑的LAN 108上,分别连接有文件管理服务器106-2及其数据库105-2、计费服务器110-2。办公室10内的LAN 107和办公室20内的LAN 108通过代理服务器103-1、103-2而连接到因特网104上。
在具有这种结构的图象处理系统中,没有特别限定存储作为检索对象的登记图像的场所。既可以存储在MFP 100内的存储装置(后述)内、管理PC 101的硬盘(未图示)内、也可以存储在文件管理服务器106-1的数据库(105-1)内。但是,为了能够检索该存储的登录图象,存储场所处于可经LAN 107或108从外部对其进行访问的状态。
根据本发明的信息处理方法(检索功能)可在图1所示的图象处理系统内的任意装置上实现。例如,既可以使MFP 100内的数据处理装置(后述)具有该检索功能、使管理PC 101具有检索功能,也可以使文件管理服务器106-1具有该检索功能。
MFP 100承担纸文档的图象读取处理以及针对读取的图象信号的图象处理的一部分,利用LAN 109将图象信号输入到管理PC 101内。管理PC是普通PC,其内部具有图象存储单元、图象处理单元、显示单元、以及输入单元,但是,其一部分也可以集成在MFP 100上。
图2是MFP 100的结构图。图2中,含有自动送稿器(以下称为ADF)的图象读取部200利用图中未示的光源照射推叠的或是1张纸文档(原稿),通过透镜将原稿的反射影像成像在固体摄像元件上,并从固体摄像元件获得一个光栅状的图象信号作为600 DPI密度的图象信息。在通常的复印处理的情况下,利用数据处理装置205将该图象信号转换为记录信号,在需要复印多张的情况下,将一页的记录数据暂时存储保持在记录装置202内之后,顺序输出到记录装置202后在纸上形成图象。
从客户PC 102发送的打印数据经由LAN 107以及网络IF 204,在数据处理装置205内被转换为可记录的光栅数据后,由记录装置202在纸上形成记录图象。操作者通过MPF 100内装备的键操作部(输入装置203)或是管理PC 101的键盘以及鼠标对MFP 100发出指示,这一系列操作是由数据处理装置205内的图中未示的控制部来控制的。
另一方面,操作输入的状态显示以及处理中的图象数据的显示是由显示装置206来执行的。存储装置201也可以由客户PC 101来控制,这些MFP 100和客户PC 101的数据交换和控制也可以通过网络IF 207或直接经LAN 109来执行。
处理概要
接下来,利用图3和图4,来说明图1所示的图象处理系统中的、包含依据本发明的信息处理方法而执行的处理的图象处理的总体概要。
为了便于说明,以下,假定具有登录图象的数据库构筑在客户PC内的硬盘(图中未示)上,而且通过使管理PC 101和MFP 100一起动作来实现的本发明的信息处理方法。
(生成检索用索引)
图3是一张流程图,显示了文件检索用索引生成处理的流程。首先,输入索引生成对象文件作为原稿(步骤S301)。该原稿可以是从图象读取部200输入印刷物并将其位图化后形成的(位图图象),可以是利用文档编辑应用程序做成的电子数据,也可以是按照客户PC 102的硬盘或CD驱动器、DVD驱动器、FDD驱动器等存储媒体内存储的应用程序的固有格式的电子数据。假定该原稿通过用户的操作而被存储在数据库的不同类别的文件夹内。例如,通过按照每个体育项目、产品小册子或商业文件等种类(类别),将原稿存储到各个文件夹内,从而容易执行文件管理。
在不是位图图象的应用数据的情况下(步骤S302中“No”的情况下),分支到步骤S303,在管理PC 101的CPU中执行光栅化。所谓光栅化,是对应用数据进行分析并产生图象数据的处理,一般而言,这是生成打印图象时广泛执行的处理。
接下来,执行块选择(区域分割处理)(步骤S304)。在步骤S304中,将区域分离成文字/艺术线条部分以及半色调图象部分。通过将文字部分分离为基于段落将文字分组而成的块,或者,分离为由线构成的表或图形,从而执行相应的分段化。另一方面,将用半色调表现的图象部分分割为针对每个数据块独立的所谓对象(object),诸如被分离为矩形的块的图象部分、背景部分等。而且,对文字块执行OCR处理(步骤S305)。
接下来,在输入图象中,检测对应于作为附加信息记录的2维条码或URL的对象,通过对URL利用OCR进行文字识别,通过对2维条码解读该标记,从而检测出分别存储该原稿的原始电子文件的存储装置内的指示字信息(步骤S306)。作为附加指示字信息的方法也可以是不直接可视的所谓的电子水印方法等,例如像在文字与文字之间嵌入信息的方法,或嵌入半色调图象内的方法等。
在步骤S306中,在没有检测出指示字信息的情况下,分支到步骤S307,使用上述任意一种方法来嵌入指示字信息。但是,在检索处理中,指示字信息的嵌入不是必须的处理。
接下来,利用作为图象部分分割的对象来产生图象检索用索引(步骤S308)。在这里,记录图象检索中所必需的图象特征量,例如是平均色。还可将该图象的色分布等作为特征量来使用。
接着,利用作为文字部分分割的对象来产生概念检索用索引(步骤S309)。在这里,在后述的概念检索中,分析所输入文章的意思、文理,并找到与该内容相关的文档。由此,与以往的检索不同,即便在不了解明确的关键词的情况下,也能检索文件。在概念检索索引产生处理中使用的文字在原稿为位图数据的情况下,输入在步骤S305中执行文字识别所得到的文字,而在应用数据的情况下,输入存储在应用程序内的文字。
接下来,产生全文检索用索引(步骤S310)。全文检索用索引产生处理中使用的文字,是与上述概念检索索引产生处理中使用的文字相同的文字。
接着,在步骤S311中,学习各个种类的特征(单词的出现频率等)、产生分类用特征矢量。学习各种文件夹内存储的索引产生对象文件的特征(单词的出现频率等),产生、更新各种文件夹的分类用特征矢量。如此,通过预先提取各类文件夹的特征,当在步骤S411中存储在后述图4的S409中被矢量化的输入图象时,能够在步骤S410中,提示作为存储目标的推荐文件夹侯选单。
之后,存储产生的索引信息(步骤S312)。存储目标可以是连接在图1中的办公室10或20的LAN 107、108上的文件管理服务器106-1、106-2内的数据库105-1、105-2内、或MFP 100自身具有的存储装置201等。在本实施例中,假定是存储在客户PC 101内的硬盘上的。
(类似原稿检索或登录)
接下来,使用图4来说明类似原稿检索处理以及登录处理。首先,操作图2的MFP 100的图象读取部200,光栅状扫描一张原稿,从而得到600DPI-24比特的图象信号。之后,对于该图象信号利用数据处理装置205执行前处理,并作为1页的图象数据保存在存储装置201内(步骤S401)。或者是,对作为应用数据存储的原始电子文件进行光栅化,从而得到600 DPI-24比特的图象信号。对于该图象信号在数据处理装置205中实施前处理,并作为1页的图象数据保存在存储装置201中(步骤S401)。
管理PC 101的CPU将所存储的图象信号区域分离为文字/线条部分和半色调的图象部分。将文字/线条部分分离为进一步按段落分块而成的每块,或者,分离为由线构成的表、图形,从而执行相应的分段化。另一方面,将用半色调表现的图象部分分割为所谓按每个数据块独立的对象(步骤S402),诸如像按照分离为矩形的块的图象部分、背景部分等。
对文件块执行OCR处理(步骤S403)。此时,在输入图象中,检测出适用于作为附加信息记录的2维条码或URL的对象,通过利用OCR对URL进行文字识别,通过对2维条码解读该标记,从而检测出存储各个原稿的原始电子文件的存储装置内之指示字信息(步骤S404)。另外,作为附加指示字信息的方法,也可以是不直接可视的所谓的电子水印方法等,例如像在文字与文字之间嵌入信息的方法,或嵌入半色调图象内的方法等。
在检测出指示字信息的情况下(步骤S405中的“YES”的情况下),分支到步骤S418,从指示字所指示的地址中检索原始电子文件。在本实施例中,原始电子文件存储在管理PC 101内的硬盘内,按照步骤S404中得到的地址信息对该硬盘进行检索。原始电子文件的存储场所并不仅限于此,也可以是以下任意一种:图1中的客户PC 102内的硬盘内;或连接在办公室10或20的LAN 107、108上的文件管理服务器106-1、106-2内的数据库105-1、105-2;或是MFP 100自身具有的存储装置201。在步骤S418中,在没有看到原始电子文件的情况下、在看到代表PDF或tiff的所谓的图象文件的情况下、或是在指示字信息自身不存在的情况下(步骤S405中的“NO”的情况下),分支到步骤S406。
在步骤S406中,为了检索数据库上的原始电子文件,首先,在步骤S403中将经受了OCR的文字块分割为单词,并提取关键词。作为关键词提取是这样一种功能:分析文字部分,根据单词的出现频率等仅仅提取预定数目的所确定的单词,作为关键词。该关键词作为全文检索的检索词进行输入。从文字块中提取文字,并利用文章开头对文章全体的说明等性质来产生摘要。所产生的摘要文作为概念检索的检索词进行输入。另外,对于图象块,作为作为图象数据的个别的图象文件执行图象检索。接下来,研究与数据库上的各原始电子文件的类似度,以检索原始电子文件。本发明的特征在于:为每个对象求取类似度,按照每个对象的文件内占有率而向文件全体的类似度反映该对象的类似度。即,通过较大地向文件全体的类似度反映文件内占有比例大的对象的类似度,从而有可能自适应地应对各种格式的文件。对于能够对全体区域计算类似度,因此,也可以看出部分一致的文件。
步骤S406中的检索处理结果,在发现类似度高的原始电子文件的情况下,显示简图(步骤S407),如果必须由操作这从多个原始电子文件中选择的情况下,通过操作者的输入操作,来执行原始电子文件的指定。
另外,在侯选文件是1个文件的情况下,也可以自动从步骤S408分支到步骤S413,并通知存储地址。在步骤S406的检索处理中没有看到原始电子文件的情况下,或是,在看到的是代表PDF或tiff的所谓的图象文件的情况下,从步骤S408分支到步骤S409。
在步骤S409中,执行从图象转换为矢量数据的变换处理。例如,在步骤S403中,对于经过OCR处理的文字块,进一步识别文字的大小、种类、字体,并使用预先为每种文字类别(字体类别、种类)准备的布局数据,对所述OCR结果的文字码进行矢量化。就文字块而言,识别文字图象的轮廓,通过沿着文字图象的轮廓提取布局而对文字区域进行矢量化,且,此时,也可以存储OCR处理结果,作为与各文字的矢量数据对应的文字码。对于由线构成的表、图形块进行矢量化,能够识别表等图形形状的话,则能识别该图形。另外,出于图象块是图象数据的原因,将其作为单独的JPEG文件来进行处理。这些矢量化处理是针对逐个对象执行的,并进一步保存各对象的布局信息,将其转换为例如是嵌入了矢量数据的rtf(Rich Text Format)形式。通过在可以使用如此产生的rtf形式的文件的应用中执行读入,不用说,能够将文章恢复为能够编辑的状态,而且,也能够将图形或图象数据恢复为能够编辑的状态。变换的应用用数据文件并不仅限于可嵌入矢量数据的对象之rtf形式,例如,也可以是转换为SVG(Scarable VectorGrafics)格式等其它的文件形式。
接下来,在步骤S410中启动了分类辅助功能。所谓分类辅助功能,是在存储文件时,辅助将其分类并存储到哪一个种类的文件夹内的功能。根据该功能,能够大幅减轻有关使用者的文件登录的作业量。从文件的文字部分来产生分类用特征矢量,并按照与索引内存储的分类用特征矢量的类似度判断,从上级的类别文件夹开始顺序显示类似度。如此,通过显示登录目的单元的推荐的侯选类别文件夹,使得使用者能够容易地执行登录处理。另外,使用者还能够在所显示的类别文件夹中进行选择,作为文件的登录目的单元,也可以产生未显示的类别文件夹、或是新的类别文件夹,并能够将作为电子文件而转换的数据存储在管理PC 101内的硬盘内(步骤S411)。
在步骤S409中,经矢量化的输入图象,在此后执行相同的检索处理时,被作为原始电子文件检索出来,在步骤S412中,执行与前述的S308-S311相同的索引产生处理,产生索引信息,并追加到检索用索引文件内。
在能够通过步骤S418由指示字信息来指定原始电子文件的情况下,以及在S408的检索处理中能够指定原始电子文件的情况下,以及能够通过在S409-412中进行矢量化和存储的文件来进行向电子文件的转换的情况下,为了操作者可以直接指定原始电子文件,在步骤S413中,将该原始电子文件的存储地址通知操作者。
再者,在步骤S414中,如果判断出操作者想执行的处理是“记录”,则分支到步骤S415,将指示字信息作为图象数据追加到文件内。
使用如此得到的电子文件自身,从而能够在步骤S416中执行文件的加工、存储、传送、以及记录。与使用图象数据的情况相比,这些处理削减了信息量,存储效率高,传送时间短,另外,在记录显示时,能够非常优秀地作为高品质的数据。
在步骤S417中,根据计费服务器110-1或110-2中存储的、按每个文件定义的版权版税信息,来执行与检索结果的显示方法/访问方法、使用者处理方法相应的计费处理。
以下,将详细说明各处理块。首先,就步骤S402中显示的块选择处理进行说明。
(块选择处理(区域分割处理))
使用图5A和5B来说明步骤S402的块选择处理。图5A是在步骤S401中读取的一页图象数据的一个例子,图5B显示了将该图象数据逐对象地识别为象素块(pixel cluster),针对该每个数据块判断其文字/图形/照片/线/表/等属性,并将其分割为具有不同属性的区域。
以下说明块选择处理的实施例。首先,将输入图象进行黑白二值化,执行轮廓线追踪,提取由黑象素轮廓包含的象素块。对于面积大的黑象素块,对内部存在的白象素执行轮廓追踪,提取出白象素块,又进一步从一定面积以上的白象素块内再次提取出黑象素块。
按大小以及形状对如此得到的黑象素块分类,将其分到具有不同属性的区域中。例如,假定:将纵横比接近1、大小位于一定范围内的块作为与文字相对应的象素块;另外,将相邻文字排列整齐的、被分组化的部分作为文字区域(TEXT);将扁平的象素块作为线区域(LINE);将一定大小以上的、四角形的、其中包含整齐排列的白象素块的黑象素块所占有的范围作为表区域(TABLE);将形状不定的象素块散乱的区域作为照片区域(PHOTO);将除此之外的任意形状的象素块成为图形区域(PICTURE)等。
将块选择处理中得到的各块的块信息用作后面将要说明的矢量化、或检索处理用信息。
(指示字信息的检测)
接下来,将就用于从图象信息中提取出原始电子文件的存储位置的指示字信息检测处理(步骤S404)进行说明。
图6是一张流程图,显示了对输入图象中附加的2维条码(QR码符号(code symbol))进行解码,并输出数据文字列的过程。在图7中显示了附加2维条码的原稿的一个例子。
首先,利用CPU(未图示)来扫描表示存储于数据处理装置205内的页存储器中的原稿301的图象,根据在先说明的块选择处理的结果来检测规定的2维条码符号703的位置(步骤600)。QR码的位置检测图案,由位于符号4角中的3角上之相同的位置检测要素图案构成。
接下来,恢复与位置检测图案相邻的格式信息,并获取应用于该符号的纠错水平以及主图案(S601)。
在确定符号的型号(S602)后,通过使用利用格式信息所得到的主图案,对编码区域的比特图案(bit pattern)进行XOR运算,从而消除了屏蔽(mask)处理(步骤S603)。
另外,按照与该模型对应的配置规则,读取符号字符、并恢复消息的数据以及纠错码字(步骤S604)。
执行在恢复的代码上是否存在错误的检测(步骤S605),在检测出错误的情况下,分支到步骤S606,并对其进行校正。
根据经过校正的数据的模式指示符和文字数指示符,将数据代码字分割为段(步骤S607)。
最后,根据式样模式对数据文字进行解码,并输出结果(步骤S608)。
另外,组合在2维条码内的数据,表示对应的原始电子文件的地址信息,例如,由文件服务名称以及由文件名称构成的路径信息,或者是由去往对应的原始电子文件的URL构成。
在本实施例中,尽管是对利用2维条码而添加了指示字信息的原稿701进行说明,但是,在直接用文字串记录指示字信息的情况下,利用先前的块选择处理来检测遵循规定规则的文字串的块,通过文字识别显示该指示字信息的文字串的各文字,从而能够直接得到原始电子文件的地址信息。
另外,也可以通过对于图7的原稿701的文字块702、或704的文字串,在相邻文字和文字的间隔等上施加难以目视程度的调制,并在该文字间隔内嵌入信息,从而提供了指示字信息。如果在执行后述的文字识别处理时,在各文字间隔中检测出所谓的水印信息,则得到指示字信息。此外,也可以在自然图形705中添加指示字信息作为电子水印。
(利用指示字信息而执行的原始电子文件检索)
接下来,使用图8的流程图,来说明图4的步骤S405和步骤S418所示的、根据指示字信息的原始电子文件的检索处理。
首先,基于指示字信息中包含的地址信息来指定文件服务器(步骤S800)。在本实施例中,尽管文件服务器指示的是管理PC 101内的硬盘,但是,在原始电子文件的存储目标是客户PC102、文件管理服务器106-1、106-2内的数据库105-1、105-2或是MFP 100内的存储装置201的情况下,也可以指示这些部件。地址是由URL、或由服务器名称和文件名称构成的路径信息。
如果能够指示文件服务器则对文件服务器传送地址(步骤S801)。文件服务器在接收到地址后,检索该原始电子文件(步骤S802)。在原始电子文件不存在的情况下(步骤S803中“No”的情况下),将其通知给MFP 100。
在原始电子文件存在的情况下(步骤S803中“YES”的情况下),如图4所说明的那样,在通过原始电子文件的地址(步骤S413)的同时,如果使用者所希望的处理是图象文件数据的获取,则将原始电子文件传送给MFP 100(步骤S808)。
(OCR处理)
接下来,将就步骤S403中的OCR处理(文字识别处理)进行说明。
在文字识别部中,使用图案匹配方法来对按照文字单位切割出的图象进行识别,从而得到所对应的文字码。该识别处理,是将从文字图象所得到的特征转换为数十维的数值序列后的观测特征矢量,与每个字种事先所获取的辞典特征矢量进行比较,并将距离最近的字种作为识别结果进行处理。特征矢量的提取有各种公知的方法,例如,有这样一种方法:将文字分割为网格(mesh)状,并按照方向将各网格内的文字线作为线素,将如此计数后所得到的网格数目的维数矢量作为特征。
对在块选择处理(步骤S402)中提取出的文字区域执行文字识别的情况下,首先对该区域判断是横向书写还是竖向书写,按各对应方向切割出行,之后,再切割出文字,从而得到文字图象。横写、竖写的判断,可以通过取得象素值在该区域内的水平/垂直投影,在水平投影的方差大的情况下判断为横写区域,在垂直投影的方差大的情况下判断为竖写区域。在横写的情况下,通过利用水平方向的投影来切割出行,再根据相对于切出的行在垂直方向的投影切出文字,来进行文字串和文字的分解。对于竖写的文字区域,只要使水平和垂直相反即可。另外,能够检测出此时文字的大小。
(文件检索)
接下来,利用图10来说明图4的步骤S406所示的文件检索处理的细节。
文件检索,是利用由前述块选择处理(步骤S402)所分割的各个块信息来执行的。具体而言,它使用了复合检索,复合了各块的属性以及文件中的块坐标信息的比较,即借助布局的比较,以及按照文件内的各块的属性而使用不同的比较方法的每块的内部信息的比较。
图10是一张流程图,用于将经过图4的步骤S406中的块选择处理的输入文件顺序与已经存储的原始电子文件的检索用索引相比较,并检索出与其一致的原始电子文件。首先,利用数据库对原始电子文件进行访问(步骤S101)。将输入文件的各块和原始电子文件的各块进行比较,对于输入文件的每块求取与原始电子文件的块的类似度(步骤S1002)。
这里,使用图5A、图9、图11以及图12,对步骤S1002的块比较进行说明。将图5A作为输入文件,在图9中显示了原始电子文件的例子。图9的原始电子文件被分割为块B’1-B’9,并分别进行了矢量化处理。图11是一张流程图,用于将输入文件中的一个块与原始电子文件进行比较,并计算出类似度。当为每个块计算出类似度时,首先,选择出被推定为与输入文件的该块布局上一致的原始电子文件的对象块。在该处理中,对于输入文件的多个块,也可以重复选择原始电子文件的对象块。接下来,求出该块和对象块的布局信息的类似度。比较块的位置、大小、以及属性(步骤S1102、1103、1104)、并从该误差中求出布局的类似度。接着,执行块内部的比较。由于在比较块内部时是作为相同属性进行比较的,因此,在属性不同的情况下,要执行将单方的块再矢量化为一致的属性等前处理。对于通过前处理作为相同属性处理的输入文件的块以及原始电子文件的对象块,执行块内部比较(步骤S1105)。在块内部比较中,为了采取最适合块属性的比较方法,随属性不同其比较方法也不同。图12是一张流程图,记述了每块的比较方法。例如,通过前述的块选择处理,将块分割为文本、照片、表、线条等属性。在处理的块是照片图象块的情况下(步骤S1201的“YES”的情况),则基于从图象中提取出的特征矢量,利用特征空间上的误差来计算类似度(步骤S1202)。这里,所谓的特征矢量,可以举出由色直方图或色矩等有关颜色的特征量、同现矩阵(日文:共起行列)、对比度、熵(entropy)、Gabor变换等所表现的结构特征量、傅利叶描述符等形状特征量等许多种,使用这多个特征量中最合适的组合。检索结果(按照类似度顺序排列的侯选清单)存储于规定的存储装置内,例如是存储在管理PC 101的存储装置内(步骤S1203)。
在文本块的情况下(步骤S1204的“YES”的情况下),由于利用OCR处理来判断文字码,因此,在步骤S1205中执行摘要文的产生,并执行概念检索。在步骤S1206中,将检索结果存储在存储装置内。接下来,在步骤S1207中,执行关键词的提取,并执行全文检索。将检索结果存储于存储装置内(步骤S1208)。
如此,计算出块位置、大小、属性、块内部的类似度,并通过合计各类似度,从而可以对输入文件的该块计算出其类似度,并记录该块类似度。对于输入文件的所有块,反复执行一连串的处理。通过整体合并求出的块类似度,来求出输入文件的类似度(步骤S1003)。
接下来,说明总类似度计算处理(步骤S1003)。对于图5A的输入文件的块,设算出的每块的类似度为n1、n2、……。此时,文件整体的总类似度N用下式表示。
N=w1×n1+w2×n2+……+γ                ……(1)
这里,设w1、w2、……是估测各块的类似度的加权系数;设γ是校正项,例如,是作为对于图9的原始电子文件的输入文件之对象块的未选出之块的估计值等。加权系数w1、w2、……是利用块的文件内占有率来求出的。例如,当设块1的大小为S1时,则块1的占有率w1就这样算出:
w1=S1/(所有块的大小之和)                ……(2)
通过使用这种占有率的加权处理,文件内占有大区域的块的类似度被进一步反映在文件全体的类似度中。
以上,在类似度高于阈值Th的情况下,将检索结果作为侯选而保存(步骤S1005),并由简略图等来显示原始电子文件(步骤S407)。如果要操作者从这么多中选择一个,则通过操作者的输入来指定原始电子文件。
(转换为应用数据的转换处理)
但是,对一页的图象数据进行块选择处理(步骤S402),矢量化处理(步骤S408)的结果被转换为图3所示样子的中间数据形式的文件,可以将这种数据形式称为文件分析输出格式(DAOF)。
图13图示了DAOF的数据结果。在图13中,1301是头部,用于保持与处理对象的输入文件有关的信息。在布局描述数据部1302中,保持按照输入文件中的TEXT(文字)、TITLE(题目)、CAPTION(字幕)、LINEART(线条)、EPICTURE(自然画)、FRAME(框)、TABLE(表)等属性而被识别的各块的属性信息和其矩形地址信息。在文字识别描述数据部1303中,保持文字识别TEXT、TITLE、CAPTION等的TEXT块所得到的文字识别结果。在表描述数据部1304中,存储了TABLE块的结构细节。图象描述数据部分1305从输入文件中切出PICTURE或LINEART等块的图象数据,并对其进行保存。
这种DAOF不仅仅作为中间数据,而且还存在其自身被文件化后保存的情况,在这种文件的状态下,在所谓的一般的文件产生应用中,不能再使用各个对象。因此,接下来,对从该DAOF转换为应用数据的处理(步骤S409)进行说明。
图14是一张流程图,显示了转换为应用数据的处理(步骤S409)的详细的流程。
在步骤S1400中,执行DAOF数据的输入。在步骤S1401中,产生作为应用数据基础的文档结构树。在步骤S1402中,以文档结构树为基础,读入DAOF内的实际数据,并产生实际的应用数据。
图15图示了文档结构树产生处理(步骤S1401)的详细流程。图16A和B是文档结构树的说明图。作为全体控制的基本规则,处理的流程从微块(因此块)转向宏块(块的集合体)。
以后,所谓的块是指全体微块以及宏块。在步骤S1501中,以纵向方向的关联性为基础,以块单位执行再分组。在开始后,按照微块单位进行判断。
这里,所谓的关联性,是能够用距离近、块宽(横向的情况下指高)基本相同等来定义。
参照DAOF来提取距离、宽度、高度等信息。图16A是实际的页结构,图16B是其文档结构树。步骤S1501的处理结果是,T3、T4、T5作为一个组V1而产生,T6、T7作为一个处于同阶层的组V2而首先产生。
在步骤S1502中,检验是否有纵向的隔离物。隔离物例如是物理上具有DAOF中的线属性的对象。在逻辑意义上说,它是应用中明确分割块的要素。这里,在检测出隔离物的情况下,在相同阶层中执行再分割。
在步骤S1504中,利用组长来判断是否有大于它的分割。这里,在纵向的组长成为页高度(该页中存在的多个块的最上端和最下端的距离)的情况下,文档结构树的产生结束。
在图16A的情况下,由于在组V1、V2中没有隔离物,且组高度也不是页高度,因此转到步骤S1504。在步骤S1504中,以横向的关联性为基础,以块单位执行再分组。这里,在开始后立即执行的第一个操作也是以微块单位来执行判断。关联性以及判断信息的定义与纵向的情况相同。
图16A的情况下,产生H1作为由T1、T2组成的一个组,产生H2作为由V1、V2组成的一个组,H1和H2分别是位于V1和V2的上一层的同阶层组。
在步骤S1505中,校验横向是否有隔离物。在图16A中,由于存在S1,因此,将其登录到树中,产生所谓的H1、S1、H2阶层。
在步骤S1506中,利用组长来判断是否存在大于它的分割。这里,在横向的组长为页宽的情况下,文档结构树的产生结束。不是这样的情况下,返回步骤S1501,在更高一级的阶层中,从纵向关联性校验开始反复执行。
在图16A的情况下,由于分割宽度为页款,因此,在此结束,最后,在向文档结构树中添加表示整个页的最高阶层的V0。在文档结构树完成后,以该信息为基础,在步骤S1402中产生应用数据。
在图16A的情况下,具体情况如下所述。即,由于H1在横方向上有2个块T1和T2,因此,作为2列,在输出T1的内部信息(参见DAOF,文字识别结果的文章、图象等)后,改变列,并在T2的内部信息输出后,输出S1。
由于H2在横方向有2个块V1和V2,因此,作为2列输出,V1按照T3、T4、T5的顺序输出其内部信息,此后,改变列,并输出V2的T6、T7的内部信息。通过上述操作,执行了向应用数据的转换处理。
(指示字信息的添加)
接下来,对步骤S415所示的、指示字信息附加处理进行说明。在由检索处理指定了应当处理的文件的情况下,或者在通过矢量化而能够再现原始电子文件的情况下,在记录处理该文件的情况中,通过在向纸上进行记录时添加指示字信息,从而在使用该文件再次执行各种处理时,能够简单获取原始电子文件。
图17是一张流程图,它显示了利用2维条码(QR码符号:JISX0510)701对作为指示字信息的数据文字串进行编码,并将其添加到图象中的过程。
引入到2维条码内的数据表示对应的原始电子文件的地址信息,它例如可以由文件服务器名称和文件名称构成的路径信息构成。或者是,由通往对应的原始电子文件的URL、对应的原始电子文件的存储的数据库内或者是MFP 100自身具有的存储装置内所管理的文件ID等构成。
首先,为了识别进行编码的各种不同的文字,对输入数据串进行分析。另外,选择误差检测以及误差校正水平,选择输入数据能够收容的最小型号(步骤S1700)。
接着,将输入数据串转换为规定的比特串,并根据需要添加表示数据类型(数字、西文数字、8比特字节、汉字等)的标识符、终端图形。另外,还将其转换为规定的比特码字(步骤是1701)。
此时,为了执行纠错,需要按照型号以及纠错水平将码字串分割为规定的块数,一个块一个块地产生纠错码字,并附加到数据代码字的后面(步骤S1702)。
连接在步骤S1702中所得到的各块的数据代码字,并后续各块的纠错码字以及根据需要后续剩余的码字(步骤S1703)。
接下来,在矩阵中配置了位置检测图案、分离图案、定时图案以及位置组合图案等,同时还配置了码字模块(步骤S1704)。
另外,对于符号的编码化区域,选择最合适的主图案,通过XOR运算将屏蔽处理图案转换为在步骤S1704中所得到的模块(步骤S1705)。
最后,在步骤S1705中得到的模块上,产生格式信息以及型号信息,完成2维码符号(步骤S1706)。
如上所述,例如在将原始电子文件作为打印数据从客户PC 102送出,并通过记录装置202在纸上形成为记录图象的情况下,组合有地址信息的2维条码在数据处理装置205内被转换为可记录的光栅数据后,附着到光栅数据上的规定位置上而形成图象。这里,形成有图象的纸被分发给用户,用户通过利用图象读取部200进行读取,能够利用前述步骤S404,从指示字信息中检测出原始电子文件的存储地点。
另外,出于相同目的添加附加信息的装置能够使用各种方法,除了本实施例中说明的2维条码外,例如还能够使用直接利用文字串在文件中添加指示字信息的方法;调制文件内的文字串、特别是文件和文件的间隔,并嵌入信息的方法;以及将其嵌入文件中的半色调图象内的方法等一般称为电子水印的各种方法。
(计费时的版权校验处理)
接着,来说明步骤S417所示的计费处理。在本实施例中,是以能够自由访问此前存储在文件服务器内的所有原始电子文件并且原始电子文件全体、或其部分的对象全都能够再利用为前提进行说明的。但是,在所处理的输入文件中,应当限制由第三者导致的再利用。因此,对包含限制第三者的再利用的输入文件的情况下的步骤S417中的处理进行说明。
在步骤S416中,在执行文件的打印等处理前,针对在从指示字信息中检索出原始电子文件时能够指定的原始电子文件,询问在计费服务器110-1、110-2中存储的、按照每个文件/对象定义的版权版税信息。作为版权版税信息,是与检索结果的显示方法、访问方法、使用者处理方法相对应的费用的对应表。例如记载有图象区域的打印花费100日元,复印花费200日元、或者文本部分可以自由地再使用等内容。
计费服务器110-1、110-2调查该原始电子文件的版税信息,在有费用的情况下,向MFP 100请求发送用户ID、口令。
MFP 100提示操作者输入用户ID、口令,并将输入的用户ID、口令传送给计费服务器。
计费服务器110-1、110-2参照所传送的口令,在一致的情况下,许可步骤S416的所希望的处理(记录等的使用),并执行相应的计费处理(步骤S417)。用于执行计费的确认方法,并不仅限制为使用口令的方法,例如也可以使用指纹确认等一般广泛使用的活体确认、利用卡确认等所有确认方法。
另外,尽管在本实施方式中,显示了通过在纸文档上添加指示字信息来指定原始电子文件的情况的实施例,但是,在利用图4的步骤S406-S407所示的所谓的检索处理来指定原始电子文件的情况中,也可以执行相同的处理。
即便对于图4的步骤S409-412所说明的矢量化处理,也能够执行计费处理。即,在根据扫描纸文档所得到的图象信息而执行矢量化处理时设定为有计费的情况下,在执行矢量化处理前,仅仅提示用户执行矢量化处理所需的费用。之后,执行支付的手续(输入用户ID、口令),在确认成功的情况下,执行矢量化处理,由此,能够从使用者处收取费用。在执行矢量化处理时,也可以组合仅执行矢量化处理所需的费用以及其后仅管理版权版税所需的费用而进行计费。
(第2实施例)
在上述第1实施例中,在文件检索中,要将摘要文字代入概念检索、将关键词代入全文检索,因此,在处理能力低下的环境中,对于摘要文字、关键词的产生中存在得不到资源的情况。这种情况下,也可以输入全部文本作为概念检索的检索词、并省略全文检索。
(第3实施例)
在上述第1实施例中,包含了检测、嵌入指示字信息的过程,但是,即便将其限制为不执行指示字信息的检测而仅仅是复合检索处理,本发明的有用性也没有丧失。
根据上述实施例,包含在块选择前执行光栅化的步骤,但这不是必需的。索引的产生也可以不在检索时执行,而是通过执行调度(scheduling)来执行。尽管在实施例中,每当输入文档时,就产生分类矢量,但是也可以在文档累积到某种程度时执行。
在实施例中,每当输入文档时,就产生分类用特征矢量,但是,也可以在文档累积到某种程度时就执行。分类用特征矢量的产生尽管是使用文字部分执行的,但也可以就表、图象等其它属性来产生分类用特征矢量,与检索时相同,利用区域的面积比来综合地产生分类用特征矢量。在上述实施例中,在步骤S410中,提示推荐侯选文件夹作为存储目标,并允许用户进行选择,但是在设置了是否自动进行分类的设定按钮,并预先由用户设定为自动分类的情况下,也可以不显示选择项而自动登录到第1位的推荐侯选文件夹内。
(第4实施例)
在第1实施例的文件检索中,在比较输入文档和数据库文件时,对于所有输入文档的全部块,就布局信息以及块的内部信息执行比较。在本实施例中,在输入文件的布局和数据库文件的布局全部不同的情况,可以省去块内部信息的比较处理,从而减轻了检索处理的计算量。图18是本实施例的文件检索的流程图。首先,从数据库中对原始电子文件进行访问(步骤S1801)。将输入文件的各块的位置、大小、属性和原始电子文件的各块进行比较,求出其类似度,从而求出文件整体的布局类似度(步骤S1802)。在步骤S523中,判断布局类似度是否高于规定阈值,在布局类似度低于规定阈值的情况下,不执行块内部信息的比较而转到步骤S1807。另一方面,当判断出布局类似信息高于规定阈值时,转到步骤S1804,并执行块内部信息的比较,按照先前求出的布局类似度以及块内部信息的类似度,来求出文件整体的总类似度。根据每块的类似度来求取总类似度的方法是与图10的步骤S1003相同的处理,因此省略对其的说明。在步骤S525中,判断总类似度是否高于规定阈值,如果高于规定阈值,则将该比较对象的文件作为侯选进行保存(步骤S1806)。另一方面,如果在规定阈值以下,则不作为侯选。在步骤S1807中,如果存在下一个比较对象的数据库文件,则转到步骤S1801,否则结束处理。
求取块内部信息的类似度的处理,由于执行照片块等信息量多的块的比较,因此,与布局信息的比较相比,一般处理负担较重。因此,通过缩小作为布局信息的程度文件,执行检索处理量的减轻、处理的高速化,能够更有效地检索所希望的文件。
(第5实施例)
在第5实施例中,通过使用户指定成为文件内特征的块区域,并指定从比较对象中除去的块,指定文件内的特征,从而更高精度地执行文件检索。
图19是用于令用户指定检索对象的用户界面画面(1901)的例子。输入文件通过块选择处理而被分割为多个块,在输入画面中显示文件上的文本、照片、表、线条等各块区域(1911-1917)。
用户可以从所显示的块中选择成为该输入文件特征的块,可以由用户指定要强调的块。此时选择的块也可以是多个。例如,在选择块1914的状态下,当按下按键“强调”(1902)时,执行强调块1914的检索处理。在根据每块的类似度来求出文件整体的类似度的计算式(1)中,通过增大所指定的块1914的加权系数并减小除此之外的块的加权系数而实现该检索处理。如果多次按压“强调”按钮(1902),则所选择的块的加权系数进一步增大,从而执行更加强调块的检索。
如果按压排除按钮(1903),则在省略了所选块1914的状态下实施检索。例如,在自动提取了错误的块的情况下,用户通过将该块排除在外,可以省略无用的检索处理,且能够防止出现错误的检索结果。在排除的情况下,也可以将算式(1)的该块的加权系数设为零。
另外,可以利用细节设置按钮(1904)来实现块的属性变更,通过能够将块的属性修正为正确的属性,能够更正确地进行检索。利用细节设置按钮1904,可以由用户精细地调节用于优先进行块的检索的值权。如此,在检索时,通过用户指定和设置作为特征的块,能够执行检索的最优化。
另一方面,还要考虑随着文件的不同其布局特殊的情况。有关这种文件,通过选择布局优先按钮(1905),从而可以执行强调布局的文件检索。这种情况下,可以通过更加强调布局的类似度的结果的方式添加加权值,从而实现这一点。
如果选择了文本优先按钮(1906),则仅仅使用文本块来进行检索,并实现了处理的减轻。
如此,通过由用户选择图象的特征,从而执行强调文件特征的检索。
(其它实施例)
本发明既适用于由多种设备(例如主机、接口设备、读取器、打印机等)构成的系统,也适用于由一个设备构成的装置(例如复印机、传真机装置等)。
不用说,本发明的目的是将记录了实现前述实施例的功能的软件的程序代码提供给系统或装置,通过该系统或装置的计算机(或CPU、MPU)读出存储媒体内存储的程序代码,从而实现其功能。
这种情况,从存储媒体中读出的程序代码自身实现所述的实施例的功能,从而存储有该程序代码的存储媒体构成了本发明。
作为用于提供程序代码的存储媒体,例如能够使用软(注册商标)盘、硬盘、光盘、磁光盘、CD-ROM、CD-R、磁盘、非易失性存储卡、ROM等。
通过执行计算机读出的程序代码,不仅实现了前述实施例的功能,而且不用说还包括以下情况:在计算机上运行的OS(操作系统)等根据该程序代码的指示,执行实际处理的一部分或全部,并借助于该处理而实现了前述实施例的功能。
另外,不用说,还包括以下情况:从存储媒体中读出的程序代码,在写入插入计算机的功能扩充板或连接在计算机上的功能扩展单元内具有的存储器内之后,该功能扩充板或功能扩展单元内具有的CPU等根据该程序代码的指示,执行实际处理的一部分或全部,并借助于该处理来显示前述实施例的功能。
本发明并不仅限于上述实施例,在本发明的主旨和范围内可以有可中改变和修改。因此,为了通知公众本发明的范围而制作了后续的权利要求书。

Claims (26)

1.一种信息处理装置,用于检索类似于所输入的文档图象的图象数据,其特征在于具有:
分割单元,用于根据每种属性将所述输入的文档图象分割为多个区域;
类似度计算单元,对每个所述分割而成的区域,使用适于所述属性的检索单元来计算类似度;
总类似度计算单元,根据所述输入的文档图象中的所述分割而成的各区域的占有率,对按照每个所述分割而成的区域计算出的类似度进行加权,从而计算出总类似度;以及
布局类似度计算单元,用于计算所述输入的文档图象与比较对象的图象数据的布局类似度,该布局类似度计算单元还用于执行控制,以便对于所计算出的布局类似度等于或大于规定阈值的所述比较对象图象数据,执行由所述类似度计算单元以及所述总类似度计算单元执行的处理,而对于所计算出的布局类似度低于规定阈值的所述比较对象图象数据,不执行由所述类似度计算单元以及所述总类似度计算单元执行的处理。
2.如权利要求1所述的信息处理装置,其特征在于所述检索单元包括:
根据通过文字识别而从由所述分割单元分割的区域中的文本区域中提取出的文本数据来进行全文检索的单元;
根据所述文本数据进行概念检索的单元;以及
根据从由所述分割单元分割的区域中的图象区域中提取出的特征量来进行图象检索的单元。
3.如权利要求1所述的信息处理装置,其特征在于,还包括与用于存储与每个所述图象数据的版权版税有关的信息的服务器进行通信的通信单元。
4.如权利要求3所述的信息处理装置,其特征在于,当存在与所述版权版税有关的信息的情况下,只要没有收到来自所述服务器的许可,就不执行对所述图象数据的处理。
5.如权利要求3所述的信息处理装置,其特征在于,还包括根据所述版权版税来执行针对用户的计费处理的计费单元。
6.如权利要求1所述的信息处理装置,其特征在于,还包括:
计费单元,用于对用户计费收取将所述输入的文档图象转换为矢量数据时的费用;
矢量数据转换单元,在执行了对所述计费单元计算出的费用的支付手续的情况下,将所述输入的文档图象转换为矢量数据;以及
存储单元,用于存储被转换为所述矢量数据的文档图象。
7.如权利要求6所述的信息处理装置,其特征在于,所述计费单元对管理被转换为矢量数据的文档图象的版权版税时的费用进行计费。
8.如权利要求1所述的信息处理装置,其特征在于,还包括:
矢量数据转换单元,用于将所述输入的文档图象转换为矢量数据;以及
侯选类别输出单元,用于根据被转换为所述矢量数据的文档图象的特征,输出存储目标的侯选类别。
9.如权利要求8所述的信息处理装置,其特征在于,还包括:
类别选择单元,由用户从所述侯选类别输出单元所输出的侯选类别中选择出存储目标的类别;以及
存储单元,按所述类别选择单元所选择的类别存储被转换为所述矢量数据的文档图象。
10.如权利要求8所述的信息处理装置,其特征在于,还包括存储单元,用于针对由所述侯选类别输出单元输出的第1位侯选类别,自动存储被转换为所述矢量数据的文档图象。
11.如权利要求8所述的信息处理装置,其特征在于,所述矢量数据转换单元,在根据所述总类似度计算单元的计算结果未发现与所述文档图象对应的原始数据文件的情况下,将所述文档图象转换为矢量数据。
12.如权利要求8所述的信息处理装置,其特征在于,所述矢量数据转换单元,在与所述文档图象对应的原始数据文件是图象文件的情况下,将所述文档图象转换为矢量数据。
13.如权利要求1所述的信息处理装置,其特征在于,还包括选择装置,用于从经所述分割单元分割的多个区域中选择出用于类似度计算的区域,
其中所述类似度计算单元针对由所述选择装置选出的区域,使用适合于所述属性的检索单元,计算类似度。
14.一种信息处理方法,用于对类似于所输入的文档图象的图象数据进行检索,其特征在于,包括:
分割步骤,根据每种属性,将所述输入的文档图象分割为多个区域;
类似度计算步骤,对每个所述分割而成的区域,使用适于所述属性的检索步骤来计算类似度;
总类似度计算步骤,根据所述输入的文档图象中的所述分割而成的各区域的占有率,对按照每个所述分割后的区域计算出的类似度进行加权,从而计算出总类似度;以及
布局类似度计算步骤,计算所述输入的文档与作为比较对象的图象数据的布局类似度,该布局类似度计算步骤还用于执行控制,以便对于所计算出的布局类似度等于或大于规定阈值的所述比较对象图象数据,执行在所述类似度计算步骤以及所述总类似度计算步骤中执行的处理,而对于所计算出的布局类似度低于规定阈值的所述比较对象图象数据,不执行在所述类似度计算步骤以及所述总类似度计算步骤中执行的处理。
15.如权利要求14所述的信息处理方法,其特征在于,所述检索步骤包含:
根据通过文字识别而从所述分割步骤分割出的区域中的文本区域中提取出的文本数据,来执行全文检索的步骤;
根据所述文本数据执行概念检索的步骤;以及
根据从所述分割步骤所分割的区域中的图象区域中提取出的特征量来执行图象检索的步骤。
16.如权利要求14所述的信息处理方法,其特征在于,还包括与用于存储与每个所述图象数据的版权版税有关的信息的服务器进行通信的通信步骤。
17.如权利要求16所述的信息处理方法,其特征在于,当存在与所述版权版税有关的信息的情况下,只要没有收到来自所述服务器的许可,就不执行对所述图象数据的处理。
18.如权利要求16所述的信息处理方法,其特征在于,还包括根据所述版权版税来执行针对用户的计费处理的计费步骤。
19.如权利要求14所述的信息处理方法,其特征在于,还包括:
计费步骤,用于对用户计费收取将所述输入的文档图象转换为矢量数据时的费用,
矢量数据转换步骤,在执行了对所述计费步骤计算出的费用的支付手续的情况下,将所述输入的文档图象转换为矢量数据;以及
存储步骤,用于存储被转换为所述矢量数据的文档图象。
20.如权利要求19所述的信息处理方法,其特征在于,所述计费步骤对管理被转换为矢量数据的文档图象的版权版税时的费用进行计费。
21.如权利要求14所述的信息处理方法,其特征在于,还包括:
矢量数据转换步骤,用于将所述输入的文档图象转换为矢量数据;以及
侯选类别输出步骤,用于根据被转换为所述矢量数据的文档图象的特征,输出存储目标的侯选类别。
22.如权利要求21所述的信息处理方法,其特征在于,还包括:
类别选择步骤,由用户从所述侯选类别输出步骤所输出的侯选类别中选择出存储目标的类别;以及
存储步骤,按所述类别选择步骤所选择的类别存储被转换为所述矢量数据的文档图象。
23.如权利要求21所述的信息处理方法,其特征在于,还包括存储步骤,用于针对由所述侯选类别输出步骤输出的第1位侯选类别,自动存储被转换为所述矢量数据的文档图象。
24.如权利要求21所述的信息处理方法,其特征在于,所述矢量数据转换步骤,在根据所述总类似度计算步骤的计算结果未发现与所述文档图象对应的原始数据文件的情况下,将所述文档图象转换为矢量数据。
25.如权利要求21所述的信息处理方法,其特征在于,所述矢量数据转换步骤,在与所述文档图象对应的原始数据文件是图象文件的情况下,将所述文档图象转换为矢量数据。
26.如权利要求14所述的信息处理方法,其特征在于,还包括选择步骤,用于从经所述分割单元分割的多个区域中选择出用于类似度计算的区域,
其中所述类似度计算步骤针对由所述选择步骤选出的区域,使用适合于所述属性的检索步骤,计算类似度。
CNB2004100366688A 2003-04-30 2004-04-29 信息处理装置和信息处理方法 Expired - Fee Related CN100458773C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2003125816 2003-04-30
JP125816/2003 2003-04-30
JP2004067779A JP2004348706A (ja) 2003-04-30 2004-03-10 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP067779/2004 2004-03-10

Publications (2)

Publication Number Publication Date
CN1542655A CN1542655A (zh) 2004-11-03
CN100458773C true CN100458773C (zh) 2009-02-04

Family

ID=32993111

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100366688A Expired - Fee Related CN100458773C (zh) 2003-04-30 2004-04-29 信息处理装置和信息处理方法

Country Status (4)

Country Link
US (1) US7593961B2 (zh)
EP (1) EP1473642A3 (zh)
JP (1) JP2004348706A (zh)
CN (1) CN100458773C (zh)

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6666377B1 (en) 2000-07-18 2003-12-23 Scott C. Harris Bar code data entry device
JP4089655B2 (ja) * 2003-09-16 2008-05-28 セイコーエプソン株式会社 レイアウトシステムおよびレイアウトプログラム、並びにレイアウト方法
US8949287B2 (en) 2005-08-23 2015-02-03 Ricoh Co., Ltd. Embedding hot spots in imaged documents
US8600989B2 (en) 2004-10-01 2013-12-03 Ricoh Co., Ltd. Method and system for image matching in a mixed media environment
US9373029B2 (en) 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
US8965145B2 (en) 2006-07-31 2015-02-24 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US9384619B2 (en) 2006-07-31 2016-07-05 Ricoh Co., Ltd. Searching media content for objects specified using identifiers
US8825682B2 (en) 2006-07-31 2014-09-02 Ricoh Co., Ltd. Architecture for mixed media reality retrieval of locations and registration of images
US8184155B2 (en) 2007-07-11 2012-05-22 Ricoh Co. Ltd. Recognition and tracking using invisible junctions
US9171202B2 (en) 2005-08-23 2015-10-27 Ricoh Co., Ltd. Data organization and access for mixed media document system
US8868555B2 (en) 2006-07-31 2014-10-21 Ricoh Co., Ltd. Computation of a recongnizability score (quality predictor) for image retrieval
US8195659B2 (en) 2005-08-23 2012-06-05 Ricoh Co. Ltd. Integration and use of mixed media documents
US9530050B1 (en) * 2007-07-11 2016-12-27 Ricoh Co., Ltd. Document annotation sharing
US8276088B2 (en) 2007-07-11 2012-09-25 Ricoh Co., Ltd. User interface for three-dimensional navigation
US8510283B2 (en) 2006-07-31 2013-08-13 Ricoh Co., Ltd. Automatic adaption of an image recognition system to image capture devices
US7970171B2 (en) 2007-01-18 2011-06-28 Ricoh Co., Ltd. Synthetic image and video generation from ground truth data
US9405751B2 (en) 2005-08-23 2016-08-02 Ricoh Co., Ltd. Database for mixed media document system
US8144921B2 (en) 2007-07-11 2012-03-27 Ricoh Co., Ltd. Information retrieval using invisible junctions and geometric constraints
US8156116B2 (en) 2006-07-31 2012-04-10 Ricoh Co., Ltd Dynamic presentation of targeted information in a mixed media reality recognition system
US8156115B1 (en) 2007-07-11 2012-04-10 Ricoh Co. Ltd. Document-based networking with mixed media reality
US7702673B2 (en) 2004-10-01 2010-04-20 Ricoh Co., Ltd. System and methods for creation and use of a mixed media environment
US8156427B2 (en) 2005-08-23 2012-04-10 Ricoh Co. Ltd. User interface for mixed media reality
US8335789B2 (en) 2004-10-01 2012-12-18 Ricoh Co., Ltd. Method and system for document fingerprint matching in a mixed media environment
US8385589B2 (en) 2008-05-15 2013-02-26 Berna Erol Web-based content detection in images, extraction and recognition
US8838591B2 (en) 2005-08-23 2014-09-16 Ricoh Co., Ltd. Embedding hot spots in electronic documents
US8521737B2 (en) 2004-10-01 2013-08-27 Ricoh Co., Ltd. Method and system for multi-tier image matching in a mixed media environment
US7812986B2 (en) 2005-08-23 2010-10-12 Ricoh Co. Ltd. System and methods for use of voice mail and email in a mixed media environment
US8332401B2 (en) 2004-10-01 2012-12-11 Ricoh Co., Ltd Method and system for position-based image matching in a mixed media environment
US8176054B2 (en) 2007-07-12 2012-05-08 Ricoh Co. Ltd Retrieving electronic documents by converting them to synthetic text
US8369655B2 (en) 2006-07-31 2013-02-05 Ricoh Co., Ltd. Mixed media reality recognition using multiple specialized indexes
US8856108B2 (en) 2006-07-31 2014-10-07 Ricoh Co., Ltd. Combining results of image retrieval processes
US8086038B2 (en) 2007-07-11 2011-12-27 Ricoh Co., Ltd. Invisible junction features for patch recognition
US8903760B2 (en) * 2004-11-12 2014-12-02 International Business Machines Corporation Method and system for information workflows
US8566705B2 (en) 2004-12-21 2013-10-22 Ricoh Co., Ltd. Dynamic document icons
JP4455357B2 (ja) * 2005-01-28 2010-04-21 キヤノン株式会社 情報処理装置及び情報処理方法
US20060209311A1 (en) * 2005-03-15 2006-09-21 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
JP2006318219A (ja) * 2005-05-12 2006-11-24 Fujitsu Ltd 類似スライド検索プログラム及び検索方法
JP4671885B2 (ja) * 2005-06-01 2011-04-20 株式会社リコー 画像処理装置、プログラムおよび画像処理方法
JP4791776B2 (ja) * 2005-07-26 2011-10-12 株式会社リコー セキュリティ情報推定装置、セキュリティ情報推定方法、セキュリティ情報推定プログラム及び記録媒体
US8739020B2 (en) * 2005-08-03 2014-05-27 Aol Inc. Enhanced favorites service for web browsers and web applications
JP4533273B2 (ja) * 2005-08-09 2010-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
JP4717743B2 (ja) * 2005-08-23 2011-07-06 株式会社リコー 情報処理装置
JP2007058605A (ja) * 2005-08-24 2007-03-08 Ricoh Co Ltd 文書管理システム
US7930627B2 (en) * 2005-09-22 2011-04-19 Konica Minolta Systems Laboratory, Inc. Office document matching method and apparatus
JP4906044B2 (ja) * 2005-09-28 2012-03-28 キヤノン株式会社 情報検索装置及びその制御方法、コンピュータプログラム、並びに、記憶媒体
JP4720544B2 (ja) * 2006-03-01 2011-07-13 ソニー株式会社 画像処理装置および方法、プログラム記録媒体、並びにプログラム
JP4799246B2 (ja) * 2006-03-30 2011-10-26 キヤノン株式会社 画像処理方法及び画像処理装置
US7630975B2 (en) * 2006-03-30 2009-12-08 Microsoft Corporation Unified searching and running of files
JP2008009572A (ja) * 2006-06-27 2008-01-17 Fuji Xerox Co Ltd ドキュメント処理システム、ドキュメント処理方法及びプログラム
US9063952B2 (en) 2006-07-31 2015-06-23 Ricoh Co., Ltd. Mixed media reality recognition with image tracking
US9176984B2 (en) 2006-07-31 2015-11-03 Ricoh Co., Ltd Mixed media reality retrieval of differentially-weighted links
US8201076B2 (en) 2006-07-31 2012-06-12 Ricoh Co., Ltd. Capturing symbolic information from documents upon printing
US9020966B2 (en) 2006-07-31 2015-04-28 Ricoh Co., Ltd. Client device for interacting with a mixed media reality recognition system
US8073263B2 (en) 2006-07-31 2011-12-06 Ricoh Co., Ltd. Multi-classifier selection and monitoring for MMR-based image recognition
US8489987B2 (en) 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
US8676810B2 (en) 2006-07-31 2014-03-18 Ricoh Co., Ltd. Multiple index mixed media reality recognition using unequal priority indexes
JP5164368B2 (ja) 2006-12-07 2013-03-21 キヤノン株式会社 画像処理装置、画像処理方法
JP5464786B2 (ja) * 2006-12-21 2014-04-09 キヤノン株式会社 情報処理装置、制御方法、及び制御プログラム
JP4873554B2 (ja) * 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
WO2008090606A1 (ja) * 2007-01-24 2008-07-31 Fujitsu Limited 情報検索プログラム、該プログラムを記録した記録媒体、情報検索装置、および情報検索方法
JP4951373B2 (ja) * 2007-03-13 2012-06-13 株式会社リコー 画像検索装置、画像検索方法、及びコンピュータプログラム
JP2008234203A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd 画像処理装置
US8103108B2 (en) * 2007-05-01 2012-01-24 Sharp Kabushiki Kaisha Image processing apparatus, image forming apparatus, image processing system, and image processing method
JP5033580B2 (ja) * 2007-10-31 2012-09-26 株式会社リコー 画像処理装置及び画像処理方法
US9535993B2 (en) * 2008-06-11 2017-01-03 Enpulz, Llc Creative work registry
JP4636343B2 (ja) * 2008-09-02 2011-02-23 ソニー株式会社 情報処理装置、情報処理方法、情報処理プログラム及び情報処理システム
JP5421609B2 (ja) * 2009-02-17 2014-02-19 キヤノン株式会社 スキャン変換装置及び画像符号化装置、並びにそれらの制御方法
JP5004986B2 (ja) 2009-03-19 2012-08-22 キヤノン株式会社 スキャン変換装置及び画像符号化装置、並びにそれらの制御方法
JP2010250657A (ja) * 2009-04-17 2010-11-04 Seiko Epson Corp 印刷装置、画像処理装置、画像処理方法およびコンピュータープログラム
JP5302769B2 (ja) 2009-05-14 2013-10-02 キヤノン株式会社 スキャン変換装置及び画像符号化装置及びそれらの制御方法
JP2010277168A (ja) * 2009-05-26 2010-12-09 Fuji Xerox Co Ltd データ入力システム、データ入力受付装置及びプログラム
US8385660B2 (en) 2009-06-24 2013-02-26 Ricoh Co., Ltd. Mixed media reality indexing and retrieval for repeated content
DE102009031872A1 (de) * 2009-07-06 2011-01-13 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur automatischen Suche nach Dokumenten in einem Datenspeicher
CN102054171A (zh) * 2009-10-30 2011-05-11 株式会社东芝 文档文件种类识别装置以及文档文件种类识别方法
US8922582B2 (en) * 2009-11-16 2014-12-30 Martin J. Murrett Text rendering and display using composite bitmap images
US8000528B2 (en) * 2009-12-29 2011-08-16 Konica Minolta Systems Laboratory, Inc. Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics
JP5528121B2 (ja) * 2010-01-05 2014-06-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US8892594B1 (en) * 2010-06-28 2014-11-18 Open Invention Network, Llc System and method for search with the aid of images associated with product categories
US8606789B2 (en) * 2010-07-02 2013-12-10 Xerox Corporation Method for layout based document zone querying
KR20120006687A (ko) * 2010-07-13 2012-01-19 삼성전자주식회사 디스플레이장치 및 그 제어방법
US20130091437A1 (en) * 2010-09-03 2013-04-11 Lester F. Ludwig Interactive data visulization utilizing hdtp touchpad hdtp touchscreens, advanced multitouch, or advanced mice
JP2012058926A (ja) * 2010-09-07 2012-03-22 Olympus Corp キーワード付与装置及びプログラム
US8358843B2 (en) * 2011-01-31 2013-01-22 Yahoo! Inc. Techniques including URL recognition and applications
US9075803B2 (en) * 2011-04-26 2015-07-07 Xerox Corporation Systems and methods for using machine readable codes to store and retrieve reversible write eraseable paper documents
US9213701B2 (en) * 2011-04-26 2015-12-15 Xerox Corporation Systems and methods for electronically auto-filing and retrieving reversible write eraseable paper documents
US9058331B2 (en) 2011-07-27 2015-06-16 Ricoh Co., Ltd. Generating a conversation in a social network based on visual search results
US20130073687A1 (en) * 2011-09-19 2013-03-21 Ronald Steven Cok System for managing information using machine-readable codes
JP2013246732A (ja) 2012-05-28 2013-12-09 Toshiba Corp 手書き文書検索装置、方法及びプログラム
US8935246B2 (en) * 2012-08-08 2015-01-13 Google Inc. Identifying textual terms in response to a visual query
KR101739669B1 (ko) * 2012-11-14 2017-05-24 미쓰비시덴키 가부시키가이샤 신호 처리 장치, 신호 처리 방법 및 정보 판독 장치
RU2597163C2 (ru) * 2014-11-06 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Сравнение документов с использованием достоверного источника
US9922247B2 (en) * 2013-12-18 2018-03-20 Abbyy Development Llc Comparing documents using a trusted source
RU2571378C2 (ru) * 2013-12-18 2015-12-20 Общество с ограниченной ответственностью "Аби Девелопмент" Устройство и способ поиска различий в документах
JP5913774B2 (ja) * 2014-01-24 2016-04-27 レノボ・シンガポール・プライベート・リミテッド Webサイトを共有する方法、電子機器およびコンピュータ・プログラム
US9741142B2 (en) * 2014-05-19 2017-08-22 Adobe Systems Incorporated Method and apparatus for enabling text editing in a scanned document while maintaining fidelity of the appearance of the text
US9235758B1 (en) * 2014-06-30 2016-01-12 Adobe Systems Incorporated Robust method to find layout similarity between two documents
JP6562276B2 (ja) * 2014-12-15 2019-08-21 大学共同利用機関法人情報・システム研究機構 情報抽出装置、情報抽出方法、及び情報抽出プログラム
US10678896B2 (en) * 2015-06-30 2020-06-09 Samsung Electronics Co., Ltd. Methods and apparatuses for updating user authentication data
US10142499B2 (en) * 2015-10-06 2018-11-27 Canon Kabushiki Kaisha Document distribution system, document distribution apparatus, information processing method, and storage medium
US10380449B2 (en) * 2016-10-27 2019-08-13 Entit Software Llc Associating a screenshot group with a screen
JP6906946B2 (ja) * 2016-12-22 2021-07-21 キヤノン株式会社 情報処理装置、その制御方法、及びプログラム
US9965695B1 (en) * 2016-12-30 2018-05-08 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method based on content type separation
JP6984147B2 (ja) * 2017-03-22 2021-12-17 日本電気株式会社 情報管理装置、情報管理方法、及びプログラム
JP7013182B2 (ja) 2017-09-21 2022-01-31 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
US10691734B2 (en) * 2017-11-21 2020-06-23 International Business Machines Corporation Searching multilingual documents based on document structure extraction
JP6988464B2 (ja) * 2017-12-26 2022-01-05 ブラザー工業株式会社 プログラム
CN111712831A (zh) * 2018-02-07 2020-09-25 柯莱普托领克斯公司 签名方法、系统和/或装置
WO2019176398A1 (ja) * 2018-03-16 2019-09-19 ソニー株式会社 情報処理装置、情報処理方法、および、プログラム
US10657676B1 (en) 2018-06-28 2020-05-19 Snap Inc. Encoding and decoding a stylized custom graphic
US11113559B2 (en) * 2018-07-20 2021-09-07 Ricoh Company, Ltd. Information processing apparatus for improving text data recognition, information processing method, and non-transitory recording medium
JP2020144427A (ja) 2019-03-04 2020-09-10 富士ゼロックス株式会社 文書作成装置、及びプログラム
JP6966749B2 (ja) * 2019-05-29 2021-11-17 株式会社マーケットヴィジョン 画像処理システム
US11049235B2 (en) 2019-08-30 2021-06-29 Sas Institute Inc. Techniques for extracting contextually structured data from document images
US11270153B2 (en) * 2020-02-19 2022-03-08 Northrop Grumman Systems Corporation System and method for whole word conversion of text in image
US11436852B2 (en) * 2020-07-28 2022-09-06 Intuit Inc. Document information extraction for computer manipulation
CN112000834A (zh) * 2020-08-26 2020-11-27 北京百度网讯科技有限公司 文档处理方法、装置、系统、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000049526A1 (en) * 1999-02-16 2000-08-24 Hewlett-Packard Company Similarity searching by combination of different data-types
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4937761A (en) * 1987-11-04 1990-06-26 Blueprint Technologies Incorporated Method and apparatus for enhanced speed graphic image processing
JP2859450B2 (ja) * 1991-01-31 1999-02-17 富士写真フイルム株式会社 画像記録装置及び画像記録方法
JPH04315272A (ja) * 1991-04-12 1992-11-06 Eastman Kodak Japan Kk 図形認識装置
US5991466A (en) 1991-07-31 1999-11-23 Canon Kabushiki Kaisha Image retrieving apparatus
JP3017851B2 (ja) 1991-07-31 2000-03-13 キヤノン株式会社 画像記憶装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP3223617B2 (ja) * 1992-11-30 2001-10-29 富士ゼロックス株式会社 描画装置及び描画方法
US5481255A (en) * 1993-02-10 1996-01-02 Data Critical Corp. Paging transmission system
US6002809A (en) * 1993-04-15 1999-12-14 International Business Machines Corporation Digital image processor for image scaling
JPH07220091A (ja) * 1994-02-04 1995-08-18 Canon Inc 画像処理装置及び方法
US5493677A (en) * 1994-06-08 1996-02-20 Systems Research & Applications Corporation Generation, archiving, and retrieval of digital images with evoked suggestion-set captions and natural language interface
JP3582675B2 (ja) * 1994-10-28 2004-10-27 セイコーエプソン株式会社 画像データをメモリに蓄積する装置及び方法
US5987171A (en) * 1994-11-10 1999-11-16 Canon Kabushiki Kaisha Page analysis system
JPH08153117A (ja) * 1994-11-30 1996-06-11 Canon Inc 文書検索装置及び方法
US5821929A (en) * 1994-11-30 1998-10-13 Canon Kabushiki Kaisha Image processing method and apparatus
JP2964931B2 (ja) * 1995-04-25 1999-10-18 富士ゼロックス株式会社 画像処理装置および画像形成装置
JP3603392B2 (ja) * 1995-07-06 2004-12-22 株式会社日立製作所 文書分類支援方法および装置
JP3504054B2 (ja) * 1995-07-17 2004-03-08 株式会社東芝 文書処理装置および文書処理方法
JPH09223195A (ja) * 1996-02-06 1997-08-26 Hewlett Packard Co <Hp> 文字認識方法
US5915250A (en) * 1996-03-29 1999-06-22 Virage, Inc. Threshold-based comparison
JP2973944B2 (ja) * 1996-06-26 1999-11-08 富士ゼロックス株式会社 文書処理装置および文書処理方法
US6539115B2 (en) * 1997-02-12 2003-03-25 Fujitsu Limited Pattern recognition device for performing classification using a candidate table and method thereof
JPH10285378A (ja) * 1997-03-28 1998-10-23 Internatl Business Mach Corp <Ibm> 複写装置及びその制御方法
JP3780623B2 (ja) * 1997-05-16 2006-05-31 株式会社日立製作所 動画像の記述方法
JP4098880B2 (ja) * 1997-06-06 2008-06-11 松下電器産業株式会社 情報検索装置
JPH1117851A (ja) 1997-06-24 1999-01-22 Sanyo Electric Co Ltd ファクシミリ装置
US6353840B2 (en) * 1997-08-15 2002-03-05 Ricoh Company, Ltd. User-defined search template for extracting information from documents
JP3747589B2 (ja) 1997-09-17 2006-02-22 コニカミノルタビジネステクノロジーズ株式会社 画像特徴量比較装置および画像特徴量比較プログラムを記録した記録媒体
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
JP3601658B2 (ja) * 1997-12-19 2004-12-15 富士通株式会社 文字列抽出装置及びパターン抽出装置
JPH11187231A (ja) * 1997-12-24 1999-07-09 Canon Inc 画像検索装置及び画像検索方法
US6463432B1 (en) * 1998-08-03 2002-10-08 Minolta Co., Ltd. Apparatus for and method of retrieving images
JP2000076339A (ja) * 1998-09-01 2000-03-14 Toppan Printing Co Ltd コンテンツ運用方法
JP3849318B2 (ja) * 1998-09-10 2006-11-22 富士ゼロックス株式会社 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000148793A (ja) * 1998-09-11 2000-05-30 Nippon Telegr & Teleph Corp <Ntt> 複合メディア文書の類似検索方法及び装置及び複合メディア文書の類似検索プログラムを格納した記憶媒体
JP2000148790A (ja) * 1998-11-10 2000-05-30 Canon Inc ファイリング方法及び装置並びに記憶媒体
US6411953B1 (en) * 1999-01-25 2002-06-25 Lucent Technologies Inc. Retrieval and matching of color patterns based on a predetermined vocabulary and grammar
JP4454789B2 (ja) 1999-05-13 2010-04-21 キヤノン株式会社 帳票分類方法及び装置
JP2001076095A (ja) * 1999-09-06 2001-03-23 Canon Inc 情報処理装置及びその方法
JP3921015B2 (ja) * 1999-09-24 2007-05-30 富士通株式会社 画像解析装置及び方法並びにプログラム記録媒体
JP4320491B2 (ja) * 1999-11-18 2009-08-26 ソニー株式会社 文書処理システム、端末装置、文書提供装置、文書処理方法、記録媒体
US6782395B2 (en) * 1999-12-03 2004-08-24 Canon Kabushiki Kaisha Method and devices for indexing and seeking digital images taking into account the definition of regions of interest
JP2001266142A (ja) * 2000-01-13 2001-09-28 Nikon Corp データ分類方法及びデータ分類装置、信号処理方法及び信号処理装置、位置検出方法及び位置検出装置、画像処理方法及び画像処理装置、露光方法及び露光装置、並びにデバイス製造方法
JP2001229186A (ja) * 2000-02-18 2001-08-24 Dainippon Printing Co Ltd 地図複合情報作成システム
FR2807852B1 (fr) * 2000-04-17 2004-10-22 Canon Kk Procedes et dispositifs d'indexation et de recherche d'images numeriques prenant en compte la distribution spatiale du contenu des images
JP3937687B2 (ja) * 2000-05-09 2007-06-27 キヤノン株式会社 画像処理装置及び画像処理方法、記録媒体
US6704729B1 (en) * 2000-05-19 2004-03-09 Microsoft Corporation Retrieval of relevant information categories
US7089420B1 (en) * 2000-05-24 2006-08-08 Tracer Detection Technology Corp. Authentication method and system
US6789113B1 (en) * 2000-07-17 2004-09-07 Kabushiki Kaisha Toshiba Information input/output system, information input/output method, recording medium of recording information transmitting/receiving program, and image forming apparatus
JP2002117037A (ja) * 2000-10-06 2002-04-19 Nec Corp 画像検索装置、並びに画像検索方法及びこれが書き込まれた記録媒体
JP2002132547A (ja) * 2000-10-27 2002-05-10 Fuji Xerox Co Ltd 電子情報管理サーバ、電子情報管理クライアントおよび電子情報管理方法ならびに電子情報管理プログラムを記録したコンピュータ読み取り可能な記録媒体
US6826316B2 (en) * 2001-01-24 2004-11-30 Eastman Kodak Company System and method for determining image similarity
JP4448623B2 (ja) * 2001-03-29 2010-04-14 セイコーエプソン株式会社 デジタルコンテンツ提供システム,デジタルコンテンツ提供方法,サーバ装置及びデジタルコンテンツ提供プログラム
WO2002082271A1 (en) * 2001-04-05 2002-10-17 Audible Magic Corporation Copyright detection and protection system and method
CA2373568C (en) * 2001-04-26 2008-06-17 Hitachi, Ltd. Method of searching similar document, system for performing the same and program for processing the same
US6870962B2 (en) * 2001-04-30 2005-03-22 The Salk Institute For Biological Studies Method and apparatus for efficiently encoding chromatic images using non-orthogonal basis functions
JP4025517B2 (ja) * 2001-05-31 2007-12-19 株式会社日立製作所 文書検索システムおよびサーバ
JP2002373177A (ja) * 2001-06-15 2002-12-26 Olympus Optical Co Ltd 類似オブジェクト検索方法及び装置
US7106470B2 (en) * 2001-08-10 2006-09-12 Hewlett-Packard Development Company, L.P. Direct printing from internet database
JP3882585B2 (ja) * 2001-11-07 2007-02-21 富士ゼロックス株式会社 画像処理装置およびプログラム
JP2003271656A (ja) * 2002-03-19 2003-09-26 Fujitsu Ltd 関係付候補生成装置,関係付候補生成方法,関係付システム,関係付候補生成プログラムおよび同プログラムを記録したコンピュータ読取可能な記録媒体
JP4183432B2 (ja) * 2002-04-10 2008-11-19 富士通株式会社 画像データ符号化方法
US7043474B2 (en) * 2002-04-15 2006-05-09 International Business Machines Corporation System and method for measuring image similarity based on semantic meaning
US20050248561A1 (en) * 2002-04-25 2005-11-10 Norio Ito Multimedia information generation method and multimedia information reproduction device
JP4452012B2 (ja) * 2002-07-04 2010-04-21 ヒューレット・パッカード・カンパニー 文書の特有性評価方法
JP4366916B2 (ja) * 2002-10-29 2009-11-18 富士ゼロックス株式会社 書類確認システム、書類確認方法、及び書類確認プログラム
US7272258B2 (en) * 2003-01-29 2007-09-18 Ricoh Co., Ltd. Reformatting documents using document analysis information
US7370034B2 (en) * 2003-10-15 2008-05-06 Xerox Corporation System and method for performing electronic information retrieval using keywords
US8392249B2 (en) * 2003-12-31 2013-03-05 Google Inc. Suggesting and/or providing targeting criteria for advertisements
US20050223031A1 (en) * 2004-03-30 2005-10-06 Andrew Zisserman Method and apparatus for retrieving visual object categories from a database containing images

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000049526A1 (en) * 1999-02-16 2000-08-24 Hewlett-Packard Company Similarity searching by combination of different data-types
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition

Also Published As

Publication number Publication date
US20040220898A1 (en) 2004-11-04
JP2004348706A (ja) 2004-12-09
EP1473642A3 (en) 2005-11-02
US7593961B2 (en) 2009-09-22
EP1473642A2 (en) 2004-11-03
CN1542655A (zh) 2004-11-03

Similar Documents

Publication Publication Date Title
CN100458773C (zh) 信息处理装置和信息处理方法
CN100595781C (zh) 图像处理设备和图像处理方法
CN100440108C (zh) 图像处理装置及其控制方法
CN100414550C (zh) 用于图像检索的图像处理设备及其控制方法
CN100397864C (zh) 图像处理系统及图像处理方法
CN101292259B (zh) 用于混合介质环境中的图像匹配的方法和系统
CN100474880C (zh) 图像处理装置及其方法
CN100393096C (zh) 图像处理系统及图像处理方法
CN100448257C (zh) 图像处理装置及其方法
KR100980748B1 (ko) 혼합 미디어 환경을 생성 및 사용하는 시스템 및 방법
CN1332341C (zh) 信息处理装置和信息处理方法
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
CN102413265B (zh) 图像处理装置及其控制方法
CN100493127C (zh) 图像处理装置及其控制方法
US20040223197A1 (en) Image processing method
EP1455284A2 (en) Image processing method and image processing system
US7481374B2 (en) System and method for placement and retrieval of embedded information within a document
JP2004334339A (ja) 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
CN102402593A (zh) 对于搜索查询输入的多模态方式
JP2004326491A (ja) 画像処理方法
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN100501728C (zh) 图像处理方法、系统、程序、程序存储介质以及信息处理设备
CN108960054A (zh) 一种基于图文识别的通关数据生成系统及方法
JP2005208977A (ja) 文書ファイリング装置および文書ファイリング方法
JP2005149210A (ja) 画像処理装置及びその制御方法、プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090204

Termination date: 20170429

CF01 Termination of patent right due to non-payment of annual fee