CN1394313A - 电子文档中嵌入和提取文本的方法 - Google Patents

电子文档中嵌入和提取文本的方法 Download PDF

Info

Publication number
CN1394313A
CN1394313A CN01803422A CN01803422A CN1394313A CN 1394313 A CN1394313 A CN 1394313A CN 01803422 A CN01803422 A CN 01803422A CN 01803422 A CN01803422 A CN 01803422A CN 1394313 A CN1394313 A CN 1394313A
Authority
CN
China
Prior art keywords
text
certificate
data
image
bit stream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN01803422A
Other languages
English (en)
Inventor
崔钟昱
崔基哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Markany Inc
Original Assignee
Markany Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Markany Inc filed Critical Markany Inc
Publication of CN1394313A publication Critical patent/CN1394313A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/32315Selecting a particular method from amongst a plurality of methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3233Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
    • H04N2201/324Selecting a particular authentication information from amongst a plurality of different authentication information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs
    • H04N2201/327Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs which are undetectable to the naked eye, e.g. embedded codes

Abstract

本发明涉及一种使用文本嵌入的方式对各种数字证书进行认证的方法和装置。根据证书的特性,本发明的方法的执行分为两种情况:一种情况是证书中包含图象,另一种情况是证书中不包含图象。前一种情况中,对证书中所含的图象使用一种嵌入文本的方法,将由证书发行者指定的一组信息文本(证书的特定号码,发行证书的组织,或者负责人的名字等)嵌入到图象中。在后一种情况中,将生成一幅人眼不可觉察但与证书背景具有相同颜色的图象。

Description

电子文档中嵌入和提取文本的方法
技术领域
本发明总体上涉及一种方法和装置,用于防止证书被伪造和篡改,并根据数字证书的特性认证证书是否为原始拷贝。更具体地说,本发明在将包含一系列认证证书的信息文本以不可见的方式嵌入数字证书后,发行该证书,并通过本发明所述的方法和装置提取嵌入的信息文本然后对所提取信息文本的内容加以确认这种方式,来认证和确认数字证书。
相关技术
首先,“嵌入”不仅意味着第一个对象物理地排列到第二个对象中,而且意味着第二个对象的内容通过使用一个特定于第一个对象的内容的算法而被改变,以便可以通过后面使用的算法和第二个对象将第一个对象的内容提取出来。特别地,如果数字证书包含图象格式(如标志(Logo)或者代表发行当局的印章图象等),信息文本将被嵌入到该图象中。如果数字证书不包含图象格式,将生成一个透明的图象用于嵌入信息文本。嵌入信息文本的图象被插入到证书中。对于裸眼来说,绝对看不到这种改变。换言之,嵌入的信息文本被嵌入到证书的图象中,或者一个基于证书所含内容生成的透明图象中,以便不可能通过视觉确认,它们用于在证书发行后认证证书。本发明涉及一种将信息文本嵌入到证书中所含的图象中的方法和装置。如果对嵌入的文本进行外部操作,例如对数字数据进行像压缩、过滤、再采样、切割等处理和类似的处理,它能被容易地去除,而证书的认证是基于所述信息文本是否存在来做出决定的。如果第三方故意修改了信息文本的内容,对嵌入的信息文本进行提取时,通过确定文本是否能被提取出来,以及同第一个嵌入的文本的内容进行比较并确定它是否相同的这种方式,可以发现这种被改变的状态。
当前,随着因特网用户的迅速增加,通过电子商务的产品贸易非常活跃。在联机/脱机的产品贸易事务中,数字证书的认证已经作为一个重要的手续出现。不仅这样的电子商务证书,各种民事相关的证书,和学校发行的证书,它们的发行过程计算机化和电子化也已经成为一种趋势。但是,目前不可能发行一种像数字文档一样的证书,其原因是其中存在伪造和篡改。
认证数字证书的技术包括认证函数应用,空白控制方法,条码方法等。在使用认证函数的方法中,设证书发行方和证书持有方共享一个公共密钥S。认证函数包括一个密钥算法、消息摘要和类似的东西,其中有代表性的函数是散列函数。使用散列函数的认证过程如下:首先,认证证书的发行方根据证书、密钥值S和散列函数计算散列值,并将散列值加到证书里,将它发送给申请发行证书的人。得到证书的人通过他已经知道的会话密钥S和散列函数找到散列值。上述散列值同认证证书发行方发送的散列值比较。如果两个散列值相同,认证就被确认,如果不同,则认为认证证书被篡改改过。散列值的比较能够确认交易的另一方的身份(认证)并检测证书是否是伪造的或者被篡改过。
使用认证函数的认证有如下缺陷:
首先,认证是基于文本文档,如果诸如图象和声音标记的不同格式的文档被嵌入到证书中,它应当被单独认证,否则不可能进行认证。
其次,它能够精确地决定文档数据是否被修改过。但是,如果被修改,不可能恢复原始文档。
第三,因为必须将签名加入用于确认认证证书的完整性,原始证书的大小增加了。
使用空白控制方法或者字符形式的控制方法是基于ASCII码的。ASCII码包括94个图形字符和34个仅用于控制而不能被打印的其它字符。图形字符包括26个大写英文字母,26个小写英文字母,10个数字和32个特殊字符(%,*,$等)。34个控制字符根据标准的指定来控制数据目的地和排列打印的文本。控制字符分为如下三类:格式控制符,信息分割符和通信控制字符。格式控制符控制打印文本的布局和包括诸如回退(BS),水平制表符(HT),回车(CR)等用于打字机的控制字符。信息分割符用于将数据分段或者分页,包括记录分隔符(RS),文件分割符(FS)等。通讯控制字符用于修正通过电话线进行传输的文本消息的格式,诸如STX(文本开始),ETX(文本结束)等等。绝大多数计算机以长度为8位的字节作为处理单位。因此,绝大部分情况下,ASCII字符一个字节一个字节地存储。如果需要,剩余的一个位用于不同的目的。例如,打印机设置最高有效位为0并将ASCII码按8位划分。空白字符控制法或者字符形式控制法使用这些字符来控制原始证书的文本文档中的空白用于表达被嵌入的信息,或者通过改变字符格式表达嵌入的信息。如果用户的信息被嵌入到上述文档代码的对象中,则存在如下缺陷:
首先,替代的证书自身的文本文档被改变,这种改变自身并不出现在文档中。如果文档被改变后被再次恢复,恢复的信号必定被破坏。亦即,完全地恢复文本文档是不可能的。
其次,用户可以嵌入信息的区域很小。它只能以受限的方式嵌入用户想要的信息。
使用条码的方法目前使用得很多。条码是一种代码体系,它用不同宽度的白色条纹和黑色条纹的排列模式来表达信息。条码的使用使得高效、快速和精确地处理办公室的工作成为可能。随着国家对条码实际价值的接受,它被用于各种的分布式行业领域,诸如办公自动化,工厂自动化等。目前,条码用在各种标识卡上。对于学员卡,在卡识别器可以识别的卡上使用条码,当学生进出图书馆时,识别装置能够认识条码,因而确认标识卡和鉴别信息的真实性。但是,这样一种使用条码的认证存在如下缺陷:
首先,条码是一种用不同宽度的黑条和白条的排列来表达信息,因而通过肉眼就可以分辨它,因此篡改是可能的。
其次,即使条码被扫描多次,也可能无法读取条码而必须使用键盘来输入数字。
再次,如果条码不可靠或者在发行时被损坏,扫描仪可能将它读作另外一个号码。
发明内容
如上所述,现有技术在证书认证中有各种问题和缺陷。这些问题导致对于认证证书的伪造和篡改,因而证书可能被滥用于非法用途。因此,本发明的目的是提供一种方法和装置,用于嵌入和提取包含一些信息的文本,这些信息使用一种不同于已有的方法来提供证书认证能力,以可靠地对联机/脱机事务中的数字证书(身份认证证书,押金确认证书,贸易证书,毕业证书,水平证书,现金交易(cash deal)证书,商业票据,信用卡认证证书等。)提供认证。
本发明的另一目的是提供必要的信息隐蔽。当传送方发送重要的信息给接收方时,它可以做为一种方法和装置使用,其中发送的信息文本被嵌入到图象格式数据中,或者文本被加工成图象格式后进行传送,接收方可以精确的恢复原始信息。这样的处理使得信息的传送不会引起网络上普遍使用的网络检测器或者其它它检测机制发出警告。在传送方和接受方之间无需加密过程就可以确保安全地传送信息。
为达到上述目的,本发明提供方法是分析已有证书的特性,并使用适合这些特性的信息文本嵌入方法来认证证书。根据本发明的用于认证数字证书的信息文本嵌入方法包括如下步骤:通过分析证书对证书进行分类;根据分类的证书生成信息文本;将生成的文本变成位流;将包含在证书中的图象数据转换成一维数据;以及在所述一维图象数据中嵌入所述位流文本数据。提取嵌入的文本的步骤包括:选择嵌入的文本图象;提取嵌入的位流数据;以及从提取的位流数据中读取嵌入的原始文本信息。证书认证的步骤包括一个用于发行嵌入了文本信息的证书的装置和软件,一个用于认证嵌入了文本的证书的装置和软件。根据本发明所制造的装置,譬如,一台计算机,它从存储相应所述步骤程序的记录介质上得到相应于所述步骤中的命令,执行文本的嵌入和提取。
一般来说,发行的证书有以下两个特性:
首先,图象形式的图片,如注册印章,公司的标志(logo)等,被嵌入在发行证书中,该图片代表发行证书或者版权所有者的法律实体,或者确认发行者嵌入在发行证书中的发行者。这种图象嵌入能够提升公众对证书的信任,并将包括在证书和其它证书表格中的个人信息数字化,并通过计算机化的发行过程将公共文档发行到远程地点。
第二,为了满足发行者要求或者保护版权所有者的权力,或者代表发行当局的独特性,这种证书经常使用特别指定的纸。这种纸经常包括一幅代表发行当局的图象,用一种图象格式或者其它文档文件格式的形式制造。
本发明使用包含信息的嵌入文本方法作为基于上述数字证书特性的证书认证方法。这种文本嵌入技术和方法面向数字证书的认证和保护,是一种区别于现有证书认证方法的新技术。特别地,本发明中所使用的文本嵌入方法是一种嵌入位流文本数据的方法,下文参照附图解释了本发明的包括详细算法的本发明的方法和装置。
作为参考,在解释本发明内容之前,有必要回顾一下证书中包含的图象,这被用于对嵌入在证书中的图象的类型进行分析和嵌入适合于所述图象特性的信息。包含在证书中的图象数据包括一个代表发行地点的符号图象(symbolic image),或者代表发行当局的注册印章。图14显示了一个这样的图象数据的例子。
附图简述
图1是一个从概念上描述本发明中文本嵌入装置的嵌入过程的流程图。
图2是一个从概念上描述本发明中的文本提取过程的流程图。
图3示例了各种数字证书的类型,描述了数字证书的特性分析。
图4的流程图描述了根据基于证书特性分类后的每个特性,生成一个用于嵌入的文本的过程。
图5基于英文文本文档的证书,描述了嵌入的文本的位流处理过程。
图6描述了基于图4中的分类,如果证书是用非英文所写时,在证书中嵌入文本位流的处理过程的实例。
图7描述了将包含在数字证书中的图象转换为一维数据,或者在证书不包含图象的情况下,将生成的透明图象转换为一维数据的过程。
图8描述了生成透明图象的过程。
图9A描述了嵌入文本数据的过程。
图9B描述了嵌入文本数据过程的一个实例。
图10描述了提取文本数据的过程。
图11描述了嵌入文本前后的灰度图象及其柱状图的比较结果。
图12描述了嵌入文本前后的彩色图象及其柱状图的比较结果。
图13描述了嵌入文本前后的注册印章及其柱状图的比较结果。
图14描述了包含在证书中的图象数据的例子。
图15描述了包含条码图象的证书的例子。
发明背景
图1是本发明的总体流程的将文本嵌入证书以便验证证书的步骤(10)的详细流程图。在图1中的将证书进行分类的步骤中,证书的分类是基于以下两个条件:证书中是否存在图象形式的数据(17)和证书是否是用英文所写(11)。证书分类的详细过程在图4中解释。在生成用于嵌入的文本的步骤(14)中,根据语言将证书分类之后,如果证书是基于英文的,则将执行步骤(13)选择一种嵌入文本的方法,如果证书是基于其它语言的,则将执行步骤(12)按照相应的语言选择一种嵌入文本的方法。如果证书是基于英文的,选择嵌入方法的步骤在图5中详细解释。如果证书是基于其它语言的,选择嵌入方法的步骤在图6中详细解释。通过生成位流的步骤(15),文本以6,7,8和16位为单位生成位流。在证书分类步骤中,如果证书中存在图象形式的数据,则将执行直接将图象数据转换为一维数据的步骤(17)。如果证书中不存在图象形式的数据,则将执行生成一个透明的图象的步骤(18)。图8详细解释了生成透明图象的步骤。在步骤(19)中,生成的透明图象的图象数据被转换成一维数据(20)。在转换图象到一维数据步骤中所使用的RSI方法将在图7中解释。步骤(21)在一维数据中嵌入位流数据,这是由公式4来处理的。在嵌入步骤中,为了安全的信息保护,使用了一个密钥。
图2是发明中对信息文本进行提取的步骤,亦即用于认证证书的步骤的详细流程图。提取文本的步骤,亦即提取出被嵌入的文本的步骤包括选择一个嵌入了文本的图象的步骤(32)和提取一个位流的步骤(33),以及从提取的位流中构造文本的步骤。选择图象的步骤中挑选一个嵌入了文本的图象。嵌入的图象也包括透明图象。用一个在第一次嵌入文本时使用的密钥,从所选图象中将位流数据提取出来。与嵌入过程一样,根据公式4,从一个图象的象素值信息中提取出位流数据。在确定提取的位流数据是英文证书(34)还是其它语种的证书(38)之后,通过一个与在嵌入文本过程中(图5和图6)所选方法(35~37,39~41)的逆向过程,生成文本数据。
图3用于分析数字证书的特性。数字证书50,51有一个特定的格式,如图3所示,经常包括图象形式的数据52。在本发明中,所有证书实例本身都是一幅图象,证书不包含图象形式的数据,证书不包含图象形式的数据是可能的。因为如果证书是一个图象形式的文件,信息文本被嵌入到证书图象中,如果图象数据不存在,生成一个透明的图象,将信息文本嵌入到该图象中,并将它包括在证书中。
图4是对数字证书分类的过程图。分类是基于证书所使用的语言和证书的模式。在证书分类步骤中,按下面两个条件对证书进行分类。
一是判断数字证书(61)是否包含图象形式的数据(62),另一个是判断证书是用英文所写还是用其它语言所写(63,66)。上述两个条件使我们能对证书进行分类。如果存在图象形式的文件,则判断数字证书是用英文所写还是其它语言所写(63)。基于使用的ASCII码和文档中以对象形式(如果是HTML,是以一个链接的形式)存在的文本中的单独的图象,可以判断是否是“用英文所写”的。对对象的追踪使得自动判断成为可能。如果整个证书是一幅图象,通过诸如神经网络的字符识别系统,包含在现存证书中的文本被提取出来,并且根据对所使用的ASCII码进行判断,实现自动分类。如果整个证书是一幅图象,“包含图象吗?”自动决定一幅图象是否被包含。如果是用英文所写,则将根据图4中嵌入文本生成部分1(a)(64)生成要嵌入的文本文档。如果不是用英文所写,则根据图4中嵌入文本生成部分2(a)(65)生成要嵌入的文本文档。相对于存在图象形式的数据的情况,如果图象形式的数据不存在,则还要增加准备透明图象的步骤。透明图象的生成过程将在图8中解释。透明图象准备好后,判断证书是用英文所写还是用其它语言所写。如果证书是用英文所写,将根据图4中嵌入文本生成部分1(b)(68)生成要嵌入的文本文档。如果不是用英文所写,则将按照图4中嵌入文本生成部分2(b)(67)生成要嵌入的文本文档。判断是否用英文所写非常重要。本发明提供一种对英文以外的韩文,日文和中文的数字证书进行认证的方法。且上述方法可用于其它任何语言。
图5显示了对于基于英文文本文档的证书,要嵌入文本的位流生成过程。在图4中的通过证书分类的过程生成要嵌入的文本的步骤里,在嵌入文本生成部分1(a)(70)和嵌入文本生成部分1(b)(71)中,生成的文本都是英文。(如果是英文证书,发行当局大多数使用英文作为主要语言,因此,假定嵌入的文本是以英文所写的)。要嵌入在英文证书中的信息文本,如基于8位ASCII码的文本,通过如下过程生成位流:首先,基本上有三种方法(72-74)用于位流生成,位流分类方法是基于作为主要参考的ASCII码表。ASCII码如表1所示。
                                      b7b6b5
b4b3b2b1   000  001     010    011     100     101     110    111
  0000   NUL  DLE     SP     0     @     P     `     p
  0001   SOH  DC1     !     1     A     Q     a     q
  0010   STX  DC2     “     2     B     R     b     r
  0011   ETX  DC3     #     3     C     S     c     s
  0100   EOT  DC4     $     4     D     T     d     t
  0101   ENQ  NAK     %     5     E     U     e     u
  0110   ACK  SYN     &     6     F     V     f     v
  0111   BEL  ETB     *     7     G     W     g     w
  1000   BS  CAN     (     8     H     X     h     x
  1001   HT  EM     )     9     I     Y     i     y
  1010   LF  SUB     =     :     J     Z     j     z
  1011   VT  ESC     +     ;     K     [     k     {
  1100   FF  FS     ,     <     L     l     |
  1101   CR  GS     -     =     M     ]     m     }
  1110   SO  RS     .     >     N     ^     n     ~
  1111   SI  US     /     ?     O     -     o    DEL
            [表1]
图5中方法1是按照表1将文本文档变成7位的位流(75)。如果将文本文档转换为使用7位代码的二进制流,则100个英文字符组成一个700位的位流。
英文代码里通常以一个字节位单位进行处理。剩下的一位根据其使用有细微的差别。方法2通过以所余的奇数或者偶数的形式将一个奇偶校验位加到表1中的7位上,组成一个1字节形式的代码,从而生成位流(76)。当对要嵌入在证书中的文本数据进行位流转换时,以奇数或者偶数的形式在7位上加入一个校验位表示存在嵌入,并且在嵌入时要参考ASCII偶数码表和奇数码表。对于每100个英文字符,方法2组成一个800位的位流。(参看国际标准ASCII偶数码表和ASCII奇数码表)
考虑到表1中部分代码并没有被使用的特点,方法3通过减少被使用的代码数,如表2,以6位为单位表达6个位和位流。方法3每100个英文字符包含600个位流。
   char  INDEX  char    INDEX    char  INDEX   char   INDEX
    a     0     q     16     6     32     `     48
    b     1     r     17     7     33     -     49
    c     2     s     18     8     34     -     50
    d     3     t     19     9     35     /     51
    e     4     u     20     SP     36     :     52
    f     5     v     21     !     37     ;     53
    g     6     w     22     “     38     <     54
    h     7     x     23     #     39     =     55
    i     8     y     24     S     40     >     56
    j     9     z     25     %     41     ?     57
    k     10     0     26     &     42     @     58
    l     11     1     27     ‘     43     [     59
    m     12     2     28     [     44     60
    n     13     3     29     45     ^     61
    o     14     4     30     *     46     {     62
    p     15     5     31     +     47     .     63
               [表2]
因此,当不嵌入与组成证书的文本相同的文本时,对于相同的位流,方法3可以比其它方法嵌入更多的文本文档。但是,方法1和方法2可以嵌入与证书文本相同的文档。换言之,方法3代码的减少使得表达证书所包含的字符的形状信息是不可能的。这意味着不可能表达一种和它自己一样的字符。
图6描述了基于图4的分类对嵌入文本生成位流的过程。其中解释了基于非英文的韩文,中文和日文文本的生成位流的过程。在图4嵌入文本生成部分2(a)(80)和嵌入文本生成部分2(b)(81)中生成的要嵌入的文本数据(82)不是用英文准备的,而是使用基于其它Unicode的2字节编码准备的。因此,证书语种被分类,用于将要嵌入证书中的文本数据转换成位流。
用非英语如基于2字节编码的韩文,中文,和日文等所准备的证书都以16位为单位转换成位流(83)。关于1993年3月发布的UniversalCode system ISO 10646-1/Unicode 1.1,因为Unicode和ISO10646被整合在一起,技术上讲,ISO 10464也“几乎”类似于Unicode版本1.1。ISO10646-1的UCS-2合二为一。目前ISO10646的修订版Unicode 2.0已经解决了版本1.1中存在的部分问题。ISO10646/unicode现在被普遍使用。Universal Code System以16位的形式支持韩文,中文和日文等。基于这个国际标准,当对数字证书进行位流转换时,本发明将韩文,中文和日文等数字证书以16位为单位转换成位流。(参看国际标准ISO 10646-1 UCS2和ISO 10646 Unicode 2.0/3.0代码表)。
因此,当英文证书和其它语言证书转换成位流时,位流的长度是不同的。换言之,如果是英文证书,在证书中可以嵌入的文本的数目是嵌入其它Unicode字符证书中文本数目的两倍。
图7描述了将包含在数字证书中的图象,或者在证书不包含图象的情况下所生成的透明图象转换成一维数据的过程。将图象转换成一维数据有各种方法。在广泛使用方法中,光栅扫描图象法(RSI方法)在本发明中被使用。Hilbert扫描图象法,Z扫描图象法等也可以应用在本发明中。
光栅扫描图象法将二维数据转换为一维数据,这是最简单和使用最广泛的方法。在图象的左上角的点开始,,较低的扫描线(下一行)从最高的扫描线(行)依次重新排列成一维数据,由此得到一维图象信号。如果图象是从黑白图象91中提取的,二维数据通过光栅扫描法转换成一维数据。如果图象是从彩色图象90中提取的,图象被分解成红,绿和蓝三个分量,然后按照红绿蓝分量的顺序组合转换成一维数据。
图8描述了生成透明图象的过程。如果发行的数字证书的背景是白色,那么生成一个透明的图象。如果背景不是白色,根据背景的色彩信息生成一个透明的图象。透明图象的生成过程如下:用于指示位流精确信息而生成的透明图象数据必须被量化成最少2位。如果图象被量化成2位,则它包含四个象素值(100)。每个象素被赋予0,1,2或3的值,0对应于象素值RGB=[255,255,255](101),1对应于象素值RGB=[255,255,254](102)。使用上述0和1生成透明图象。在选择0和1时,有三种方法,选择全0,选择全1,随机选择0和1(103)。生成的透明图象的大小由被嵌入的文本大小决定。为了嵌入足够的用于认证的文本,透明图象的象素数目至少要大于位流数据的长度。因为图象是二维数据,其大小应该是两个自然数的乘积。
图9A描述了嵌入文本数据的过程。嵌入位流数据的步骤如下:首先,如果证书中的图象是灰度图象,图象的最大象素值Max(Pixel)变为Max(Pixel)-1(120)。如果证书中提取的图象是彩色图象,图象按照颜色进行分解(116),红,绿和蓝分量的最大象素值Max(Pixel)变为Max(Pixel)-1(117)。之所以这样是因为嵌入一个信息文本象素值的变化最大值不能超出0~2m-1这个范围。如果证书不包括图象,则按其本身的样子新生成一幅透明图象。象图5和图6一样,要嵌入的文本(110,111)被转换成位流(112,113),象图7一样,图象数据作为一维数据生成(118)。变成位流后的文本数据用B(i)表示(114)。作为转换上述一维图象为数据的结果,这些数据用image(i)表示,一维数据的定义域按照彩色图象和灰度图象进行分类,分别用式子1和式子2表示。N×M表示图象的宽度和长度。
0≤i≤N×M       (1)
0≤i≤N×M×3    (2)
式子3是一维数据的值域。其中m代表一维数据的量化位数。当变成位流的数据被嵌入到被转换成一维数据的上述图象中时,KeySN代表指定第一个嵌入位置的密钥值,image(KeySN+i)真正代表一维数据中的嵌入位置。
0≤image(i)≤2m-1    (3)
嵌入原则(122)如下所示:
如果将满足等式4的嵌入位置的值与变成位流的值进行比较,等式5中的图象象素值不被改变。如果不能满足式子4,一维图象数据被改变为image(KeySN+i)+1.
image(KeySN+i)≡B(i)mod2    (4)
image(KeySN+i)              (5)
对于图9B中的特定实例,基于方法3将文本“four-life”嵌入6×6象素图象的过程(126)如下:首先,使用RSI法,6×6图象被变为一维图象数据Image(i)(127)。表2显示“f”和“o”分别对应于“5”和“14”。因此,基于表2的索引,“four-life”变成一行十进制数“5,14,20,17,49,11,8,5,4”。该行以6位为单位变成一个位串行,由此获得位流数据B(i)。因为根据等式4,image(1)=123,B(1)=0,通过123+1,将象素值变为124。也就是说,一维图象的第一个象素的值为123,如果123除以2,得到余数1。该余数1与位流第一位的值0不相等,通过在第一个象素的原始值上加1变为124。同时,因为当第二个象素Image(2)=124除以2时,余数等于该位流的第二个位的值0,因此象素值不改变。所有B(i)的位流信息以同样的方式嵌入到6×6图象中。在嵌入后,通过使用逆向RSI法(123),图象被建立。这个建立的图象就是嵌入了文本的图象。
由证书持有者或者发行者任意指定一个1-8的数字组成的十进制数字作为密钥。自然,密钥实际上并不被原样使用。而将准备一个按照下面的式子6,7和8通过数学计算得到的密钥值指定的域(下面式子6中的D)。证书的发行者并不关心变换到由密钥值所指定的域这一过程。这就是所有他要记住的关于第一指定密钥的信息。本发明中所使用的密钥存在下述两个限制。
第一个限制如下:
密钥与从证书中提取的图象的象素数也就是图象的大小密切相关,它也受到图象大小的影响。图象大小在由可以被真正嵌入的文本生成的位流的范围之中。其中image(i)中i定义的最大值为Max(image,i)。
第二个限制如下:
被嵌入的位流的长度根据B(i)中i的最大值是多少来决定。其中B(i)的最大值是Max(B,i)。密钥KeySN的值域是D。D的值与最大值Max(B,i)和由图象大小和嵌入能力获得的位流的最大值Max(image,i)有如下关系:
D={KeySN|0≤KeySN≤Max(image,i)-Max(B,i)}    (6)
如果KeySN的输入值大于式子7的值,使用通过等式8计算后的密钥值。如果KeySN的输入值小于式子7的值,则原样使用这个密钥值。如果真正使用的密钥值为KeySN,则该值与等式8相同。
Max(image,i)-Max(B,i)                      (7)
KeySN1=KeySN mod Max(image,i)-Max(B,i)    (8)
该密钥被用于如下用途。
首先,该密钥用于指定将转换为位流的文本文档的数据嵌入到一维图象数据中的位置。
第二,该密钥被用于证书发行者和持有者确认这是他自己的信息。这是为了防止如下的攻击。当一个人使用该密钥值伪造一个文本文档时,这可以阻止嵌入在使用此算法的证书的图象中的文本被确以。
第三,由于使用密钥值来决定嵌入的片断,保证密钥值的安全就可以确保嵌入的文本数据自身的稳定性。
如嵌入算法所示,图象基于证书被选定和生成,被嵌入的(整个证书的必须的信息/内容等的)信息文本是基于证书而生成的。由证书所准备的文本信息被嵌入到证书中所选定的图象,一幅视觉无法分辨的新图象就形成了。通过这一过程完成文本的嵌入使得可以对证书进行认证。
图10描述了提取文本数据的过程。提取算法的处理流程如下。首先,选取文本信息被插入其中的一幅图象(包括透明图象)(131),该图象是包含在证书中(130),譬如个人或者发行者的注册图象,用户的证明图片,或者发行当局的一个标志和图象。使用光栅扫描法(RSI法)(133),选取的图象被转换为一维数据(134)。下一步,根据用户或者发行者的一个密钥和一个位流找到嵌入开始的位置(135),该位流基于从一维数据image(KeySN+1)开始的象素值是奇数还是偶数满足image(KeySN+1)≡B(i)。因此,如果是英文证书,方法1,方法2和方法3分别以8位,7位和6位为单位用于组合位流,因此以上组成的位流(136)被转换为一个十进制数(137)。如果不是英文证书,以上位流在以16位为单位组合后被转换为一个十进制数。组合的十进制数字流被转换为文本数据(138),这些数据基于嵌入方法所参考的表。转换的结果成为要恢复文本数据(139)。
如图10所示,嵌入文本的恢复过程是一个嵌入过程的逆过程。
本发明的特定算法包括三个基本步骤。它们是:生成一个要嵌入的文本,嵌入信息文本和提取信息文本。对算法性能有直接影响的是在嵌入信息文本过程中图象的改变和被嵌入到文本中的信息的数量。下面将对他们进行详细解释。首先解释图象的改变。
可以说嵌入文本文档的过程是一个真正改变图象的过程。换言之,通过将用户指定的文本嵌入到图象中,图象被改变,它可以是一个在图象中嵌入噪声的过程。嵌入的噪声的大小区分了原始的图象和嵌入了文本的图象。在本发明中,作为认证证书并提供给申请发行证书者而发行的证书,并不包含在原始证书中包含的图象。换言之,嵌入在发行证书中的图象,是一幅嵌入了由发行者生成的信息文本的图象。在嵌入信息文本后,原始图象不再需要。
图11,图12和图13是灰度图象140,彩色图象150,和注册印章160在文本被嵌入到图象142,152和162前后的比较结果和柱状图141,143,151,153,161,163的比较。因为象素值的改变很小,这种改变是视觉不可分辨的。象素值的改变仅仅在嵌入的区域里改变。
比较图11的柱状图,可以看出,嵌入更多文本数据的红色分量被改变。图12和图13显示了彩色图象和注册印章图象的性能评价。作为在灰度图象,彩色图象和注册图象中嵌入文本并比较嵌入的图象和原始的图象的改变的结果,可以看出,不可能通过视觉确认象素的改变。
下面,解释被嵌入的信息的数量。
作为一系列文本嵌入的信息的数量与证书中包含的图象的大小和图象的量化水平有直接的关系。下表显示的是根据量化的位数和图象的大小,计算嵌入文本的数量的结果。正如看到的嵌入的信息的数量,如果证书包含图象,内容几乎没有限制。通常,证书包含的文本内容大约500~3000个字符。因此,嵌入的信息文本的大小几乎没有限制。
  图象大小    量化位数     可以被嵌入的信息的数量
  256×256 彩色(24位) 最大32,768字符(6位为单位)
  256×256 灰度(8位) 最大10,922字符(6位为单位)
  153×134 彩色(24位) 最大10,251字符(6位为单位)
  153×134 灰度(8位) 最大3,417字符(6位为单位)
               [表3]
这样,当第三方发动各种攻击(修改等)和对经本发明所提方法处理的图象进行加工时,所产生的影响被表现出来。
图象处理有多种方法。本发明试验性地提出一种针对嵌入了文本的图象的处理方法。如果在与JPEG相同的频率空间对嵌入了文本的图象进行压缩行处理,嵌入的文本会消失。如果使用类似过滤的方法,嵌入的文本不能被恢复。对于不同的图象处理方法,使用柱状图平均化,图象锐化,图象剪切。因此,嵌入的文本图象仍然不能被恢复。除非使用包括旋转这样的几何图象处理,几乎不可能使用图象处理方法来提取嵌入的文本。
下面显示的表4是图象处理的分析结果(X-无法提取,O-可能提取)。
            [表4]
也就是说,对于“认证”用途,本发明中的方法具有不可避免的易损水印特性。(请参考以本申请的名称提交的有关易损水印的专利)。
证书的篡改包括证书内容文本篡改(名字或数据等)和证书包含的图象的篡改。如果包含在证书中的文本内容改变了,对嵌入到图象中的证书内容信息文本进行的提取使得找出这种篡改并恢复原始文本文档成为可能。根据以上结果,因为所有包含在证书中的文本内容可以被嵌入到证书的图象中,所以如果对嵌入的文本的提取可以恢复所有原始证书的内容,那么就可以确认证书是否被伪造或者被篡改。如果改变包含在证书中的嵌入了文本的图象,嵌入的文本将不能被提取出来。如果不能提取嵌入在上述图象中的文本,则证书被认为是无效的。
证书伪造是以一个人所希望的方式改变证书的一部分。如果要伪造证书,必须找出发行者或者使用者所使用的密钥。如果不这样,虽然在以上图象中嵌入文本是可能的,但是要通过认证是不可能的。因此,伪造可以被检测到。
如图15所示,根据本发明的其它实施例,可以将条码和上面所描述的文本嵌入方法结合起来。这是一种将条码加入到嵌入在证书中图象的方法。更确切地,它是一种将条码171加入到包括在目前证书中的图象类型中并应用本发明的方法。这种方法的类型分为如下两种情况:应用到组合了条码和其它图象的一幅图象上;条码和嵌入了文本的图象分别应用。
在通过组合方法应用到一幅图象上的情况下,覆盖条码的图象部分使用块处理,因此不嵌入文本,这使得维护条码和文本的稳定性成为可能。在单独使用的情况下,条码使得证书的认证更加容易和快速。更有利的是,本发明提取嵌入到图象的文本的过程,是一个双层认证,因而有更好的性能,使之可以增强安全和稳定性。特别是在使用条码的情况下,如果一个人试图伪造或者篡改证书,只是查看条码并攻击该部分,被不可见地插入了文本的图象部分170可能被忽略,这有双重保护的作用。
虽然没有说明,但文本嵌入和提取是使用计算机来完成的。通用的编程语言读取电子证书作为其处理对象,也就是电子文档,然后将文本和图象分开,并编写一个程序,其中文本被嵌入到图象中,并存储在记录介质上,以使其可以在计算机上执行。具有该领域基本技能的人可以很容易的开发出各种能实现本发明的程序。换言之,众所周知,与程序相关的数据可以临时从外部存储介质也就是软盘存储到计算机的硬盘上,并且当上述文本嵌入程序运行时,这些数据可以从硬盘读取到内存中。使用存储介质,例如软盘,硬盘,光盘,磁光盘,CD-ROM,CD-R,磁带,非易失性存储卡,ROM等来提供程序代码。当将本发明应用于前面提到的存储介质上时,相应于前面提到的嵌入步骤的程序代码被保存在这些存储介质上。
行业适用性
本发明适用于各种数字证书的认证。防止证书伪造或篡改避免了由于伪造或篡改所造成的破坏。本发明可以辨别出证书被伪造/篡改,并且在被伪造/篡改时,恢复被伪造/篡改的内容。此外,本发明可以安全地将证书发行者的签名发送给接收者,并通过提取文本的内容来确认对方的确切身份。

Claims (12)

1.一种将文本嵌入电子文档的方法,包括:
将至少一部分所述文本转换为位流;
如果所述电子文档中包含所述图象数据,将至少一部分图象数据转换为一维数据,如果所述电子文档中不包含所述图象数据,那么生成透明图象数据,以将这些生成的透明图象数据转换为一维数据;
将被转换成位流的文本嵌入到所述一维数据中;
将嵌入了所述文本的所述一维数据恢复成所述电子文档的图象数据;以及
将恢复的图象嵌入到所述电子文档中。
2.如权利要求1中的方法,其特征在于,所述文本是用于验证所述电子文档的信息。
3.如权利要求1中的方法,其特征在于,所述透明图象是所述电子文档的至少一部分背景。
4.如权利要求1中的方法,其特征在于,所述文本图象是从所述电子文档中选取的至少一部分的所述电子文档。
5.如权利要求4中的方法,还包括:
分辨所述文本的语种;以及
将所述要被嵌入的文本转换为所述的相应于每种语言的位流。
6.如权利要求1中的方法,其特征在于,所述的嵌入还包括:
使用余数运算符,计算所述一维数据每个单元数据的余数;以及
将所述余数与所述位流的一个位值进行比较,如果余数等于所述位流的所述位值,那么保持所述单元数据,如果余数不等于所述位流的所述位值,那么将所述单元数据加1。
7.如权利要求1中的方法,其特征在于,通过对至少一部分所述文本进行块编码或者计算消息摘要值后,它们被转换为所述位流。
8.如权利要求1中的方法,其特征在于,使用光栅扫描法(RSI法),Hilbert扫描法和Z扫描法三中技术的一种进行所述转换。
9.如权利要求1中的方法,其特征在于,所述图象的至少一部分包括条码。
10.如权利要求1到9中任意一条所述的从嵌入了文本的电子文档中提取文本的方法,包括:
从所述电子文档中选择用于嵌入文本的图象数据;
将至少一部分所选图象数据转换为一维数据;
根据所述一维数据生成所述一系列位流;以及
通过将所述一系列位流转换为文本从而提取嵌入的文本。
11.如权利要求10中的方法,其特征在于,根据所述一维数据生成所述一系列位流,包括:
用所述单元数据第一位除以2计算余数;以及
从所述余数中生成所述系列位流。
12.一种用于存储验证电子文档的程序所使用的计算机可读的记录介质,该程序允许计算机执行如下步骤:
将至少一部分文本转换为位流;
如果所述电子文档包含图象数据,将至少一部分图象数据转换为一维数据,如果所述电子文档不包含图象数据,则生成透明图象的数据,以将透明图象数据转换为一维数据;
将转换为所述位流的文本嵌入到所述一维数据中;
恢复嵌入到所述电子文档图象数据中的一维数据;以及
将恢复的图象数据插入到所述电子文档。
CN01803422A 2000-11-02 2001-11-02 电子文档中嵌入和提取文本的方法 Pending CN1394313A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR65038/2000 2000-11-02
KR1020000065038A KR100548983B1 (ko) 2000-11-02 2000-11-02 디지털 증명서의 발급 및 인증을 위한 텍스트의 삽입 방법및 장치

Publications (1)

Publication Number Publication Date
CN1394313A true CN1394313A (zh) 2003-01-29

Family

ID=19697015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01803422A Pending CN1394313A (zh) 2000-11-02 2001-11-02 电子文档中嵌入和提取文本的方法

Country Status (6)

Country Link
US (1) US6940995B2 (zh)
JP (1) JP2004513543A (zh)
KR (1) KR100548983B1 (zh)
CN (1) CN1394313A (zh)
AU (1) AU2002214359A1 (zh)
WO (1) WO2002037309A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333574C (zh) * 2004-09-29 2007-08-22 致伸科技股份有限公司 一种数字图像中提取文本区域的方法
CN103985082A (zh) * 2014-05-29 2014-08-13 中国工商银行股份有限公司 电子凭证信息的验证方法及装置
CN104412277A (zh) * 2012-05-02 2015-03-11 艾可有限公司 比较两个含有图形元素和文本元素的文件的设备和方法
CN105718432A (zh) * 2016-03-16 2016-06-29 北京睿新科技有限公司 一种用于电网运行设备的信息挖掘与数据质量的校验方法
CN108920612A (zh) * 2018-06-28 2018-11-30 山东中孚安全技术有限公司 解析doc二进制格式并提取文档中图片的方法及系统

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020009208A1 (en) * 1995-08-09 2002-01-24 Adnan Alattar Authentication of physical and electronic media objects using digital watermarks
US8144368B2 (en) * 1998-01-20 2012-03-27 Digimarc Coporation Automated methods for distinguishing copies from original printed objects
US6728390B2 (en) 1995-05-08 2004-04-27 Digimarc Corporation Methods and systems using multiple watermarks
AU2001255445A1 (en) * 2000-04-17 2001-10-30 Digimarc Corporation Authentication of physical and electronic media objects using digital watermarks
US7305104B2 (en) * 2000-04-21 2007-12-04 Digimarc Corporation Authentication of identification documents using digital watermarks
US6760464B2 (en) 2000-10-11 2004-07-06 Digimarc Corporation Halftone watermarking and related applications
US6512837B1 (en) 2000-10-11 2003-01-28 Digimarc Corporation Watermarks carrying content dependent signal metrics for detecting and characterizing signal alteration
JP3983993B2 (ja) * 2001-04-13 2007-09-26 株式会社日立製作所 顔写真付き申請書データ作成方法及びその実施装置並びにその処理プログラム
US8094869B2 (en) 2001-07-02 2012-01-10 Digimarc Corporation Fragile and emerging digital watermarks
KR20030021294A (ko) * 2001-09-05 2003-03-15 (주) 선우정보시스템 위조방지를 위한 문서의 관인 및 표시방법
JP3935879B2 (ja) * 2001-11-06 2007-06-27 インターナショナル・ビジネス・マシーンズ・コーポレーション データ供給のためのシステム
KR100878518B1 (ko) * 2001-12-03 2009-01-13 삼성전자주식회사 워터마크 삽입방법, 전송방법, 복원방법 및 그 장치
US7728048B2 (en) 2002-12-20 2010-06-01 L-1 Secure Credentialing, Inc. Increasing thermal conductivity of host polymer used with laser engraving methods and compositions
KR100467930B1 (ko) * 2002-01-17 2005-01-24 주식회사 마크애니 텍스트 문서로/로부터 워터마크를 삽입 및 추출하는방법과 그 장치
US7054461B2 (en) 2002-02-15 2006-05-30 Pitney Bowes Inc. Authenticating printed objects using digital watermarks associated with multidimensional quality metrics
JP4554358B2 (ja) 2002-05-14 2010-09-29 メディアセック テクノロジーズ ゲーエムべーハー 印刷文書のための可視認証パターン
US7519819B2 (en) 2002-05-29 2009-04-14 Digimarc Corporatino Layered security in digital watermarking
MXPA05003984A (es) * 2002-10-15 2005-06-22 Digimarc Corp Documento de identificacion y metodos relacionados.
ATE491190T1 (de) 2003-04-16 2010-12-15 L 1 Secure Credentialing Inc Dreidimensionale datenspeicherung
US20050063027A1 (en) * 2003-07-17 2005-03-24 Durst Robert T. Uniquely linking security elements in identification documents
US7328847B1 (en) * 2003-07-30 2008-02-12 Hewlett-Packard Development Company, L.P. Barcode data communication methods, barcode embedding methods, and barcode systems
ITMI20050222A1 (it) * 2005-02-15 2006-08-16 Milano Politecnico Lipidi cationici per la trasfezione di acidi nucleici
EP1796368A1 (en) * 2005-12-06 2007-06-13 Océ-Technologies B.V. Scan apparatus
JP2007174314A (ja) * 2005-12-22 2007-07-05 Ricoh Co Ltd 電子証明書管理方法および画像処理装置
JP4715662B2 (ja) * 2006-07-21 2011-07-06 セイコーエプソン株式会社 データプリントシートのための印刷データ生成装置、および、印刷データを生成する方法、ならびに、コンピュータプログラム
US8220047B1 (en) * 2006-08-09 2012-07-10 Google Inc. Anti-phishing system and method
US7996677B2 (en) 2006-12-06 2011-08-09 Microsoft Corporation Digitally certified stationery
US7680882B2 (en) * 2007-03-06 2010-03-16 Friendster, Inc. Multimedia aggregation in an online social network
JP4420045B2 (ja) * 2007-03-07 2010-02-24 ブラザー工業株式会社 画像処理装置
US7852195B2 (en) * 2007-03-27 2010-12-14 Valmarc Corporation Authentication of source, plus, for goods and services system, method, and components
US20080301815A1 (en) * 2007-05-31 2008-12-04 Microsoft Corporation Detecting Unauthorized Changes to Printed Documents
US8170270B2 (en) * 2007-12-14 2012-05-01 International Business Machines Corporation Universal reader
US8788523B2 (en) * 2008-01-15 2014-07-22 Thomson Reuters Global Resources Systems, methods and software for processing phrases and clauses in legal documents
KR100910378B1 (ko) * 2008-10-06 2009-08-04 주식회사 오엘콥스 암호화된 이미지를 이용한 전자증명서 발급 시스템 및 방법
US10943030B2 (en) 2008-12-15 2021-03-09 Ibailbonding.Com Securable independent electronic document
EP2249307B1 (en) * 2009-05-05 2019-07-03 InterDigital Madison Patent Holdings Method for image reframing
US20120008693A1 (en) * 2010-07-08 2012-01-12 Echostar Technologies L.L.C. Substituting Embedded Text for Video Text Images
JP5012993B2 (ja) * 2010-12-27 2012-08-29 セイコーエプソン株式会社 データ復号方法、データ再生システム、及び、コンピュータプログラム
US9076140B2 (en) * 2012-06-26 2015-07-07 Wal-Mart Stores, Inc. Image embedding apparatus and method
KR101710032B1 (ko) * 2016-10-13 2017-02-24 주식회사 마크애니 전자문서 내용기반의 위변조 방지 장치와 시스템 및 그 방법
KR101863615B1 (ko) * 2017-05-24 2018-06-01 (주)이스트소프트 신경망 학습 기반의 변종 악성 코드를 탐지하기 위한 장치, 이를 위한 방법 및 이 방법을 수행하기 위한 프로그램이 기록된 컴퓨터 판독 가능한 기록매체
JP7151477B2 (ja) * 2018-12-28 2022-10-12 京セラドキュメントソリューションズ株式会社 画像形成装置
KR102103525B1 (ko) * 2019-10-24 2020-04-22 상명대학교산학협력단 동형문자를 이용한 CityGML 파일 워터마킹 방법, 워터마크 추출 방법 및 워터마킹 시스템
KR102489574B1 (ko) * 2022-02-09 2023-01-18 (주)큐브더모먼트 가명정보 파일을 판별하기 위한 정보집합물 내에 삽입된 서명을 포함하는 가명정보 파일의 생성 및 판별 방법, 장치 및 컴퓨터프로그램

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3542678B2 (ja) * 1995-12-28 2004-07-14 沖電気工業株式会社 電子文書の単語間の空白部分の長さを利用した符号化および復号化方法、電子文書への署名情報の埋め込み方法、機密文書の暗号化方法
JPH11203207A (ja) * 1998-01-14 1999-07-30 Niisu:Kk 暗号化されたファイルを作成または解読するファイル作成方法、暗号化されたファイルを作成または解読するファイル作成装置、暗号化されたファイルを作成または解読するためのプログラムが内蔵されている記憶媒体、暗号化されたファイルを作成または解読するためのプログラムによって情報を処理する情報処理装置、および暗号化されたファイルを作成または解読するためのプログラムによって情報を処理する情報処理システム
US6256736B1 (en) * 1998-04-13 2001-07-03 International Business Machines Corporation Secured signal modification and verification with privacy control
EP1131769B1 (en) * 1998-11-19 2005-02-16 Digimarc Corporation Printing and validation of self validating security documents
FR2787604B1 (fr) * 1998-11-30 2001-08-31 Canon Kk Procede d'insertion d'une marque secrete et d'authentification d'un signal numerique
EP1157499A4 (en) * 1999-03-10 2003-07-09 Digimarc Corp PROCESS FOR SIGNAL PROCESSING, DEVICES AND APPLICATIONS FOR THE MANAGEMENT OF DIGITAL RIGHTS
KR20010068946A (ko) * 2000-01-11 2001-07-23 최종욱 연약한 워터마크 기술을 이용한 문서 변조 방지 기술
KR20010008048A (ko) * 2000-11-04 2001-02-05 김주현 디지털 콘텐츠의 워터마크 삽입방법
US6925192B2 (en) * 2001-08-15 2005-08-02 Eastman Kodak Company Authenticatable image with an embedded image having a discernible physical characteristic with improved security feature

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333574C (zh) * 2004-09-29 2007-08-22 致伸科技股份有限公司 一种数字图像中提取文本区域的方法
CN104412277A (zh) * 2012-05-02 2015-03-11 艾可有限公司 比较两个含有图形元素和文本元素的文件的设备和方法
US10102223B2 (en) 2012-05-02 2018-10-16 Eyec Gmbh Apparatus and method for comparing two files containing graphics elements and text elements
CN104412277B (zh) * 2012-05-02 2021-08-27 艾可有限公司 比较两个含有图形元素和文本元素的文件的设备和方法
CN103985082A (zh) * 2014-05-29 2014-08-13 中国工商银行股份有限公司 电子凭证信息的验证方法及装置
CN103985082B (zh) * 2014-05-29 2017-02-15 中国工商银行股份有限公司 电子凭证信息的验证方法及装置
CN105718432A (zh) * 2016-03-16 2016-06-29 北京睿新科技有限公司 一种用于电网运行设备的信息挖掘与数据质量的校验方法
CN105718432B (zh) * 2016-03-16 2019-02-01 北京睿新科技有限公司 一种用于电网运行设备的信息挖掘与数据质量的校验方法
CN108920612A (zh) * 2018-06-28 2018-11-30 山东中孚安全技术有限公司 解析doc二进制格式并提取文档中图片的方法及系统

Also Published As

Publication number Publication date
WO2002037309A1 (en) 2002-05-10
JP2004513543A (ja) 2004-04-30
US6940995B2 (en) 2005-09-06
US20030099374A1 (en) 2003-05-29
AU2002214359A1 (en) 2002-05-15
KR20010095343A (ko) 2001-11-07
KR100548983B1 (ko) 2006-02-02

Similar Documents

Publication Publication Date Title
CN1394313A (zh) 电子文档中嵌入和提取文本的方法
KR100405828B1 (ko) 위변조의 방지가 가능한 문서를 제작하는 장치 및 방법,그리고 상기 문서를 인증하는 장치 및 방법
CN1209730C (zh) 一种数字防伪方法
US8595503B2 (en) Method of self-authenticating a document while preserving critical content in authentication data
EP2237546B1 (en) Device and process for protecting a digital document, and corresponding process for verifying the authenticity of a printed hardcopy
US6983056B1 (en) Method and device for embedding and detecting watermarking information into a black and white binary document image
US8379261B2 (en) Creation and placement of two-dimensional barcode stamps on printed documents for storing authentication information
CN1635533A (zh) 数字印章系统
US6978035B2 (en) Information hiding system, method, and printed matter into which information is hidden
CN1567340A (zh) 一种防伪票据、票据防伪方法及系统
Tkachenko et al. Printed document authentication using two level or code
US7596270B2 (en) Method of shuffling text in an Asian document image
CN1691087A (zh) 用于解码数字编码图像的系统和方法
Yadav et al. Estimation of copy-sensitive codes using a neural approach
Noore et al. Embedding biometric identifiers in 2D barcodes for improved security
CN109558741A (zh) 一种打印文件和票据原件的保护和验证方法
Dlamini et al. Mitigating the challenge of hardcopy document forgery
Yazdani et al. A new method to persian text watermarking using curvaceous letters
US11279164B1 (en) Length-modulated screening lines and line codes
US20040123100A1 (en) Certificate issuing method and certificate verifying method
JP4260076B2 (ja) 文書作成装置、文書検証装置、文書作成方法、文書検証方法、文書作成プログラム、文書検証プログラム、文書作成プログラムを格納した記録媒体、および文書検証プログラムを格納した記録媒体
JP3903436B2 (ja) 印影の認証システム
Jiang et al. Robust document image authentication
DE19907251A1 (de) Digitales Wasserzeichen für eigenhändig geleistete Unterschriften
Bern et al. Trustworthy paper documents

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication