怎么将数据库系统工程师里的数据存到工程里

怎么把数组存到数据库里相应的字段里【mysql吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:37,214贴子:
怎么把数组存到数据库里相应的字段里收藏
有一数组$info_array
有近百个值,存到数据库里相应的近百个字段里。要怎么做???insert 语句
AutoTDS-V1型全自动热解吸仪是一款20位常温二次全自动热解吸仪,气路采....
如果你改变看世界的方式,你就能改变你眼前的世界!加入群(交流解决IT难题)!!
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或怎么把数组存到数据库里相应的字段里【php吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:131,614贴子:
怎么把数组存到数据库里相应的字段里收藏
有一数组$info_array
有近百个值,存到数据库里相应的近百个字段里。要怎么做???insert 语句
阿里云云市场镜像可以一键部署主流云服务器web环境,mysql,MongoDB,MariaDB,Redis等数据库部署,高速管理服务器及数据库日常运维.
有一个数值数值 和一个字段数组 怎么存???数值长度94
我用循环一下子存进了94条。要怎么存?????
循环数组拼value ,拼成一条sql再执行
键拼一个字符串,值拼一个字符串
serialize(),jsondecode()
哎睡不着太无聊顺便写了个示例忘记预处理能不能绑定字段名了如果不能绑定就用拼sql的方法吧
登录百度帐号推荐应用
为兴趣而生,贴吧更懂你。或如何把sqlserver数据迁移到mysql数据库及需要注意事项
字体:[ ] 类型:转载 时间:
由于项目起初用的是sqlserver数据库,后来改用了mysql数据库,那么如何把sqlserver迁移mysql呢?对sqlserver数据库迁移感兴趣的朋友可以参考下本篇文章
在项目开发中,有时由于项目开始时候使用的数据库是SQL Server,后来把存储的数据库调整为MySQL,所以需要把SQL Server的数据迁移到MySQL。下面是小编日常整理的一种sqlserver数据库迁移的方法。
一、SQL Server中常用数据类型与MySQL不同的地方
二、将SQL Server数据迁移到MySQL需要注意的一些问题
1、唯一索引的不同,sql server的唯一索引的字段只能允许存在一个null值,而mysql,一直oracle中唯一索引对应的字段都允许存在多个null值。
2、存储过程的语法存在很大的不同,存储过程的迁移是最麻烦的,需要仔细修改。
3、程序中部分写的SQL语句由于语法的不同也要相应的修改。
三、将SQL Server数据迁移到MySQL的常见方法
1、使用 SQLyog 迁移
该迁移方法很简单,灵活,迁移时,可以进行字段的修改,比如在sql server中原来是datetime,然后迁移到mysql时你可以配置成timestamp;成功率很高;
迁移很慢!这是该方法最大的缺点,如果表的数据量达到几十万行,甚至几百万行,你会发现迁移起来真的很慢。明显比其他迁移方法慢很多。
2、使用 powerdesigner 和 sql server 的脚本导出功能 来迁移
(1)、该方法首先使用 powerdesigner,对sql server数据库,进行逆向工程,得到E-R图,然后生成MySQL的建表语句。完成数据库结构的迁移;当然表结构的迁移,不使用powerdesigner一样也是可以的。比如我将表结构导出成语句,然后手动进行修改,然后在MySQL中运行,也是一样的;
(2)、然后使用 sql server的工具 SSMS,将sql server数据库中的表的数据,导出成insert语句,每个表对应导出一个文件,然后对文件进行一些处理,然后导入到MySQL数据库中。
3、使用Oracle MySQL Server 官方的 workbeach 工具进行迁移
(1)、在workbench 连接sql server时,用户需要有 view any database 的权限。不然workbench无法访问sql server的表结构的元数据,从而无法进行迁移。
(2)、还有使用 Navicat 来进行迁移的方法,方法和 SQLyog 是类似的。
以上sqlserver数据库迁移方法,希望大家喜欢。
您可能感兴趣的文章:
大家感兴趣的内容
12345678910
最近更新的内容
常用在线小工具用于把来自多个数据源的著录项目数据存入数据库的方法和系统的制作方法
专利名称用于把来自多个数据源的著录项目数据存入数据库的方法和系统的制作方法
技术领域本发明涉及数据库管理系统,更具体地说,涉及用于把来自多个数据源的著录项目数据存入数据库的方法和系统。
背景技术根据使用环境,有多种方法可以把关联数据存入数据库。可以通过用户界面一次输入一段数据,或者可以以自动的方式从一些其他数据源收集数据。在许多系统中,从几个数据源存入数据库,以其各自方式解释每一个数据源,然后把数据关联并添加到已经存在于数据库中的其他数据中。例如,基于例如预定源-数据库转换,可以获得特定源格式的源数据文件并直接将其转换为适用于数据库的格式。也就是说,如果已知特定源格式或模式(即,源数据结构),那么就可以根据预定的数据库格式或模式(即,目标数据结构)进行适当的转换,以便解释所获得的用于直接存入数据库的源数据。
当从包含有相同格式数据文件的单个数据源存入数据库时,处理过程可能比较简单。然而,当从提供不同格式(即,不同源模式)数据的不同数据源存入数据库时会出现问题。针对该问题的一种解决方案是以每一数据源为基础,从数据源中选取未处理的数据,然后解释该数据,以便获得适合存入数据库的格式的数据。利用这种技术,需要单独的解释
器来把来自每一个数据源的文件存入数据库;也就是说,为了根据目标
模式直接转换并输入至数据库,需要设计一系列特定源解释器来解释根据特定源模式格式化的源数据。除了需要单独的解释器或者单独的解释协议以外,对于每一个数据源,这种方法还可能受到建立链接方面的限制,其中该链接是在来自不同数据源并因此通过不同解释器的文件之间存在的链接。当把来自多个数据源的复杂的相互关联的数据存入数据库时,会加剧这个问题。一般来说,已知的多源数据库存入方法受限于其执行对直接相关数据库存入的特定源的解释。也就是说,大多数解决方案涉及特定源格式的源数据的直接特定源转换(即,由特定源数据结构或模式指示),以便根据最终数据库的数据结构直接存入数据库。例如,在"嗅觉感受器数据库-
自基因蛋白质序列源的元数据驱动自动存入(Olfactory Receptor Database:a metadata-driven automated population from sources of gene and proteinsequences)" (354-360, Jc/& 7 e^arcA, 2002, Vol. 30, No. l)中,从
不同特定源格式的不同数据源下载数据。首先剖析下载的HTML文件,以提取出与数据库有关的信息。例如,如果HTML剖析程序识别出对于生物体小家鼠(Mw
m^cM/Ms)克隆嗅觉感受器序列,那么该程序会把字符串mascw/wj与数据库的知识库进行匹配。该程序可以确定mwjmiwcw/w符合生物体属性a30并且存储在数据库中作为对象ol44。用XML line &a30 object—name-'mus musculus,〉ol44〈/a30建立XML编码文档。这种XML编码文件包含有以与用于输入数据库的结构化数据库体系结构相适应的格式选取出的数据。利用这种复杂的方法,来自每一个不同数据源的文件必须以特定源的方式解释,以便基于与数据库的知识库内元素的关联或匹配来直接存储数据库。以下这种系统非常低效,例如通过査找与相同数据源文件内元素的匹配或关联的方式,试图直接解释从不同数据源访问的不同格式的数据。在以下参考文献中可以找到使用这种方法的其4也例子"Data Warehouse Population Platform",Proceeding of the 5th International Workshop on the Design andManagement of Data Warehouses, 2003;以及通过BMC Bioinformatics在线出版的Biozon: a System for Unification, Management and Analysis ofHeterogeneous Biological Data, 2006。在后一参考文献中,假定从不同特定源模式到目标数据库模式的直接数据库存入转换存在一般缺陷,执行例如数据库存入后的清除/过滤,以减少已存入数据中的重复和矛盾,其中该参考文件提供了一种用于直接数据库存入的特定源数据转换的复杂方法,该方法能够识别复杂的来自不同数据源的数据之间的相互关系。
可选择的解决方案提出首先定义不同数据源模式或数据结构之间的相互关系,然后通过评估或整合多源数据的方式改变这些相互关系。
美国专利申请公开No. 提供了这种例子,其 通过存入多源关系表的方式在数据源之间建立对象关系以进一步评估(即,报告)。在
"Source Integration in Data Warehousing", DWQ Foundations of DataWarehouse Quality, Proceedings of the 9th, International Workshop onDatabase and Expert Systems Applications (DEXA-98),第192-197页,IEEEComputer Society Press, 1998中,建立每一个数据源的概念性表述,以便能够理解和表述这些数据源之间的关系(即,协同声明(intermodelassertion)),然后用于数据整合。虽然这可能会导致来自不同数据源的数据的更多整合,但是也需要大量的消耗来识别不同数据源结构或模式,而且还要基于预定义的目标模式并使用这些相互源的表述来充分理解和表述不同数据源模式如何可以与存入数据库相关,因此每次改变或修改数据源模式时必须进行修订。作为"Using AutoMed Metadata in DataWarehousing Environments", Proceedings of the 6 ACM InternationalWorkshop on Data Warehousing and OLAP, 2003所出版的另一例子包括通过使用原始转换序列来逐步转换数据源模式的方式,将每一个特定源模式逐步整合成目标模式,从而提供数据转换过程的全部表述的访问,其中每一个原始转换都与由此定义的转换路径一起存储。总之,这些逐步转换是多源清除操作,该操作通过逐步存入组合的数据表述的方式改变预定义的相关源数据的相互关系。虽然这种逐步的过程提供了在反映可用转换信息量(即,记录路径)方面的一些优点(包括与交互源合并操作有关的细节),但是其复杂程度尤其不能适合于一些应用,在这些应用中,降低计算和存储要求的简单处理强过记录路径的益处。
对于处理文档的数据库,待存入数据库的相关数据(S卩,著录项目数据)可以包括文档本身和/或相关文档数据(例如,元数据)。这种元数据可以是简单的,例如文档识别数字,或者可以是复杂的并具有可以与其他数据或文档相互关联和/或链接的多个数据项。管理基于文档或相关文档的数据库或数据栈(data warehouse)中的多源数据的一般方法与上述方法相似,其中,虽然来自不同数据源的数据可以在模式的相同数据库结构内组合并且从其访问,但是由于直接转换这种数据并且将其输入到集中存储库(centralizedrepository),所以这种不同源数据之间的相互关系常常被忽略或省略。虽然上面对多源整合的某些水平论述了一些解决方案,但是常常以复杂程度与其他潜在缺陷大幅增加为代价,因此这些解决方案已经不易应用于基于文档的系统。作为选择的是,已经设计出不同的方法来进行不同数据源系统的综合研究和分析,而不是有效组合来自这
些数据源的数据。在欧洲专利申请公开No. 1 182 578、美国专利申请公开No. 、美国专利申请公开No. 和美国专利申请公开No. 中提供了这种方法的例子。虽然这些方法可以通过多源数据获得更综合的研究策略,但是这些方法不能解决把这种多源数据整合到组合数据库或数据栈中的问题。
因此,需要一种数据库存储方法和系统,其至少克服了以前方法和系统的一些缺点,或者至少为公众提供有用的选择。即,需要一种用于把来自多个数据源的著录项目数据存入数据库的新的有效方法。
上述背景信息用于揭示本申请人所认为的与本发明可能相关的信息。不必须意图承认,也不应被解释为上述信息构成本发明的现有技术。
本发明的目的是提供一种数据库存储方法、系统和计算机可读介质。
本发明的另一个目的是提供用于把来自多个数据源的著录项目数据存入数据库的方法、系统以及计算机可读介质。
根据本发明的一个方面,提供一种把与一个或多个基于文档的集合关联的著录项目数据存入相关数据库的方法,其中所述著录项目数据来自具有不同特定源格式的两个以上数据源,所述方法包括以下步骤访
问来自所述两个以上数据源的源数据;根据由中间数据结构规定的共同
中间无关源格式使来自所述两个以上数据源的每一个数据源的所述访问数据独立标准化,使得来自不同特定源格式的相似数据元素被共同识别
为所述中间格式;以及把所述标准化数据进一步解释成与包括来自所述两个以上数据源的每一个数据源的至少一部分数据库元素的已存储数据库元素相关,再根据所述关系把参考其自身替换的至少一部分重复元素存入所述数据库,以便与不同于所述中间数据结构的精制数据库数据结构一致。
根据本发明的另一个方面,提供一种把与一个或多个基于文档的集
9合关联的著录项目数据存入相关数据库的系统,其中所述著录项目数据 来自具有不同特定源格式的两个以上数据源,所述系统包括 一个或多
个数据存储器,用于限定中间数据结构和与其不同的精制数据库数据结 构,并且根据所述精制数据库数据结构存储来自所述两个以上数据源的 每一个数据源的数据库元素;独立标准化模块,用于根据由所述中间数 据结构规定的共同中间无关源格式使从所述两个以上数据源的每一个数 据源访问的数据独立标准化,使得来自不同特定源格式的相似数据元素 被共同识别为所述中间格式;以及解释器,用于把所述标准化数据进一 步解释成与来自所述两个以上数据源的每一个数据源的所述已存储数据 库元素相关,再根据所述关系把参考其自身替换的至少一部分重复元素 存入数据库,以便与所述精制数据库数据结构一致。
根据本发明的另一个方面,提供一种把与一个或多个基于文档的集 合关联的并且从不同特定源格式的两个以上数据源访问的著录项目数据 存入相关数据库的计算机可读介质,包括由执行以下步骤的计算机执行 的声明和指令根据由中间数据结构规定的共同中间无关源格式使来自 所述两个以上数据源的每一个数据源的所述访问数据独立标准化,使得 来自不同特定源格式的相似数据元素被共同识别为所述中间格式;以及 把所述标准化数据进一步解释成与包括来自所述两个以上数据源的每一 个数据源的至少一部分数据库元素的已存储数据库元素相关,再根据所 述关系把参考其自身替换的至少一部分重复元素存入所述数据库,以便 与不同于所述中间数据结构的精制数据库数据结构一致。
在参考附图阅读了仅以举例方式给出的下面具体实施例的非限制性 描述之后,将更清楚本发明的其他意图、目的、优点和特征。
下面将参考附图描述本发明,附图中
图1是用于把来自不同数据源的数据存入数据库的已知系统的示意
图2是根据本发明实施例的用于把来自具有不同特定源格式的不同数据源的数据存入数据库的系统的示意图3是根据本发明另一实施例的用于把来自具有不同特定源格式的 不同数据源的数据存入数据库的系统的示意图4是根据本发明实施例的可用于相关专利数据库环境的一部分共 同中间数据结构的例子;以及
图5是根据本发明实施例的相关专利数据库的一部分精制数据库结 构的例子。
具体实施例方式
除非另有定义,本文所使用的所有技术和科技术语的含义与本发明 所属领域的普通技术人员一般理解的含义相同。
图1提供了用于把来自不同数据源的数据存入数据库的已知系统 100的示意图。在该例子中有四个不同的数据源102,这些数据源通常提 供不同特定源格式的数据。使用特定源解释器114来解释来自每一个数 据源的访问数据104,以便参考数据库的现有数据存储数据库。已存储的 数据库元素(例如,现有数据)可以存储在数据存储器112中。以下这种系 统非常低效,例如通过在数据库(例如,现有数据)内或者在相同源文件内 査找元素的匹配或关联的方式,试图直接规范化或解释从不同数据源访 问的不同格式的数据。此外,这种系统会受限于链接,该链接可以形成 在来自不同数据源并通过不同解释器解释的数据之间。在一些直接从不 同特定源格式的文件进行解释并存储的系统中,当仅在来自相同数据源 的数据之间存在链接时,来自不同数据源的数据基本上存在于主数据库 内的单独表中。此外,如果数据库结构改变,那么所有解释程序都必须 改变以适应新的结构。
现在参考图2,根据本发明的一个实施例,示出用于把来自具有不 同特定源格式的不同数据源的著录项目数据存入数据库的系统200的示 意图,其中所述著录项目数据通常与一个或多个基于文档的集合相关联。 基于文档的集合的例子可以包括但不限于由不同出版者、编者、零售渠 道、图书馆等出版或以其他方式获得的文档和/或不同的专用文档管理系统(例如,科技/学术文档,比如出版物、期刊文章、书籍、教材等;法律 文档,比如判例法、专利和专利申请、引证、案例记录等;文学作品, 比如书籍、小说、杂志等)。应当意识到,可以从不同资源(g卩,不同的数 据服务供应者、出版者、数据存储库等)访问不同集合,同样可以从相同 的组合资源(例如,来自相同出版者的不同期刊、来自相同地区专利库或 国际专利库的不同国家的专利资源、由相同数据存取服务供应者管理的
不同集合等)访问不同集合。本领域技术人员应当清楚这些和其他考虑因 素,因此这些不意味着脱离本发明的总体范围和精神。此外,应当意识 到,著录项目数据可以包括但不限于与特定文档或文档组关联或将要关 联的不同数据,其中不仅表述其来源和格式,比如(多个)作者、(多个)出 版者、(多个)
公开日期、原始和/或翻译语言、出版字体、页数,而且还 表述与该文档相关的关联或识别信息,比如引证、向前和/或向后引用、 评论、处理记录(例如,相关专利文档的诉讼记录)、不同版本或修订本、 相关联出版物(例如,来自同族文档的不同文档)等。在一些实施例中,著 录项目数据同样适用于文档本身和/或文档的几部分,关于与该文档有关 或关联的信息。根据本发明实施例所考虑的环境和应用,本领域技术人 员应当清楚这些和其他考虑因素。
在图2的实施例中,具有四个不同的数据源202。从不同数据源202 访问的著录项目数据204通常为特定源格式(例如,特定源数据语言和/ 或编码、数据加密、数据结构/模式等)。标准化模块206根据共同中间无 关源格式(例如,由中间数据结构或模式规定)使来自每一个数据源的访问 数据204独立标准化。标准化格式可应用于来自不同数据源202的数据, 使得可以在该中间格式内普遍识别来自不同特定源格式的相似数据元 素。然后,通过共同解释器210把这种标准化数据208进一步解释成与 已存储数据库元素(例如,现有数据)有关系,已存储数据库元素可以包含 来自其他数据源的数据库元素、相同数据源的以前数据译本或版本等, 再根据这种关系存储数据库,即把通过这种进一步解释获得的任何新的 或修改的数据引入数据库。已存储数据库元素可以存储在数据存储器212 中。在根据中间数据格式进行解释的过程中,可以参考重复元素自身来 替换一部分或者全部重复元素。例如,重复元素可以构成指定源文件的 一部分和/或可以包括已存元素。20
本领域技术人员将会意识到,例如可以从不同或相同的数据存储库 访问以不同特定源格式提供的源数据。也就是说,来自相同数据存储库 (例如由相同机构或组织产生、出版和/或一般访问)的数据实际上可以以 不同的特定源格式提供,例如作为相同数据的不同译本(例如,原始译本 对更新译本、修订译本和/或更正译本)、不同版本(例如,使较老版本实 现新的数据格式),并且其他考虑因素可能导致不同格式化的源数据(例 如,不同的数据表述、领域、代码、语言等),因此即使对于从相同或相 似的物理资源访问的不同数据集,也可能需要不同的标准化协议来实现 共同的标准化中间格式。同样,本文公开的方法和系统可以用于调整这 种不同的特定源格式,无论不同数据源实际上是否有效被相同或不同机 构管理。本领域技术人员将会意识到,机构或组织管理、出版和/或一般 地提供对给定数据集的访问,无论是否根据一个或不同数据格式提供对 这种数据集的访问,都不会特别关系到本文,因此,为了下面的描述, 将考虑和限定不同数据源和特定源格式,而不管它们是否由相同或不同 的起源机构所提供。然而,出于描述的目的,在一些情况下,明确地希 望来自相同机构的不同数据格式将会共享有效数据格式的相似性,即一 旦从相同标准化模块进行处理,这种相似性不足以根据预定义的中间数 据结构提供相同的标准化输出,而不同标准化模块将被考虑用于使这些 相似但不同的特定源格式独立标准化。因此,在一些实施例中,把来自 两个或更多个数据源的数据存入数据库,其中两个或更多个数据源中的 一个或几个位于相同位置,或者可以例如通过相同的机构或服务供应者 获得,并且提供不同格式的数据。在这些实施例中,位于相同位置或者 可以通过相同机构等获得的每一个不同数据源可以被识别为提供特定源 格式数据的不同数据源。相反,不同机构可以提供对相同格式的不同数 据集的访问,使得相同的特定源格式被两个不同机构使用并且从它们访 问。因此,相同的标准化模块可以用于这种不同的数据集,从而以用于 这种不同数据集的相同中间格式提供标准化结果。在这种实施例中,为 了下面的描述,从不同机构或数据服务供应者访问的数据被识别为相同 数据源,这是因为所提出的数据库存入方法和系统的执行对数据供应者 而言通常是不可见的,而且受到提供源数据的不同格式的影响。
通常,共同中间格式用于来自不同数据源的数据,并且是与数据库结构不一致的格式。例如,标准化模块不完全解释数据,而是仅把数据 转换为由共同解释器进一步解释的共同中间格式。也就是说,根据数据 库数据结构的规定,通过解释器把标准化数据解释成与已存储数据库元 素相关,再根据这种关系存入数据库。由于中间数据结构和数据库数据 结构两者都是固定的,所以解释步骤通常是对来自不同数据源和来自不 同特定源格式的数据的解释步骤。因为根据共同中间格式首先使来自一 个以上数据源的不同格式的数据标准化,所以与如图1所示的通过把数 据源格式直接解释为数据库格式的已知系统相比,可以更容易、有效地 与来自不同数据源的元素建立关系或链接。也就是说,图2的系统把特 定源数据首先转换为由中间数据结构或模式规定的无关源中间格式,其 中中间数据结构或模式对于从每一个特定源格式的每一个数据源访问的 数据而言是共同的。然后,解释器继续解释这种与精制数据库数据结构 一致的数据,从而可以以无关源方式执行进一步解释,因此可以导致更 高的处理效率、更好的处理简易性和/或数据整合的更高水平,而不需要 上述某些较复杂的数据整合方案。也就是说,既不需要定义相异特定源 模式之间的关系,也不需要同步解释不同数据集以供有效的数据交叉引 用。例如,可以独立地处理不同源的数据,也可以成批地处理(即, 一次 处理涉及几十、几百或几千个文档的著录项目数据)或者单独地处理(即, 独立处理所关心的单个文档及其相关数据)。
此外,通过从数据库的目标数据结构中分离每一个特定源数据结构, 可以通过仅修订特定源标准化模块来调整在源数据结构中进行的变化 (例如,涉及由相同资源提供的新的、修订的和/或更新的信息),这是因 为中间数据结构没有变化,所以共同解释器也保持不变。相反,如果修 订了数据库数据结构,那么仅需要修订共同解释器,并且每一个特定源 标准化模块保持不会因这种修订而改变。
此外,应该意识到,在一些实施例中,通过从特定源格式中仅选取 所关心的信息来标准化成与中间数据结构(例如,与给定数据库应用有关 的著录项目数据的子集)一致,可以与已存储数据库元素相关地仅有效解 释转换成共同无关源格式的这种所关心信息,从而形成有效的、全面的 多源数据库存储方法。相反,访问与数据库结构的不同部分有关的不同源数据,在数据库结构的该特定部分内可以更容易地转化为用于直接解 释的中间格式,同时允许与来自数据库结构的其他部分的数据建立适当 关系(例如,可以整合文档的分类代码与描述符,以准备与引用这种分类 代码的文档相关联)。
本领域技术人员将会意识到,本发明的方法和系统可以允许通过使 精制数据库结构内的整合数据规范化的方式精简中间数据结构。例如, 中间数据结构可以用于仅提供给定其中间状态的最小规范化(例如,规范 化成一次正常形式),然后在对与已存储数据库元素相关的这种中间数据 解释之后可以进行再次规范化,从而在适宜时可以规范化成三次或者更 高的正常形式。此外,这种方法可以避免在一次迭代时源数据的完全直 接规范化,其中这种数据此后需要相对于在先存储的数据库元素完全再 次规范化。因此,数据库数据结构的规范化可以高于中间数据结构的规 范化。此外,在一些实施例中,例如,在精简与数据库数据结构一致的 中间数据以后,减少或避免了对数据库存入数据后处理的需要,例如数 据过滤、清除等(例如,去除副本、错误输入等)。本领域技术人员将会意 识到,其他考虑因素可以应用于精简与目标数据库数据结构一致的中间 数据,从而获得与现有技术情况类似的优点。
在一些实施例中,与已存储数据库元素相关并且与标准化数据内的 其他元素相关地解释标准化数据。例如,不仅可以参考重复数据库元素 替换与已存储数据库元素重复的元素,而且如果访问数据本身和因而的 标准化数据都包含重复元素,那么也可以参考所述元素替换访问数据本 身和标准化数据。本领域技术人员将清楚,在存储过程中可以用更多最 新数据或者全部数据来更新或替换己存储数据库元素。
此外,根据一个实施例,例如,基于与不同文档相关联的其他数据 元素之间的相似程度,解释步骤可以用于把与不同文档相关联的相似数 据元素解释为相同,以便参考其替换这种相同元素的出现。例如,虽然 两个文档可以列出具有相同姓名的作者,例如,在中间数据格式内共同 识别其著录项目数据元素,但是如果发现这些作者输入的问候数据也充 分相似,那么这些作者将仅被视为为同一作者。例如,在一个实施例中, 虽然明显识别的居住城市可以足以维持两个共同姓名作者之间的区别,
15但是可以认为共用相同姓名、国籍和居住城市的两个作者是同一作者。 本领域技术人员将清楚,当把本文所述的方法和系统用于特定应用时, 在不脱离本发明的总体范围和精神的情况下,在此可以考虑这些和其他 解释规则。
本领域技术人员将会意识到,可以并行、顺序或者按照其他顺序处 理来自不同数据源的访问数据。例如,可以同时从所有可用数据源规则 地更新数据库,和/或根据循环进度表定时地更新数据库,例如根据由每 一个数据源独立提供的源数据的更新有效性确定的循环进度表。来自数 据源的访问数据可以是一个文件或者是多个/批文件。访问数据可以在解 释之前或者解释过程中被剖析为相关的或者所需的元素。在一些实施例 中,利用以下系统自动地进行数据库存入,其中该系统从一个或多个数 据源下载文件,并且自动地将文件转换为用于解释并存存数据库的中间 标准。在一些实施例中,根据预定的进度表从数据源下载文件。进度表 可以基于相应数据源的更新时机。也可以手动地或者半自动地启动存储。
在一个实施例中,访问数据可以为XML。在一些其他实施例中,访 问数据可以转换为用于标准化模块的XML或者通过标准化模块转换为 XML。在其他实施例中,访问数据可以为CSV,或者可以转换为用于标 准化模块的CSV或者通过标准化模块转换为CSV。本领域技术人员将会 意识到,访问数据可以为不同的语言或结构,象得到的标准化数据一样。
在一个实施例中,通过以下方式使至少一部分访问数据标准化首 先读取特定源格式的访问数据,然后将其适用的每一个读取数据元素与 可用于共同中间标准化格式的相应标准化元素(例如,数据的类别、类、 索引、项、记录等)关联。也就是说,在这种标准化中,有关的标准化模 块等用于读取和理解特定源格式的数据元素,以便与共同的标准化格式
的相应元素关联。
在相同的或者可选的实施例中,通过以下方式使至少一部分访问数 据标准化从共同的标准化格式中读取可用元素(例如,数据的类别、类、 索引、项、记录等),然后从访问数据中检索特定源格式的相应数据元素。 因此,这种方法涉及读取和理解共同标准化格式,以及从特定源格式中 检索相应的可用数据。在以下这种实施例中,可以根据可扩展样式表语言转换(XSLT)实现 关联的标准化模块,其中该实施例为至少对于数据源之一,根据可扩 展标记语言(XML)格式提供并格式化访问数据。也就是说,可以通过 XSLT使特定源XML格式标准化以提供共同标准化中间格式(可以为 XML),或者使用更适合于下游解释的可选语言(例如,超文本标记语言 -HTML等)使特定源XML格式格式化。本领域技术人员将容易知道这些 和其他转换协议,因此应当被认为它们是示例方式而不是限制方式。在一个实施例中, 一个或多个标准化模块被编码和/或包括用于从给 定的特定源格式组合数据以便与共同标准化格式一致的声明和指令。例 如,在访问数据提供专利相关数据的实施例中,可以提供特定源格式的 不同数据元素来识别文档国家和文档序列号,因此共同标准化格式更需 要这种元素的组合以按照特定国家的方式提供文档序列号。例如,可以 以特定源格式提供美国专利申请序列号(US Patent Application Serial Number) 10/111,111,作为两种不同的输入&country&US&/country&和 &ser-number& 10/111,111 &/ser-number&,因此标准化格式可以提供以下格 式&serial-num&US 10/111,111 l&/serial-num&,从而组合两个数据输入。 在一些实施例中,接着同一例子,可以重复利用相同的特定源数据元素 以便与标准化格式一致,例如当考虑到用于标准化格式的下游解释时, 特定源格式的国家代码可以用于组合了申请序列号输入的标准化格式、 单独的国家代码输入(可以为相同格式,例如US,或者为可选格式,例 如United States)和/或其他适当输入。因此,数据标准化可以包括一对一 关联、 一对多关联和/或组合;多对一关联和/或组合;和/或多对多关联 和/或组合。应当意识到,虽然以XML类型的格式提供上述实施例,但 是本领域技术人员容易理解,本文描述的本发明实施例不限于这种语言。图3是根据本发明另一实施例的用于把来自不同数据源302的数据 存入数据库的系统300的示意图。在本实施例中,访问数据304被判定 剖析器316处理,其决定使用哪一个标准化模块306来标准化数据格式。 然后,通过解释器310把标准化数据308解释成与已存储数据库元素(例 如,现有数据)相关,再根据这种关系存入数据库。已存储数据库元素可 以存储在数据存储器312中。数据库可以包括数据存储器,在一些实施例中还包括解释器。在一 些实施例中, 一个或多个标准化模块也可以构成数据库的一部分。在包 括判定剖析器的实施例中,其可以构成或不构成数据库的一部分。本领域技术人员将会清楚,系统可以是整套的,或者不同组成部分 或功能可以是远程的。例如,多个标准化模块可以位于一个位置,而解 释器和数据存储器可以位于另一个位置。多个标准化模块也可以位于分 开的位置或者位于一个位置,解释器和数据存储器也是如此。数据存储 器和/或解释器也可以具有远程功能。本领域技术人员将会意识到,这里 可以考虑各种本地的、分布式的、网络化的和/或其他这种系统结构,例 如,在不脱离本发明的总体范围和精神的情况下,通过各种通讯媒介(例如,互联网、以太网、LAN等)并使用各种通讯算法和/或协议来相互连接。在一个实施例中,可以通过一个或多个用于提供用户界面的计算机 从内部和/或外部进一步访问系统,例如通过适当的监视器和用户数据访 问平台(例如,对已存储数据提供结构化和有组织访问的应用程序界面 等,比如本地或网络化桌面应用程序、基于网络的应用程序等),从而能 够对解释数据进行查看、搜索、恢复、分类、分级、选取和/或其他的用 户操作和消费以及它们之间的相互关系。可以通过例如桌上型计算机、 膝上型计算机和/或掌上计算机提供这种访问,该访问可以是系统本地的 (例如,包括一部分或者全部与标准化模块和解释器有关的处理器和数据 存储介质)、区域性的(例如,包括与一部分系统模块或部件的一些本地的 或区域性的网络互联)或远程的(例如,包括经由一个或多个公共的、专用 的、私人的和/或安全的网络连接的远程网络容量)。本领域技术人员将会意识到,通过不同的计算平台、装置等可以实现本发明不同实施例的各种部件和/或模块。例如,可以通过能够操作和 交换不同格式数据的相同或不同计算平台来实现不同的模块,并且通过一个或多个数据存储器、处理器等支持不同的模块。此外,可以通过一 个或多个用户界面(例如,诸如监视器、键盘、打印机等本地和/或远程外 围设备)提供对这种模块的管理访问,从而不仅能够通过处理来操作和/ 或修改数据和模块本身,而且还可以获得对最终产品(例如,存储的并相互联系的解释过的数据元素)的访问。在一个实施例中,数据库通常是可以规范化成各种形式的相关数据 库。例如,本领域技术人员将会意识到,数据库可以被规范化成一次、 两次、三次或以上的规范形式,以便有效组织数据库中的数据,并且通 过以参考其自身替换一些或全部重复元素的方式来消除或减少冗余数 据。在一个实施例中。数据可以包括元数据。在一些实施例中,至少部 分地基于元数据的各个元素之间的相互关系存入数据库。在一个实施例中,数据库是文档数据库并包括涉及文档的元数据以 及文档本身。在一个实施例中,文档是出版物,并且元数据可以包括出版日期、(多个)作者、语言、出版字体等。在一个实施例中,数据库是专利数据库。在本实施例中,元数据可 以包括申请状态(公开、放弃、公布的专利等)、各种日期(例如,申请曰
公开日)、优先权数据、引用的现有技术等。每一个专利或专利申请的数 据之间的各种关系可以用于存入数据库。链接可以建立在例如元数据与 其他专利之间。在一个实施例中,数据库是规范化成三次规范形式的完全相关数据 库,同时参考所述数据替换重复数据。例如,在专利数据库的应用中, 如果单个数据集中的五个专利被划分为相同的分类代码,比如H01L-015/32,那么来自数据源的访问数据以及标准化数据会包括该数据 元素的五种情况。在解释和存储之后,单个H01L-015/32元素将从涉及 该类别的专利存储在包括有与其链接的数据库中。使用具有专利和类别 二者的一对多关系的链接表可以实现这种多对多关系。例如,还可以从 WIPO下载数据以列举IPC类别代码的分类以及名称等,使得数据库还 可以包含有关代码的信息(比如,它的专利代码、任何子代码和代码的名 称/描述)。按照这种方式,与获得自单个数据源的情况相比,五个专利可 以与更多数据链接。在根据一个实施例的有关专利数据库的另一个例子中,把标准化数 据解释成与包含有专利的已存储数据库元素相关,以便根据这种关系存19入数据库。例如,如果访问数据包含引用另一专利的专利,其中所述另 一专利已经在数据库中作为已存储数据库元素(g卩,因为其包含在先前访 问的数据中),那么可以根据这种关系存入数据库。例如,除了专利号以 外,访问数据包含很少或者不包含有关引用专利的信息。然而,由于根 据这种关系存入的数据库,来自访问数据的专利的记录与它的已存储数 据库元素的引用专利的记录链接。因为它们在数据库中链接,所以对引 用专利的向前引用分析很简单,而如果没有这种链接,那么针对所有引 用专利的文献必须对数据库进行检索。在该例子中,向前引用分析与向 后引用分析一样简单。因为首先把访问数据标准化成共同中间标准化格 式,然后解释成与已存储数据库元素相关,再根据所述关系把参考其自 身替换的至少一部分重复元素存入数据库,所以数据库可以包括有效链接。例如,如果一个数据源提供了引用EP专利的U.S.专利,其中EP专 利已经在数据库中并且来自另一数据源,那么该数据库存储方法(涉及把 来自标准化格式的这种数据解释成与已存储数据库元素相关)允许这两 个文档在数据库内有效链接。按照这种方式,因为这两个文档已经在数 据库内链接,所以数据库用户不必为U.S.专利所引用的EP专利而检索数 据库。图4给出了根据一个实施例的可用于相关专利数据库环境的一部分 标准化中间数据结构的例子。该标准化数据结构包括专利与类别之间的 简单的一对多关系。 一个专利可能具有多个类别,但是每一个类别只属 于一个专利。如果存在与给定类别代码有关的多个专利,那么在分类表 中将存在多个重复输入并且每一个输入指向不同的专利。图5给出了根据一个实施例的相关专利数据库的一部分解释的精制 数据结构的例子。通过链接表PatentClasses,这种规范化数据结构显示 出专利与类别之间的多对多关系。分类表具有附加信息,比如母-子关系 和类别名称。PatentCitations是另一链接表,用于创建Patents与Patents 之间的多对多关系,例如,包括专利与其引用专利之间的链接。下面提供了用于根据一个实施例的存入相关专利数据库方法的有关 数据格式的例子。下面是来自European Patent Office's Open Patent Services (欧洲专利局的公开专利服务)网络服务的响应,作为对EP1000000数据的请求的响应。访问数据为特定源格式。 &WORLDPATENTDATA&&BIBLIO Seed="EP1000000" Seed—Format="E" Seed—Type="PN"& &SDOBI& — —&B111EP DATE=""&EP1000000&/B111EP&&B 131 EP&A1&/B 131 EP&&B211EPDATE=""&EP&/B2nEP&&B211EPTYPE="originarDATE=""&&/B2UEP&&B311EP DATE="1998m2"&NL&/B311EP&&B311EP TYPE="originar DATE=""&1010536&/B311EP&&B510 TYPE="EPC"&H02P6/08; B28B1/29; B28B5/02B2; B28B7/00F&/B510&&B510 TYPE="IPC"&B28B5/02; B28B1/29; B28B7/00&/B510&&B510TYPE="CI"&B28Bl/00; B28B5/00; B28B7/00; H02P6/08&/B510&&B510 TYPE="AI"&B28Bl/29; B28B5/02; B28B7/00; H02P6/08&/B510&&B542 TYPE="TI"&Apparatus for manufacturing green bricks for the brick manufacturing industry&/B542&&B542 TYPE="OT"&Vorrichtung zur Herstellung von Stdnformlingen fiir die Ziegelindustrie&/B542& &B542 TYPE="OT"&Dispositif pour la fabrication de briques crues utilis6es dans l'industrie manufacturi6re des bHques&/B542&&B560 TYPE="PAT"&EP0680812 Al |A;NL9400663 AA;DE3546191 Al [A]&/B560& &B570EP&The invention relates to an apparatus (1) for manufacturing green bricks from clay for the brick manufacturing industry, comprising a circulating conveyor (3) carrying mould containers combined to mould container parts (4), a reservoir (5) for clay arranged above the mould containers, means for carrying clay out of the reservoir (5) into the mould containers, means (9) for pressing and trimming clay in the mould containers, means (11) for supplying and placing take-off plates for the green bricks (13) and means for discharging green bricks released from the mould containers, characterized in that the apparatus further comprises means (22) for moving the mould container parts (4) filled with green bricks such that a protruding edge is formed on at least one side of the green bricks. &IMAGEx/B570EP& &B71 lEP&BOER BE肌ER NIJMEGEN BV DE (NL)&/B711EP&&B711EP TYPE="original"&BEHEERMAATSCHAPPIJ DE BOER NIJMEGEN B.V&/B711EP&&B721EP&KOSMAN WILHELMUS JACOBUS MARIA (NL)&7B721EP&&B721EP TYPE="originar'&KOSMAN, WILHELMUS'JACOBUS MARIA&B721EP&&/SDOBI& &/BIBLK&&BIBLIO Seed="EF1000000" Seed—Format="E" Seed—Type='TN"& &SDOBI& — 一&B111EP DATE=""&EP1000000&/B111EP&&B131EP&B1&/B131EP&&B211EP DATE=""&EP&/B211EP&&B211EPTYPE="origiDar'DATE=""&1EP&&B311EP DATE=""&NL&/B311EP&&B311EP TYPE-"originar DATE=""&1010536&/B311EP&&B510 TYPE="EPC"&H02P6/08; B28B1/29; B28B5/02B2; B28B7/00F&/B510&&B510 TYPE="IPC"&B28B5/02; B28B1/29; B28B7/00&/B510&&B510 TYPE="CI"&B28Bl/00; B28B5/00; B28B7/00; H02P6/08&/B510&&B510 TYPE="AI"&B28Bl/29; B28BS/02; B28B7/00; H02P6/08&:/B510&&B542 TYPE="Tr&Apparatus for manufacturing green bricks for 也e brick manufacturing industry&/B542&&B542 TYPE="OT"&Vorrichtung zur Herstellung von SteinformliDgen fiir die Ziegelindustrie&/B542& &B542 TYPE="OT"&Dispositif pour la fabrication de briques crues utilises dans l'industrie manufacturi6re des briques&/B542&&B711EP&BEHEERMIJ DE BOER NIJMEGEN B V (NL)&/B711EP&&B711EPTYPE="originar&BEHEERMAATSCHAPPIJ DE BOER NIJMEGEN B.V&/B711EP& &B721EP&KOSMAN WILHELMUS JACOBUS MARIA (NL)&/B721EP&&B721EPTYPE='Wiginar&KOSMAN, WILHELMUS JACOBUS MARIA&/B721EP&
&/WORLDPATENTDATA&
下面是通过根据本实施例的共同中间标准化格式使上述访问数据标 准化获得的标准化中间数据。这种格式可用于来自其他数据源的数据,
例如在本实施例中,这种格式可用于美国专利商标局FTP服务器。
& xml version-" 1.0" encoding="utf-8"
& &AUPatents verskm-"SI 1.0"& -&Patents&
&InventionTitle&Apparatus for manufacturing green bricks for the brick manufacturing industry &/Lrven1ionTitle& &ExempClaim&0&/ExempClaim& &NumClaims&0&/NumClaims& &SirFlag&(K/SirFlag:& &ContProsApp&(K/ContProsApp& &Rule47&0&/Rule47&
&TerminalDisclaimer&0&/TerminalDisclaimer&
&NumFigures&0&/NumFigures&
&NumDrawSheets&0&/NumDrawSheets&
&Country&EP&/Country&
&AppNumber&&/AppNumber&
&AppPrefix A&
&AppDate&&/AppDate&
&AppType&UNKNOWN&/AppType&
-&Parties&
&DisplayName&BEHEERMAATSCHAPPIJ DE BOER NIJMEGEN B.V&/DisplayName&
&Countiy&NL&/Country&
&PartyType&ASSIGNEE&/PartyType&
&AssigneeType&UNKNOWN&/AssigneeType&
&ExaminerType&NON_EXAMINER&/ExaminerType& &/Parties& -&Parties&
&DisplayName&KOSMAN, WILHELMUS JACOBUS MARIA&/DisplayName&
&Countiy&NL&/Country&
&PartyType&APPLICANT&PartyType&
&AssigneeType&NON—ASSIGNEE&/AssigneeType&
&ExaminerType&NON_EXAMINER&/ExaminerType& &/Parties& -&Classes&
&ClassSystem&IPC&/ClassSystem&
&ClassCode&B28B"001/29&/ClassCode&
&Version&8&/Version&
&Edition&&/Edition&
〈Class"Name /&
&ParentClassID&(K/ParentClassID& &IsPrimary&l&/IsPrimary& &/Glasses&-&Classes&
&ClassSystem&IPC&/ClassSystem& &ClassCode&B28B-005/02&/ClassCode&
&Version&8&/Version& &Edition&&/Edition&
&ClassName 〉 &ParentClassID&0&/ParentClassn& &IsPrimary&0&/IsPrimary& &/Classes& -&Glasses&
&ClassSystem&IPC&/ClassSystem& &ClassCode&B28B-007&/ClassCode& &Version&8&/Version& &Edition&&/Edition& &GlassName /& &ParentClassID&0&/ParentClassID& &IsPrimary&0&/IsPrimary& &/Classes& -&Classss&
&ClassSystem&IPC&/ClassSystem& &ClassCode&H02P-006/08&7ClassCode& &Version&8&/Version〉 &Edition&&/Edition& 〈ClassName /i&
&ParentClassID&0&/ParentClassID&
&IsPrimary&0&/IsPrimary& &/Classes& -&Classes&
&ClassSystem&EPC&/ClassSystem&
&ClassCode&H02P-006/08&ClassCode&
&Version&0&/Version&
&Edition&0&/Edition&
〈ClassN咖e /&
&ParentClass[D&0&/ParentClassID&
&IsPrimary&l&/IsPrimary& &/Classes& -&Class6S&
&ClassSystem&EPC&/ClassSystem&
&ClassCode&B28B-001/29&/ClassCode&
&Version&0&/Version&
&Edition&0&Edition&
&ClassName &
&ParentClassID&(K/ParentClassID&
&IsPrimary&0&/IsPrimary& &/Classes& -〈ClassC
&ClassSystem&EPC&/ClassSysteni&
&CIassCode&B28B"005/02.B2&/CIassCode&
&Version&0&/Version&
&Edition&0&/Edition&
&ClassName /&
&ParentClassID&0&/ParentClassID&
&IsPrimaiy&0&/IsPrimary& &/Classcs& -&Classes&
&ClassSystem&EPC&/ClassSystem&
&ClassCode&B28B-007/00.F&/ClassCode&&Version&0&/Version& &Edition&0&/Edition& 〈ClassName /&
&ParentClassID&0&/ParentClassID&
&IsPriinary:&Q&/IsPrimary& &/Classes& -&RelatedApplications&
〈Parent(3ountrj^NI/^/ParentCountrj^"
&ParentAppNumber&1010536&/ParentAppNumber&
&ParentAppDate&&/ParentAppDate&
&ChildCountry&EP&/CMdCountry&
&ChildAppNumber&&/ChildAppNumber&
&ChildAppDate&々ChildAppDate&
&RelationType&FOREIGN_PRIORITY&/RelationType& &/RelatedApplications&
&EariiestFilingDate&&/EarliestFilingDate&
&ExpiryDate&&/ExpiryDate&
&GrantNumber&1000000&/GrantNumber&
&GrantKind&Bl&A3rantKind&
&GrantDate&&/GrantDate&
&PubNumber&1000000&/PubNumber&
&PubDate&&/PubDate&
&PubKind&Al&/PubKind&
&Abstract&The invention relates to an apparatus (1) for manufacturing green bricks from clay for the brick manufacturing industry, comprising a circulating conveyor (3) carrying mould containers combined to mould container parts (4), a reservoir (5) for clay arranged above the mould containers, means for carrying clay out of the reservoir (5) into the mould containers, means (9) for pressing and trimming clay in mould containers, means (11) for supplying and placing take-off plates for the green bricks (13) and means for discharging green bricks released from the mould containers, characterized in that the apparatus further comprises means (22) for moving the mould container parts (4) filled with green brici(s such that a protruding edge is formed on at least one side of the green bricks. &IMAGE&&/Abstract&
&/Patents& &/AllPatents&
把上述标准化中间数据解释成与已存储数据库元素相关,其中已存 储数据库元素包括来自至少另一数据源的数据库元素,再根据上述关系 把参考重复元素替换的至少一部分所述重复元素存入数据库。根据精制 数据库数据结构使存入数据库的数据规范化。虽然通常仅存在于数据库
中,但是下面的是数据库中的输出返回至XML文件的相应数据的近似 值。
& xml versk n="1.0" standa!one="yes"
&PatentDB xmlns="http:〃tempuri.org/PateiitDB.:xsd"&
-&Patents&
&PatID&-l&yPatID&
&InventionTitle&Apparatus
manufacturing
brick manufacturing
industry&/InventionTitle&
&ExempClaim&0&/ExempClaim&
&NumClaims&0&/NumClaims&
&SirFlag&false&/SirHag&
&ContProsApp&false&/ContProsApp&
&Rule47&false&/Rule47&
24& &NumDrawSheets&0&/NumDrawSheets&
&Abstract&The invention relates to an apparatus①for manufacturing green br|cks from clay for the brick manufacturing industry, comprising a circulating conveyor (3) carrying mould containers combined to mould container parts (4), a reservoir (5) for clay arranged above the mould containers, means for carrying clay out of the reservoir (5) into the mould containers, means (9) for pressing and trimming clay in the mould containers, means (11) for supplying and placing take-off plates for the green bricks (13) and means for discharging green bricks released from the mould containers, characterized in that the apparatus further comprises means (22) for moving the mould container parts (4) filled with green bricks such that a protruding edge is formed on at least one side of the green bricks. &IMAGE&&/Abstract&
&Country&EP&/Country&
&GrantNumber&1000000&/GrantNumber&
&GrantKind&Bl々GrantKind&
&GrantDate&&/GrantDate&
&AppNumber&&/AppNumber&
〈AppPrefix &
&AppDate&々AppDate&
&AppType&UNKNOWN&/Appiype&
&PubNumber&1000000&/PubNumber&
&PubKind&Al&/PubKind&
&PubDate&&/PubDate&
&TerminalDisclaimer&false&/TerminalDisclaimer& &/Patents& -&Patents&
&PatID&-2&/PatID&
&Country&NL&/Country&
&AppNumber&1010536&/AppNumber&
〈AppPrefix /&
&AppDate&&/AppDate&
&TerminalDisclaimer&false&yTerminalDisclaimer& &/Patents& -&Parties&
&PartyID&-l&/PartyID&
&DisplayName&BEHEERMAATSCHAPPIJ DE BOER NIJMEGEN B.V&/DisplayName&
〈Countiy〉NL々Country〉
&PartyType&ASSIGNEE&/PartyType&
&AssigneeType&UNKNOWN&/Assignee"Type& &/Parties& -&Partiss&
&PartyID&-2&/PartyID&
&DisplayName&KOSMAN, WILHELMUS JACOBUS MARIA&DisplayName&
&Country&NL&/Country&
&PartyTyp6&APPLICANT&/PartyType&
&AssigneeType&NON_ASSIGNEE&/AssigneeType&
&/Parties& -&PatentPartks&
&PatID&-l&/PatID&
&PartyID&-l&yPai1yID&
&ExaminerType&NON_EXAMINER&/ExaminerType& &/PatentParties& -&PatentParties&
25&PatID&-l&/PatID&&PartyID&-2&/PartyID&
&ExaminerType&NON—EXAMEVER&/ExaminerType&&/PatentParties&-&Glass6s&
&ClassID&-l&/ClassID&
&ClassCode&B28B-001/29&/ClassCode&
&Edition&&/Edition&
&Version&8&/Version&
&ClassSystem&IPC&/ClassSystem&&/Glassss&-&Classes&
&ClassID&-2&/aassID&
&ClassCode&B28B^005/02&/ClassCode&
&Edition&&Edition&
&Version&8&/Version&
&ClassSystem&IPC&/ClassSystem&&/Classes&-&Glasscs&
&ClassID&-3&/ClassID&
&ClassCode&B28B^007&/ClassCode&
&Edition&&/Edition&
&Version&8&/Version&
&ClassSystem&IPC&/ClassSystem&&/Classes&-&Glasses&
&ClassID&-4&/ClassID&
&ClassCode&H02P-006/08&/ClassCode&
&Edition&&/Edition&
&Version&8&/Version&
&ClassSystem&IPC&/ClassSystem&&/Classes&-&Class6s&
&ClassID&-5&/ClassID&
&ClassCode&H02P-006/08&/ClassCode&
&Edition&0&/Edition&
&Version&0&/Version&
&ClassSystem&EPC&/ClassSystem&&/Classes&-&Glassss&
&ClassID&-6&/ClasslD&
&ClassCode&B28B~001/29&/ClassCode&
&Edition&0&/Edition&
&Version&0&/Version&
&ClassSystem&EPC&/ClassSystem&&/Classes&-&Classss&
&ClassID&-7&/ClassID&
&ClassCode&B28B-005/02.B2&/ClassCode&
&Edition&0&/Edition&
&Version&0&/Version&
&ClassSystem&EPC&/ClassSystem&&/Glass6s&-&Classes&
&ClassID&-8&/ClassID&&ClassCode&B28B-007/00.F&/ClassCode&
&Edition&0&/Edition&
&Version&0&/Version&
&ClassSystem&EPC&/ClassSystem&&/Classes&-&PatentClasses&
&PatID&-l&/PatID&
&ClassID&-l&/ClassID&&/PatentClasses&-&PatentClassss&
&PatID&-l&/PatID&
&ClassID&-2&/ClassID&&/PatentClasses&-&PatentClasses&
&PatID&-l&/PatID&
&ClassID&-3&/ClassID&&/PatentClasses&-&PatentClasses&
&PatID&-l&/PatID&
&ClassID&-4&/ClassID&&/PatentClasses&-&PatentClasses&
&PatID&-l&/PatID&
&ClassID&-5&/ClassID&&/PatentClasses&-&PatentClasses&
&PatID&-l&/PatID&
&ClassID&-6&/ClassID&&/PatentClasses&-&PatentClasses&
&PatID&-l&/PatID&
&ClassID&-7&/ClassID&&/PatentClasses&-&PatentClasses&
&PatID&-l&^PatID&
&ClassID&-8々ClassID&&/PatentClasses&-&PatentRelations&
&ParentPatID&-2&^ParentPatID&
&ChildPatID&-l&/ChildPatID&
&RelationType&FOREIGN—PRIORTTY&/RelationType&&/PatentRelations&&/PatentDB&
如上文所述,本发明的不同实施例可以应用于不同类型的著录项目数据,例如应用于与来自不同类型的基于文档的集合的文档关联的并相互联系的相关文档数据。例如,虽然上文应用于专利数据库集合,但是下面的例子涉及一般出版物,包括书籍和/或论文以及与其相关的著录项目数据。在下一个例子中,没有提供特定源数据格式,特别是在上面例子后,本领域技术人员将会意识到可以提供源数据的不同特定源数据格式。相反,下面的例子首先提供从不同数据源访问的并且根据共同中间无关源格式独立标准化的并列标准化中间数据。
& xml version="1.0" encoding="utf-8"
&-&LiteraryWorks&
-&Work type-"book" id="DA25674"&
&Title&Hitchhiker's Guide to the Galaxy&/Title&-&Author&-&Nams&
&LastName&Adams&/LastName&&FirstName&DougIas&/FirstName&〈MiddleN咖e /&&Suffix /&&Prefix /&
&Salutory&Mr.&/Salutoiy&&/Name&&/Author&
&PublicationDate&&/PublicationDate&&Country&UK&/Country&&Publisher&Pan Books&/Publisher&-&Binding type=="hardcover"&
&NumberOfPages&224&/N umberOfPages&&/Binding&
〈IdentityNumber type="ISBN-10"&&/IdentityNumber&&IdentityNumbertype="ISBN-13"&978-&/IdentityNumber&&OriginalEdition id="DA091921" /&&/Work&
-&Work type="book" id="DA17531"&
&Title&Hitehhiker's Guide to the Galaxy&/Title&-&Author&-&Nams&
&LastName&Adams&/LastName&&FirstName&Douglas&/FirstName&&MiddleName /&&Suffix /&&Prefix /&
&Salutory&Mr.&/Salutory&&/Name&■ &/Author&
&PublicationDate&&/PublicationDate&&Country&UK&/Country&&Publisher&Pan Books&/Publisher&-&Binding type="paperback"&
&NumberOfPages&180&/NumberOfPages&&/Binding&
&IdentityNumbertype="ISBN-10"&0-330-25864-8&/IdentityNumber&(Container type-"series" id="lD838195R" ordei="l" /&&/Work&
-&Work type-"book" id="DA18173"&
&Title&The Restaurant at the End of the Universe&/Title&&Author&-&Name&
&LastName&Adams&7LastNanie&
&FirstName&Douglas&/FirstName&
&MiddleName /&
〈Prefix /&
&Salutory&Mr.&/Salutory&&/Name&&/Author&
&PublicationDate&&/PublicationDate&&Country&UK&/Country&&Publislier&Pan Macmillan&/Publisher&-&Binding type="paperback"&
&NumberOfPages&208&/NumberOfPages&&/Binding&
〈IdentityNumber type="ISBN-10"&0-345-39181-0&/IdentityNumber&〈Container type="series" id="lD838195R" order="2" /&&/Work&
-&Work type="book" id="DA18230"&
《itle〉Ufe, the Universe and Everything&/Title&&Author&-&Nams&
&LastName&Adaras^/LastName&
&FirstName&Douglas&/FirstName&
&MiddleName /&
&Prefix /&
&Salutory&Mr.&/Salutory&&/Name&&/Author&
&PublicationDate&&/PublicationDate&&Country&U'K&/Country&&Publisher&Pan Books&/Publisher&-&Binding type="paperback"&
&NumberOfPages&160&/NumberOfPages&&Binding&
&IdentityNumbertype="lSBN-10"&0-330-26738~8&/IdentityNumber&〈Container type="series" id="lD838195R" ordei="3" &&/Work&
-&Work type="book" id="DA19291"&
&Title&So Long, and Thanks for All the Fish&/Title&-&Author&-&Name&
&LastName&Adams&/LastName&&FirstName&Douglas&/FirstName&&MiddleName /&
〈Prefix /&
&Salutory&Mr.&/Salutory&&/Name&&/Author&
&PublicationDate&&/PubIicationDate&&Countty&UK&/Country&&Publisher&Pan Books&/Publisher&-&Binding type="paperback"&
〈NumberOfPagePl92,umberOffages〉&/Binding&
&IdentityNumbertype="ISBN-10"&0-330-28700-l&/IdentityNumber&&Container type-"series" id="lD838195R" order="4" /&&/Work&
-&Work type="journal" id="PW1840912"&&Title&TechNet&/Title&&Author&Microsoft Corporation &/Author&&PublicationDate&&/PublicationDate&&Country&US&/Countiy&&Publisher&United Business Media LLC&/Publisher& -&Editor& -&Name〉
&LastName&Hoffman&/LastName&
&FirstName&Joshua&/FirstName&
&MidcUeName /&
〈Prefix /&
&Salutory&Mr.&/Salutory& &/Name& &/Editor& -&Editor& -&Namc&
&LastName&Gravcn&/LastName&
&FirstName&Matthew&/FirstName&
〈MiddleName 〉
&Salutory&Mr.&/Salutory& &/Name& &/Editor& -&Editor& -&Nam6&
&LastName&Terdeman&/LastName&
&FirstName&Sharon&/FirstName&
〈MiddleName /&
&Salutory&Ms.&/Salutory& &/Name& &/Editor&
"Binding type="paperback"&
&NumberOfPage^&64&/NumberOfPages& &/Binding&
〈IdentityNumber type="ISSN"&&/IdentityNumber& -&Volumes&
&VolumeNumber&5&/VolumeNumber&
&Edition&7&/Edition& &/Volumes& &/Work&
-&Work type-"arttde" id="TN283912"&
&Title&Inside Windows 7 User Account Control&/Title& -〈Author〉 -&Name&
&LastName&Russinovich&/LastName& &FirstName&Mark&/FirstName& &MiddleName /&
&Salutory&Mn&/Salutory& &/Name& &/Author&
&PublicationDate&&/PublicationDate& &Country&US&/Countiy&
&Publisher&United Business Media LLC&/Publisher& -&Binding type="paperback',&
&NumberOfPages&7&/NumberOfPages&&^Binding&
&Container type="journar id="PW1840912" /i& &/Work&
-&Work type="series" id="lD838195R"&
&Work type="book" id="DA17531"
&Worktype="book" id="DA18173" /&
&Wbrk type="book" id="DA18230" /&
&Worktype="book" id="DA19291" &/Work& &/LiteraryWorks&
与第一个例子一样,然后可以根据已存储数据库元素解释上述取样 的无关源中间数据,再根据精简的无关源数据库的数据结构把新的和/或
更新的数据存入该数据库。
& xml version=" 1.0" encoding="utf-8"
& :〈StandardizedLiterary Works& :&Gontainer&
&ContainerID&l&/ContainerID&
&ContainerType&series&/ContainerType& 々Container〉 :&ContainerWorks&
&ContainerID&l&/ContainerID&
&WorkID&2&/WorkID&
&OrderNumber&l々OrderNumber& &/ContainerWbrks& :&ContainerWorks&
&ContainerID&l&/ContainerID&
&WorkID&3&/WorkID&
&OrderNumber&2&/OrderNumber& &/ContainerWorks& ;;&ContainerWorks&
&ContainerID&l&/ContainerID&
&WorkID&4&/WorkID&
&OrderNumber&3&/OrderNumber& &/ContainerWorks& :&ContainerWorks&
&ContainerID&l&/ContainerID&
&WorkID&5&/WorkID&
&0rderNumber&4&/0rderNumber&
&yContainerWorks& :;&Work&
&WorkH&l&/WorkID&
&WorkType&book&/WorkTyps&
&TMe&Hitchhiker,s Guide to the Galaxy&/Title&
&PublicationDate&&/PublicationDate&
&Country&UK&/Country&
&Binding&hardcover&/Binding&
&NumberOfPages&224&/NumberOfPages&
&Volume&0&VoIume&
&Edition&0&/Edition& &/Work& :&Work&
&WorkID&2&/WorkID&&WorkType&book&/WorkType&
&TWe&Hitchhiker's Guide to the Galaxy&/Title&
&PublicationDate&&/PublicationDate&
&Countiy&UK&/Countiy&
&Binding&paperback&/Binding&
&NumberOfPages&180&/NumberOfPages&
&VoIume&0&/Volum6&
&Edition&(K/Edition& &/Work& 二 &Work&
&WorkID&3&/WorkID&
&WorkType&book&yWorkType&
&Title&The Restaurant at the End of the Universe&/Title&
&PublicationDate&&/PublicationDate&
&Country&UK&/Country&
&Binding&paperback&/Binding&
&NumberOffages&208&/NumberOfPages&
&Volume&0&/Volume&
&Edition&0&7Edition& &7Work& :&Work&
_ &WorkID&4&/WorkID&
&WorkType&book&/WorkTyps&
&TitIe&Life, the Universe and Everything&/Title&
&PublicationDate&&/PublicationDate&
&Country&UK&/Country&
&Binding&paperbaek&/Binding&
&NumberOfPages&160&/NumberOfPages&
&Volume&0&yVolume&
&Edition&0&/Edition& &/Work& 二 &Work&
_ &WorkID&5&/WorkID&
&WorkType&book&/WorkType&
&Title&So Long, and Thanks for All the Fish&/Title&
&PublicationDate&&/PublicationDate&
&Countiy&UK&/Country&
&Binding&paperback&/Binding&
&NumberOfPages&192&/NumberOfPages&
&Volume&0&/Volum6&
&Edition&0&/Edition& &/Work& :&Work&
_ &WorkID&6&yWorkID&
&WorkType&journal&/WorkType& &Title&TechNet&/Title&
&PublicationDate&&/PublicationDate&
&Country&US々Country&
&Binding&paperback&/Binding&
&NumberOfP^es&64&/NumberQfPages&
&Volume&5&/Volume&
&Edition&7&/Edition& &/Work& -&Work&&WorkID&7&/WorkID& &WorkType&artkIe&/WorkType&
&Title&Inside Windows 7 User Account Control&/Title& &PublicationDate&&/PublicationDate& &Country&US&yCountiy& &Binding&paperback&/Binding& &NumberOfPages&7&/NumberOfPages〉 &Volume&0&/Volume& &Edition&0&/Edition& &/Work&
:&IdentityNumber&
&WorkID&l&/WorkID&
&IdentityType&lSBN-10&/IdentityType& &IdentityCode&&^IdentityCode&
&/IdentityNumber&
:&IdentityNumber&
_ &WorkID&l&/WorkID&
&IdentityType&ISB]V-13&/IdentityType& &IdentityCode&1&/IdentityCode&
&/IdentityNumber&
:&IdentityNumber&
—&WorkID&2&/WorkID&
&IdentityType&ISBN-10&/IdentityType& &IdentityCode&&/IdentityCode&
&/IdentityNumber&
:&IdentityNumber&
一 &WorkE&3&/WorkID&
&IdentityType&ISBN-10&/IdentityType& &IdentityCode&(K/IdentityCode&
&/IdentityNumber&
:&IdentityNumber&
一 &WorkID&4&/WorkID&
&IdentityType&ISBN-10&/IdentityType& &IdentityCode&&/IdentityCode&
&/IdentityNumber&
:&IdentityNumber&
一 &WorkED&5&/WorkID&
&IdentityType&ISBN-10&/IdentityType& &IdentityCode&&/IdentityCode&
&/IdentityNumber&
:&IdentityNumber&
—&WorkID&6&/WorkID&
&IdentityType&ISSN&/ldentityType& &Identi^Code&&/IdentityCode&
&/IdentityNumber&
_ &EntityID&l&/EntityID&
&EntityType&person&/EntityType&
&FullName& Adams, Mr. Douglas&/FullName& &/Entity& :&Entity&
&EntityID&2&/EntityID&
&EntityType&company&/EntityType&
&FullName&Pan Books&/FullName& &/Entity&二 &Entity&
&EntityID&3&/EntityID&
&EntityType&company&/EntityType&
&FullName&Pan Macmillan&/FullName& &/Entity& :&Entity&
&EntityID&4&/EntityID&
&EntityType&company&/EntityType&
&FullName&Microsoft Corporation&/FullName& &/Entity& :&Entity&
&EntityID&5&/EritityID&
&EntityType&company&/EntityType&
&FullName&United Business Media LLC&/FullName& &/Entity& 二 &Entity&
&EntityID&6&/Entityn&
&EntilyType&person&/EntityType&
&FullName&Hoffman, Mr. Joshua&/FullName& &/Entity& :&Entity&
_ &EntityID&7&/EntityID&
&EntityType&person&/EntityType&
&FullName&Graven, Mr. Matthew&/FullName& &/Entity& 二 &Entity&
&EntityID&8&EntityID&
&EntityType&person&/EntityType&
&FullName&Terdeman, Ms. Sharon&/FullName& &/Entity& 二 &Entity&
&EntityID&$K/EntityID&
&EntityType&person&/EntityType&
&FullName&Russinovkh, Mr. Mark&/FullName& &/Entity& ::&WorkEntity& _ &WorkID&l&/WorkID&
&EntityID&l^/EntityID&
&Relation&author&/Relation& &/WorkEntity& :&WorkEntity&
&WorkED&l&/WorkID&
&EntityID&2&EntityID&
&Relation&publisher&/Relation& &/WorkEntity& 二 &WorkEntity& _ &WorkID&2&/WorkID&
&EntityID&l&/EntityID&
&Relation&author&7Relation& &/WorkEntity& 二 &WorkEntity& _ &WorkID&2&/WorkID&
&EntityID&2&/EntityID&
&Relation&publisher&/Relation& &/WorkEntity&&WorkEntity&
_ &WorkID&3&/WorkID& &EntityID&l&/EntityID& &Relation&author&/Relation&
&/WorkEntity&
::&WorkEntity&
_ &WorkID&3&yWorkID& &EntityID&3&/EntityID& &Relation&publisher&/ReIation&
&/WorkEntity&
:&WorkEntity&
一 &WorkID&4&/WorkID& &EntityID&l&/EntityID& &Relation&author&/Relation&
&/WorkEntity&
二 &WorkEntity&
_ &WorkID&4&/WorkID& &EntityED&2&/EntityID& &Relation&publisher&/Relation&
&/WbrkEntity&
二 &WorkEntity&
—&WorkID&5&/WorkID& &EntityID&l&^EntityID& &Relation&author&/Relation&
&/WorkEntity&
:&WorkEntity&
_ &WorkID&5&/WorkID& &EntityID&2&/EntityID& &Relation&publisher&/Relation&
&/WorkEntity&
:&WorkEntity&
_ &WorkID&6&/WorkID& &EntityID&4&/EntityID& &Relation&author&/Relation&
&/WorkEntity&
::&WorkEntity&
—&WorkID&6&/WorkID& &EntityID&5&/EntityID& &Relation&publisher&VRelation&
&/WorkEntity&
:&WorkEntity&
一 &WorkID&6&/WorkID& &EntityID&6&/EntityID& &Relation&editor&Relation&
&WorkEntity&
;:&WorkEntity&
一 &WorkID&6&/WorkID& &EntityID&7&/EntityID& &Relation&editor&/Relation&
&/WorkEntity&
:&WorkEntity&
一 &WorkID&6&/WorkID& &EntityID&8&/EntityID& &Relation&editor&/ReIation&
&/WorkEntity&二 &WorkEntity&
&WorkID&7&/WorkID&
&EntityID&9&/EntityID&
&Relation&author&/Relation& &y\VorkEntity& ::&WorkEntity&
&WorkID&7&/WorkID&
〈EntitylD〉5^Entityn^
&Relation&publisher&/Relation& &/WorkEntity& :&WorkRelation&
&ParentWorkID&2&/ParentWID&
&ChildWorkID&l&/ChildWorkID&
&Relation&republication&/Relation& &/WorkRelation& :&WorkRelation&
&ParentWorkID&6&/ParentWorkID&
&ChildWorkID&7&/ChildWorkID&
&Relation&container&/Relation& &/WorkRelation& &/StandardizedLiteraryWorks&
本领域技术人员将会意识到,在不脱离本发明的总体范围和精神的 情况下,可以考虑上述的和其他的数据库存入方法和系统。
虽然根据目前被认为最实际并且优选的实施例描述了本发明,但是 必须理解,本发明不限于所公开的实施例。本领域技术人员将懂得,在 不脱离权利要求书限定的本发明的精神和范围的情况下,可以有各种修 改形式以及等同结构和功能。因此,权利要求书限定的本发明必须给予 最宽泛的可能解释,以涵盖所有这些修改形式以及等同结构和功能。
1.一种把与一个或多个基于文档的集合关联的著录项目数据存入相关数据库的方法,其中所述著录项目数据来自具有不同特定源格式的两个以上数据源,所述方法包括以下步骤访问来自所述两个以上数据源的源数据;根据由中间数据结构规定的共同中间无关源格式使来自所述两个以上数据源的每一个数据源的所述访问数据独立标准化,使得来自不同特定源格式的相似数据元素被共同识别为所述中间格式;以及把所述标准化数据进一步解释成与包括来自所述两个以上数据源的每一个数据源的至少一部分数据库元素的已存储数据库元素相关,再根据所述关系把参考其自身替换的至少一部分重复元素存入所述数据库,以便与不同于所述中间数据结构的精制数据库数据结构一致。
2. 根据权利要求l所述的方法,其中所述数据库数据结构被规范化 成高于所述中间数据结构的规范形式。
3. 根据权利要求l所述的方法,其中所述中间数据结构被规范化成 一次规范形式,而所述数据库数据结构被规范化成三次规范形式。
4. 根据权利要求1所述的方法,其中所述进一步解释步骤通过一个 或多个数据元素与著录项目数据相互关联,所述著录项目数据最初来自 不同的特定源格式并且与来自不同的基于文档的集合的文档关联,所述 一个或多个数据元素为所述文档的每一个文档共用并通过所述标准化步 骤被共同识别为所述中间格式。
5. 根据权利要求l所述的方法,其中所述进一步解释步骤包括基 于与所述不同文档相关联的其他数据元素之间的相似程度,把与所述不同文档相关联的相似数据元素解释为相同。
6. 根据权利要求1所述的方法,其中所述进一步解释步骤是通过用于所有独立标准化数据的共用解释器实现的。
7. 根据权利要求l所述的方法,其中所述至少一部分重复元素至少 存在于以下之一在来自单个数据源的所述标准化数据中、在来自多个 数据源的所述标准化数据中、在所述标准化数据与所述已存储数据库元 素之间以及同时在所述标准化数据中和在所述标准化数据与所述已存储 数据库元素之间。
8. 根据权利要求l所述的方法,其中以同时、顺序和可用方式中的 至少一种方式进一步解释来自不同数据源的独立标准化数据。
9. 根据权利要求l所述的方法,其中所述访问数据选自单个文件、多个文件和批文件。
10. 根据权利要求1所述的方法,其中所述数据库被规范化成一次、 二次、三次和四次规范形式中的一种规范形式。
11. 根据权利要求l所述的方法,其中所述访问数据包括元数据。
12. 根据权利要求1所述的方法,其中所述一个或多个基于文档的 集合包括一个或多个基于专利文档的集合。
13. 根据权利要求12所述的方法,其中所述已存储数据库元素包括 元数据和专利文档。
14. 根据权利要求1所述的方法,其中用至少一种多对多关系规范 化所述数据库。
15. 根据权利要求14所述的方法,其中使用具有一对多关系的链接 表实现所述至少一种多对多关系。
16. 根据权利要求1所述的方法,其中所述进一步解释步骤根据所 述关系存入数据库,使得在不能从所述两个以上数据源的任一数据源获 得的数据库中单独存在链接。
17. 根据权利要求1所述的方法,其中通过一个或多个计算机自动 地实现所述标准化和进一步解释步骤,其中所述一个或多个计算机包括 与其中存储有声明和指令的一个或多个数据存储器操作性连接的一个或 多个处理器,当所述一个或多个处理器执行声明和指令时,自动地实现 所述标准化和进一步解释步骤。
18. 根据权利要求1所述的方法,其中所述访问步骤包括以下步骤 中的一步或几步至少从所述数据源之一获得所述源数据,和访问在先获得的源数据。
19. 根据权利要求1所述的方法,其中以不同特定源格式访问来自 相同的基于文档的集合的不同数据集。
20. —种把与一个或多个基于文档的集合关联的著录项目数据存入 相关数据库的系统,其中所述著录项目数据来自具有不同特定源格式的 两个以上数据源,所述系统包括一个或多个数据存储器,用于限定中间数据结构和与其不同的精制 数据库数据结构,并且根据所述精制数据库数据结构存储来自所述两个以上数据源的每一个数据源的数据库元素;独立标准化模块,用于根据由所述中间数据结构规定的共同中间无关源格式使从所述两个以上数据源的每一个数据源访问的数据独立标准 化,使得来自不同特定源格式的相似数据元素被共同识别为所述中间格式;以及解释器,用于把所述标准化数据进一步解释成与来自所述两个以上 数据源的每一个数据源的所述已存储数据库元素相关,再根据所述关系 把参考其自身替换的至少一部分重复元素存入数据库,以便与所述精制 数据库数据结构一致。
21. 根据权利要求20所述的系统,还包括判定剖析器,其基于所述 访问数据关联的特定源格式决定用于所述访问数据的适当标准化模块。
22. 根据权利要求20所述的系统,包括专利文档数据库系统。
23. —种把与一个或多个基于文档的集合关联的并且从不同特定源 格式的两个以上数据源访问的著录项目数据存入相关数据库的计算机可 读介质,包括由执行以下步骤的计算机执行的声明和指令根据由中间数据结构规定的共同中间无关源格式使来自所述两个以 上数据源的每一个数据源的所述访问数据独立标准化,使得来自不同特 定源格式的相似数据元素被共同识别为所述中间格式;以及把所述标准化数据进一步解释成与包括来自所述两个以上数据源的 每一个数据源的至少一部分数据库元素的已存储数据库元素相关,再根 据所述关系把参考其自身替换的至少一部分重复元素存入所述数据库, 以便与不同于所述中间数据结构的精制数据库数据结构一致。
24. 根据权利要求23所述的计算机可读介质,还包括在选择适当 标准化指令时,用于基于特定源格式剖析访问数据的声明和指令。
25. 根据权利要求23所述的计算机可读介质,其中所述一个或多个 基于文档的集合包括基于专利文档的集合。
本发明公开一种把来自多个数据源的著录项目数据存入数据库的方法。所述方法包括以下步骤访问来自两个以上数据源的源数据;根据由中间数据结构规定的共同中间无关源格式使来自两个以上数据源的每一个数据源的访问数据独立标准化,使得来自不同特定源格式的相似数据元素被共同识别为中间格式;以及把标准化数据进一步解释成与包括来自两个以上数据源的每一个数据源的至少一部分数据库元素的已存储数据库元素相关,再根据所述关系把参考其自身替换的至少一部分重复元素存入数据库,以便与不同于中间数据结构的精制数据库数据结构一致。本发明还公开用于执行上述方法的系统和计算机可读介质。
文档编号G06F17/30GKSQ
公开日日 申请日期日 优先权日日
发明者杰森·怀特, 阿萨德·阿巴斯 申请人:英赛特半导体有限公司}

我要回帖

更多关于 数据库怎么存图片 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信