用XML来描述元数据pop广告有哪些优势势

您所在位置: &
&nbsp&&nbsp&nbsp&&nbsp
XML在数字图书馆信息资源组织中的应用研究硕士论文.pdf83页
本文档一共被下载:
次 ,您可免费全文在线阅读后下载本文档
文档加载中...广告还剩秒
需要金币:200 &&
--优秀硕士毕业论文,完美PDF格式,可在线免费浏览全文和下载,支持复制编辑,可为大学生本专业本院系本科专科大专和研究生学士硕士相关类学生提供毕业论文范文范例指导,也可为要代写发表职称论文的提供参考!!!
你可能关注的文档:
··········
··········
华中科技大学
硕士学位论文
XML在数字图书馆信息资源组织中的应用研究
姓名:汪勇
申请学位级别:硕士
专业:计算机技术
指导教师:王芳
座机电话号码
华中科技大学硕士学位论文
随着计算机、网络和通信技术的迅猛发展,数字型文献正以几何级数膨胀,海
量的信息涌现于Internet,信息的管理、查询变得越来越困难。为了满足处理大量
信息资源的要求,提高信息资源的组织、加工、传递和有序发布以及用户检索、获
取所需信息资源的效率,数字图书馆的理论和技术应运而生。数字图书馆建设的核
心和关键是数字信息资源的建设,主要包括馆藏信息资源数字化和网上信息资源馆
藏化两方面。如何描述信息资源、科学地对数字信息资源进行组织、管理,成为数
字图书馆信息资源建设必须要解决的问题。
数字图书馆的信息对象以网络为存在基础,具有数量巨大和异构的特性,针对
这些特性,在分析数字图书馆信息组织的方法和NML技术优势的基础上,选择XML
作为数字图书馆信息组织的技术,并给出了基于x札的数字图书馆的体系结构;在
分析数字图书馆中两种典型元数据标准的基础上,阐述了XML在数字图书馆元数据
描述中的应用方法:研究了传统图书馆中凇Rc元数据的描述转换问题;以基于XML
的资源描述框架 RDF 来描述元数据来解决多种元数据方法并存的问题,保证了数
字图书馆元数据的完整性与互操作能力;以及如何对XML文档进行有效存储、查询
正在加载中,请稍后...育龙网中国第一教育门户【咨询电话:010- 】
您现在的位置:&>&&>&
育龙网校 &WWW.CHINA- B.C0M&& 日&&来源:
核心提示:
内容提要随着Internet和WWW的飞速发展,XML凭借其自身的特点,为网络信息的治理、搜索以及Web上各种应用的链接提供了极大的便利,从
内容提要随着Internet和WWW的飞速发展,XML凭借其自身的特点,为网络信息的治理、搜索以及Web上各种应用的链接提供了极大的便利,从而得到了广泛应用。XML的一个重要特点就是答应用户定义自己的标签,从而实现对信息的存储和治理。XML中较常用的标签定义工具有DTD和XMLSchema,而RDF是一个专用的元数据描述框架。本文结合一个MARC元数据描述的实例,对这三个工具进行了比较细致的分析和对比,并对未……引言XML是继HTML之后的又一种WEB标记语言,它为用户提供了灵活的标记扩展机制,使得不同内容的资源能以格式良好的自定义的标记元素来表现。元数据是描述信息资源或数据等对象的数据,主要用来识别、评价、追踪资源,以及方便对资源的治理、发现、查找和交换。随着网络的发展,非凡是Internet的普及,网络环境下信息的描述和处理成为一个重要的问题,相应地网络环境下的元数据问题也成为一个研究的热点。DTD和XMLSchema是XML中常用的进行标记扩展的工具,RDF是专用的元数据描述工具,网络环境下的元数据描述通常就是借助这几个工具,利用XML的标记可扩展性来完成。在这三个工具中,DTD随着XML0最早被提出,伴随着XML应用的普及和人们对DTD熟悉的加深,又进一步提出了RDF和更有发展潜力的XMLSchema。DTDDTD作为XML0规范的重要组成部分,它使用EBNF语法完成XML文档结构的定义,即XML文档中标记的定义。一个XML文档只能对应一个DTD,一个DTD由一系列标记定义组成,包括元素定义、属性定义、实体定义、注释定义,是目前支持和应用最广泛的一种标记扩展工具。例如,一个用于描述MARC元数据的XML文档的DTD可以定义如下:<!DOCTYPEmare【<!ELEMENTmarc><!ATTLISTmareTYPE#REQUIRED><!ELEMENTrecord><!ATTLISTrecordtypeCDATA#REQUREDinfoCDATA#REQUIRED><!ELEMENT,datafield><!ATTLISTdatafieldtagCDATA#REQUIREDindCDATA#IMPLIEDindCDATA#IMPLIED><!ELEMENTsubdatafield><!ATTLISTsubfieldcodeCDATA#REQUIRED>】>上例中各个标记和属性的作用如下:<MARC>:用于标记内容的开始和结束,属性“type”用于标记MARC类型,如CNMARC,USMARC,UNIMARC。<RECORD>:用于标记MARC记录的byte定长头标区,属性有“type”和“info”。<DATAFIELD>:MARC记录数据字段区的数据字段标记,对应MARC记录中每个字段的内容,属性“tag”、“ind”和“ind”分别代表字段标识、第一和第二指示符。<SUBDATAFIELD>:MARC记录数据字段区中数据字段的子字段标记,属性“code”为子字段标识。通过该例,我们可以看到DTD较好地完成了XML的标记扩展的任务,目前在Internet上已有大量使用DTD描述的元数据存在。但是DTD提出较早,人们在使用过程中也发现它有很多的不足之处。其主要特点如下:①难以理解和书写。由于采用的是不同于XML的名为EBNF的语法,因为需要先了解EBNF,这对于人们的阅读和书写都带来了困难。②难以使用程序进行元数据的自动处理。由于使用EBNF语法,这给DTD的自动处理也带来了麻烦。通常情况下,我们需要对DTD进行验证,这时使用DOM就不可能对使用EBNF语法书写的DTD进行分析,而必须使用专门的分析程序进行分析验证。③DTD不支持数据类型。DTD只支持包括文档类型在内的少数几种数据类型,这意味着在实际使用过程中经常需要进行类型的转换才能达到预想的效果。④DTD不支持Namespaces。由于必须把所有的元数据放在一个DTD文件中,假如需要对已有的DTD进行扩充则只能在原文件的基础上进行重写,这对于元数据的维护和扩充都十分不方便。总之,DTD在简单的文档结构定义方面是较出色的,假如考虑到XML,是源自同样使用DTD的SGML的话,理解在XML0中选择了DTD就不难了。但假如我们考虑到XML的用途现在已不仅局限于文档处理,那么DTD的这些缺点就变得日趋严重。因此WC在看到了DTD的诸多问题之后,提出了一系列用来代替DTD的建议,包括RDF、XML-Data、DCD、XMLSchema等,其中以RDF和XMLSchema的影响较大.RDFRDF是WC在999年月颁布的一个关于元数据的建议,它主要解决如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述资源的元数据信息成为机器可理解的信息。RDF不仅可以象DTD一样答应设计者定义对象,并可以加入属性以对对象进行描述和定义,还可以作出有关对象的复杂的陈述,例如申明资源之间的关系等。RDF的基本对象类型有:资源、属性、陈述。每一个资源都有属性,每个资源通过唯一资源标识符URI来标识,它的属性由属性类型来作标识,每一个属性类型都有对应的属性值。属性类型表示出这些属性值与资源之间的关系。在RDF中,属性值要么是一些被认为具有原子性的事物,要么是其他的资源,而这些资源本身又拥有自身的属性。所有指向同一资源的陈述的集合就是描述。以前面所描述的MARC元数据为例,使用RDF可以定义如下:<?xmlversion=‘0’?><rdf:RDFxmlns:rdf=“httP://www.worg/999/0/rdf―syntax―ns#”xmlns:rdfs=“http://=www.worg/TR/999/PR―rdf―schema―99900#”xmlns:dc=“http://purl.org/dc#”xmlns:marc=“http://libsys000./marc#”><rdf:DescriptionID=“MARCTYPE”><rdf:typerdf:resource=“http://www.worg/999/0/―rdf―syntax―ns#Property”/><rdfs:label>MARCTYPE</rdfs:label><rdfs:isDefinedBYrdf:resource=“”/></rdf:Description><rdf:DescriptionID=“RECORD”><rdf:typerdf:resource=“http://www.worg/999/0/―rdf―syntax―ns#Property”/><fdfs:label>RECORD</rdfs:label><rdfs:isDefinedByrdf:resource=“”/></rdf:Description><rdf:DescriptionID=“DATAFIELD”><rdf:typerdf:resource=“http://www.worg/999/0/―rdf―syntax―ns#Property”/><rdfs:label>DATAFIELD</rdfs:label><rdfs:isDefinedByrdf:resource=“”/></rdf:Description><rad:DescriptionID=“DATAFIELD”><rdf:typerdf:resource=“http://www.worg/999/0/―rdf―syntax―ns#Property”/><rdfs:label>SUBDATAFIELD</rdfs:labcl><rdfs:isDefinedByrdf:resource=“”/></rdf:Description>通过上例,我们可以看到针对DTD种种不足而提出的RDF建议克服了DTD的主要缺点,具有以下几个优点:①易控制性。由于RDF使用简单的资源――属性――值三元组,所以很轻易控制,即使是数量很大的时候。②包容性。在RDF这种元数据模型中既可以定义自己的词汇集,也可以嵌入DC元数据或别的类型的元数据。③可交换性。由于XML是目前最具发展前景的标记语言,使用XML作为描述语法的RDF在未来也就可以成为一种可以携带多种元数据来往于网络上的框架工具。④易综合性。在RDF中资源的属性是资源,属性值以及关于资源的陈述也可以是资源,都可以用RDF进行描述,这样可以很轻易地将多个描述综合,以达到发现知识的目的。总之,RDF是一个公认的极佳的强有力的元数据描述工具,这也部分地实现了它结束在元数据描述领域一切努力的雄心。但是,RDF的这种强有力也导致了它严重的缺陷,就是在一些日常应用中显得太复杂了,设计者不仅需要定义对象和属性,而且需要定义复杂的陈述。一个复杂的标准是很难在短时间内被广大网络应用开发人员接受、把握和应用的,因此这个复杂的标准也就很难在网络上推广和被接受。就象复杂的SGML很少有人使用,而对其进行简化后形成的XML则迅速被接受一样,RDF在网络上尤其是Internet上是很难有市场的,而只会在一些特定的领域得到应用。Internet上的元数据描述需要的应该是一种简单而且可靠的解决方案。XMLSchemaSchema是一种描述信息结构的模型,它是借用中一种描述相关表格内容的机制,为一类文件建立一个模式。从这一层意义上讲,DTD实际上也是一种Schema,只不过这种Schema使用了古怪的EBNF语法,因而带来了诸多的不便。RDFSchema可能是由于RDF的原因,WC最终只推出了RDFSchema的草案,一直未能更进一步推出正式的建议。XMLSchema是00年月由WC推荐的用于描述XML文件结构的一个框架,它的语法与XML相同,但Schema文件所描述的是引用它的XML文件中的元素和属性的具体类型。以前面所描述的MARC元数据定义为例,使用XMLSchema可以定义如下:<xsd:schemaxmlns:xsd=“http://www.worg/00/XMLSchema”><xsd:elementname=“mare”type=“marc”/><xsd:complexTypename=“marc”><xsd:sequence><xsd:elementname=“recurd”minOccurs=“0”maxOccurs=“unbounded”><xsd:complexType><xsd:sequence><xsd:elementname=“datafield”type=“datafield”minOccurs=“0”maxOccurs=“unbounded”/></xsd:sequence><xsd:attributename=“rectype”type=“xsd:string”/><xsd:attributename=“recinfo”type=“xsd:string”/></xsd:complexType></xsd:element></xsd:sequence><xsd:attributename=“marctype”type=“xsd:string”/></xsd:complexType><xsd:complexTypename=“datafield”><xsd:sequence><xsd:elementname=“subdatafield”type=‘xsd:string”minOccurs=“0”maxOccurs=“unbounded”content=“textOnly”><xds:attributename=“code”type=“xsd:string”/></xsd:element></xsd:sequence><xsd:attributename=“tag”type=“xsd:string”/><xsd:attributename=“ind”type=“xsd:string”/><xsd:attributename=“ind”type=“xsd:string”/></xsd:complexType></xsd:schema>通过上例,我们可以看到XMLSchema本身就是一个XML文件,但不同的是,Schema文件所描述的是引用它的XML文件中的元素和属性的具体类型。相比DTD,XMLSchema具有以下优点:①一致性。Schema使得对XML的定义不必再利用一种特定的形式化的语言,而是直接借助XML自身的特性,利用XML的基本语法规则采定义XML文档的结构,使得XML达到了从内到外的完美统一,也为XML的进一步发展奠定了坚实的基础。②扩展性。Schema对DTD进行了扩充,引入了数据类型、命名空间,从而使其具备较强的可扩展性。③互换性。利用Schema,我们能够书写XML文档以及验证文档的合法性。另外,通过特定的映射机制,还可以将不同的Schema进行转换,以实现更高层次的数据交换。④规范性。同DTD一样,XMLSchema也提供了一套完整的机制以约束XML文档中置标的使用,但相比之下,后者基于XML,更具有规范性。Schema利用元素的内容和属性来定义XML文档的整体结构,如哪些元素可以出现在文档中、元素间的关系是什么、每个元素有哪些内容和属性、以及元素出现的顺序和次数等等,都可一目了然。综述田于XMLSchema的种种优点,现在Schema取代DTD已成大势所趋。在这种情况下,国际上一些知名企业和组织审时度势纷纷在战略上向XMLSchema倾斜,提供对XMLSchema的支持。其中最为典型的当然要数微软的BizTalk和xml.org组织的注册/资源库。更加值得一提的是:微软在其浏览器软件InternetExplorer0中率先提供对Schema的支持。尽管微软支持的Schema也只是过渡性“标准”,但今后肯定还会不断修改。虽然我们说XMLSchema终将代替DTD,但在短期内DTD还是有着它的优势的,例如广泛的工具支持,广泛的应用经验等。因此,短期内DTD会与XMLSchema共存,而RDF则会在一些需要它的强大的元数据描述能力的领域找到它的位置。参考文献黄伟红,张福炎.基于XML/RDF的MARC元数据描述技术.情学,000程变爱.试论资源描述框架.现代图书情技术,000XMLSchemaPart0:Primer.http://www.worg/TR/xmlschema―0/#Q99html.xmlXMLSchemaPart:Structures.http://www.worg/TR/xmlschema―/XMLSchemaPart:Datatypes.http://www.worg/TR/xmlschema―/6XMLSchemaRequirements.http://www.worg/TR/NOTE―xml―schema―req7WCProposedRecommendation.ResourceDescriptionFrameworkSchemaSpecification.http://www.worg/TR/PR―rdf―schema8WCProposedRecommendation,ResourceDescriptionFrameworkModelandSyntaxSpecification.http://www.worg/TR/999/PR―rdf―syntax―999009张敏,张晓林.元数据的发展和相关格式.四川图书馆学,0000张伟,苑迎春,等.DTD与Schema简介.现代电子技术,00基于XML的三个常用元数据描述工具的评价与比较
相关热词搜索:
-- 本站部分信息来源于互联网,不代表本站观点或立场,如有侵权,请来电告知,我们将及时处理[DOCIN]基于XML的海洋信息元数据标准的研究与实现
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
[DOCIN]基于XML的海洋信息元数据标准的研究与实现
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口元数据编码,元数提醒架构,元数据编码语言,元数据编码的作用,命名域概念实例。
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
元数据编码
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口}

我要回帖

更多关于 pop广告有哪些优势 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信