XML(可扩展标识语言)的产生
2000-08-23 15:07:11
“HTML (超文本链接标示语言)是我们的数据类型” __比尔.盖茨(1996.2)
这句话预示了户联网无可限量的发展前景.无论是公司,政府机构,还是个人;无论是腰缠万贯的企业, 个人网页的设计人,还是小学课堂,网络和它最初用以表达信息的方法HTML都获得了圆满的成功.这样看来HTML可以解决绝大部分问题了。
但是,一些独具慧眼的人却已经认识到有必要重新发展一种新的语言XML.
HTML并不完美
HTML只是一种表达的技术.它并不一定能揭示HTML tag中说揭示的含义.举一个最简单的例子. Apple这句话在网络浏览器中有特定的表现.但是HTML却并没有告诉我们它倒底是什么.Apple只是一个英文单词罢了.它在不同的环境之下可能会有不同的意义.是一个计算机公司,一个水果,还是一个姓氏?HTML并没有告诉我们Apple具体的内容.
HTML中有一个大问题就是它的tag的集合是固定的.用户不能新增有意义的能供他人使用的tag.网络浏览器是一个应用平台,以HTML作为数据标准,网络上的应用程序依赖服务器上的CGI(公共网关接口)脚本来处理网页上的数据.这样的结构是非常清晰的,但HTML却使在服务器的一端要处理的数据量过大.这使得网络速度降低,效率不高.
XML 将会带来什么
SGML (通用标记语言标准ISO 8879:1986)是HTML的前身技术.它是文件和文件中信息的构成主体. SGML与HTML不同.它允许用户扩展tag集合, 允许用户建立一定的规则. SGML所产生的tag 集合是用来描叙信息段特征的.而HTML仅仅只是一个tag集合.所以我们可以说HTML是一个SGML的子集.
XML开发者源于SGML的设计和应用者. 他们已经在SGML上投入了大量精力,但他们却发现SGML 并没有完全发挥它的作用.他们当然有其充分的理由.我们可以列举以下几个重要方面给大家.在这些方面SGML 带来的影响可以说是一场革命.
对EDI的支持
EDI就是电子数据交换.它是网络发展的一个主要目的市场.结构化信息的一个主要目的就要使数据交换成为可能.不同的工业都制定本工业统一的模型.就像是不同的国家有着不同的语言,这便于本国文化的交流. 不同的工业内部信息用统一的模型标识,便能方便和高效地共享.这样一个统一的模型就是DTD(文件类型定义).当然DTD已经落伍了,它正被XML的Schema(模式)所替代.很明显的,网络是一个理想的电子数据的集散地. 在这里HTML是显然有缺陷的数据形式.HTML不能完全表示不同工业中所需的不同的令人满意的模型和它的语义.能不能有一种新的语言来解决这个问题呢?答案就是XML.
对Java 技术的帮助
Java 技术是本世纪最重要的技术发展之一.Java 使浏览器工作时就像在通用的应用平台上,而平台与平台之间却是独立的.但固定的tag 集合和HTML语义上的贫瘠使得Java的应用受到了极大的限制. 正如前面提到的,在HTML中不同的语义无法表现.故数据元中丰富的信息得不到一种统一的表示. XML 却能完全胜任这份工作.
HTML页面要依赖网络服务器上的CGI脚本来表现几乎每一个编程函数.这显然使服务器工作量太大.有了XML和Java技术,更多的应用软件处理起来将不占用多少网络通信量.这使得网络更加快捷,客户可以同时应用多个应用软件.
XML真正使得Java有了用武之地.
信息独立于平台之间
SGML作为HTML和 XML的前身技术,一直是一种平台之间互相独立的信息技术.这便于指定信息语义的结构.当企业正忙于展开各种各样的信息格式时(比如微软的RTF, Adobe的PostScript和MIF,以及WordPerfect, Lotus, Borland等公司的格式), SGML已先人一步,确定立了一套严格一致的, 独立于平台之间表达信息的格式.
但在八十年代,正当SGML悄悄兴起时,绝大多数工业上的计算机开发者都把目光集中在新的计算机平台上.人们并没有意识到多种私有信息格式可能带来的麻烦.到了九十年代,网络技术的崛起之后人们才清醒过来,试图寻找一种解决办法.
网络上的SGML
SGML已不适用于网络社会的需要.“如何使SGML能成功地运用于网络?”,这一问题已自然而然地提上了议程.1996年8月,GCA(图形通信协会)在Seattle召集SGML开发者们举行了一次会议.会议由Sun Microsystems公司的Jon Bosak主持.论题集中于两大方向:
(1)在软件应用中HTML是一种不理想的信息表现格式.
讨论的结果是有必要把SGML应用于网络.
(2) SGML的某些方面已经落伍了.已成为了它广泛传播的障碍.讨论的结果是有必要考虑怎样修补SGML.既然SGML有着多重语义的tag集合,它早就应出现在网络上了.而具有讽刺意味的是,在1996年8月在网络上人们热衷的却不是SGML,而是HTML和它的固定的tag集合.
SGML开发者们立刻制定了一个紧急修改SGML标准的方案. 因为SGML是一个严格而完整的系统,方便软件应用并不是它的首要任务.所以在SGML中有许多语法语义标准.它们既不方便而且消耗昂贵.它们必须被修改或是删除. SGML开发者们首先所作的工作就是得到一个SGML中可移给网络的,非关键的结构信息的清单.他们可以基于这个清单对SGML进行修改.
XML诞生了
早在Seattle会议之前,Bosak和一些精心挑选的SGML结构信息专家就已向W3C提出了“网络上的SGML”计划. W3C支持并赞助了他们的努力. 工作于1996年7月正式开始起动.
工作的早期,有较大的阻力.因为也存在反对SGML的人.一些制定XML标准的W3C代表甚至声称“网络上的SGML”是不可能实现.工作组(原称“SGML编辑审议委员会”)并未退缩.他们打算让SGML以全新的面目出现在网上,给SGML以全新的面貌,故给它命名为“可扩展标识语言”,即XML.
工作组制定了一个雄心勃勃的计划来展示XML特色的计划. 计划的实施分三部分:
(1)XML的句法.
(2)XLL(可扩展链接语言): XML 的语义链接.
(3)XSL(可扩展类型语言): XML的表现.
XML 1.0版本标准由W3C正式批准公布于1998年1月10日. XLL和XSL的工作还正在进行.
XML的应用
最初XML的目标是让各种结构的文件都作为统一的网络文件的一部分在网上传输.过去这些文件是HTML实现的. HTML允许指定明确的元素类型说明, 比如特定的商品标号,文档标识,或是可测量量的数值.和HTML 相比,XML允许客户定义他们自己的文件元素集合,同时也可以指示这些素元在屏幕上如何按指定的要求表现.
在早期,为了解决怎样在固定的目标之间传输数据元, XML被定义为一种自然的编码形式.在一些方案被考虑之后,一种被称为RDF (资源描叙框架)的方案倍受亲睐. RDF为XML提供了数据元编码定义.这就像是一个公用的翻译器,为不同的固定目标之间的数据提供翻译.
XML将支持更加专业的数据语言,比如说OSD(开放软件描叙). OSD是由Microsoft和Marimba提出的一种新的格式描叙语言.在这种格式下,软件在网上能时时检查, 时时刷新版本. 不是等用户自己更新,或由是软件提供商提供类似的服务.当OSD镶嵌于XML支持的CDF(频道定义格式)中时, OSD更能使支持频道的桌面自动地更新.
正如前面提到的,XML的一个主要目标市场是电子商务.传统EDI(电子数据交换)机制依靠不同商业之间的强大计算机系统来实现压缩的信息传输.每一条信息在传输使用,提供给用户之前都必须编码.电子商务在网上运作时用户端每填完一个HTML的表格之后,都要把表格法还给初始的服务器处理.产品交易,谈判签约,后勤管理,税收报表等等这一些活动的数据处理都集中在了一端.可以预测到,有了XLL所链接的行为控制机构和XSL所提供的客户端评价功能,将来的数据可以从屏幕上抓取,有必要的话可在客户端处理,在处理数据时,传输给相关用户而不必要改换数据格式.一个类似的协议是OTP(开放网络贸易协议).它的草稿最初是于1998年1月发布的.这个协议的制定是为了满足在网上.消费者和销售者之间交易时消息的传输.它同时也允许第三方,比如说供货商,市场评估机构, 消费者保护机构等,来参与使用.
XML的应用弥补了许多HTML的缺陷,我们把它在网上的应用总结为四点:
1.当网络客户必须在不同的数据库之间传递信息时的应用.
2.当需要把大部分从网络服务器载下的数据在用户端处理时的应用.
3.当相同的数据对于不同的用户需要有不同的界面时的应用.
4.当网络情报供货商要把发现的信息精心裁减,并发送给不同的个人用户时的应用. 摘自《赛迪网》 郁桦/文 |
404 Not Found
404 Not Found
nginx
|
|