新书推介:《语义网技术体系》
作者:瞿裕忠,胡伟,程龚
   XML论坛     W3CHINA.ORG讨论区     >>计算机科学论坛<<     SOAChina论坛     Blog     开放翻译计划     新浪微博  
 
  • 首页
  • 登录
  • 注册
  • 软件下载
  • 资料下载
  • 核心成员
  • 帮助
  •   Add to Google

    >> 本版讨论Semantic Web(语义Web,语义网或语义万维网, Web 3.0)及相关理论,如:Ontology(本体,本体论), OWL(Web Ontology Langauge,Web本体语言), Description Logic(DL, 描述逻辑),RDFa,Ontology Engineering等。
    [返回] 计算机科学论坛W3CHINA.ORG讨论区 - Web新技术讨论『 Semantic Web(语义Web)/描述逻辑/本体 』 → 万维网:过去,现在和未来[译] 查看新帖用户列表

      发表一个新主题  发表一个新投票  回复主题  (订阅本版) 您是本帖的第 4217 个阅读者浏览上一篇主题  刷新本主题   树形显示贴子 浏览下一篇主题
     * 贴子主题: 万维网:过去,现在和未来[译] 举报  打印  推荐  IE收藏夹 
       本主题类别:     
     jiexincao 帅哥哟,离线,有人找我吗?
      
      
      威望:6
      等级:计算机学士学位
      文章:394
      积分:2379
      门派:XML.ORG.CN
      注册:2005/1/27

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jiexincao发送一个短消息 把jiexincao加入好友 查看jiexincao的个人资料 搜索jiexincao在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jiexincao的博客楼主
    发贴心情 万维网:过去,现在和未来[译]

    原文:http://www.w3.org/People/Berners-Lee/1996/ppf.html

    万维网:过去,现在和未来
    Tim Berners-Lee 1996年8月
    最初为了响应IEEE计算机1996年十月特刊的征稿邀请而写的,但是我想这一期特刊最后被放弃了。
    摘要:
    万维网的设计初衷是是作为共享信息的交互的世界,在这个世界里人们能够相互交流,同时还能够与机器交流。从1989年出现以来,它从最初的作为一个媒介用于来自于高负载的企业服务器上的只读材料的广播发展到了使用Internet连接的消费者的大众媒体。最近的商业上对于它在组织中的应用――就是所谓的“Intranet”的兴趣把它带入了更小的,封闭的,针对特定组织的领域,在这个领域中更多的信任允许更多的交互。将来我们有望看到万维网成为更小的组织、家庭和个人信息系统的工具。其他的有趣的发展将会是用户接口的日益增长的可交互性和包含已定义语言的机器可读的信息的利用,这种信息让机器能够更好的处理全球的信息,这种信息中还包括以机器可读的符号表达的断言。
    引言
    这篇文章代表了作者的个人观点,不代表W3C组织成员或者发表本文章的机构的观点。
    这篇文章鸟瞰了万维网的历史,现状和可能的发展方向。万维网简单的定义为全球性的通过网络可以获取的信息的总和。它是一个通过它人们能够交流的抽象的空间,目前它的主要的形式是内部相关联的文本、图像和动画,偶尔还有声音、三维世界和视频。它的存在标志着令人沮丧、令人感到虚弱的计算机系统之间无法相互接触的时代的结束。这种明智的爆发和潜在的对社会对经济的影响并没有悄然离去而丝毫不被注意,相反,它被比先前已经使用电脑的更大的群体所关注。这个系统中潜在的商机已经诱发了新特性的快节奏的发展,使得维持万维网所带来的全球性的交互能力成为所有关注者长期的任务。同时,它集中了一些将越来越迫切需要解决方案的研究领域,这些我们将只能在文章中顺便提及。按照许诺的一样,我们先由这个计划最初的目标开始,这个目标的构思是作为满足作者个人需要、组织和由科学家与工程师组成的更大型社团所认识到的需要,概括的说全世界的需要。
    历史
    在万维网之前
    超文本的思想起源能够追溯到历史性的工作,比如说Vanevar Bush 在1945年发布在《大西洋》月刊上的著名的文章《As We May Think》,在那篇文章中,他提出了通过对二进制编码、光电管和即使摄影术的处理,能够实现缩微胶片的相互引用和自动的追溯这种应用的Memex机器。接下来就是Doug Englebart的使用数字计算机提供超文本邮件和文件共享的“NLS”系统,这里的“超文本”的概念得到了Ted Nelson 的修正。尽管有这些思想,但是关于真实世界本身的高能物理领域却发现世界本身就是一个不一致的网络,磁盘格式、数据格式和字符编码方式,所有的尝试在不同系统之间传递信息都是令人畏缩的一般看来是不实际的工作。假如计算机越来越广泛的用于大部分的信息处理工作,以至于几乎人们想知道的任何事情都差不多一定记录在某个地方,这将是特别令人沮丧的。
    设计标准
    万维网的目标是成为人们(和机器)能够相互交流的共享的信息空间。
    目标是这个空间应该横跨私有的信息系统和公共信息,横跨价值高的仔细检查和设计的材料和只是对于一些人有意义也许以后没人会再看的即席的思想。
    万维网的设计基于一些标准。
    • 这个信息系统一定能够记录在任何对象之间的随机的联系,而不像大多数的数据库系统;
    • 如果两组用户开始独立的使用系统,从一个系统到另一个系统建立连接应该是一个增长性的工作,而不需要一个不可升级的操作,比如说合并相互连接的数据库。
    • 任何约束用户使用特定语言或者特定操作系统的尝试都注定要失败;
    • 所有的平台都能够获取信息,包括未来的;
    • 任何尝试约束用户关于数据的思维模型为某一特定模式的尝试注定要失败;
    • 如果组织的信息要在系统中得到精确的表达,输入或者纠正它对于明确的知道它的人来说是微不足道的事。
    作者的经验包括使用很多由物理学家设计私有的系统,同时包括他自己的允许随机连接、对于个人非常有用但是未被广泛的使用的咨询程序(1980)。
    最后,万维网的一个目标是:如果人和超文本之间的交互是非常基于直觉的以至于机器可读的信息空间精确的表达了人们的思维、交互和工作模式的状态,然后,机器的分析能够成为功能强大的工具,看着我们在工作中的喋喋不休的同时促进我们一起解决传统的困扰着大型组织的难题。
    基本架构原理
    人们在1989年提出了万维网的架构,图示如下。这一架构的设计就是为了满足上面的标准,并基于一些能够适用于网络的众所周知的软件设计原理。

    图片:1990年的最初的万维网架构图。粉色的箭头代表通用的标准:URL、HTTP和数据格式约定
    规范的独立性
    弹性显然是重点。每个规范需要保证约束万维网的实施和使用的互操作性。因此,尽可能少的东西需要特别的规定(最小约束),并且那些规范应该独立的制定(模块化和信息隐藏)。规范的独立性应该允许设计的一部分在保存基本架构的同时取代设计的任何部分。对这种能力的一种测试方法是以旧的规范替代现有的,来演示他们和新规范混和使用的能力。这样,在地址空间上,旧的FTP协议能够和新的HTTP协议混和使用,传统的文本文件能够和新的超文本混和使用。
    值得一提的是最小约束原理是保证万维网的可适应性的主要因素。无论哪种观点,人们需要作一些小的增量的改变来使用万维网,开始作为与现有系统平行的技术,然后把它作为基本的系统。这种从在基本原理的框架下从过去向现在的进化能力使得人们有理由相信从现在向未来进化会一样的顺利,一样的会有提高。
    统一资源标识符(URI)
    超文本的概念由来已久。传统的,尽管超文本的系统围绕着包含连接的数据库而建立的,但是从上述需求的角度来说,这并没有仔细对它进行衡量。然而它确实保证了链接应该是一致的,并且当文档被删除的时候链接也应该被删除。这种可移除的特性是万维网架构的原则性的妥协,这种能力通过允许建立引用而不必征求数据源的同意,保证了后来万维网迅速扩张后的可度量性。
    万维网中链接的能力是它能够指向信息领域的任何格式的任何文档 这就需要一个全球化的标识符空间。这些URI是万维网架构中的主要元素。现在众所周知的结构用一个前缀比如说“http:”作为开头以表明字符串的剩余部分所指向的空间。URI空间是一个通用的空间,在这个空间里任何一种具有标识、命名和寻址的语法的新的空间都能够被映射到一个能够出版的语法,并被赋予一个前缀,然后它能够成为URI空间的一部分。任何给定的URI的属性取决于它所指向的空间的属性。由这些属性决定,一些空间可能是“名称”空间,另一些可能是“地址”空间,但是空间真是的属性不仅仅取决于它的定义、语法和支持协议,还取决于支持它的社会结构以及标识符的分配和再分配的行为的定义。幸运的是,万维网架构并不取决于URI到底是明智或者是地址,尽管术语由IETF (Internet工程任务组)制定的“URL” 表明目前使用的大多数的URIs更多的是指向地址而不是名字。我们期待着一种功能更加强大的命名空间的出现,但是值得注意的是这并不是微不足道的事。
    标识符的不透明性
    一个重要的原理URI通常被当作是不透明的字符串:客户软件不允许看到它的本质,也不能根据它获得关于应用的对象的结论。
    一般的URIs
    URIs的另一个有趣的特征是它能够一般性的标识对象(比如文档):例如,我们能够为一本书指定一个URI,而这个URI可以是用多种语言写成的,可以包含多种数据格式。我们也能为同一本书指定一个使用特定语言的URI,或者为这本书的某个特定版本的比特流的表达形式指定使用某种语言和数据格式的URI。这样,一个万维网对象的“标识”这个概念考虑到了一般性,而在面向对象系统中则不一样。
    HTTP
    用于获取远程数据的协议,过去存在这样一个标准就是文件传输协议(FTP)。 然而,对于万维网来说这不是最优的,在万维网中它太慢了,并且自身就存在不足,因此人们要设计了一个新的协议来满足对传输超文本链的快速超作的需要,超文本传输协议被设计出来。人们把HTTP URIs分成两个部分,这样指向被寻址的文档。第一部分用于域名服务,来获得适合的服务器,第二部分是一个由服务器处理的不透明的字符串。
    HTTP的一个特性是它允许客户端从语言和数据格式角度详细指定参数。这样服务器能够在被请求的URI具有一般性的时候选择合适的特定对象。这种特性在很多的HTTP服务器上实现了,但是在客户端未被充分利用,部分原因是传输这些参数所要的时间太多,部分原因在于早先的一般的URIs没有利用这些参数。这一特性,就是所谓的格式约定,是HTTP规范和HTML规范之间相互独立的一个重要元素。
    HTML
    为了进行超文本的数据交换,人们设计了超文本标记语言作为传输的数据格式而不仅仅就是为了书写。 考虑到提倡全世界使用一种全新的全球化信息系统的可能的困难,HTML类似于基于SGML的系统以鼓励文件社团使用它,在这个社团里,人们使用SGML作为语言同时它也为了让超文本社团使用它,而这个社团认为SGML是唯一可能的格式标准。尽管采用SGML确实会使得这些组织更容易的接受万维网,但是SGML最终太复杂了,并且缺少一种定义好的语法,在SGML的完全的表达能力和HTML的易用性之间寻找这种曾经困惑了专家们很长时间。
    早期历史
    从概念的提出到采纳这一思想的过程是曲折的,对于万维网来说,它的发展也充满艰辛。说服每个人像以前那样使用系统,也就是仅仅拥有少数的听众并且只能表达关于他们自身的内容是明显不可能的。其发展的一些阶段如下。
    • 最初的原型出现于NeXTStep系统中(1990年10月-12月)。作为一个能够同时浏览的所见即所得(wysiwyg)编辑工具,它允许添加简单的链接和文档。然而,NeXTStep的可部署能力限制了它的可见性。这个最初描述网络的万维网使用这个工具编写,能够链接到声音和图像文件,并且发布在一个简单的HTTP服务器上。
    • 为了确保能够在得到全球范围的接受,Nicola Pellow开发了一个所谓的“线性模式”的浏览器,这个浏览器是允许万维网信息能在任何平台被检索的轻便的超文本浏览器。这就是那个时代很多人所看到的万维网。(1991年)
    • 为了给万维网“播种”数据,人们开发了第二个服务器在CERN的主框架下给继承性的地址簿数据库提供网关。这是第一个“有用”的万维网应用,这时候很多人把万维网看作是一个有着奇怪用户界面的电话本程序。然后,它使得一些线性模式的浏览器进入了桌面。这种网关服务器以后又出现其他的几种,这些使得万维网客户端至少在物理组织内部成为有用的工具。
    • 当在CERN没有更多的可获取的资源的组织的时候,Internet社团普遍的收到鼓励将万维网程序移植到其他平台。X windows平台的"Erwise", "Midas"和"Viola-WWW",Windows(TM)平台的"Cello"就是各种研究结果的客户端,但是不幸的是他们仅仅是浏览器,尽管PeiWei所提出的Viola-WWW很有趣的是基于一种解释性的移动编码语言(Viola),这在某种程度上能够和后来的很热门的Java(TM)相比。
    • 很长一段时间,Internet Gopher 被认为是可选的信息系统,它避免了HTML的复杂性,但是关于技术的谣传激起了人们对它的全面的重新评估。
    • 1993年美国全国超级计算机应用中心的Marc Andreessen在看了ViolaWWW以后,开发了"Mosaic",这是一个用于X的万维网客户端。Mosaic非常容易安装,后来支持内嵌图片,变得非常流行。
    • 1994年,Navisoft有限公司开发了一个更具有纪念意义的浏览器和编辑器,它能够以同一种模式来显示和编辑(这就是目前众所周知的“AOLPress”)。
    一个早期的万维网增长情况的统计是在info.cern.ch上的第一个万维网服务器的负载情况统计 (最初它和最早的客户端运行在同一台机器,现在它的网址就www.w3.org)。奇怪的是,由图可见(粗略的测定)它以稳定的指数函数形式增长,三年来每年增长十倍。这种增长是爆炸性的,尽管人们很难说具体的那一天比其他的日期更有意义。

    图片:从1991年7月到1994年7月,万维网客户端的增长情况。空白的点对应的数据丢失。甚至周末和工作日的增长比率也是非常稳定的
    那个服务器包含一些寻找和运行客户端和服务器的建议。它还包括介绍惯例的一个页面,这个页面中包括一些约定,比如说用于提供关于服务器的咨询的“网络管理员”的邮件地址,比如说仅仅是服务器名称的那个URL默认就是系统的入口,而不管服务器内部连接的拓扑结构如何。
    这发展到了一般大众都知道它,剩下的各种文档中就有很好的记录了。HTML最初只是想作为包括丰富多样的数据类型的超文本这片织锦前一片纬纱的东西,令人惊讶的到处存在。万维网开始驾驭计算机可用性和internet的连接性而不仅仅依赖它们。像“http:”这种类型的URL语法就像800号码一样向人们描述它自己。
    现状
    现在我们总结一下万维网目前的研究情况和一些最近的发展。
    不兼容和紧张
    URIs、HTTP和HTML这些通用的标准使得万维网迅速的扩张,也使得全世界企业和大学的资源能倍用于万维网的开发与扩展,这导致了大量新的数据类型和协议的出现。
    就数据格式的问题来说HTTP的处理任意数据类型的能力使得它能够轻易的扩展,所以比如说三位场景描述语言VRML或者用于传输移动代码的Java(TM)比特码的引入也十分容易。不容易的是服务器知道要支持什么样的客户端,因为格式协议系统并没有广泛的部署在各个客户端。这就导致了比如说一些糟糕的工程实践,例如在服务器上需要维护一个表来检查浏览器的性能和版本。这样使得引入新的浏览器变得很困难,同时当然的也难以管理。这导致了新的未被很多人了解的客户端为了获取服务器段的足够丰富的数据不得不在服务器面前“伪装”成一个众所周知的浏览器。同时还存在着MIME描述数据类型不充分的问题:text/html用于描述很多层次的HTML;当一个图片使用多少颜色引起了人们的极大兴趣的时候,image/png却用于表示任何的PNG格式的图像;Java(TM)文件到处传播却没有任何可见的关于运行时所需要支持的说明。
    推动兼容性和进步的力量
    从1992年开始,整个业界都强烈的担心万维网标准的分裂性将破坏是那么多开发、技术和商业应用的基础的信息领域。截至本文写作之时,这个组织有包括所有万维网技术的主要开发者和其他的一些其商业越来越依靠万维网的普遍性和功能的150个左右的成员。以美国的MIT和欧洲的Institute Nationale pour la Récherche en Informatique et Automatique为基础 ,这个组织为相互竞争的企业提供一个中立的让他们为了公共利益商讨公共规范的论坛。这个组织的任务是实现万维网的全部潜力,和我们后文中介绍的发展方向。
    从保护弱小到保证质量:PICS
    驱使网络协议发展的有时时基础架构的技术需要,比如说有效的缓存,有事是一些特殊的应用,还有时是万维网和它的建立基础的社会之间的联系。 Sometimes these become interleaved.有时,这些是交叉存在的。后者的一个例子是反映家长,学校和政府对少年儿童能够获取网上的下流、暴力或者其他的被认为是对他们有害的东西的担忧。在政府限制Internet应用的威胁或者更有甚者,政府审查下,组织迅速的作出反应,指定了W3C的Internet内容选择平台(Platform for Internet Content Selection ,PICS)。PICS为万维网架构引入了新的协议元素和数据格式,并对相关的可以用于未来发展的原理提供支持。
    本质上,PICS允许家长为他们的孩子的信息入口设置过滤,这些过滤能够将独立的等级服务反映到家长的选择上。这种方法哼明智的允许家长(而不是中央政府)为孩子定义什么是太“下流”,就像是Internet和万维网一样,是一种分布式的解决办法。
    技术上讲,PICS包括一个机器可读“文本”的规范。不想HTML,PICS文本设计的目的是给机器阅读,给过滤软件阅读。他们是属性—值对的集合,并且是自描述的,这样任何包含URL的文本在检查时都同时提供机器和人可读的对于属性和可能的值的语义的说明。
    图片:RSAC-i的等级安排。一个PICS格式的例子(译注:原文图片缺失)
    PICS标签可以使用很多方法获取。他们可能标在CD-ROM的表面,或者他们能够由与标注数据向配合的服务器发送(PICS 标签可以是数字化的符号,这样他们的权威性能够有他们的发行方式的独立性来验证)。他们也能从第三方实时的获得。这就需要一个协议的说明,这样组织!
    能够向组织B索取任何是组织C发布的信息的标签。
    很明显,这项技术会在关于通信的严肃性的压力之下很快地得到应用。它能够在很多其他方面得到应用。标签查询协议和标注检索协议是一样的。一旦部署,标签服务器能够在表达标签地同时提供标注服务。人们能够为承认和学术使用对材料进行评级,形成“承认标签”,让个人更明智的选购他们的读物。
    安全和电子商务
    如果世界通过交换信息和钱来工作,万维网允许我们交换信息,因此,下一步是很自然就是交换钱。事实上,如果把现金看作是不可锻造的货币,数字化的交换是不可能的。但是很多加密或者提供对承诺的担保的方案使得我们能够采用支票簿、信用卡和一些新的形式的支付手段。这篇文章中我们不可能仔细的讨论这些方法,也不可能讨论用于保证网络安全的各种方法。 加密以保证机密性、授权、不可抵赖和信息完整的能力不是最近才有的。现状是目前有很多提议采用特别的协议以保障安全,对于支付来说,也有越来越多的协议可可供使用。一个协议Netscape的“安全套接字”(Secure Socket Layer ,SSL)保证了会话的机密性,已经得到很好的应用。为了保证可扩展性,W3C正在研究一个草案来讨论使用那个安全支付协议。
    机器和万维网的交互
    至今为止,机器对万维网上信息的分析的主要方法还是使用搜索引擎进行基于文本的标引。有证据表明,搜索引擎是非常有用的,在搜索引擎中,我们能够对巨大的索引库进行检索以发现不明文档。也有证据说明它们是无用的,在使用它们进行搜索时,仅仅考虑了文件中的词汇,很少甚至不考虑文档的质量,因此产生了很多笑话。下面我们讨论向万维网添加包含合适定义的语义的文档会怎样支持更强大的工具。
    一些相关的有前途的思路时既包括对万维网的分析,还分析人们怎样和万维网进行交互,以自动获取相关的高质量的信息。一些这种类型的工具,高级的搜索工具被描述为“智能体”(因为他们按照用户的行为工作),尽管“智能体”这个概念一般用于可移动的程序。现在几乎没有通用的可移动“智能体”。移动代码用于建立有趣的数据人机接口(比如Java的Applets),使得用户能够进入新的分布式的应用。移动代码对于关于客户端和服务器软件的软件架构有更大的潜在的影响。然而,没有一个执行按照用户行为运行的移动程序(或者就是固定的万维网搜索程序)的可信网络,进步会非常有限。
    未来方向
    在总结了万维网的起源和目前状态之后,我们现在来看看一些可能的将在最近几年的发展方向。我们能把这些方向分成三个长期的目标。第一个包括基础设施的进步,提供一个功能更强,更具活力和高效的可获得的服务。第二个强化万维网作为人们交流和交互的手段。第三个是使万维网除了成为人们可浏览的空间外,包含丰富的机器可理解形式的信息,这样允许机器能够在分析万维网数据中起到更大作用,帮助我们解决问题。
    基础设施
    万维网设计之初,这些事实是主要特性,使得万维网的可度量的:任何人能够启动一个服务器,不需要向任何中央授权机构注册就能够快乐的运行,也不需要注册其他人的HTTP服务器的数量。如今这种可缩放性是不够的,客户端的数量是如此巨大以至于对于服务器所能操作的大体上于客户端的数量无关。这种情况就是文档的读者数量非常巨大以至于服务器的负载变得无法接受。
    此外,为了使万维网成为现实生活的有用的反映,一定要能够做到对不同文档所作的强调能够迅速显著的更改。如果一个很流行的新闻频道偶然的被某个上学的小孩的网上作品所引用,人们不应该期望学校有足够的资源以满足所有的突然之间对此感兴趣的人们进行拷贝的需要。
    另一个需要进步的原因是目前商业依赖万维网已经到了无法忍受其服务器和网络断供期的地步的事实。我们需要一个能够允许差错忍耐的架构。 这些都需要自动的有时是抢先的数据的复制。
    同时,人们也许不希望看到不得不为不同类型的数据手工配置磁盘和缓存时间的Usenet 新闻管理员所忍受的情况进一步恶化。
    人们也许更愿意选择一种能够自行配置使得可用资源能够最好的被各种组织所使用来优化服务质量的可适应的系统。这不是简单的问题,这包括下面一些问题
    • 对文档和用户进行分类这样来分组对他们进行处理;
    • 对那些特定小组对于特定的文档的高使用率情况进行估计;
    • 为快速存取决定文档拷贝的最佳位置;
    • 一个算法来根据URL以获取最便宜或者最近的拷贝;
    这些问题的解决方法必须包含在一个特定的,不同的基础设施的不同范围基于拥有不同优先权和政策的部分建造的环境中。
    这些是关于基础设施(万维网的基本架构)的长期的思考,短期看来,协议设计者正在提高HTTP通讯的有效性,特别是针对于那些使用电话Modem的用户的情况。
    人类通讯
    短期看来W3C或者其他地方为了使万维网成为一种通讯媒体的主要工作还是围绕着可用于不同可显示的数据格式来进行的:HTML的继续拓展,新的便携式网络图像(Portable Network Graphics,PNG)规范,虚拟现实建模语言(Virtual Reality Markup Language ,VRML)等等。我推测接下来的情况仍然是这样,尽管HTML将成为现有架构得一部分,但是仍然会出现新的格式,也许一种功能更强大,一致性更好得格式会最终取代HTML。长期看来,其他得一些改变将使得万维网用于人类通讯的潜力得以实现。
    我们已经看到万维网最初的设计目标是成为人们表达他们的共享的知识的空间。我们可以看到这是一个强大的工具:
    • 当人们把他们的理解放到一起建立超文本的时候,这些文本在任何时候都能阅读,这就减少了一次性信息产生误会的可能性。
    • 当一个新人加入某个小组的时候,他们能够看到过去所有的决定的记录和所有的有希望的可用理由;
    • 当一个人离开小组,他们的工作已经记录下来,所谓的将不再需要“任务报告”;
    • 对于网上关于某个项目的所有文档,组织的机器分析是非常激动人心的,也许能允许我们能够得到关于管理和再组织的个人难以阐述明白的结论。
    目标是万维网应该能成为个人信息系统,能成为任何范围的组织的工具使得从二人小组扩展到全世界以对社会生态问题作出决定。就像上文提到的一样,这个系统的本质的功能在于能够在这些层次移动和连接信息,使得它们之间的链接成为清晰的焦点,并在当这些层次收到损害是帮助人们维护它的一致性。
    在本篇文章写作的时候,万维网最著名的方面是忙于一般消费者人数的企业站点。组织中的万维网,也就是所谓的Intranet日益得到更多的注意。根据定义,估计万维网的私密部分的材料的数量是非常困难的。然而,仅仅存在数百个公共的服器的同时,一个大型的计算机企业就有超过100个内部服务器。尽管建立一个私有服务器需要考虑访问控制的问题,但是,一旦建立起来,由于它是一个组织、企业的一部分,参与者共有一个信任等级,这一事实将极大的推进它的使用。
    相比于公共信息需要更多的验证,上述问题将促使信息共享在一个更加自发的、更加直接的层次发生。
    最近的一个研究项目专注于一些万维网协议能够被改进以辅助合作使用的领域,其中包括:
    • 允许直接和万维网数据进行交互的更好的编辑器;
    • 当信息更改时对感兴趣的人进行通知;
    • 音频视频网络会议技术的整合;
    • 以可见和可分析的方法表达人类过程的语义的超文本链处理如论据,peer评论和工作流管理
    • 第三方标注服务器;
    • 可验证的授权,允许小组成员建立访问控制;
    • 作为包含版本控制、作者关系和所有权关系的第一类对象的链接的表示。
    最微观的角度,万维网应该能够很自然的用于个人信息系统。事实上,只有当全球数据和个人数据以一致的方法进行处理的时候,那才是很自然的。从人机接口的观点来看,通常使用“桌面”来暗喻的基本的计算机接口需要使用超文本进行整合。尽管他们并没有太大的差别:文件系统就像万维网文档一样也有链接(“别名”,“快捷方式”)。有用的信息管理对象比如说文件嫁和嵌套的文件列表需要转换成万维网上已经存在的标准的方式。直到到处存在的文件名对话框消失了,作者才不会觉得计算机系统中的文件名的重要性会降低。 关于信息的重要的东西能够最好的使用它的标题和以各种形式存在的链接来表示,比如说将文件包含在文件夹内,在“To:”域显示消息的Email地址,文档和它的作者的关系,等等。这些语义丰富的断言对于人来说是很有意义的。如果用户指定了一些信息,如访问一篇文档所需要的可用性和可靠性层次,文档可见度范围,然后剩下的就是系统管理最佳的磁盘空间这样提供所需要的服务的质量。
    最终结果,人们可能希望万维网成为一个一致性的,就像我们直觉中的信息世界,无论何时人们看着计算机屏幕、不管是袖珍屏幕还是起居室的屏幕或者礼堂的屏幕都能看到它的一部分。
    机器和万维网的交互
    就像上文所提到的,万维网发展的一个早期和长期的目标是如果机器能够精确的反映小组的知识和合作成果,那么机器分析将成为能够分析我们交流方式的和推动我们一起工作的工具。随着万维网商业应用的不断增加,这一目标发展到了允许计算机推动商业、担当拥有执行财务功能的个人代理的出现。
    这一切发生所需要的第一个显著的改变是万维网上那些对这个程序有潜在用途的数据以一种包含定义好的语义的机器可读的形式表达。  按照EDI(电子文档交换)的道路走下去,我们能够实现这一目标。在EDI中人们发明了一些纸质文档的电子等价物,如出价,抵押证券,所有权证书和发票。这样,各种形式的语义被定义成人们可读的规范的说明。可选的方法还有定义一种能够用来声明断言的通用语言,人们还能随时的在人们可读的文档中定义自明的概念。这样,这种语言综合不同领域的概念的能力将使得我们能够建立功能更加强大的能作为人们建立机器推理系统的基础的系统。 知识表达(KR)语言从某种成都来说是一种学术上很有趣但是对于计算机的应用却没有什么深远影响的东西。但是,在万维网在全球范围普及之前,超文本也是这样。在机器处理全球数据和加密安全之间存在着一种双向的连接。 为了使机器对各个领域的推理使有效的,机器必须能够验证在万维网上发现的断言的有效性:这就需要一种全球化的基础设施来保证对文档进行签名。相似的,全球化的安全基础设施在关于加密密钥和信任的信息中也似乎需要一种能够操纵复杂断言的能力。 着也许就是鸡和蛋的相互依赖关系,这些伴随着政府对于加密的使用的限制使得这两种系统迟迟不得使用。PICS系统也许许是这一方向的第一步,因为其中的文本是机器可读的。
    伦理和社会关注
    在1994年5月日内瓦举行的第一届万维网会议上,作者(指Tim)作了一个结束发言,其中说到,(万维网的研究)不只是纯粹的学术或者技术领域的问题,工程师们在设计协议的时候将会发现很多伦理的和社会学的问题,他们不应该认为这些问题是其他人应该解决的问题。那以后的很短的时间内,这种问题出现的频率越来越高。PICS提案表明了网络协议的形式囊构影响建立在信息空间基础上的社会的形式。
    我们所说的个人隐私权就只是我们在很大的广场中间所享有的权利,我们是不是也应该认为在一个通过网络连接的个体之间进行的谈话也属于隐私?我们的社会文明的中心环节——知识产权的概念就没有使用能够映射到抽象的信息空间的方法来表达 。在信息空间中,我们能够考虑到怎样表示作品的原作者和他们的思想,但是我们从上面也可以看到目前是怎样的需要一种潜在的基础设施来保证能够仅仅出于效率和可靠性的考虑来复制数据。用复制的方法来表达版权的概念是毫无意义的。此外,一旦机器自动的进行了复制,这就使得复制品有可能被占有,有个被认为是隐私的谈话就这样后来被曝光。确实,列举出所有的隐私成了一种妥协的方法是非常困难的,因为那些原来的手工操作现在变得非常的容易。内容提供者如何才能够获得浏览他们网页的人数的统计的反馈,而不需要牺牲个人隐私? 尽管数量小的时候这种问题是很无味的,但是人们向搜索引擎提出的问题是巨大的,这能够成为危害信息。
    长期看来,还有关于当地理的概念弱化成多元因素中的一个的时候,我们的文化将会怎样?网络会不会使得全世界都成为一元文化(美式文化),还是它会催生一种全新的目前不存在的利益集团? 它将会通过给选举的民众提供国家决策背后的显示允许真正的民主,还是它将会窝藏顽固的情感比真相更容易受人支持的犹太人区?这需要我们来决定,但是评估简单的工程决定对这些问题的影响的意义是重大的。
    结论
    万维网就像Internet一样,其设计的目的是创造人们所期望的“端到端”的效果,同时尽可能隐藏它的实现机制。如果土地法能够注意到这一点,能够表现出这种“端到端”的特性,那么在这种机制下没有政府或者其他的冲突是合法的,因为那将会破坏端到端的法则,这样它能够继续下去。 如果不是,那么工程师将不得不学习设计系统的艺术来保证不管发生彼此之间什么,端到端功能都能够实现。TCP所做的是保证可靠的数据传输(提供端到端目前网络不能提供的方法),加密保证机密性。未来的协议将会用来保证信息的所有权,支付和那些目前为地利条件所限制的人们交流的其他的方面。为了是信息空间成为能够解决下一代问题的强大空间,他的完整性,包括它独立于硬件,数据包路由。操作系统和应用软件的品牌都是至关重要的。它的特性必须是一致、可靠和平等,我们国家的法律需要和网络协议的规范一起来实现这一目标。
    引用
    还剩下足够的空间用于包括许多相关领域的参考文献。万维网将会有一系列的由中立社团举办的会议。更深入的论文和与万维网相关主题的提议,读者可参见过去和将来的会议。最近的两个会议的会议录如下
    Proceedings of the Fourth International World Wide Web Conference (Boston 1995), The World Wide Web Journal, Vol. 1, Iss. 1, O'Reilly, Nov. 1995. ISSN 1085-2301, ISBN: 1-56592-169-0.  [[Later issues may also be of interest.]
    Proceedings of the Fifth Internatonal World Wide Web Conference, Computer Networks and ISDN systems, Vol 28 Nos 7-11, Elsevier, May 1996.
    Also refered to in the text:
    [1] Bush, Vannevar, "As We May Think", Atlantic Monthly, July 1945.  (Reprinted also in the following:)
    [2] Nelson, Theodore, Literary Machines 90.1, Mindful Press, 1990
    [3] Englebart, Douglas, Boosting Our Collective IQ - Selected Readings, Boostrap Institute/BLT Press, 1995, <AUGMENT,133150,>, ISBN:1-895936-01-2
    [5] On Gopher, See F. Anklesaria, M. McCahill, P. Lindner, D. Johnson, D. John, D. Torrey, B. Alberti, "The Internet Gopher Protocol (a distributed document search and retrieval protocol)", RFC 1436 03/18/1993. , http://ds.internic.net/rfc/rfc1436.txt
    [6] On EDI, See http://polaris.disa.org/edi/edihome.htp

    --------------
    word形式:

    ---------------
    里面很多话翻译的很痛苦,所以读起来也会有点痛苦,希望大家帮忙指出来啊。
    另外声明,本文的翻译稿仅限于学术交流使用,请勿滥用,请尊重原作者的著作权和翻译者的劳动!


       收藏   分享  
    顶(0)
      




    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/21 11:46:00
     
     jiexincao 帅哥哟,离线,有人找我吗?
      
      
      威望:6
      等级:计算机学士学位
      文章:394
      积分:2379
      门派:XML.ORG.CN
      注册:2005/1/27

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给jiexincao发送一个短消息 把jiexincao加入好友 查看jiexincao的个人资料 搜索jiexincao在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看jiexincao的博客2
    发贴心情 
    本文中的两张图片:
    ---------------------
    图片:1990年的最初的万维网架构图。粉色的箭头代表通用的标准:URL、HTTP和数据格式约定
    按此在新窗口浏览图片

    ---
    图片:从1991年7月到1994年7月,万维网客户端的增长情况。空白的点对应的数据丢失。甚至周末和工作日的增长比率也是非常稳定的

    按此在新窗口浏览图片

    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/21 11:50:00
     
     apple403 美女呀,离线,快来找我吧!
      
      
      等级:大二(研究汇编)
      文章:32
      积分:243
      门派:XML.ORG.CN
      注册:2005/8/12

    姓名:(无权查看)
    城市:(无权查看)
    院校:(无权查看)
    给apple403发送一个短消息 把apple403加入好友 查看apple403的个人资料 搜索apple403在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 引用回复这个贴子 回复这个贴子 查看apple403的博客3
    发贴心情 
    正在找这个方面的内容就在这里碰到了,真是谢谢了!
    点击查看用户来源及管理<br>发贴IP:*.*.*.* 2005/8/21 21:23:00
     
     GoogleAdSense
      
      
      等级:大一新生
      文章:1
      积分:50
      门派:无门无派
      院校:未填写
      注册:2007-01-01
    给Google AdSense发送一个短消息 把Google AdSense加入好友 查看Google AdSense的个人资料 搜索Google AdSense在『 Semantic Web(语义Web)/描述逻辑/本体 』的所有贴子 访问Google AdSense的主页 引用回复这个贴子 回复这个贴子 查看Google AdSense的博客广告
    2024/5/21 21:45:15

    本主题贴数3,分页: [1]

    管理选项修改tag | 锁定 | 解锁 | 提升 | 删除 | 移动 | 固顶 | 总固顶 | 奖励 | 惩罚 | 发布公告
    W3C Contributing Supporter! W 3 C h i n a ( since 2003 ) 旗 下 站 点
    苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
    4,007.813ms