万维网技术走到尽头 “语义网”将成下一代网络

2011-8-01 14:39 来源: 科技日报
1035 收藏到BLOG

图为英国雷丁大学信息科学研究中心副主任唐银山博士

  自上世纪七十年代被美国人发明以来,网络的发展超乎所有人的想象,给社会带来了巨大的影响。人们惊讶于如今的网络力量的同时,不禁要问,未来的网络发展方向如何?下一代网络又该是什么样子?为此,《科技日报》记者近日对英国雷丁大学信息科学研究中心副主任唐银山博士进行了专访。

  社交网络已是巅峰,万维网技术走到尽头

  唐银山指出,网络的产生要感谢美国军方。自1969年美国国防部高级研究计划局(ARPA)提出构想后,经过近20年的努力,网络构想一步步变为了现实。1989年,被称为互联网之父的英国人蒂姆·伯纳斯-李提出万维网(WWW)构想,并于1991年创建了世界上第一个网站http://info.cern.ch/,互联网进入飞速发展阶段,各种网络新应用层出不穷,互联网成了人们相互交流、相互沟通、相互参与的互动的一个平台,它改变了人们的生活方式,改变了经济运行的模式,改变了社会发展的轨道。

  唐银山说,在互联网发展史上,社交网络的出现是一件大事,有不少人将其看作是第二代互联网,但实际上这是一个误解。基于Web2.0技术的社交网络,脸谱也好,推特也罢,确实很大程度上改变了社会生态,成为近十年互联网发展的重要一步,但冠之以其“第二代互联网”则显牵强。社交网络是万维网技术的最新应用,实际上也是万维网技术应用的巅峰。自社交网络诞生以来,近十年中再没有值得注目的新的网络应用诞生,这也意味着万维网技术已经走到尽头。

  遵循网络发展规律,语义网将成下一代网络

  如今人们对网络的依赖如此之大,网民对网络体验的要求越来越高,而万维网技术已发展到极致,无论是网络发展的客观规律,还是网络用户的体验要求,都催生着下一代互联网的研究。

  唐银山指出,根据符号学的理论,符号可分三个层次,即符号(Syntactic)、语义(Semantics)和所指(Pragmatics),而网络发展则可以用这三个层次来对应,意即符号网络(Syntactic Web),语义网络(Semantic Web)和语用网络(Pragmatic Web)。万维网属于符号网络,而下一代互联网,则应该是科学家们已经开始着手研究的语义网络。至于语用网络,则是一种完全智能化的网络,那将是人类发展网络的终极梦想。

  语义网,顾名思义,就是能够根据语义进行判断的网络,它不仅能够理解人类的语言,且可以使人机交流变得如人与人交流一样轻松。语义网是智能网络,它可以说是脱胎于万维网,但与万维网完全不同,万维网面向的是文档,而语义网面向的则是文档所表示的数据。如伯纳斯-李所言,万维网使得所有的网络文件看起来像一本巨大的书,而语义网则使网络上的所有数据汇总成为一个巨大的数据库。

  语义网以一种计算机可以理解的方式来描述事物,它会理解事物之间的关系(如A是B的一部分)以及事物的属性(如体积、重量、年龄、价格)。唐银山举例说,match一词,在万维网中,仅是“火柴”(当然还有如“比赛”等其他意思),而在语义网中,计算机不仅会理解match的“火柴”表面含义,还知道它是一个一端包裹着药料的木制小棒;而到了语用网中,计算机则知道match可以用来燃火,可以用来摆设图形(一种智力游戏)等等实际应用。

  语义网研究引关注,投资意愿影响研究进展

  唐银山指出,语义网的核心技术是资源描述框架(RDF)和可扩展标记语言(XML),目前研究表明,实际的语义网页的创建已不是难题。欧洲的许多政府组织网站上已有不少的RDF格式网页。虽然目前来看还很难判断发行RDF格式网页的好处,但这正如国家要建设其交通系统一样,RDF格式网页的创建正是第二代网络的基础建设之举。

  在万维网联盟(W3C)中,已有许多人开始了语义网的相关研究。唐银山介绍称,W3C中有一个语义网行动组织,其中包括语义网协调小组、RDB2RDF工作组、FDF网络应用工作组、SPARQL(查询语言)工作组等。此外还有许多团队也在进行着语义网的相关研究与推广工作,如OWL (网络本体语言)工作组、规则交换格式工作组、语义网教育延展服务小组等等。

  唐银山说,目前谷歌公司正在致力于将RDF编码格式网页融入其搜索结果中。而最近,有报道称美国谷歌、微软和雅虎三大IT巨头联手推出了schema.org,希望以此鼓励包含语义标注的网页的开发,从而使所涉及的页面数据能够被搜索引擎所理解。这一行动表明,语义网已开始引起业界关注,语义网研究将逐步向实际应用方向发展。

  唐银山强调说,相比于先进的科学发展速度,语义网的研究进展不是很快。其中一个原因是语义网的开发源于逻辑与人工智能领域的研究人员,不太容易被大众理解,这一认知过程需要时间;另外,投资意愿也影响着语义网的研究开发,少有私营机构愿意投入巨资进行推进,政府部门对此很感兴趣,但与市场渠道相比,其融资能力有限,欧洲的情况即是如此。

  智能网络知你心,但不可替代你的大脑

  唐银山说,语义网具有智能网络的一些特点,它可知你心,却无法替代你的大脑。那种网络具有思维能力,终有一天会统治世界的想法目前来看只是一个幻想。

  智能网络不能比拟人脑的原因,一是在具体结构上,人脑是计算机目前无法比拟的:人脑中拥有大约1000亿个神经细胞、每秒钟会生成100万个新的神经连接,这些都是计算机所无法比拟的。二是较之结构更重要的,人所具有的情感因素是计算机无法拥有的。唐银山说,计算机所拥有的计算能力是一种精确计算,这种经人类编程后的精确认知,带给计算机的是一种优化逻辑,这也是“深蓝”们可以下国际象棋,并战胜人类“世界棋王”的原因;而人类具有模糊计算的能力,可以对复杂事物进行模糊度量、识别、推理,进而抽象,这一点是计算机的精确认知所无法达到的。因为无法抽象,计算机也就不会具有人脑所产生的情感意识,不会因成功而喜悦,因孤寂而悲伤。

  唐银山最后指出,如果网络要真正实现智能化,那么其在结构上就需要有一场革命性的变革,需要在化学模型、物理学模型、数学模型以至于哲学模型等方面有革命性的创新。也许有一天,网络终会拥有像人类一样的智能,但这条路依然遥远。