书城社科网络传播实务
21172900000004

第4章 网络传播原理(2)

流式传输的过程原理如下:

①用户选择某一流媒体服务后,Web浏览器与Web服务器之间使用HTTP/TCP交换控制信息,以便把需要传输的实时数据从原始信息中检索出来。

②Web浏览器启动音/视频客户程序,使用HTTP从Web服务器检索相关参数对音/视频客户程序初始化,这些参数可能包括目录信息、音/视频数据的编码类型或与音/视频检索相关的服务器地址。

③音/视频客户程序及音/视频服务器运行实时流协议,以交换音/视频传输所需的控制信息,实时流协议提供执行播放、快进、快倒、暂停及录制等命令的方法。

④音/视频服务器使用RTP/UDP协议将音/视频数据传输给音/视频客户程序,一旦音/视频数据抵达客户端,音/视频客户程序即可播放输出。

原始音/视频流经过编码和压缩,形成媒体文件存储后(直播的方式不需要文件存储),媒体服务器根据用户的请求把媒体文件(或者直播的媒体流)传递到用户端的媒体播放器。在媒体传输中间还可能需要代理服务器进行媒体内容的分发或转发。

(4)Web数据库技术

因特网是目前全球最大的计算机通信网,它遍及全球几乎所有的国家和地区。WWW系统是一个大型的分布式超媒体信息数据库,它极大地推动了因特网的发展,已经成为因特网中最流行、最主要的信息服务方式。它能够把各种类型的信息资源,如静态图像、文本、数据、视频和音频有机地结合起来,使用户能够在因特网上浏览、查询和共享建立在WWW服务器所有站点上的超媒体信息。目前Web技术与数据库管理系统(DBMS)相互融合领域的研究已成为热点方向之一,数据库厂商和Web公司也纷纷推出各自的产品和中间件支持Web技术和DBMS的融合,两者取长补短,发挥各自的优势,使用户可以在Web浏览器上方便地检索数据库的内容。所谓Web数据库管理系统是指基于Web模式的DBMS的信息服务,充分发挥DBMS高效的数据存储和管理能力,以Web这种浏览器/服务器(B/S)模式为平台,将客户端融入统一的Web浏览器,为因特网用户提供使用简便、内容丰富的服务。Web数据库管理系统必将成为Internet和Intranet提供的核心服务,为因特网上的电子商务提供技术支持。

(5)搜索引擎技术

目前,计算机信息检索功能已经从基本的布尔检索、截词检索、邻近检索、短语检索、字段检索发展为高级的加权检索、自然语言检索、相关信息反馈检索、模糊检索和概念检索。网络信息检索的核心工具是搜索引擎。

搜索引擎的目的是帮助新闻工作者和受众寻找信息资源。在因特网环境下,其典型实现是基于关键词匹配的信息检索机制。搜索引擎主要由四部分组成:搜索器、索引器、检索器、用户接口。

搜索器的功能是在互联网中发现和搜索信息。它要尽可能快、尽可能多地搜集各种类型的信息,同时还要定期更新已有信息,避免死链接和无效链接。

索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表,建立起自己的物理索引数据库。一个搜索引擎的有效性在很大程度上取决于索引的质量。

检索器的功能是根据用户的查询指令在索引库中快速检索出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性的反馈机制。

用户接口的作用是输入用户查询、显示查询结果,提供用户相关性反馈机制。

搜索引擎的工作原理。搜索引擎起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的倒排文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。互联网搜索引擎除了需要有全文检索系统之外,还要有所谓的“蜘蛛”(Spider)系统,即能够从互联网上自动收集网页的数据搜集系统。蜘蛛将搜集所得的网页内容交给索引和检索系统处理,就形成了我们常见的互联网搜索引擎系统。当然,一个完整的搜索引擎系统还需要有一个搜索结果的页面生成系统,也就是要把检索结果高效地组装成互联网页面。当系统的访问量(Pageview)变大时,页面生成系统往往会成为整个系统的瓶颈。与传统的信息检索理论研究不同,搜索引擎的用户看重的是系统的稳定性、速度、易用性和返回的信息量及相关度。

据专家评测,目前主要搜索引擎返回的相关结果的比率不足45%,其原因是现有的因特网搜索引擎拥有极少量的知识,并且是面向最一般的用户模型。不划分知识领域,不对用户建立任何描述以及使用关键词匹配的交互方式,都限制了搜索引擎的使用效率。智能搜索引擎的概念因此而被提出来。

新一代中文智能搜索引擎是一个基于汉语语法、词的上下文和语义等的中文信息处理技术,能自动收集、识别因特网上的WWW和News信息,智能化地提取摘要和关键词、建立索引、提供查询和对不良信息的监控、报警功能和网络信息自动发现和查询系统。[它以加权的启发式搜索算法控制信息资源的搜集,采用了一种加权的启发式搜索算法。]系统根据用户配置的领域导向词和资源服务器所在地域的信息,以启发式函数计算每个URL的权值,并选择权值高的URL优先访问。

智能搜索引擎可以根据互联网本身的链接结构对相关网站用自动方法进行分类,再加上结构严谨、萃取精华的开放式信息目录,为每一个搜索请求迅速提供准确的结果。

智能搜索引擎可以预期用户的需求,并可有效地抑制关键词的多义性。

智能搜索引擎还可以采用协同式检索方法。该方法一般用于一个特定的用户(如一个或一组新闻工作者、一个新闻媒体、一个或一组受众)。协同式方法有时又称为公众学习方法,它将其他用户的反应反馈给当前的用户。系统不去计算分类项目的相似程度,而是计算用户之间的相似程度。协同式方法不分析分类项目的内容。协同式方法一般用于非文本化的数据,如电影、音乐等,但是有的系统将其用于文本数据的挖掘,如新闻过滤等。已有一些系统用于电子邮件处理、会议时序安排、电子新闻过滤和娱乐节目推荐。

与智能搜索引擎技术相关的还有信息智能“推”技术和个性化检索技术。

基于网民和新闻工作者访问互联网的特点,在用户拉取信息的搜索过程中,根据其输入的关键词,通过机器学习,可以识别和预测其兴趣或偏好,从而有针对性地、及时地向网民和新闻工作者主动推送相关知识和最新信息和新闻线索。推送的形式可采用频道式推送、邮件式推送、网页式推送或专用式推送。目前已有构造Web访问模式树(Web tree)的算法,可从大量信息访问日志中挖掘用户访问信息的模式。也可从用户访问文档的超链接来预测用户的访问偏好,其知识发现采用关联性法则。

(6)网格技术

网格(Grid)计算,顾名思义,就是指将多个计算机组成网格状网络。“grid”在英文中是“方格”的意思,是一种“模拟实现高性能计算机”的技术。假如有一项业务使用速率为1G的CPU需要6分钟的处理时间,如果网络中有6台安装了同样CPU的计算机,可以把这项业务平均分成6等份,分别交给每台计算机进行处理,那么,理论上这项业务的处理时间将缩短到1分钟。这就是网格计算的基本思路。简单地讲,网格把整个因特网整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。当然,网格并不一定非要这么大,也可以构造地区性的网格,如企事业内部网格、局域网网格,甚至家庭网格和个人网格。事实上,网格的根本特征是资源共享而不是它的规模。作为信息社会的网络基础设施,网格将连通一个个信息和资源孤岛,让人们的工作和生活变得更方便。

网格是一种新兴的技术,正处在不断发展和变化当中,因而网格尚未有精确的定义和内容定位。目前学术界和商业界围绕网格开展的研究有很多,其研究的内容和名称也不尽相同,比如国外媒体常用“下一代互联网”、“Internet2”、“下一代Web”等来称呼网格相关技术。但“下一代互联网(NGI)”和“Internet2”又是美国的两个具体科研项目的名字,它们与网格研究目标相交叉,但研究内容和重点有很大不同。企业界用的名称也很多,有内容分发(Contents Delivery)、服务分发(Service Delivery)、电子服务(E.service)、实时企业计算(Real.Time Enterprise Computing,RTEC)、分布式计算(Peer.to.Peer Computing,P2P)、Web服务(Web Services)等。我国有关专家认为,网格实际上是继传统互联网、Web之后的第三次浪潮,可以称之为第三代互联网应用。

2.Web2.0模式下的新技术及其应用形式

(1)Web2.0的新模式

近年来,伴随新一代互联网技术的蓬勃发展,IPv6、网格计算、语义网、P2P(Peer to Peer,对等网络技术)等核心技术概念越来越多地出现在人们面前,“Web2.0”(也被称为互联网2.0)这个名词,在媒体上出现的频率越来越高。Web2.0其实是相对Web1.0(2003年以前的互联网模式)的新的一类互联网应用的统称,是一次从核心内容到外部应用的革命。网络由现行的单纯通过网络浏览器浏览HTML网页的Web1.0模式向内容更丰富、联系更广泛、工具性更强的Web2.0模式的发展。在Web2.0模式中,Blog(博客)、Wiki(维基百科)、RSS(简易信息聚合)、BT(下载)、TAG(标签)、SNS(社交网络)等这些带有鲜明Web2.0特征的网络应用形式,不仅带来了网络产业的升级,也给旧的传播观念、传播模式带来了巨大冲击。新一代互联网将使网络的能量再次成倍增长,而Web2.0更多的是信息互动传输,即应用方式的新变革,它可能会对网络中人与计算机、人与信息、人与人的关系产生重大的变革推动力。在Web2.0中,用户成为信息制造的中心,拥有更多点对点传递信息的渠道,网络个人化、社会化、自组织等新的传播特点日益凸显出来,一场以“交互”为核心的互联网创新浪潮已经扑面而来。

与Web1.0时代网站之间互不相通、各网站自行其道相比,Web2.0时代借助RSS和XML技术实现网站之间的交流,用户可以根据自己的喜好,自由选择信息。但这一切还仅仅是表面现象,Web2.0倡导的个性化,与传统网站的个性化有本质的区别。在传统门户网站中,个性化意味着页面设计风格和内容组织方式而非内容本身,不管怎样都没有脱离大而全的中心门户的特点。Web2.0倡导的个性化则意味着精而专,网站之间有明确的分工。简而言之,Web2.0时代的个性化不是原来的网页个性化,而是服务个性化。

(2)Web2.0的相关技术

随着Web2.0的发展,相关技术也逐步涌现,比如AJAX、开放式API等。

①AJAX

AJAX的全称是Asynchronous JavaScript and XML,它不是一种技术而是多种技术的组合。AJAX采用远程脚本调用技术,通过JavaScript语言与XML Http Request对象来实现数据请求,将数据处理由服务器转移到客户端,减少了服务器的资源占用,加快了数据处理的速度。也就是说,服务器仅需发送数据信息和指令,由客户端解码呈现。采用AJAX开发的软件能让用户在使用网络应用软件时感觉就像在本机上一样。这一技术已经延伸到移动通信领域,是提高手机网络速度、增强其便捷性从而提升其竞争力的重要动力之一。

目前AJAX技术已经广泛应用于网络应用软件开发中,Google也许是AJAX技术开发投入最大、收获最多的公司,AJAX已经成功应用于GMail、Google Suggest和Google Maps等网络应用软件中。

②开放API

以前的开放API(应用程序接口)主要指桌面应用软件,希望通过开放API融合更多的应用。在Web1.0时代只有少数网站,比如ebay、亚马逊公司(Amazon)、Yahoo公司、Google公司等,在设计之初就遵循各种工业化标准,进而开放API接口,正是由于开放API,产生了不少有趣的应用。但大多数公司当时还没有这种意识,不过在Web 2.0时代,开放API已经成为不可忽视的趋势,这是因为对于公司来说,技术领域的竞争已经演化为标准之争,标准的形成在于有多少人在使用,因此开放API就意味更多的人采用,也就意味着标准。

③内容协同

基于XML的多种内容格式和基于这些格式的互操作/通信协议,包括RSS、RDF(RSS1.1)、Atom以及大量的微格式;而FOAF XFN等特别设计的格式和协议(主要是基于社会型网络Socialnetworking)扩展了Web 2.0网站的功能,允许用户分布式交互。