监理公司管理系统 | 工程企业管理系统 | OA系统 | ERP系统 | 造价咨询管理系统 | 工程设计管理系统 | 签约案例 | 购买价格 | 在线试用 | 手机APP | 产品资料
X 关闭
南昌OA信息化

当前位置:工程项目OA系统 > 泛普各地 > 江西OA系统 > 南昌OA系统 > 南昌OA信息化

营造播存网格

申请免费试用、咨询电话:400-8352-114

文章来源:泛普软件

■ 关于“互联网本质”的讨论,已成为跨越科技、经济、政治、社会乃至诸多边缘科学领域的热点话题。各种学术研讨、科技论坛、技术研发,乃至科幻电影,都围绕着互联网做了大量热烈的讨论。

■ 最近一段时间,中国工程院院士李幼平关于“互联网的无尺度现象”的学术观点,在业界产生了广泛影响。立足于现象,发掘其成因、规律,并通过可计算的数学逻辑,对互联网进行客观分析,在此基础上,李幼平提出:互联网是一个无尺度分布和随机分布并存的网络!

■ 并且,他在此基础上阐述了互联网次级结构——播存网格的概念、结构和示例,以帮助克服现有互联网的数字鸿沟,为营造“存文化于民间”的环境、实现信息共享的历史性跨跃,提供了一种新思路。

■ 更进一步,李幼平院士据此提出双结构互联网的思想、概念和框架结构。

■ 《计算机世界》近日特约李幼平院士就其研究方向为本报撰稿,以使读者能够深入浅出地了解纷乱互联网背后所隐藏的本质,以及互联网的未来发展方向。

近年来的科学实验发现,万维网网页的连接数服从幂次律分布,互联网也因此成为无尺度网络。普通网民对互联网的访问具有明显的“群聚”特征,大多数网民的访问对象集中于为数不多的网站,因此,只需把数千个热门网站整合起来,就可以形成满足绝大多数人日常需求的主流资源。

我们提议,互联网在保留TCP/IP主体结构的基础上,增添一种“卫星广播和分布存储”的“播存结构”作为次级结构。通过次级结构广泛复制数千个网站的内容,让每一栋大楼与每一个自然村都拥有主流文化资源,营造“存文化于民间”的全国环境,实现信息共享的历史性跨跃。如图1所示。


图1 双结构互联网示意图

用“透明计算”模式整合互联网的主、次两级结构,用户只需提出内容需求,网页将自动以最低成本的方式到达用户端,用户无需感知网页是来自何种网络。这一思路将有助于创造类似于水电服务那样简便的信息共享服务。

1 互联网中的无尺度现象

互联网是20世纪人类最伟大的发明之一,自1969年Internet的前身ARPANET诞生以来,计算机网络技术飞速发展。以TCP/IP协议为核心的网络互联技术实现了计算机硬件的连通,形成了全球范围内计算机互联的基础设施,即Internet。在此基础上,以HTTP、HTML和URL为核心的Web技术,实现了信息资源的互联,使Internet进一步演变成全球性共享文化的巨大平台。


图2 互联网的三个发展阶段

从互联网普及的角度考察互联网的发展阶段,可以将其划分为Net、Web和Grid三个时代。如图2所示,其中横坐标代表时间轴,纵坐标p为普及指数(pervasive index),代表参加联网的计算机总数与人口总数之比。

在互联网诞生初期的Net时期,网络仅仅作为科学家之间的一种联络工具,联系数量不多的计算机。这个时期平均每一万人才有一台计算机,p值小于万分之一。

20世纪90年代之后,Web的应用开始了网络的公众认可期,WWW作为搜寻信息的文化工具,采用一对多的Client/Server结构,p值跃升到0.01至0.1。

进入21世纪以来,互联网正在进入广泛应用计算机的网格(Grid)时代,网格所追求的目标是全部的人通过计算机共享信息,采用pervasive/Grid结构,计算机成为一种遍及化的工具,联网的计算机总数将接近甚至超过人口总数,p接近或超过1。

从以上分析可以看出,互联网正在朝着“普适化”(pervasive)方向发展。普适化既深刻影响着人类的文化活动,又使得人类的文化活动渗入互联网的发展过程中,使得互联网的发展脱离了纯粹的技术范畴。也就是说,人类的文化活动随着其与互联网的深入结合又反过来深刻地影响着互联网的发展,包括互联网发展阶段的划分、互联网的主流技术,甚至是互联网的网络结构。

互联网演化为无尺度网络

最近几年,美国科学家A.L.Barabasi等人用统计物理学的实验方法发现,文化活动悄悄改变着网络运作的数学模型,由原先正态分布的随机模型转变为幂次分布的无尺度(scale-free)模型。

“无尺度”是什么意思?理论家把庞大复杂的网络,分解为“节点”(node)和“连接”(link)两大要素; 提供内容的网站和接受内容的网民统称为“节点”,而内容在节点间的运动称为“连接”。一个网站的社会作用或文化地位,可以用该网站与外界的连接数来衡量。如果某个网站很长时间也没有人来连接,表明网站的社会影响不大,文化地位不高; 反过来,如果连接频繁,作用就大,地位就高。

网民对网站的访问,可以说是独立、自由的,完全取决于网民本人的主观意愿。在做大量统计实验之前,科学家预测,连接数应当服从泊松分布或正态分布,即每个网站的被访问量差异不会太大,就像人类身高差异不会太大那样。然而,实测结果推翻了这个预测。Barabasi等人设计了一种软件,可以从一个节点跳到另一节点,收集并记录网上的所有连接。在对几十万个节点进行统计之后,他们获得了令人惊异的结果: 当绝大多数网站的连接数很少的情况下,却有极少数网站拥有高于普通网站百倍、千倍甚至万倍的连接数。

这就像在茫茫人海中突然发现若干身高数百米巨人一样令人吃惊。巨人的身高之大,已不能用普通人高度的尺度来度量,于是“无尺度”一词被应用,以形容少数节点连接数大大超出普通节点的现象。

尽管万维网(WWW)中能够提供内容的网站很多,网页量更是天文数字,但是,有能力长时间吸引众多网民大量访问的网站,却为数非常有限,使用连接数作为判断依据,可以把少数对社会贡献特别大的热门网站从信息海洋中分离出来。

我们在实际网络中看到的现象正是如此。尽管中国境内向网民提供内容的网站多达67万个,但是,其中只有为数不多的网站,才拥有网民感觉丰富无穷尽的大量内容,具有接纳足够多人同时访问的高带宽,有条件演化成热门网站,我们把这些拥有大连接数的热门网站称之为互联网中的集散节点。就目前来看,互联网中的集散节点除了新浪、Google、Yahoo等门户网站外,就是己经上网的报纸、期刊、通讯社、电台之类的专业“网络传媒”。

在某种意义上,正是这些集散节点的客观存在,影响了网络运作的数学模型,使得互联网从早期的随机网络演变为目前的无尺度网络。

无尺度现象的成因

无尺度现象的成因,可以从多个角度解释。Barabasi等人解释,优先连接性和网络的成长性是两个起因。

所谓成长性指网民网页都急剧增加; 优先连接性指新网民总是优先选择前人经常访问的网站,随着时间的推进,某些热门的网站愈加热门,不知名的网站受访问的机会越少。计算机仿真可以演示出:万维网如何由相对均衡分布的随机网络逐渐演化为极不均衡分布的无尺度网络。

哲学家解释这一现象时认为: 存在决定意识。某人选择连接某一网站,虽然是一种个人意识。但人类生活在同一地球上,相同或者相似的客观境遇,使得人群中有相同或相似的个人意识。大量的统计,把深藏于个性中的共性强烈地反应出来了。充分的自由民主,在一定条件下,有可能转化为高度的集中统一,这是“对立统一”的例证。以DNA为例,DNA虽然是个性标志,但人与人之间的码元99%以上是相同的,说明个性中潜在存有共性。

无尺度现象给信息科技工作者带来很多启示。它首先让大家认识到: 信息社会同时兼有“大世界”与“小世界”两种属性。一方面,网民、网页、带宽随时间快速成长,使得万维网成为名副其实的全球范围内的巨大网络(World Wide Web); 另一方面,每个人一天之内所能接受的信息,受到生理带宽与生理精力的限制,又是一个不随时间变化的小世界。大世界与小世界之间,技术世界同“以人为本”的人文世界之间,存在明显的差异与矛盾,而这一矛盾的主要方面在用户端。

用户感觉到,数十万网站和数百亿网页,犹如“信息孤岛”,实在难以分别直接面对。他们希望出现一种能承大启小的“中间代理”,使用户很容易对这个统一的中间代理表达自己的需求,有兴趣的内容又会通过中间代理主动地流入自己的家中。“中间代理”是什么?它正是无尺度现象所指出的、由热门网站构成的群体。由数百或数千资源构成的热门群体,是网民通过民主的方法由大家“选举”出来的,是人类文明进程的自然产物,值得我们倍加珍惜。

如何整合资源

中国工程院最近组织的“信息基础设施和资源共享”发展战略研究论坛上,李国杰院士指出“信息取精是关键”,李德毅院士也认为,当前的迫切目标是让“适当的人在适当的时候享用适当的信息”。

无尺度现象告诉我们,要求所有的人享用所有信息,既不可能,也没有必要。关键问题是,如何“取精”?对绝大多数普通用户而言,什么是他们日常最适当的信息资源?这两个问题必须用科学统计的结果来回答。可以像Google的Page Rank软件那样,把网民对网页的访问数,看成是网民对资源的“民主投票”的结果,以这个数据作基础,判断该信息资源对推动社会进步所可能做出的贡献,决定它是不是属于“主流资源”,可否成为我们整合的对象。

也就是说,借助幂次定律作为工具,把茫茫无边的信息资源一分为二,把满足广大人民日常需求的主流资源,甄别出来,整合起来。由此,必须首先回答,中国互联网信息资源连接数,服从什么样的幂次分布。中国工程物理研究院马卫东等几位年青人,根据中国互联网中心CNNIC发表的实测数据,初步描绘了我国万维网网站连接数的数学模型(这一过程中利用了CNNIC提供的相关数据,因此很具现实性,如表1所示)。

表1 CNNIC提供的连接数据

他们建立的数学模型,最后获得的幂次数大约为2.124。依此模型推算,当99.5%以上的网站连接数均低于100次时,却有万分之四的网站大于1000次,十万分之三的网站超出10万次。因此,只要整合2至3千个网站作为主流资源,就可以在很大的程度上满足老百姓的日常需求。

按幂次规律整合主流资源的同时,也应关注连接数较少的网站。这些网站是大量存在的,数量比主流网站多几百倍、几千倍。为什么它们的连接数较少,有三种可能: 1.有些网站因为内容质量较差,属于竞争中的失利者; 2.有些网站品味很高,专业性太强,很少人看得懂; 3.还有一些网站属于“真理掌握在少数人手里”,只是暂时未被大多数人接受而已,虽然没有列入被整合的“主流”名单,但绝不等于应该列入取缔对象,它们将继续“散居”于互联网之中,静候网民的按需访问。

互联网应增添次级结构

两种资源并存的现实给我们带来了新的思考: 互联网是否应该增添一种专门用于传播主流资源的次级结构?让主流资源通过卫星广播直达全国城乡,克服数字鸿沟?在主流信息大量分流后,主结构也将变得“轻松”。


图3 双结构互联网的示意图

如图3所示,我国大约有一亿网民,有67万个Web站点,这是两个直径很大的圆。根据无尺度(scale-free)规律,其中属于主流资源的不会超过几千个站点,这是一个很小的圆。小圆是Web服务的“芯”(core),也是主结构的“芯”,如果我们把“芯”镜像出去,在广播中心营造几何上的第二中心,通过广播的机制,直接覆盖全国乡村与城镇,就形成互联网的次结构。

双结构中的主结构(primary)可依靠现有互联网技术,而次结构(secondary)则可依靠播存网技术,两者之间的区别比较如表2所示。

表2 双结构互联网中主次结构的比较

播存结构的终端有两类: 一类是个体用户,一类是采用透明计算模式的团体用户。透明计算的服务器,从右边收存大量来自播存结构的低成本信息资源,左边通过现有的电信网与主结构双向互联,形成整合主次结构的“跨网”机制。

清华大学首创的透明计算还实现了操作系统的共享,使得团体用户中的每一用户的软、硬成本和系统维护成本可降至最低,到我国城乡大多数居民所能承受的范围之内。通过透明计算和正在迅速发展的下一代电信技术(尤其是无线接入),主次结构互补整合,使窄带的互联也能获得接近于宽带互联的效果。在这种情况下,主结构本身将得到进一步扩大(篮圈所示),保持向全人口持续增长的态势。由此,下一代互联网NGI,下一代广播网NGB和下一代电信网NGN将循环相助、和谐相处。

2 共享信息的网格

最“正统”的网格研究来源于十几年前美国政府资助的高性能计算项目,这类研究使用的名词就是“网格(Grid)”或“计算网格”。

计算机专家试图把整个Internet整合成一台巨大的超级计算机,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享。

在计算网格中,资源可分为“不可再生”和“可再生”两大类,它们的共享难度,有很大的不同。计算资源和存储资源属于不可再生资源,服从总量守恒定律。所谓共享,只能是一种“分配”或“分享”。计算网格侧重于整合不可再生的计算资源,希望通过计算资源的整合,达到提高与普及的双重目标: 提高就是用若干台高性能计算机得到一台更高性能的计算机,普及是让普通性能的计算机,通过联网也能获得高性能的计算能力。

数据资源、信息资源、知识资源则是另一类资源,它可以不限量再生,理论上用户的规模可以“不限量”增长。所谓信息网格,共享的资源是信息,可以不考虑非再生资源的共享,更容易实现更广泛地共享。进入新世纪以来,有部份计算机专家转向研究信息网格,并把网格的研究重点转向普及化,让网格的理念同如何扩大网络规模,最终实现“无处不在”的“普适计算(pervasive computing)”联系起来。

如何整合信息资源?美国国防部的“全球信息网格”(GIG)提供一个重要的思路。2000年美国国防部在向国会提供的报告中说,如果向战士提供过多的信息,无异于把他们淹没于信息海洋之中,容易失去做出正确判断的时机。GIG并不要求把所有的信息资源送给所有的用户,只要求“在适当的时机以适当的方式把适当的信息送给适当的人们”(getting the right information to the right people at the right time in the right format)。

重新审视互联网与广播网

网格在英语中称为grid,几何上指横纵两组平行线正交形成的栅格图形。

从图4的栅格图形,可以看出信息网格的供需关系。一根横线代表一个信息资源,一根纵线代表一个用户,而图中不同形状代表着不同的信息资源,M根代表信息资源的横线与N根代表用户的纵线横纵交叉,形成方形栅格。两线交叉处的“交点”代表按需连接,它的物理意义是指它所关联的第n个用户按需共享第m种资源。一般而言,M的数量表示资源品种的丰富程度,N的数量表示资源共享的广泛程度。理想的共享希望做到: 任一资源都有机会为N个用户提供服务,任一用户也都有机会得到M个资源的并行服务。也就是说,我们应该找到一种系统,它的M值和N值都不设上限,这样,信息共享将进入“各献所知,各取所需”的理想境界。


图4 研究网格的栅格模型

用这个标准来审视互联网与广播网,它们都存在一定的差距。

互联网的优势在于M,信息资源的个数不设上限; 短处在于N,即用户数目受到带宽及服务质量的严格限制。广播网正相反,优势在N,短处在M,只要信号强度足够,它支持用户数目的自由增长,支持共享服务普及边远山村,但广播不支持信息资源品种的自由增长。

我们可从比较两网的长处与短处入手,引出建立两网互助互补的建议。

大约五年前,大家都以为只要投资扩大带宽,“带宽障碍”将迎刃而解。实践征明,带宽的增长很难全面解决用户增长引发的一系列问题。“最初一公里”和“最后一公里”的宽带化,只提供缓解矛盾的必要条件,不是充分条件。要求所有用户对所有资源的连接都无障碍,等于要求全国互联网中许许多多串接的路由器、网关和缆线任何时候都不发生带宽障碍,这是一个“无底洞”式的难题。

传统的广播网,更非理想的信息共享手段。从用户角度(纵线)看上去,电台的内容是时间上串行播出的,信息资源在时间上时而出现,时而消失。什么时候广播什么内容完全由电台决定,个人缺乏通过双向互动自由选择的机会。

要让广播对理想的共享结构做出贡献,必须在接收端引入存储技术。存储器是一种时间积分装置,积累不同时刻播出的内容。用存储器代替人,发送端可以同时播出几十种乃至几千种资源,不必顾虑用户是否有空闲接应。在接收端,把临时性串行出现的信息资源变成永久性并行存在的信息资源。人们很容易对近处存储器实现双向互动,自由选择享用时间的问题也就迎刃而解了。应该说,“播存结构”的资源品种比传统广播网有质的飞跃。

“播存结构”保留传统广播网普适性(pervaive)的潜在优势。广播卫星就像信息阳光,普照960万平方公里的中国大地,栅格图形上的每条横线都能承受得起无限数目的连接,用户再多也不会给广播带来麻烦。用户数目很容易从1亿人上升到几亿人,直至全国13亿人。最近几年在中国兴起的“广播电视村村通”,只要把广播电视节目换成万维网的网页,就很容易实现Web资源低成本的广泛共享。

对比两网的优点缺点,我们萌生了一种变革信息服务的新思维: 先将广播网改造成播存网,再用能够包容海量资源的播存结构去帮助互联结构克服带宽障碍,争取同时获得M和N两个数量的双双突破。

跨越“信息公路”概念

在互联网中引入播存方式的次级结构,也许在短时间内很难取得网络专家的认同,原因是 “信息高速公路”概念已根深蒂固。“信息公路”理念已经提出十几年了,这个比喻是戈尔(他的父亲老戈尔是提出美国高速公路倡议的参议员)担任副总统时期提出的,己经深入人心,多年来都没有其他概念对其形成挑战,两年前才由Barabasi等人在《科学美国人》上首次提出质疑,但迄今为止,仍然有不少专家不知道Barabasi所提出的思路。


图5 美国高速公里网 (随机网络、符合正态分布)

Barabasi在 “无尺度网络”一文中,指出只有随机分布的网络才能用美国高速公路系统的性能来描绘。互联网巳从随机网络演化为无尺度分布的网络,节点之间的连接服从幂次定律,多数节点只拥有少数连接,只有少数节点才拥有极大的连接。这种系统的性能应该用星爆形连接的美国航空网的性能来比喻(如图5和图6所示)。


图6 美国航空网 (无尺度网络,符合幂次公布)

不幸的是,人们依然习惯于用物质共享的方法去解决信息共享的问题,习惯于用物流的“公路”理念来解释信息共享,误以为“车多路堵”和“人多网堵”同样无法抗拒,而弱势地区、弱势人群难以平等共享信息的现象,也是天经地义。人们在“数字鸿沟”面前束手无策,看不见“信息共享本应无冲突、享用的人数本可无上限”的光明前景。

互联网从诞生的一刻起,就遵循“端对端“的原则,它的网络层只提供“尽力而为之”的服务,可靠性与安全性要端系统自巳来保证。尽管“端对端”原则极大简化了系统的复杂程度,但随着网民、网页规模的急剧扩张,单纯“端对端”结构的负面效应逐步显现: 除了网民规模难以摆脱带宽限制、服务区域很难深入农村地区之外,规模(scale)越大,可靠性与安全性越没有保证。

当然,是否可以依靠播存技术构成次级结构,也取决于广播与存储技术本身是否成熟。直到今天,广播技术与存储技术才发展到一个临界点,达到足以直接平移大量万维网网站内容的能力。

2004年6月,清华大学力合公司接受我们的建议,通过卫星进行差分并播定比实验,判断这种可能性。实验只利用DMB-S数十Mbps转发能力中的0.5Mbps,故称为定比下推(scaling down)实验。把0.5Mbps再划分为16个子信道,每个子信道32Kbps。每一个子信道分工传输一种文化传媒(一种报纸,一个网站或一门课件),看每24小时能把多少字节的文化内容无差错地送到全国各地。实验和计算结果令人鼓舞: 一个净数据率大于32Mbps的卫星转发频道,每24小时有能力把超过345GB的网页直接地送达全国城市的每一栋大楼和农村的每一个自然村。

2005年中国互联网信息中心的研究人员统计,尽管中国互联网网民巳超过1亿人,国内67万个网站,每天新投入网页的字节量总加起来,估计为40GB/天左右,这一状况将维持几年不变。

340GB/天远大于40GB/天,也就是说,中国人巳掌握这样的卫星广播技术,有能力把所有网站一体化地转到城乡分布存储。

播存结构的具体案例

同其他信息系统一样,设想中的文化网格由信源、信道与信宿三大部份组成,它们分别称为“整合一体的资源平台”、“覆盖全国的广播信道”和“透明计算的网格终端”。

如图7所示,为了说明文化网格的具体工作原理,我们讨论用卫星广播整体平移3330种网站的案例。


图7 基于播存结构的文化网络

一、整合一体的资源平台

用单一的载波整合数千网站。用户只需通过单一的数据接口,便可以得到数千网站的主动服务。

我们把提供信息内容的报纸、期刊、课程内容的单位(ICP)统称为网站,它们都以Web页面的形式提供服务。

3330个网站分散于全国各地,刚刚编辑出稿的新鲜网页,通过互联网FTP或电信网专线瞬间送到广播中心,在广播中心形成一个容纳所有网站镜象数据库。广播中心的码分并播软件(以后详细介绍),从数据库中有序地取出数据,通过单一载波,以适当的速率和适当次数的重播,保征网页在全国可靠落地。

广播中心对几千种网站平等相待。每一个网站都独自掌握一定数量的子带宽,有权在第一时间里向全国发布最新鲜、最重要的网页,而不受其他网站工作状态的影响。

卫星数字广播的总速率为32Mbps,每天都具备向全国同时推送超过340GB文件的能力。各个网站可根据编辑出稿能力(每天大约可以向网格提供多少字节的非重覆内容),向广播中心申请独立享用子带宽。全网32Mbps的数据速率,合理分配,可供30个巨型网站(内容提供少于3GB/天,申请320Kbps的子带宽)和300个普通网站(内容提供少于300MB/天,申请32Kbps)MB以及3000个小型网站(内容提供少于30MB/天,申请3.2Kbps)共同享用。根据初步调查,我国尚未出现日产超过1GB(不含视频)内容的网站,因此,以上估计是留有一定冗余的。

二、覆盖全国的广播信道

广播中心通过同步卫星转发,将网页直接落地于全国城乡。中途没有路由转接,没有信道拥堵; 不分先后顺序,立即到达、全部到达。地面的任务,只是根据统一内容定位代码,从中挑选出用户有兴趣的网页下载存储。

为什么信道可以如此简单,原因在于接收端拥有海量存储能力。信道在存储之前,而不是在后。

Web存储是按“一次写入、多次读出”原理工作的,播存结构在“存内容于网站”的基础上,实现“存网站于本地”的变革,把存储挪到通信的后边。昨天、前天的网页写入终端存储器,不再需要通过信道传输了,信道只需传输新鲜内容或差分内容。这种“差分信道”,与读出无关,不介入读者与网页的双向互动,“一次广播,一劳永逸”,比互联网要简单多了。

三、透明计算的网格终端

播存网格中的终端,负责有选择地下载、存储广播信道中的信息内容,并向用户提供实时的内容服务。通过网格终端,用户无需感知信息资源的具体所在,便可以得到多种信息资源的按需服务,如同只要插上电源,就可以得到电力网(Power Grid)的服务一样,这本身就是一种“透明”的概念。

网格的终端,可以直接设在家中,利用PC机的硬盘作为终端存储。但此时PC机必需24小时连续工作,否则会漏掉关机时间播出的网页。为了实现低成本,比较现实合理的办法是,存储器设在离用户不远的服务器中,几家人或者几十家人可以共用一个服务器,家庭中的客户机可以非常简单。连续工作的存储成本可以由大家来分担,而且客户机本质上只是一种NC(网络计算机),任何显示设备(包括家用电视机)只要添加一个小盒子就可以成为客户机。

清华信息科学与技术国家实验室的相关研究小组研究和开发的透明计算环境,服务器不仅可以存储信息资源,还存储操作系统,实现操作系统的共享。而几个或几十个最终用户,共享同一个服务器里存储的多种资源,也使得用户成本进一步下降。

透明计算的网格终端服务器中存储的信息资源有三类: 操作系统、应用软件和已下载的信息内容,这些信息内容可以来自播存网格中的广播信道,也可来自其他网络,包括互联网、电信网等,因此,透明计算的网格终端本身也可以成为多种网络整合的场所,实现信息资源的按需整合。

3 数字广播面临重大变革

广播数字化遇到困难

传统的广播电视,尽管仍然是吸引“人时总数”最多的最大媒体,但从用户的角度观察,其资源在时间上是阵发性出现的,大部份时间内用户得不到这些内容,只有电台正在广播的时间里,才有可能得到它的服务。广播资源时间上的间歇性存在,造成传统广播若干固有的结构性缺陷。

首先,它难以实现按需服务,内容与时间由电台决定,用户对信息资源不能双向互动,缺乏自主权。其次,提供的资源品种不够丰富,尤其是缺少静态视觉的书刊、网页,不能反映数字文化的博大精深。最后,缺乏形成产业的经济杠杆,传统广播很难形成产业,广告收入之外,难以找到市场的经济支持,优秀节目得不到正比于贡献的回报。

广播数字化的困难,从最近几年数字电视进展迟缓的过程中充分表现出来。原先预想: 我国2003年底使数字电视用户达到3000万户,而实际只有十几万户,2004底也只有百万户左右,因此2005年只能把指标再次调低。进度迟缓的情况在国外同样存在,美国原定2006年切断模拟电视,看来目标也相差甚远,时间表只能后延,据说欧洲到2010年数字化率也只能达到五成左右。

当广播数字化遇到某种困难的关键时刻,不少专家献计献策,建议数字化不应该停留在改善图像质量和增加电台数量之上,应该将终端引入双向互动的“客户机/服务器(C/S)”结构,完成广播业服务方式变革。

在广播终端引入海量存储,可以积累不同时刻播出的内容,把瞬态存在的广播数据流,变成为时间上长期存在的服务器数据库,向最终用户提供双向式按需服务。这就是所谓“播存结构”。播存结构不仅可以实现电视节目的按需服务,还将承担普及几千种报刊网站和几千门大中小学课程的任务,为科教兴国营造“存文化于民间”的环境。

基于播存结构的下一代广播

一、对下一代广播的设想

下一代广播,是根据“整合资源,广泛共享”的“网格”思想设计的。如图8所示,其中包括三种网格,即电视网格(整合上百种电视节目)、文化网格(整合几千种报刊、网站)和教育网格(整合数千种大中小学课程)。终端采用海量存储,用户不但对极其丰富资源具有自由选择的权力,而且全国城市的每一栋大楼,农村的每一个自然村,都可以拥有这样的资源。

下一代广播,既是一个大的世界,也是一个小的世界,其分界在终端存储器。

终端存储之前,是由庞大的单向广播系统所构成的大世界。数以千计的各种信息资源,经地面整合之后,形成DVB-S单一射频载波,通过同步轨道卫星转发,覆盖中国国土,再通过地面有线(DVB-C)或地面无线(DMB-T)到达海量存储的终端服务器。大世界采用大量成熟的硬件设备和少量创新的软件(如差分并播程序、基于UCL的信息过滤代理等)技术。

终端存储之后便是一个小范围、短距离的“服务器/客户机”双向互动系统。这是一个小世界,它只为百米之内的百个以下的客户机提供服务。正因为它的小和少,服务器与客户机之间几乎没有带宽瓶颈,而且成本极其低廉。小世界采用透明计算模式。客户机尽可能简单(瘦身),普通电视机或手机上的显示设备,只要增添一个“机卡分离”的插卡便可以成为客户机。

迄今为止,大多数人主张“远互动”,双向通信需要跨越比较长的距离。例如,IPTV就是把资源服务器设在电信局里,通过双向工作的ADSL与客户机实现互动。这类方案存在两个问题: 一是下行带宽不足,只能支持分辨率较低的视频服务; 二是运作成本太高,以电信业按时间或按流量方式收费,即使资费水平再有大幅度降低,普通居民也难以承受。

二、选择终端存储的理由

业界比较关注的是,运算速度和通信带宽进步很快,但很少人注意到存储成本下降更快。三十年来,每百万字节数字存储的价格下降已超过一千万倍。如图9所示,1973年百万字节的存储器售价几十万美元,相当于一座小洋房,以后陆续下降,相当于一辆汽车、一辆自行车……

2005年,中关村市场80GB硬售价已低于800元人民币,百万字节存储成本已降到不到人民币一分钱。更令人鼓舞的是,存储器的成本还将持续下降。科学家已经指出成本继续下降的空间,只待工程师把它变成现实。

三、双向互动

不同时间、不同电台播出的内容进入存储器之后,串联播出和瞬间存在的信息资源,变成永久存在和随意调用的并列资源。人们再也不受“广播节目时间表”束缚,随时随意点取自已有兴趣的内容。

广播的按需服务从诞生一刻起就将是满足“质量保证(QoS)”需求的,万维网的按需服务通过“存内容于远处”实现,从网站与用户之间要途经多个节点,任何一个环节的带宽瓶颈都可能造成时间滞后,最终用户所获得的QoS难以保证,而播存结构“存内容于近处”,没有带宽瓶颈,没有滞后环节,随点随得。

四、丰富内容

海量存储器除了收集电视节目和音频节目之外,还可以增添直播卫星转播的、从万维网精选出来的报刊、网站与课程,包括了数字文化全部常用内容。可以说,每一终端存储器,就是一座数字图书馆,其内容的丰富程度,达到相当理想的程度,可以随着存储容量而线性增长。如果城市的每栋大楼和山区的每一个自然村,都拥有一个这样的数字图书馆,中国将迎来第二次“存文化于民间”的高潮(第一次高潮发生在一千年前毕升发明印刷术之后)。

五、形成产业

终端服务器是广播网格公用设施的最后一部份,为几个家庭所公用。任何客户机从存储器中取走内容,服务器都将详细记录在案,准确扣除交费卡的金额。因此,可以把存储器当成是信息产业的零售商,看成是家门口自动经营的文化超市,由内容提供者标明价格(包括标明免费),并直接得到用户回报,网格公司只是从回报中提取固定比例作为服务费。用这个办法,兼容网格的公益性与产业性,并使广播成为服务业的新内容之一。

差分并播技术

传统广播采用时间上串列出现的“串播”。播存结构取消“节目时间表”,实施各种内容并列出现的“并播”。本质上看,并播是一种时间复用,每一个网站占用一个子信道。各子信道按时分复用原理工作,速率有1倍速、10倍速和0.1倍速三种。以总速率为32Mbps,1倍速为32Kbps为例,一个广播频道共可容纳3330个网站,其中有30个网站分享320Kbps、300个网站分享32Kbps、3000个网站分享3.2Kbps的子速率,所有的子信道并行工作,就像大规模并行计算中CPU并行工作那样。

差分并播是并播的一种改进。考虑到网站编辑出稿新鲜网页是阵发性的,时间上非均匀的。当它出稿的网页已被播出几遍之后,地面各接收站都已正确收存,再重复广播已经没有意义。于是,制定一种优待新鲜(差分)内容的“礼让准则”。例如,规定某网站文本数据重播超过五遍,语音超过二遍,视频超过一遍之后,主动退出对子信道的占用。因此,发送端不同时刻正在播出的网站数目是变动的,每一个网站的下载速率也是变化的。只当3330个网都有新鲜网页需要播出的特殊情况下,各网站的速率才回落到最低值,即按预先约定的速率播出,大部份时刻,实际速率将大于预约值,甚至大大地大于预约值。

在播存结构的接收端,用数据包包头的UCL代码确定是否下载,它本质上是一种“码分”接收,无论子速率多少,也不管有多少网站需要下载,数据包都不会丢失,这种方法又称为“码分并存”。

差分并播和码分并存软件是下一代广播的关键技术。国家可以用儿十兆的带宽整合全国数以千计的信息资源,地方城市用较小的带宽整合数目较少资源。例如,用15Mbps的DMB-T无线广播,除并列组织十几种电视节目之外,再并列组织上百种满足当地老百姓日常需求的报刊网站,覆盖一个大城市,用很少的投资就可把数字文化送到家家户户。

李幼平

中国工程院信息与电子工程学部院士,电子工程学家,也是我国核武器电子学领域的主要学科带头人之一,在无线电遥测、遥控和引爆控制系统的研究领域作出重要贡献。

4 透明计算的网格终端

为什么引入透明计算

透明计算是一种计算模式,用户在使用计算机系统时,无需感知操作系统、中间件、应用程序和信息资源的具体所在,只凭用户需求,通过网络便可得到相应的计算服务。

我们希望未来的信息网格能做到:只要用户提出对信息内容的要求,就可以得到相应的网页,无需感知网页来自何种网络。

引入透明计算的第二个原因,是我们希望能找到一种“最低成本”的终端方案。原则上说,在播存结构中的单向广播可以一直延伸到家庭,利用家庭PC机中的硬盘作为终端存储,此时要求PC机需要“永不关机”,运行成本较高。用“客户机/服务器(Client/ Server)”方式,由几家人来分担服务器、操作系统、中间件等软硬件的固定成本和运行成本,有利于降低用户承担的费用。用户费用低,才能普及化,最终实现普适计算的目标。

透明计算的核心思路

在计算机技术的发展过程中,CPU、内存、外存储器、输入输出设备一直是计算机硬件的几大主要部分,而操作系统(OS)和支持工具(中间件)以及相关应用软件则构成了计算机软件系统。迄今为止,尽管Web服务技术和网络存储技术等为用户提供了网上高层(应用层)信息资源共享和应用软件的复用,但是计算机的硬件和OS一起才能构成一台可使用和操作的系统,这种方式造成了当前计算机发展中存在的几个主要问题:即不断升级问题、兼容性问题,和病毒及盗版问题。

如何解决上述问题?特别是在普适计算时代,针对那些内存、外设都较小的各种各样的计算设备,如何减少它们的升级换代,如何使它们能够运行不同的OS环境,为用户提供不同的服务,如何进一步减少病毒?使计算机变得更便宜一点,更安全一点,资源共享更容易一点,就是透明计算试图解决的问题。

图10是在一个基于透明计算模式的系统中,用户可选择Windows 2000、Linux及Windows 98的初始图,在图10中,用户可任意选择3个OS中的任一系统运行。

从计算机系统开放性的角度来看透明计算,它其实也是计算机系统进一步开放的必然结果。

传统计算机的软硬件的层次关系如图11所示。应用软件依赖于下层的中间件工具和编程环境,中间件和编程环境依赖于下层的操作系统,操作系统依赖于硬件。在这样的体系结构下,计算技术的发展也是体系结构不断开放的过程。每一个更加底层的接口被开放,就意味着上层软件可以自由开发和选择,将极大地推动计算机技术的发展。

透明计算实际上是遵循开放的理念,将操作系统和硬件之间的接口开放,只要计算机CPU支持相关操作系统和硬件接口,该硬件系统就可以在开机运行之前不装操作系统,而是等待加电后透过网络从服务器上下载该系统并随后运行,正是由于开放了这个底层的接口,才导致透明计算模式的实现。透明计算由客户机/服务器模式组成,其拓扑连接示意图如图12所示。

图12中的服务器既可以是单台,也可以是多台;其网络既可以是有线网,也可以是无线网;既可以是局域网,也可以是广域网。只是,其网络的传输速度必须满足服务器与客户机之间程序和数据传输的需要。透明计算中的客户机负责完成客户端应用程序的计算工作,服务器端只负责进行资源存储和管理,客户机所需要的任何应用程序、中间件及OS都通过动态的请求调页方式从服务器中获得,服务器和客户机的体系结构如图13所示。

综上所述,我们可以总结出透明计算模式的几个主要技术特点如下:

1.客户机上不预置任何OS,但用户可在执行时通过网络选择所需要的、并与客户机兼容的任何操作系统。

2.所选OS和应用并不是一次全部下载到客户机上,通过动态调度,根据客户机内存大小,采用分页调度方式,按计算需要分页下载,从而减少了客户机内存和CPU需求。

3.所有的客户机应用计算都在客户机上完成,资源和数据的存储在服务器上,这使得资源共享更加容易。

4.使用和维护分离: 由于所有的资源都放在服务器上,因此,维护管理人员只需维护管理服务器则可; 客户机主要提供给用户使用,使用户摆脱繁琐的OS安装、数据维护等工作。

透明计算作为网格终端

透明计算环境因其低成本、易管理、易操作、高安全性和高可靠性等特点,非常适合用于搭建播存网格的终端环境,为播存网格的终端用户提供低成本的用户环境和实时的内容服务,如图14所示。此时,透明计算服务器负责各种网络的接入和整合,将来自不同网络的信息资源统一存储并管理起来。同时,透明计算服务器通过OS远程启动和管理模块支持多种操作系统的远程系统。对于用户来说,他首先在透明计算客户机上自主选择所需要的操作系统并启动,然后调用相应的应用软件访问已经存储在“近处”的信息资源,而不需关心操作系统本身、应用软件和信息资源的具体所在,这是一种“透明”的概念。

同时,透明计算在播存网格中的应用也可以用栅格模型来描述(这方面内容可参见前文《共享信息的网格》),如图15所示。因此,透明计算本身也是一种“微网格”。由此,透明计算环境可以为播存网格提供多方面的条件和服务,主要包括:全天候的存储终端、多种网络的整合场所、低成本的服务环境,以及减免病毒垃圾的洁净内容。

总论

推进三网和谐整合

中国互联网已经拥有超过一亿的网民,仅次于美国成为全球第二互联网大国。但是,网民数仍然只占全人口的不足8%,普及化水平只相当全球平均水平的一半左右,相对而言,在固话、移动通信和电视领域,我国的普及率都已超过全球平均水平,互联网则因此更显落后。

本期这一组文章的目的,正是在于说明一种“普及互联网”的思路。

首先,运用幂次定律,从几十万个网站中精选出数千种“主流信息资源”;其次,运用卫星数字广播,一体化地把主流资源分布存储于城市的大楼和每一个自然村,造成跨越数字鸿沟和“存文化于民间”的全国性态势;最后,运用透明计算模式,把服务器与客户机都不发达可能做到低成本,向全体人民(包括不发达地区和弱势人群)提供双向按需服务。

播存结构将带来下列好处:

● 支持宽带用户持续增长;

● 数字文化上山下乡;

● 缓解现有网络的带宽压力;

● 窄带电信接入重现生命力;

● 手机、电视机用户变成互联网用户;

● 播存网格本身是一种“下一代广播网”。

古人云:“君子和而不同,小人同而不和”,我们应该借助古人和谐处世的思想,借助播存结构作为手段,实现互联网、广播网和电信网的相互帮助与和谐整合,如图16所示。

发布:2007-04-22 10:02    编辑:泛普软件 · xiaona    [打印此页]    [关闭]
南昌OA系统
联系方式

成都公司:成都市成华区建设南路160号1层9号

重庆公司:重庆市江北区红旗河沟华创商务大厦18楼

咨询:400-8352-114

加微信,免费获取试用系统

QQ在线咨询

泛普南昌OA信息化其他应用

南昌OA软件 南昌OA新闻动态 南昌OA信息化 南昌OA快博 南昌OA行业资讯 南昌软件开发公司 南昌门禁系统 南昌物业管理软件 南昌仓库管理软件 南昌餐饮管理软件 南昌网站建设公司