返回目录
关灯 护眼
加入书架

分节阅读 155(1 / 2)

火大。

章节目录 第二百二十四章:you 字数:2738

“好消息啊,老板。”一见面任正飞就对着张国栋毫无形象的大喊大叫,如果不是看着张国栋那戒备的眼神,说不定还想冲上来给他一个热情的拥抱,张国栋有些好奇,从部队里面出来的任总可是很沉稳的啊。

“从此以后我们又多了一项在全世界吸血的工具了,盛田昭夫刚刚亲自打电话来向我们通报了此事,明天将是我们的cdi标准正式推广的日子,目前已经有三十几家企业加入了我们的压缩联盟。”从zi格式获得大量利润的任正飞当然知道标准的好处了,所以听到索尼的消息后还是会忍不住高兴,不过心里还是有点感慨,不知道什么时候中国人能够独立的申请一项国际标准就好了,现在却不得不与小日本合作,想想西方国家对社会主义国家的防治,他又忍不住摇摇头,看来老板上次说要加大对创新公司的投入是非常正确的。

“哦,这的确是个不错的消息,不过我也有个好消息要和你分享,世界上第一个搜索引擎已经由我们中国人首先发明出来了,昨天龚定雨他们已经去登记了专利号了,发明人是我们中国的一个留学生,很难得的他的国籍还是中国。”相比于必然的收获,张国栋显然对这个偶然的成果更加满意,以前他都已经忘记历史上1990年,加拿大麦吉尔大学universityofcgi计算机学院的师生开发出archie。当时,万维网还没有出现,人们通过ft来共享交流资源。archie能定期搜集并分析ft服务器上的文件名信息。提供查找分别在各个ft主机中的文件。用户必须输入精确地文件名进行搜索,archie告诉用户哪个ft服务器能下载该文件。虽然archie搜集的信息资源不是网页ht文件,但和搜索引擎的基本工作方式是一样的:自动搜集信息资源、建立索引、提供检索服务。所以,archie被公认为现代搜索引擎的鼻祖。

然而现在由于龙腾的贡献,万维网已经出现,网络上最大最多的资源也是ht网页,而留学美国斯坦福大学的赵维均在博士攻读阶段,发现同学们非常喜欢去彼此地个人网站去凑热闹。但是有的同学在看了一个很漂亮的网页后想介绍给别人时不得不繁琐的记下该站得网址,要知道网址要链到某个具体网页的时候有可能会非常地长,所以他忍不住想到,能不能做一个工具将网络上所有的网页都抓取下来,然后存在自己的服务器中。当人们输入一定的关键将某个具体的资源返还给人们呢。大学地研究还不像公司,公司开发一款产品往往会进行大量的市场

调查,然后还要考虑是否盈利,而大学生做产品往往是灵光一闪。赵维均也是这样。做这个产品他没有告诉任何人,经过长达四个多月地编程实现。赵维均得到了一款比较满意的产品。随后他前去美国专利局进行注册,产品名yout。可能注定着世界上要多一家伟大的公司,那天龚定雨和几个公司的技术专家也去专利局去申请两项专利,由于总公司和香港分公司专利都在不断增加,给了美国分公司很大的压力,所以龚定雨是为了摆个姿态。就一起去了,结果赵维均正好排在他们后面。得知龚定雨竟然是中国龙腾公司的人。赵维均非常佩服,毕竟他用地很多计算机产品都是龙腾生产的。可以说龙腾是整个中国人地骄傲。

而龚定雨也不愧拥有鬼神之智,竟然一眼就瞧出了赵维均手上专利的价值。随后就隆重邀请赵维均加盟了,能加盟自己心目中地大公司,赵维均其实也非常满意,他博士也快毕业了,只剩下最后论文答辩,本来他最近就一直在犹豫要加入哪个公司。不过当他听说龙腾还有一个创业投资基金后,他就觉的有点心动了,开始龚定雨见他婉拒还以为是给地条件不够吸引人,所以咬咬牙一再的提高筹码,搞得那两个技术人员都是脸一阵阵抽动。不过当他得知赵维均是想自己创业时,失落的心情又好了一点点。

和archie不同,由于有了互联网,赵维均的yout拥有世界上第一个sider程序。sider指自动抓取网页内容的机器人robots,是搜索引擎用来访问ter上网页的自动程序。siders根据ht的语法和格式,对读取的页面进行代码过滤,收入相关的文字内容。爬虫从一个或若干初始网页的ur开始,获得初始网页上的ur,在抓取网页的过程中,不断从当前页面上抽取新的ur放入队列,直到满足系统的一定停止条件。有被爬虫抓取的网页将会被系统存贮,进行一定的分析、过滤,并建立索引,以便之后的查询和检索;对于聚焦爬虫来说,这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。

可以说yout已经具备了后世搜索引擎的一些特征了,虽然还比较毛糙,在切词计算词之间距离的方面做得还不是那么完善,但是作为世界上第一个诞生的网页搜索器,yout仍然具备光辉的前景。没能将这一项目握在自己手上的张国栋还有些遗憾,不过旋即又开心起来,毕竟这第一的荣誉好歹也是中国人自己的了,于是张国栋马上自己炮制了一份agerank算法的论文寄给了英国自然杂志。

历史上agerank网页级别,取自googe的创始人rryage。它是googe排名运算法则排名公式的一部分,是googe用于用来标识网页地等级重要性的一种方法。是googe用来衡量一个网站的好坏的唯一标准。在揉合了诸如tite标识和keywords标识等所有其它因素之后,googe通过agerank来调整结果,使那些更具“等级重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。

级别从1到10级,10级为满分。r值越高说明该网页越受欢迎越重要。例如:一个r值为1的网站表明这个网站不太具有流行度,而r值为7到10则表明这个网站非常受欢迎或者说极其重要。一般r值达到4,就算是一个不错的网站了。googe把自己地网站的r值定到10,这说明googe这个网站说这个网站非常重要。