第23章(第1 / 1页)
我想人民往往想使用它做很多的事情,其中有一个事情叫自动问答系统。当然获得某些问题的时候,今天很多人使用搜索引擎,这样来回答他们的问题。我想它应该叫做文件获取,它实际上是通过获得一系列文件,这样可以根据你的查询或者要求获取信息,特别的案例中实际上问了一个问题,中国总理是谁?你可以获得一些有关的相关的文章,这其中最相关的反应实际上就是指向了一个网站,你查询中国总理是谁,它让你查询一个网站。实际上它与中国总理是谁这个问题没有太多的联系。我们想做的一个事情就是要建立一个系统,它能够充分利用因特网的趋势,这样能够充分地处理网上的信息,而且也能够自动回答我们的问题。这是建立一个自动系统,如果比如说你有这个问题,谁是中国总理这个问题的话,你会得到什么呢?你会得到一个正确的回答,那么你就像我们搜索引擎一样,这种系统实际上也是上了一个网。建立很多的文件,这个文件与你这个问题是相关的,但是与搜索引擎不同,它使用自然语言或者合成的技术来充分把你这个信息进行联系,而且充分找到最想像的最有可能对你问题的回答,实际上这也是最正确的回答。如果你问一问中国的主席是谁呢?而且这样你也会得到正确的回答。我想这个系统根本对中国的主席,中国没有太多的了解,它实际上做了一个事情就是把不同的网站上的信息能够充分联系在一起。我第一次看到这个的时候,它是不是知道我是谁呢,因此我就问了一下谁是微软研究院的头,好消息,他们的回答是很正确的,否则回答不正确,让它继续工作。当然还有其他很想像的回答,但是比如说微软研究院剑桥实验室的负责人,比如说在微软的研究院当中有一个首席科学家,也可以说首席科学家是微软研究院的头,可以有关时事的问题。这个系统的确在网络上有很多存储的信息,你可以充分挖掘这些信息,尽管系统不知道这个回答是什么样,可以做出相应的反应。林肯在美国内战的时候被刺杀,你问一下,林肯什么时候去世的呢?他回答是1865年4月15日,我想这的确是最正确的答案。而且大家也知道,我们还有一个日期就是4月14日,还有一些网站在4月14日去世的,实际上这个答案是不对的。问一下林肯什么时候被刺杀,4月14号遇刺,4月15日去世,实际上是系统把所有的信息联在一起这样给出一个正确的答案。如果问一问草的颜色是什么颜色的,他会说绿色的,很正确的,当然还有其他很多的颜色,同时给你相应的选择回答。如果问一问天空为什么是蓝的,这是很平常的问题,而且是一个小孩问家长的问题,我的小孩问,因为光线的原因。同时可以问一些具有哲理性的问题,你问一问生命的意义在哪儿呢?可能不止有一个意义,但是系统本身,他回答很对,生命的意义在于问题。我想大家也可以看到,在上面有上帝,有亲情,还有有42条生命的意义。如果我们看这些系统如何改变我们做工作的方式,就像我们作为学生、作为教授,受到影响一样。我想我们认识这个世界实际上正在发生转变,在新的世界中信息将会得到广泛的公布,而且它存储的方式也会有所改变,技术改变被我们充分理解和想像。我们建立非系统式的系统,他有很多的客户,很多的服务器,而且可以提供多种的服务。
在企业界来说,企业界人士往往会谈XML的网络服务。XML实际上是标准的方式来描述信息的标准方式,它实际上是对数据做一些标志,这样它能够把这个信息与其他信息进行相应的联系。在这种企业界在XML网络服务会发生什么事情呢?我们有对知识和交换开放的标准,有这种联系不太紧密的编程方式,它是在网络上任何地方都可以能够获取以XML方式存储的数据和信息,而且应用将是自我描述性的,数据也是自我描述性的。
当我在马里兰州大学做教授的时候,我们曾经建立这种系统,而且我们当时努力实现这种目标,进而我们现在实现了这种目标。这个图向大家展示的就是网络服务XML网络服务的基础架构(指屏幕),关键一点在基础层它实际上以因特网的技术建立起来的,HTTP与SMTP,它是信息交换的标准,在这上面有一系列的标准。通过这些标准,我们获取信息,可以找到服务,可以找到服务为你做的事情,和信息结构,进行信息的处理和数据的处理,其中关键的一点叫做松散式编程方式。它还看到通过这种方式能够允许双方的协议使用,而没有所谓权威存在。
那么对于我们学者来说意味着什么呢?这些技术实际上一般转化成产品的话,可以对学术研究和研究方式发生影响,大规模存储的方式意味着我们可以更好地组成我们的信息,可以存储相当长的信息,并且可以在线存储。比如说在今后两年或者更长的时间里,个人电脑有TV级的存储,其实TV是相当大量的存储,它可以把你从出生到去世所有的谈话都能够记录下来。如果大家来看一看在科学上的存储意味着什么呢?它也就意味着你不用只是在纸上记下我们的研究成果,现在我们可以把这些计算成果或者计算材料进行电子化的存储,而且也可以长期的保存,使别人充分利用。网络的存储意味着应用使人们能够访问科学家建立的数据中心,也可以使他们获得新的信息和新的数据,将会是自我描述性的。这种信息可以得到保护,比如说你作为一个学者,或者作为一个教师,作为一个学生,曾经与同事进行合作或写一篇论文,这样你可以充分地保护这些论文,可以保证只有被允许的人才能访问,直到有一天整个世界都能够看到这篇论文为止。实际上今天出现的这种事情,我们的确在线与所有人分享我们发表的文章,这样使所有人能看到我们的研究成果。许多科学家他们都共享他们的基础研究的文件,特别是HTTP或者FTP这种方式进行下载,但是信息的形式往往是有缺陷的。你没有对信息的格式有一个充分的保存和保护,每一个研究者都有他自己的信息,都有他自己的数据,而且每个应用都是在个人的电脑上跑的。我想如果我们来看看明天是什么情况,可以使用我们的技术能够改变我们做研究的方式。比如说我们可以在线分享我们的文章,以及可以分享其他人对我们的评论,这样我们不但可以看到论文作者正在做什么,而且也可以看到其他科学家对某篇论文的评论。比如说他可以做一个公开用的数据库,每个人都可以访问有关的信息,但是实际上可以在网络的环境下做到这一点。因此在这样的世界中,我们有这种网络服务的数据联盟,可以说数据服务是相当大的,而且是分布在网络上的。JIM会谈一谈他做的工作,因此我不会讲得太详细,太多,这样就不会提前泄露他讲的内容。我大概讲一点,他首先就是把基础的信息放到网上去,比如说他做Terra服务器的工作,可能是五到八年前做的工作,可以把基础的信息,比如卫星的资料或者其他的资料放到网上去。世界上任何一个人,如果他们需要的话都可以看到这些信息,比如金字塔的信息和交通的信息等。实际上大家可以看到,在上面仔细看一看,上面有一个交通堵塞,在桥上有一个交通堵塞。它的确给我们一种感觉,我们可以通过科学的力量把信息放到网上去,Terra服务器可以服务成百上千万人。通过网站为他们服务,可以继续为他们提供相关的数据,但是由于它是网站,就具有一定的局限性,因此需要到这个网站来查询信息,因此我们要提出网络服务的概念。JIM和小组做的工作就是,能够把这个网站变成一个服务,这种服务实际上通过跑因特网的应用来获得这个服务。信息可以是自我描述性的,而且是标准的格式,UDDI这种方式进行服务或者可以是自我发现式,同时通过因特网的协议获得这种服务。过了不长时间,他们做的TIAL,后来美国农业部也使用了他们的服务,通过这种服务帮助美国农场主充分利用他们的土地,实际上这可以通过网上的服务,农场主服务,通过跑某些应用使他们获得服务。现在正在与企业界人士进行合作,也是涉及到天文学的工作。我想我不会讲得太多,还有很多有关科学家,自然科学基金的科学家他们建立这种叫做数字化的天空扫描仪,这样建立一个虚拟的天文观测站,使科学家24小时能观测天文现象。我想这实际上就是学者研究,而且我们的技术可以充分改变我们做学者研究的工作。我们也可以想一想,科学技术如何能够改变教授知识的方式,比如我们想到教授电脑,我做教授的时候,首先做的一个事情是弄一个教室,弄一些电脑,让学生坐在电脑后边,我想这可能是一个笑话,但是这是曾经我们这么做的,因为学生坐在电脑后边。教授根本看不到他们。在于过去的教授方式我们现在对它进行改变,把它做成电脑化的教授方式,实际上并不需要把上课能够改变成电子化的教育。我想我们主要是希望能够使这样的技术使教授上课更加容易,使男教授和女教授都能够获取相关的信息,使他们更好教授知识,更好完成任务。我们也可以充分改变这种互动的方式,因此这样可以使教育以合作的方式,一种延续的方式来进行教育。可以使教授不断与学生进行互动,我想向大家展示一个视频资料,我希望我能够放出来。