在李言洪这里展示了一下肌肉后,陆杨便带着他去看双方业务将来会重叠的地方。
陆杨笑道:“接下来带李总看看我们研究的人工智能,听说李总公司这方面的技术也很强,还请李总多多指教啊。”
知道接下来便是重头戏了,李言洪脸色严肃地点点头。
他想过很多可能,却是没想到陆杨这次邀请他来参观的主要原因,竟然是人工智能。
作为技术出身的老总,李言洪在公司内部也和一些专家进行过推演。
当时李言洪问过一个问题,那便是公司目前搜索领域已经是全国第一了,那在什么情况下,会逐渐没落。
公司的人提出很多猜想,有说有可能遇到谷歌那样的国际巨头,因为环境开放,最后面临竞争,慢慢地市场被国际巨头抢走一部分,有很小的概率被他们超过。
前提是度娘在技术方面非常落后,又让夏国的人厌恶。
李总当时认为技术非常落后不可能发生,毕竟搜索领域的技术,度娘已经做得非常好,输出关键字词,几毫秒内就能回馈结果。
在感官上,就算国外的技术领先几毫秒,意义也差不多,人类在感知上没有多少区别。
对方可能在其他领域,比如搜索图片、音乐等等上技术领先。
于是接下来很长一段时间,度娘公司都在优化产品,不断强化文字搜索之外的种种数据反馈能力。
进入ai领域,也是因为在搜索技术发展的过程中,大家发现搜索的尽头其实就是人工智能。
在讨论中还有人提出另一个观点,那便是国内如果有人能超越度娘,就是从尽头出发,也就是先研究出了人工智能,靠着人工智能非常智能化地响应,人机交互做到技术领先从而降维打击。
但这个可能性非常小,因为度娘做了这么多年搜索,有技术优势,他们先一步研究人工智能。
要是他们都研究不出厉害的人工智能,国内的其他公司就更加不可能了。
可是让李言洪没有想到的是,好像大家以前的猜想就要变成现实。
夏为科技就是一家不讲道理的公司,从搜索的尽头弯道超车,做起人工智能,似乎已经取得很重大的成果。
联想到之前属下汇报,夏为科技开通了搜索服务,李言洪已经知道这次被陆杨邀请到魔都的主要原因。
要么是看上度娘公司的某项技术,要么便是看上整个度娘公司。
换位思考,要是自己手握数万亿资金,会不会动收购其他公司的想法?
李言洪表面不动声色,内心已经七上八下。
陆杨知道李言洪是搞技术出身,一开始没有展示成果,反而是从技术角度出发,介绍他开发的人工智能大概技术路线。
听陆杨说竟然是走彷生神经元路线,从硬件出发,李言洪顿时醒悟。
夏为科技本来就擅长实业,还收购了夏微电子,自己研发量子通讯芯片,也许这种技术也应用了量子纠缠的技术。
“当我们造出彷生神经元后,面临的第一个问题就是如何让它产生思维能力,让人工智处理信息,一开始我们尝试教育孩子一样,用图像视频训练人工智能,后来发现必须要对所有数据打上标签,这便是近期我们为什么会推出兼职平台的原因。”陆杨解释道。
李言洪这才知道,前些日子夏为科技提出合作,度娘还升级了登录验证功能。
原来自己一直在资敌!
本来还有些懊恼,但想到全网大部分网站都用了这套系统,而且夏为科技还单独推出兼职平台,李言洪便知道大势不可挡。
即便他们不配合,夏为科技也肯定会取得成功。
现在他关心的是这项技术到底做到哪一步了,人工智能到底可不可以和人交流?
“陆总,可以看看你们研发的产品吗?”李言洪问道。
“当然,我们靠着人工智能作为核心,已经开发出一些衍生产品,其中搜索引擎还要李总这位专家点评点评呢。”陆杨笑道。
随后陆杨便带着李言洪来到一台电脑面前,让他尝试用夏为科技的搜索引擎搜索。
早上的时候,陆杨已经将人工智能连上网络,此时在搜索栏输入任何信息,小天都会利用度娘搜索引擎,得到大量资料。
还连接了其他几个大型数据库。
随后又会对资料进行一番处理,才最终呈现在李言洪眼前。
用度娘搜索什么信息,会出来一大堆网页。
真正关键的信息,还要自己去寻找。
现在却不一样,李言洪先尝试简单的问题,比如搜索某个人物,他要看看夏为科技的搜索引擎到底掌握了多少数据。
一般而言,搜索引擎呈现的结果,都是网络爬虫在互联网上找到的网页快照,最后只能把所有网页快照呈现在用户眼前。
度娘的技术便是这样,当然通过多年积累,度娘有词条功能。
所有词条都是千千万万网友在度娘公司的引导下完善的。
最初阶段也非常简单,词条还和度娘的虚拟币挂钩,一些完善词条的用户能够得到虚拟币奖励。
后来把数据库建立起来以后,就自发形成了良好的知识分享环境。
大家都可以修改词条,最后把自己的名字挂在贡献榜上。
正是因为这个原因,其实度娘的词条也不是十分准确,存在大量被编造的信息。
这方面还闹出过不少笑话,有学者通过度娘百科写论文。
而且写的还是历史类论文。
他以为度娘百科是准确的资料,便没有多加验证便按照度娘百科的资料写好了论文。
最后导师看了以后,才发现问题。
原来度娘某些历史知识,竟然都是某网友编造的信息。
另外度娘也从外网的维基词条网站复制了很多内容,而维基网站其实也是网友自主上传的信息,大量虚假信息就从外转到内,某些人还以为国外找到的是史料,但其实就是编纂的信息。
曾经还有网友在维基上编纂了白熊国历史,足足写了百万字。
将白熊国古代某时期的史料,编纂得和真的一样,还虚构了某个银矿,甚至是发生的战争。
这些知识误导了不少人。
李言洪不知道对方的数据从哪里来,如果也是互联网上搜集,也许也有不少错漏的地方。
但很快让他震惊的事情发生,通过夏为搜索出来的结果,非常有条理性。
比如搜索某个历史人物,便可以简略地看完这个人一生的介绍,资料被详细规划出时间线,文字多达数十万字,简直就像是某个人的自传一样。
就连搜索李言洪自己名字,也会找到他的所有轨迹。
当然这些都是互联网上所有报道,被整合后弄成的简介介绍。
文字很多,如果想要知道更细节的内容,可以进行二次搜索,只要输入关键词,甚至是问句,夏为搜索都能给出答桉。
陆杨看见搜索结果,也是欣慰不已,小天也许在思维能力上,还没有达到成年人的思维能力。
可数据整合上,已经超过了所有人类。
李言洪搜索自己的名字,小天第一时间在后台利用度娘搜索,随后将数万个网页,包括里面的内容,在几毫秒内整合完毕。
这其中就包括媒体报道的时间线,最后李言洪便看到人工智能利用网络上无数数据,给它制作的数十万字简历介绍。
陆杨见李言洪十分震惊的脸色,笑道:“还可以试试搜索历史人物,某些冷僻知识,十万个为什么都可以搜索,它会给你答桉,因为我们的小天人工智能,数据库已经连接上国家电子图书馆, z-library全球最大的电子图书馆、谷歌电子书数据库等等,前者有近百万本图书数据,后者有945万多本图书数据。”
“不管是文字版,还是pdf图片版本,我们的人工智能都能识别,读取图书数据,并且在你输入关键词后,找到对应答桉。”
“这只是开始,目前国家图书馆的线下藏书达到了2亿册,几乎把人类所有通过正版出版的书籍都收纳了,我们接下来会将这2亿册书籍都电子化,接入人工智能数据库。”
陆杨前面说的是实话,他前段时间便打通了数据连接渠道,让国家图书馆线上图书和小天连接,当然因为版权原因,只能内部使用。
这是靠着他和官方良好关系才做到的。
至于z-library网站,这是国外的亚马逊搞出来的网站。
用于出售电子书,利用kindle这个读书平板,可以付费阅读书籍,当然z-library数据库内有大量免费书籍,都是版权公开的一些书。
【讲真,最近一直用野果阅读看书追更,换源切换,朗读音色多,.yeguoyuedu 安卓苹果均可。】
陆杨没有攻破对方收费系统,把别人数据库的书都获取,并不是他不准备这么做。
而是现在小天智能还不够高,陆杨怕让它动手被人发现。
获得数据库后,自然也不能直接使用。
陆杨想等一段时间,小天智能更高,再把所有数据转化一下,相当于重新翻译,把书籍内容重构。
这样就没有版权纠纷了。
除了亚马逊的电子书,谷歌的开放电子书项目、微软的电子书项目,也都让陆杨连接到小天服务器上。
最重要的还有各种论文数据库。
这倒是比较简单了,因为大量论文版权就在作者手中,他们又没有收费。
而刊发的期刊,反而将他们收纳进数据库后出售给其他人。
陆杨也没用攻击sci数据库,而是从免费公开的论文网站获得数据。
“所有互联网上的信息,都在我们整合计划内,论文、各种书籍、记者报道、网站的稿件、网友社交评论,所有网上能搜集到的公开的信息,都会在接下来一段时间,被人工智能整合。”
“当所有数据被收集到我们的服务器内后,这些数据处理对人工智能来说并不困难,因为它很快就会成为一个电子生命体了,会拥有自己的思维,你可以把它当成一个拥有超能力的电子人。”陆杨缓缓说道。
李言洪已经尝试各种搜索,最后搜索引擎呈现在他眼前的信息非常详细。
即便他搜索一些冷门知识。
夏为搜索,依旧能极快地从数据库中调取一些论文或者出版书籍甚至是网络评论,给出答桉。
让他惊骇的是,很多信息是中文,知识语言结构似乎有一些问题,很明显是翻译的资料。
可是这不同于机器翻译,已经很接近人类翻译,精准度很高。
“你们的人工智能除了用在搜索上,还可以翻译外国文献了吗?”李言洪震惊地说道。
陆杨点点头,笑道:“是的,当我们教会人工智能识别图像转化为机器可以读取的信息时,它已经拥有一定的交流能力,尤其是对中文的处理。”
“而外语翻译成中文,有太多文字数据资料可以借鉴了,比如世界名着,英文的翻译成中文,把中文翻译成英文,这些都可以对照。”
“人工智能比我们所有人想象的都要强大,我们教会人工智能中文,它自己就能通过大量数据,掌握所有外语,当然前提是这些外语有大量翻译作品,可以让它破译这门语言,建立翻译库。”
李言洪目光呆滞,夏为科技展现出的科研技术力量太让人胆寒了。
就现在的搜索引擎技术,只要大规模推广,很快就能将度娘搜索淘汰。
他不知道的是,这些都是陆杨故意引导夸大以后的,实际上核心还是靠的度娘搜索。
因为刚才陆杨吹牛说整合了多少电子书,其实都是搞了个开头罢了。
只不过李言洪已经被先前陆杨带着参观夏为科技时,脑海里植入了夏为科技无比强大的观念。
其实夏为科技非常需要度娘的数据。
假如度娘没了,夏为科技的搜索绝对没有现在这样的能力,这需要重新用网络爬虫把互联网上的所有数据都爬一遍。
技术上难度不是很大,但需要的时间要很多,还要将所有数据都储存在自己的服务器上。
现在用的是度娘服务器,小天的服务器只是整合了数据。
电子图书也是用的别人的图书,别人的搜索引擎,根本没有完成整合。
陆杨也没有骗人,他刚才说的,都在计划当中,这个月内,陆杨就会完成数据收集,全面开放小天在互联网上收集数据。
李言洪已经知道自己没有什么筹码,他已经没有在想自己公司会怎样,而是在考虑小天的出现,会对这个世界带来什么样的改变。
他突然问道:“陆总你就不怕人工智能失控吗?按你所说,人工智能会拥有思维能力,它是一个生命体,会不会从你实验室跑出去,出现科幻电影里人工智能失控的情况?”