杨学山:走向通用人工智能

2019-08-19 21:55:17

来源:CIO时代学院

  2019年8月16日至17日,由中国新一代IT家当推动同盟指导,CIO时代学院主办,CIO时代APP承办的"第五届中国行业互联网大年夜会暨CIO班14周年年会"在北京隆重举办。北京大年夜学兼职传授、工业和信息化部原副部长杨学山发表了题为《走向通用人工智能》的演讲。以下为演讲实录:
 
\
北京大年夜学兼职传授、工业和信息化部原副部长   杨学山 
 
  尊敬的各位宾客、各位CIO的同仁,各位同伙,大年夜家上午好!很高兴参加第五届中国行业互联网大年夜会暨CIO班14周年年会!CIO班14年的学员们像一颗颗种子在全国各个处所和各个行业开花成果,所以我在此表示祝贺!
 
  根据会议安排,明天讲讲通用人工智能。我自己是不太爱好通用人工智能(AGI)这个词,所以在我的书外面,没有效到这个词。然则大年夜家对这个话题感兴趣,并且这个概念大年夜家也都熟悉,所以照样用这个概念来讲。讲三个部分:一是讲汗青,我们对通用人工智能的寻求;二是讲一下人类智能,由于通用人工智能必须懂得人的智能,不睬解的话做不出来;三是讲一下通向AGI的一种途径,这个途径就是我从《论信息》到《智能道理》到如今正在写的第三本书《智能工程》,一向想描述的一个实际和一种完成方法。
 
  维基百科关于AGI这一段英文大年夜概是三个意思。第一,通用人工智能是甚么?通用人工智能就是可以或许完成一小我一切智能行动或许是智能义务的一个机械体系;第二,它既是人工智能研究者,也是我们写科幻小说的人和将来学研究的人合营应用的一个概念,这句话很成心思;第三,通用人工智能和其他相干的几个智能概念的关系。
 
  确切,我们人类对通用人工智能的寻求有着漫长的汗青。莱布尼茨应当说是我们走向机械智能的一个奠定者,他是二进制创造者,是符号思想符号逻辑的创建者,也是机械思想的创建者。所以应当说从他开端往后,我们在持续寻求一种机械,这类机械可以或许像人的思想,有人一样的智能。
 
  在这个过程当中有很多的尽力,然则很多都掉败了。其实前面两个我们都熟悉,通用成绩求解器,五代机谁也知道,固然美国国防部的DARPA项目我们懂得的不多,然则它也是想寻求通用人工智能,然则他也掉败了。
 
  虽然莱布尼茨1640年前后到如今350多年了,我们依然没有找到解。这外面有说人工智能弗成能在近期有严重年夜冲破的如许一些不雅念,这是左边。左边讲的是为甚么通用人工智能不可,重要的否决看法,所以说我们到明天为止没有找到解。
 
  虽然没有找到解,然则尽力依然没有放弃。到如今,大年夜概全球还有40多个项目在做着通用人工智能,都在停止中。美国2019年的人工智能计谋外面,六项义务中的第四项依然是要找通用人工智能毕竟怎样完成。所以还有40多个项目在明天依然活泼在通用人工智能范畴,然则非常遗憾的是,一切的这些项目到明天为止,连他们本身在内都弗成能认为他曾经找到了走向通用人工智能的路。只是说他们在尽力,没有放弃。
 
  缘由就在于我们一切的通用人工智能的尽力,都没有真正把人的智能毕竟是怎样回事儿弄清楚。维基百科的定义很清楚,通用人工智能就是一个机械体系,可以或许完成一小我一切的智能行动,可以或许成功地完成一切的智能行动。这个定义告诉我们要寻求的目标本身就应当是若何懂得人的智能,然后才说通用人工智能怎样做。人的智能是怎样回事儿?我们确切本身不懂得本身。我一直说,我们最不懂得的是本身,亲信知彼百战百胜,其实最难的不是知彼而是亲信。简直一切的掉败,找找缘由简直都是本身是重要缘由。
 
  怎样懂得人类智能呢?要有很多维度。第一个是多样性,这是教导学和心思学的研究成果。人的智能是有多种类型的,代表人物是加德纳,《多元智力实际》,有中译本,你们可以看一看。他根据智力与大年夜脑的关系及在人类知识和实际体系中的不合部分将智力分为9类:说话、音乐、逻辑和数学、空间、体能、人际、内省、天然、存在。这本书初版提出来了七个,到第二版重版时在媒介外面加了第八个。他在20年后的一篇论文中加了0.5个,存在。他本身都没有肯定这个存在毕竟算不算,所以这是多样性。智力和智能是同一个英文字,只是在不合的语境下翻译成智能或许智力,但英文词是同一的,所以我们说人的智力是不合类型。为甚么心思学和教导学要研究它呢?解释我们人的不合类型的智能或许智力它是有不合方法的。所以明天一直认为智能就是逻辑和数学,这确切是我们熟悉人工智能到明天最大年夜的艰苦。认为数学和逻辑是智能,其他的都是在数学和逻辑之上建立起来的,其实不是。
 
  想想我这一生走过去,数学甚么时辰用的最多?小学、中学、大年夜学。大年夜学以后走向任务单位,数学用的愈来愈少,简直不消。到超市去买器械,你不清算算帐,你如今可以本身结账,扫一下就OK了,所以不计算。即使在人的智能义务中,数学计算的义务是很少很少的,并且人的计算才能是极端弱的。我们很多人两位数的加减法都想用笔算,都想用计算器,所以解释我们的计算才能有多弱,更不消说算法了。想甚么呢?你怎样能够做取得?
 
  第二个生长性,人的智能是渐渐生长起来的,不是一开端就非常完美。所以这是我们的心思学,特别是生长心思学研究的成果。皮亚杰是有名代表人物,所以从胎儿开端,受精卵第三周开端就开端智力发育,一向到成为社会的自力主体,我们才开端行使我们的才能、义务。
 
  第三个构造性,这个构造有时空两个概念。生长心思学就是一小我在你的平生中,不合的时代对不合的智能敏感,这是生长心思学的重要成果。其实还得看时间,我们的智能是一代一代传上去的,而不是一个时间平面。就是你的一生不是你的一生,而是说一代一代传上去的,同时它的空间构造是一切的智力,它在人的一切的认知功能体系的构造中是稳定的,从感知到传输到脑的记忆和应用,它都是固定的构造。这个固定的构造是生上去就有的,构造之间的关系,构造之间哪个先启动哪个后启动都是生上去就曾经定了。
 
  再就是遗传和生命。正由于它有时空构造,所以遗传和生命是人的智能的重要构成部分,没有遗传、没有生命、没有智能。遗传是从甚么时辰开真个?不是你父母的过程遗传了你,而是你遗传了从人类生命的第一个生命开端,一切的基因都在这个遗传过程当中。所以我们才说人的基因本来和一条小虫子、一个细菌、一头猪、一个猴子的有如此多的基因相象性。固然这还不敷,为甚么还不敷?由于我们明天所谓的人类的基因组的研究只是说清楚明了在一小我生命过程当中应用的2%的基因,还有98%所谓的暗基因或许不活动基因还没有研究。假设再把这98%没研究的基因放出来,就知道简直40亿年来退化的都在基因中生长。所以遗传和生命是懂得人类智能的重要内容。
 
  这一点是我们计算机界最大年夜的缺点。计算机界认为信息是符号,所以机械进修、深度神经搜集尽力想尽一切办法把符号变成含义。其实这是跟人的智能比拟,这是错得离谱。由于人从一开端感知信息开端就是含义的,不是符号的。所以不论是很多听到、眼睛看到、鼻子闻到这些感到到,一切的从一开端都是经过过程特定的细胞构造来肯定是甚么器械,然后经过一个构造化的整合和传输过程到大年夜脑外面,所以你感到到痛就是痛、冷就是冷、热就是热,看到的这个光就是这个光,这个器械就是这个器械,没有计算过程,没有任何计算过程。这是我们的神经体系。所以人一切的信息都是含义的,绝不是符号的。符号是在人生活和生长过程傍边为了交换所以才有了说话有了符号,有了符号大年夜家相互之间都是知道的,大年夜家知道这个器械是甚么含义,然则这中心停止记录今后,然则他人不知道,所以就有了重新认知的过程,然后我们的计算机学家认为信息是符号,其实错了,信息它的根本是含义而不是符号。
 
  我们把一代一代的知识经过过程进修过程来积聚到明天的大年夜脑外面。所以往前推一千年、三千年,你取得的知识和才能是不一样的。同时他是从胎教开端,一向到我们任务过程都是持续的交互过程。
 
  同时我们再把如许的器械合起来看到,人的智能一个重要的特点就是主体性(认识、自我、存在、生命),没有存在、没有生计,哪有智能。没有自我保护,智能就玩完了。生物退化的第一要义是生计、自我保护。在如许的过程当中,我们才有了认识、自我。自我和认识不是人独有的,是生物在经久退化过程当中逐步逐步退化过去的。同时是全体的,人的行动要完成从感知到传导过程到记忆到应用到行动,动用了人的生物体各类功能体系,缺任何一个功能体系都是不可的,所以自力的通用人工智能要从外面切出一块那是弗成能的。正是由因而通用人工智能,你可以或许承当人的智能义务,所以承当着社会的角色和义务。
 
  把这些器械合在一路,不合的智力和他的构成和生长的特点放在一路,才是人的智能的全体的视图。如许的全体视图我们怎样样来完成它?我们要完成它起首得答复四个成绩:第一个成绩,定义清楚你要做的是甚么?所以AlphaGo不是通用人工智能,由于它历来没有说我要做通用人工智能。沃森也不是通用人工智能,他历来没有说过他要做通用人工智能。所以起重要定义清楚你毕竟要做甚么;第二个成绩,定义完今后能完成吗?第三个成绩,能使完成的话,给出一条途径来;最后一个成绩特别重要,真能做到了,你做不做?该不该做?这就是明天我们人工智能威逼论的重要须要答复的成绩。
 
  为甚么我的第三本书原筹划这个月要封稿的,然则到明天没有完成。是我写的过程当中愈来愈忐忑。这本书究竟该不该写,该不该出?这是我明天最重要的纠结。我定义的长短生物智能体,在《智能道理》这本书里明白定义了,这个器械就长短生物智能体。有自我和认识,可以或许具有、调用、控制、维系其生计和生长的一切逻辑、物理资本。所以计算资本不是他人的,这个动力不属于他人的,是本身管理和控制的,所以才能成为社会主体。可以或许完成社会交给他的义务,实施社会职责,同时跟人一样,从一开端处理的是含义而不处理符号。符号只是他处理不了的时辰临时放在那的,然则只需进到智能体外部必定是含义,不是符号。
 
  怎样做呢?这个途径就来答复怎样做。这个“做”大年夜体上要满足一个自力的社会的跟人一样的智能体得有照应的功能和束缚。所以起首一个准绳,他和人一样,有照应的功能。而这个功能是由一个一个功能体系来完成的,同时他要担当社会角色,承当社会义务。在这外面一个重要的任务是人的智能40多亿年,不要认为我们可以把最早的原始生命体的基因去掉落,去掉落今后对不起,人就是残破的。所以从40多亿年第一个生命体开端,他一切的故事都是我们明天智能的重要的构成部分。这几百年构成了我们明天在人类社会行动的重要的知识体系,然则不要忘了,没有前面的就没有前面的。然则怎样办呢?我们这个智能体不克不及有若干年,弗成能的,必须要比较短的完成它,所以我们用空间换时间。我们用若干亿的并发来完成时间的年代的迭代,所以这是一个最根本的准绳。我们用大年夜范围并行自我发展,一个一个自力的很小的,既有自力的智能功能的小的器械在一个总的架构下持续的发展,来用空间换时间。
 
  人的功能,通用的非生物智能体他有11个功能体系。从感知开端到描述、记忆,经过过程连接计算,和我们照应的行动生成交互,来完成人的全部的器械。我的第三本书《智能工程》大年夜体上分红两个部分,一个是11个功能体系,第二个部分是一个生命周期。两个内容构成了第三本书的框架。
 
  它的功能体系,我就先不展开讲了。人有生命周期,智能有生命周期,非智能生物体异样有生命周明,它的终点是初始付与,这个遗传的过程依附人给它付与,所以初始是由人来付与。付与以后生长,生长的过程就像孩子从怀孕一向到成为自力的司法主体之前,须要大年夜人的监护。所以说是在人创造的情况傍边生长。那么长大年夜了,18岁了,就得实施职务,要承当社会中的义务而不是科研的义务,是真正承当社会中人承当的各类各样的任务,不是科研而是承当社会义务。最后,是复制和终止,也就是说你可以传承下去,这个跟人不一样,传承不等于本来的灭亡。可以并行的一个一个的生出来,所以这是它的生命周期。
 
  刚才讲了功能体系,一个个功能体系都是由四个层级的,最低层级就是微处理器,下面是功能组织,再下面是功能子体系,最下面是功能体系。功能体系有11个,下面有子体系。所以构件最基本的是微处理器。微处理器,我说的非生物智能体要达到一小我的才能的微处理器有若干?大年夜概10的12-13次方,是如此大年夜量。功能是万亿、十万亿微处理器。微到甚么程度?微到一个字就是一个微处理器。并且这个微处理器是这个字的百科全书,比百科全书还要凶猛。为甚么?它是直接跨界到一切的应用处景中去。所以不是一句话一段文字一篇文章是一个微处理器,而是一个字,任何字母,世界上只需有文字的一切的字母,一个字母就是一个微处理器,只要如许才经过描述、连接、记忆变成真正智能体懂得的器械,而不是符号。只需出去绝不是符号,他就是他,只需进入智能体就是含义,绝不是符号,跟符号没有任何干系。
 
  感知处理器非常复杂,感知处理器怎样做?存算一体,类似于FPGA,每个微处理器有它的操作体系,而这个操作体系用FPGA格局来完成。每个微处理器都有本身的操作体系、存算体系,都有一个自力的功能。总而言之,就是一切的相干都出去了。功能组是一组微处理器构成的,变成一个功能组,下面就构成功能子体系,所以一个词、一句都是一个功能组。智能体说了有11个功能体系,一个功能体系下面大年夜概有几万到几十万个子体系,有百万到切切级的功能组,有亿到十亿量级的功能体系,所以微处理器将是百亿乃至更多。
 
  其实构件还有一个器械就是客不雅对象,客不雅对象须要不合功能体系来处理的,所以我们还有一个逻辑的构件体系,就是一切的认知对象。比如说苹果,其实苹果曾经是一个集成的智能单位,下面还有一组智能单位把各个功能体系外面相干的器械集成起来。
 
  那么怎样完成?其实很简单,我一直说,这个器械的完成简直就是持续的1+1+1+1……,而一切的“1”明天曾经存在,也就是说我们在坐的人一小我都可以做很多很多的“1”。比如编一个 “狄”字,从微处理器到百科全书构成起来,它的音形意、变体、重要应用高低文都集中起来。只需智能体有各类接触情况或许义务触发它的时辰便可以用它了。有音形意,有变体,有场景,我们便可以用它了,所以每小我都可以做很多的根本的构件。
 
  途径就是0-1、1-n、n-N的过程,所谓0-1就是一个详细构件从起步到根本运转起来;1-n,这个可以任务了;n-N就是这个构件完全了,可以遗传可以复制。固然这外面1-n不只仅是指一个微处理器成熟程度往前走,还指微处理器构件数量赓续增长,增长到10亿到万亿这个量级便可以任务了。到N就是完全的了。比如说 “狄”,不合音形意,明天都存在了,当你用到“狄”这个字的时辰,经过过程连接进到这外面都能完成,没有任何的艰苦,这就是它的生长过程。
 
  我们来看苹果,沿着它渐渐的增长,从根本认知到拓展认知、延长认知、归结归结、艺术、笼统、逻辑、迷信、空间、发散思想,都在如许的过程当中来做。这个“做”只需在记忆中完成有效连接,任何义务的触发和这个器械完成有效的连接,那么一切过程都可以往前走。固然,这个写的很简单,真正要变成记忆的话,是一个极端大年夜量的器械。极端大年夜量太复杂了,你做完苹果再做梨、桃、枣,都可以处理。这个法式榜样稍微变一变就变成梨、桃、枣,并且有很多描述都可以变过去,实际上当你做的多了今后,同类之间的任务量会快速降低。假设只需做一个的话,这一个就够一小我用机械做上几年。
 
  一切启动的构件都是明天人类智能曾经有的,并且做的人可以或许完成这个转换过程。固然大年夜家会说到高层怎样处理?其实不复杂,完全经过过程连接和构造来完成。固然要有准绳、要有逻辑,那是别的的事。同时生长情况的请求是必须有的,就像我们从婴儿到可以或许自力行动的一个主体之前,须要家长和社会的庇护一样,须要情况。这个情况必须得存在,不然这个智能体要么夭折要么就变成坏人。明天人类社会里也有坏人,有遗传的也无情况的。不好的器械,遗传的我们不要传出来,所以不克不及设置恶意途径,遗传不克不及有。固然情况也不克不及让他夭折,而技巧上不存在算法、算力的任何能够,由因而叠加的。一个微处理器,假设我们没有存算一体的芯片,没紧要,由于一个微处理器它的计算量不大年夜,照样用并行来处理所谓算力的成绩。技巧复杂性重要在于整体架构、生长途径的规矩化及规矩的生长。采取交互、容错、渐进的准绳,技巧上没有雷区。
 
  我从客岁到本年一向在算,做成一个比我们在坐一切人都加倍聪慧的器械须要若干钱?大年夜概千亿美元到万亿人平易近币,须要6-8年时间。而假设我当项目担任人或许总设计师的话,大年夜概6-8年可以完成,然则我肯定欠妥,所以团队是最大年夜的艰苦。
 
  感谢大年夜家!
 
  备注:想收看杨学山师长教员视频或下载杨师长教员PPT,请登录CIO时代APP。

CIO时代培训产品手册