图灵为何不亲自设计AI?

DeGao 2025-09-05 00:47:16

2024一开年,中美AI行业发生两件大事,进一步把1993年启动第三次人工智能浪潮推向高潮:OpenAI上线GPT商店,AI商业化进程更进一步;1月16日,中国智谱AI推出比肩GPT-4GLM-4大模型,为中国在全球AI领域博弈增加一份筹码,

人工智能风云70余载,几起几落,沉沉浮浮,拼人才、拼算力、拼资金、拼算法,哪些轶事须要铭记,哪些教训又值得审视?

跨越七十年华丽篇章

只为把“智能”装进机器

阿兰·图灵是一位传奇人物,他不光是每一位当代程序员“祖师爷”,图灵还是一位世界级长跑运动员,马拉松成绩2小时46分03秒,只比1948年奥运会金牌成绩慢11分钟,二战期间,他耀领“Hut 8”小组破译德军密码,变成盟军在大西洋战役中击败轴心国海军根本因素,


图灵也是個马拉松运动员|midjourney

显然,咱们今天要说还是“人工智能”,

图灵被誉为计算机科学与人工智能之父,1950年,图灵最先個次提出“机器智能〔Machine Intelligence〕”概念,“人类利用可用信息、推理来搞定难题并做出决策,那么为什么机器无法做同样事情呢?”

自那时开始,无数科学家、科技企业为之奋斗——赋予机器以“智能”革命悄然拉开序幕,70多年过去,“三次浪潮,两次低谷”, 人工智能到底是冲破层层阻隔,进入大众日常生活,

纵观三次人工智能浪潮,咱们会发现一個有意思现象:理论总是比现实更超前,不是科学家设计不出更非常好人工智能,而是囿于当时计算机技术,无法做到,


人工智能发展大事年表|哈佛大学官网

图灵在1950年论文《计算机器与智能》中已经提出机器思维概念、著名图灵测试,是什么阻止图灵开始就业?有两個原因,先说,在那個年代,计算机缺乏智能一個根本先决条件:它们无法存储命令,只能执行命令,这意味着,计算机只能被告知要做什么,但是不记得自己做什么,第二,计算本钱在上世纪50年代太昂贵,租赁一台电脑每個月须要20万美元,笔者根据通货膨胀率做换算,这相当于现在每月租金254万美元,名副其实“有钱人游戏”


名副其实“有钱人游戏”|midjourney

科学家之所以称之为科学家,是因他们研究总是着眼于后世,就使当下缺乏转变现实条件,

图灵发表那篇著名论文后仅两年,计算机科学家阿瑟·萨缪尔〔Arthur Lee Samuel〕开发出一款跳棋程序,并提出“机器学习”这個概念,1956年达特茅斯会议上,约翰·麦卡锡〔John McCarthy〕正式提出“人工智能”这個词语,1956年,也就变成实际意义上人工智能元年,

至此,“人工智能”跨越混沌初开早期阶段,进入一個高速发展时期,多年后,当大众回看那個阶段,称之为人工智能“最先個次浪潮”


计算机科学与人工智能之父——阿兰·图灵

咱们先来看看“最先個次浪潮”给咱们今天生活留下哪些遗产吧,说出现大概有些惊讶,咱们今天运用大多数软件追根溯源都是“最先個次浪潮”产物,或者说,根据一种叫“手动编码知识〔Handcrafted Knowledge〕”人工智能,比方说咱们Windows系统,智能手机应用程序,人行道上按下开关等待红灯变绿交通灯,这些都是人工智能〔这里采用最先個次浪潮中对人工智能定义〕,

这真算“人工智能”?

算,

人们对人工智能理解一直在更迭,30年前,倘若你问路人,谷歌地图算不算人工智能,得到答案是绝对,这個软件能帮你规划最优路线,还能用清晰语言告诉你如何行驶,为什么不算?〔谷歌地图应用确实是最先個波人工智能典型案例〕

最先個次人工智能浪潮最先选根据清晰且逻辑规则,系统会检查须要搞定每种情况下最要紧参数,并就每种情况下采纳最舒适当行动得出结论,每种情况参数均由人类专家提前确定,因为这個,这种系统很难应对新情况,他们也很难实行抽象——从某些情况中获取知识、见解,并将其应用于新难题,

总而言之,最先個波人工智能系统能够为明确定义难题实行简单逻辑规则,但无法学习,同时很难搞定不确定性,

1957年,罗森布拉特发明感知机,这是机器学习人工神经网络理论中神经元最新模型,这一模型也使得人工神经网络理论得到巨大突破,乐观情绪在科学界蔓延,最先個次人工智能浪潮逐渐被推向高潮——挫败要来,


感知器原理图|加利福尼亚州立大学

1966年,人们发现好像人工智能路走歪,逻辑证明器、感知器、强化学习等等只能做很简单、非常特意且很窄任务,稍微超出范围就无法应对,为更非常好理解,咱们主张读者脑补运用Windows系统体验:一切功能都是提前设计非常好,你无法教会这個系统做什么事,它也无法自己学习额外知识,

另一方面,当时计算机面对内存有限、搞定速度不够挑战,搞定实际人工智能难题变得十分困难,研究者们火速认识到,要求程序具备儿童类似世界认知水平是一個过高期望,在那個时候,没有人能够构建出满足人工智能需求浩大数据库,也没有人晓得如何让程序获取这般丰富信息,与此同时很多计算任务复杂度呈指数级增加,使得完成这些任务变得接近无法能

科学家进入死胡同,人工智能发展也进入“蛰伏期”,

这一;就是十多年,

当时间来到20世纪80年代,两個根本突破重新点燃“第二次人工智能浪潮”:深度学习、专家系统

约翰·霍普菲尔德 〔John Hopfield〕 、大卫·鲁梅尔哈特 〔David Rumelhart〕 推广“深度学习”技术,使计算机能够利用经验实行学习,这意味着人工智能可以搞定那些“没有提前设定”难题,它具备学习本事,另一方面,爱德华·费根鲍姆〔Edward Feigenbaum〕引入专家系统,它模仿人类专家决策过程

反正,第二次人工智能浪潮改变人工智能发展方向,科学家放弃符号学派思路,改用统计学思路来研究人工智能,深度学习、专家系统引入让机器能够根据领域内专业知识,推理出专业难题答案,

因为这個,第二次人工智能浪潮也叫“统计学习〔Statistical Learning〕”阶段

关于这一次浪潮,笔者想要着重两点,最先個,为何它这般要紧?第二,它无法克服弊端是什么?

第二次浪潮时间很短,但经由引入“统计学习系统”,工程师、程序员不会费心去教授系统要遵循精确规则〔最先個次浪潮理念〕,相反,他们为某些类型难题开发统计模型,而后在很多各异样本上“训练”这些模型,使它们更加精确、全效,

另外,第二波系统还引入人工神经网络概念,在人工神经网络中,数据经过计算层,每個计算层以各异方法搞定数据并将其传输到下一個级别,经由训练每一层以及整個网络,它们可以引发最准确结果,


神经网络示意图|Pixabay

这些都为第三次人工智能浪潮奠定基石,况且留下浩大遗产,咱们今天依然在运用,比方说人脸识别、语音转录、图片识别,以及自主汽车、无人机一部分功能,都来自于这次浪潮成果,

但这套系统有一個巨大弊端,根据美国国防高级研究计划局〔DARPA〕指出,咱们尚不清楚人工神经网络背后实际运行规则,也就是说,这套系统运行良好,但是咱们不晓得为什么运行这么好,这就好比人可以把球抛到空中,同时能大概判断球会落在哪里,倘若你问他,你是如何做出判断,是根据牛顿力学定律计算吗?他无法回答,但他就是晓得,

这暴露一种因果关系挑战,因“看不到因果”,第二套系统依赖数据输入,数据输出做决策,缺乏因果会导致严重后果:这個系统容易学坏

微软过去设计一個机器人叫“Tai”,他可以顺畅、人聊天,但倘若有越来越多人告诉他“希特勒是個好人”,它就会逐渐接受这個结论,

这些难题,留给第三次人工智能浪潮来搞定,

这次浪潮也是目前咱们所正在经历,也称之为“情景适应〔Contextual Adaptation〕”,倘若非要确定一個时间节点,应该是1993年之后,摩尔定律让计算机算力急速提升,大数据发展让海量数据存储、分析变成大概,


来源:开源图库Pixabay

为更非常好说明、上一次人工智能浪潮区别,咱们可以用一张图片打個比方,倘若用第二次系统来回答“图片里动物是什么?”你会得到“图片里是一头牛大概性为87%”,倘若同样难题给到第三次系统,它不光告诉你这是一头牛,还会给出符合逻辑理由,比方说四只脚、有蹄子,身上有斑点等等,

换句话说,第三次系统更讲逻辑,

笔者感觉,第三次人工智能浪潮有3個要紧节点〔往往感觉是前两個〕,2006年,杰弗里·辛顿〔Geoffrey Hinton〕发表《一种深度置信网络高速学习算法》,在基层理论上取得若干重大突破,2016年,谷歌DeepMind研发AlphaGo在围棋人机大战中击败韩国职业九段棋手李世乭,这地标着“人工智能”从科研领域开始迈向公众领域,从学术主导走向商业主导,

以后便是2022年11月30日,OpenAI发布ChatGPT,让AI变成一款消费级产品,“生成式AI”、“大语言模型”一时变成大众热议焦点,

生成式AI竞赛,

咱们要拼是什么?

“生成式AI”是人工智能一個分支,经由利用大型语言模型、神经网络、机器学习无敌功能,能够模仿人类创造力生成新颖文字、图片、音、影像等内容,

大众看到OpenAI有多辉煌,那成立之初就有多落寞,那时候OpenAI面对两個困境:一是缺乏资金,二是其技术路线不被主流所认可,

根据机构测算,直到2019年OpenAI共接受捐助总额仅为1.3亿美元,也就10亿人民币,马斯克個人捐助最多,显然,这点钱、国内创业公司动辄上千亿价值融资比不值一提,由于缺乏资金,OpenAI只好依靠捐赠,2016年,英伟达赠送给OpenAI一台DGX-1超级计算机,协助其缩短训练更复杂模型时间〔从6天到2小时〕,

2018年,就连之前最大捐赠来源马斯克也离开OpenAI,他过去提议接管OpenAI,但遭到董事会拒绝,于是离开,同时以后没有再实行捐赠,

另外一方面,OpenAI选择一条不好走路——先研发预训练模型,2018年,OpenAI推出具有1.17亿個参数GPT-1〔Generative Pre-training Transformers, 生成式预训练变换器〕模型,这一年也叫预训练模型元年,

为何这個于预训练模型发布这般要紧?这地标着AI进化路线转变,在此之前,神经网络模型是有监督学习模型,存在两個缺点:

先说,须要大量标注数据,高质量标注数据往往很难获得,因在很多任务中,图像标签并非唯一或者实例标签并非存在明确边界;第二,根据一個任务训练模型很难泛化到其它任务中,这個模型只能叫做“领域专家”而不是真正理解NLP〔自然语言搞定〕,

预训练模型则很非常好搞定上述难题,

2020年,OpenAI发布第三代生成式预训练 Transformer,就GPT-3,这一大事同样变成大洋彼岸另一家中国AI初创企业转折点——智谱AI

GPT-3 发布给大家非常明确信号,就大型模型真正具备实际可用性,在反复纠结、讨论后,智谱 AI 终于定夺全面投身大模型,变成国内较早介入大模型研发企业之一,

同样,智谱AI投入大量研发资源在预训练模型上,2022年,GLM-130B发布,斯坦福大学大模型腹地对全球30個主流大模型实行全方位评测,GLM-130B 是亚洲唯一入选大模型,评测报告显示GLM-130B在准确性、公平性指标上与GPT-3 175B 〔davinci〕 接近或持平,鲁棒性、校准误差、无偏性优于GPT-3 175B,


实际上,GLM-130B是中国科技公司智谱AI发布一個“预训练模型”,“预训练模型”是训练“大预言模型”模型,它位置比大众接触到“生成式AI”更加前置,是埋藏在海平面之下基石设施,现在市面上可供运用预训练模型不多,相对主流是来自OpenAIGPT,以及来自谷歌Bert,GLM-130B正是结合以上两個框架优点国产自主研发预训练模型,

智谱AI则是奋起直追,对标OpenAI,变成阿国内唯一一個对标OpenAI全模型产品线公司,

2020年,OpenAI推出GPT-3

2021年,OpenAI推出DALL-E

2022年12月,OpenAI推出轰动一时ChatGPT

2023年3月,OpenAI推出GPT-4

对比智谱AI、OpenAI产品线,咱们可以看到:

GPT vs GLM

- ChatGPT vs. ChatGLM〔对话〕

- DALL.E vs. CogView〔文生图〕

- Codex vs. CodeGeeX 〔代码〕

- WebGPT vs. WebGLM 〔搜索增强〕

- GPT-4V vs. GLM4 〔CogVLM, AgentTuning〕 〔图文理解〕

为何抢占生成式AI高地这般根本?

2023年一句论断可以回答这個难题,“所有产品都值得用AI重做一遍”,AI对各個行业效能提升是革命性,这种提升发生在服务业、新药研发、网络保障、制造业升级各個方面,

根据中国信通院数据,2023年中国人工智能专利申请量、论文发表量都位居世界最先個,中国人工智能市场规模也在连续扩大,预计到2023年将达到5132亿美元,占全球近四分之一,

“工欲善其事必先利其器”,在“利器”GLM-130B训练下,智谱在2023年10月推出自研第三代对话大模型 ChatGLM3,现在距离发布上一代产品ChatGLM2仅过去4個月,

2024年1月16日,距离ChatGLM3发布不到3個月,公司又推出GLM-4,GLM-4 相比 GLM-3 性能全面提升 60%,其各项参数已经达到比肩GPT-4层次,在基石本事指标MMLU 81.5、GSM8K 87.6、MATH 47.9、BBH 82.25等项目上,GLM-4已经达到GPT-4 90% 以上水平,HumanEval 72 达到 GPT-4 100%水平,

对齐本事上,根据AlignBench数据集,GLM-4超过GPT-4在6月13日发布版本,逼近GPT-4最新疗效,在专业本事、中文理解、角色扮演方面超过GPT-4精度,

GLM-4 还带来 128K 上长文本本事,单次提示词可搞定文本达到 300 页,在 needle test 大海捞针测试中,128K 文本长度内 GLM-4 模型均可做到接近百分之百精度召回,

同时GLM-4大大增强多模态本事以及Agent本事,GLM-4 可以实行自主根据运用者意图,自动理解、规划复杂指令,自由调用WebGLM搜索增强、Code Interpreter代码解释器、多模态生成本事以完成复杂任务,GLMs個性化智能体定制本事也同步上线,不须要代码基石,运用者用简单提示词指令就能创建属于自己GLM智能体,


其实智谱AI发展路径也符合AI行业内在规律,“人工智能不是一個简单从1到100进步过程,它往往趋向于两個极端:要么90分以上,其它都是10分以下,”换言之,要么“高速突破”,要么“原地打转”,不奋力前进就只能滑入另一個极端,

回到历史时间线里,咱们目前正处于第三次人工智能浪潮当中,既然有浪潮,就有高潮与低谷,第三次浪潮会结束,什么才是推动它根本?

有一种观点感觉“深度学习算法”带来技术红利,将会支撑咱们前进5-10年,随后瓶颈就会到来,在瓶颈到来之前,咱们急切须要一個“技术奇点”拿过接力棒,把这次浪潮推到更高高度,

“技术奇点”在哪里尚无法知,但有一点可以确定,它发生有赖于企业永久投资、深度研发、对科技信念。

封面图来源:midjourney

-果壳商业科技传播部出品-

很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯