院士强调AI大模型:“技术落地不易,数据仍无法满足需求”

DeGao 2025-09-06 19:19:27

南方财经全媒体见习记者马嘉璐南沙报道

人工智能发展正在驶入“快车道”,面对ChatGPT,咱们如何发展自己人工智能大模型?5月22日,2023大湾区科学论坛人工智能分论坛——第四届广东人工智能发展论坛暨2023新一代人工智能院士论坛在广州南沙举办,以“智创大引擎,赋能新后世”为主题,邀请各领域院士、行业专家围绕大数据、大算力、大模型等内容实行深入探讨,

“要想做大模型,不是说拍拍脑袋、喊個口号那么容易,须要有算力,是有几十亿、上千亿价值投入才干做出点像样东西,”中国工程院院士、鹏城实验室主任高文表达,目前我国人工智能大模型在算力、算法、数据方面不同样层次地面对挑战,须要逐個击破,希望能够进一步发挥数据价值,融合算力、算法,使大模型性能更加改良,

中国科学院院士、深圳大学校长毛军发感觉,ChatGPT既不是“洪水猛兽”,也不是“神丹妙药”,应抓住机遇,借助ChatGPT热潮使更多人工智能项目落地,


2023大湾区科学论坛人工智能分论坛现场,中国工程院院士、鹏城实验室主任高文致辞

“既不是洪水猛兽,也不是神丹妙药”

“确是百年一遇技术变革,”IEEE Fellow、广东省人工智能与机器人学会常务理事王孝宇永久在产业界深耕,他表达,这次通用人工智能表现出通用本事突破,任凭是对其他领域技术,还是对整個产业商业化,都带来非常透彻变革影响,

在人工智能行业已就业三十余年ACM/IEEEFellow、腾讯最先席科学家张正友坦陈自己看到ChatGPT“确实感到震惊”,他感觉,ChatGPT带来虽说不是“互联网阶段”,但可以说是“iPhone阶段”,“ChatGPT确实展露出当前人工智能研究已经取得‘质’进步,但还没到毁灭人类地步,”

张正友以计算器打個比方:在计算器被发明出现时,有人感觉不再运用算盘会让人类脑力下降,但实际上这种情况并未发生,他感觉,同样,拥抱ChatGPT也可以使人类本事再次得到质飞跃,但是,张正友也指出,ChatGPT并非完美,“一本正经胡说八道”难题仍待搞定,另外还面对着算力本钱高、多個模型博弈与协作等难题,最要紧是,“GPT算法是否就是通往通用人工智能唯一路径,依旧值得探讨,”

IEEEFellow、国际级欧亚科学院院士、新一代人工智能产业技术独创战略联盟联合秘书长李世鹏分析,GPT大规模参数,使其基石模型在零样本学习情况下就能很好地就业,经过寥寥无几样本监督学习就能有惊人性能,非监督学习使它具有一些初步抽象本事,并进一步具有归纳本事,就可以将类似属性数据聚集在一起,纵然它自身并非晓得到底是什么属性,经由提示训练,ChatGPT将这些属性打上能够被人类理解标签,使它能够更好地理解人类意图,这也使其与运用者交互更智能、更准确,进而为进一步自我增强采集更多数据,根据完备基石模型、人类提示训练、初现归纳本事,ChatGPT就可以生成很合理答案框架,

中国工程院外籍院士、香港中文大学〔深圳〕副校长罗智泉也感觉,人类智慧可以集中体现在记忆、关联、举一反三、计算四個方面,ChatGPT目前在记忆、计算本事方面已经可以超越人类,又显示出一定举一反三本事,但根本是,ChatGPT不具备人类原始独创本事,也就是“从0到1”,利用它可以使各行各业人们就业更加简化,同时罗智泉也提醒到,ChatGPT将对社会引发很大冲击,尤其是带来失业难题,应该提前部署应对,

此前,涵盖特斯拉CEO联合发明者埃隆·马斯克在内企业家、学者发布公开信,呼吁全球所有AI实验室要暂停训练比GPT-4更强系统六個月,对此,香港大学副校长〔学术发展〕、地球科学系全球可持续发展讲席教授、国际级欧亚科学院院士宫鹏感觉,ChatGPT发生离不开人工智能行业几十年积累,有其存在客观规律,它发展进程并非寥寥无几人就可以改变,况且,目前人类对ChatGPT是“知其反而不知其所以然”,依旧须要进一步研究,

“ChatGPT既不是洪水猛兽,也不是神丹妙药,要一分为二地来看待,”毛军发总结道,ChatGPT掀起人工智能又一次高潮,咱们应该抓出机遇,借助ChatGPT热潮使更多人工智能项目落地,


2023大湾区科学论坛人工智能分论坛现场

对大模型来说 数据量“依旧不解渴”

“要想做大模型,不是说拍拍脑袋、喊個口号那么容易,须要有算力,是有几十亿、上千亿价值投入才干做出点像样东西,”高文表达,目前我国大模型在算力、算法、数据三個基本要素方面不同样层次地面对挑战,须要逐個击破,

山东大学信息科学与工程学院教授、华为昇腾计算业务CTO周斌祥明介绍道,大模型系统工程围绕着从基石硬件到算法、算力、开发工具、调试调优、部署等一系列非常复杂应用开发系统,每一环节都存在着大量工程、技术挑战,他表达,希望有高质量数据、高性能计算平台以及更非常好框架设计,来支撑大规模训练、调优、支撑大规模并发系统改良,

鹏城实验室作为国家战略科技力量要紧组成一部分,建设具有E级AI算力“鹏城云脑”重大科技基石设施,高文透露,在算力方面,鹏城实验室已投入大量资源建设“鹏城云脑II”,并将投入更多用于建设“鹏城云脑III”,面向全社会供应大模型训练算力底座,

得益于开源生态,算法接近是“公开知识”,高文指出,下一個须要攻克,就是数据量不够难题,目前企业可以经由公开渠道相对容易地购买数据,但“依旧不解渴”,这次论坛发布“鹏城·星云系统”、“鹏城·星方数据集”,就是聚焦天文、遥感两大学科科研云平台,希望用数据让AI更加“聪明”,于是更好地满足国际级大科学计划、工程需求,高文还介绍,鹏城实验室也将实施增无敌模型技术平台计划,数据持有方能够经由数据在有限范围共享方法对大模型实行微调适配,换取大模型运用权益;鹏城经由运用更广泛数据获得更普适大模型,形成互利共赢,

数据到底有多要紧、难在哪儿?鹏城实验室云脑使能研究所所长张伟实行祥明解释:“数据之于大模型就像石油之于汽车,汽车是无法直接运用原油,原油经过一系列复杂过程炼化成汽油后,才干给汽车运用,”同样,海量原始数据须要经过“炼化”构建成数据集,这样才干真正有效地供应给大模型训练,

在不同样专业领域,数据体现出不同样方面复杂性,广州大学天体物理腹地副主任王锋面对数据量是“太多”,他参与目前世界最大500米口径球面射电望远镜〔FAST〕,每天搞定数据量与国家级互联网一天引发数据量相当;正在参与建设平方公里阵列射电望远镜,每天搞定数据量将大概与全球互联网一天引发数据量相当,

中山大学中山眼科腹地副院长、广东省近视防空专家指导委员会主任委员卓业鸿面对数据量则是“太少”,卓业鸿说,病例数据存在共性,但更多是個性化,难以用同一個准则去统一,一方面,是因每個病人情况都未尽相同,又会分散到不同样科室;另一方面,每位医生记录习惯也有所不同样,更要紧是,不同样医院不同样检测设备数据质量参差不齐,这就造成在医疗领域能够实际用于大模型训练数据并非多,须要实行特殊“炼化”,

以前,这個“炼化”过程基本是依靠人工清洗、标注等来完成,本钱高且效能有限,张伟透露,鹏城实验室正在尝试构建一整套数据加工本事,将数据、算力、算法真正融通,在多领域形成系统性研究本事,

大湾区人工智能布局应“顶天立地”

作为国家级高精尖企业、人才聚集地,粤港澳大湾区高规格谋划人工智能产业、技术布局,数据显示,2022年广东省人工智能企业已超过1500家,人工智能重心产业规模突破1500亿元,带动相关产业产值近万亿元,位列中国最先個梯队,

张伟感觉,粤港澳大湾区具备人才优点,不光聚集国内人才,也在逐渐诱惑国际级人才;大湾区还具有传统产业优点,可以为人工智能行业发展供应软硬件持助,在政策大力扶持下,大湾区已经变成人工智能行业发展沃土,

“用一句老话来说,就是‘顶天立地’,”毛军发提醒,粤港澳大湾区在人工智能领域虽说具备明显优点,但也要清醒地认识到,很难面面俱到,因为这個,一方面要“顶天”,抓紧推动数据、算力、算法基石设施构建;另一方面要“立地”,选准一些重点应用场景实行落地,

布局人工智能大模型,下一步应该怎么做?毛军发主张进一步增强开放,提高数据、算力、算法泛用性、多元服务,让更多运用者能够方便地运用,罗智泉感觉,算法无法仅仅停留在“微调”层面,还是应该做原创,要把复杂度、本钱降下来,使各项性能得到综合改良,李世鹏则着重,要以基石研究独创耀领产业发展,

“一個大模型很难搞定所有难题,”张正友感觉,倘若多個大模型之间可以实行良非常好协作,将会“发挥出巨大威力”,IEEE/IET Fellow、鹏城实验室副主任石光明表达,在鹏城实验室供应算力、算法持助下,倘若能够进一步发挥数据价值,我国人工智能大模型将有望迈上新台阶。

很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯