2024世界人工智能大会语料主题论坛成功举办

DeGao 2025-09-09 00:38:46

高质量、大规模、保障可信语料数据资源是AI阶段要紧基石,7月6日上午,2024世界人工智能大会语料主题论坛在上海成功举办,上海市各相关部门代表、上海人工智能实验室、人民网、上海报业、上海图书馆、上海信投、上海算法独创研究院、中国信通院、复旦大学、华东师范大学、上海资产管理协会、中国银行、招商银行,国泰君安,以及近1000家大模型语料生态企业一道参会,


本次论坛以"语料筑基,智生阶段"为主题,围绕高质量语料数据如何全效供给赋能大模型产业发展,向市场传递专业化、链接型、前瞻性语料生态设计理念,

会上,中国工程院院士鄂维南,人民网党委书记、董事长叶蓁蓁发表主旨演讲,华为、阶跃星辰等大模型语料生态企业经由案例共享、圆桌共话格局畅谈各自对大模型产业发展独创想法、实践,库帕思公司携手大模型语料生态伙伴,集中发布一批大模型语料成果,

上海市政府副秘书长庄木弟在致辞中表达,语料数据是大模型训练要紧"燃料",高质量语料对于大模型在各行各业应用十分根本,有助于大模型更好地适配实际应用场景,加快实行人工智能赋能千行百业愿景,

后世,上海将围绕战略性语料资源重点发力,为大模型独创发展,创造更非常好语料基石环境:夯实语料数据基座,发挥大模型语料运行平台重心枢纽作用,汇聚基石性综合语料资源,配置行业性、专业性语料资源;厚植语料应用场景,围绕大模型训练需求,保障多知识、多模态、准则化高质量语料数据供给,赋能大模型行业应用落地;营造语料良好生态,紧密链接大模型语料供给方、需求方、加工方、技术策源方、专家智库等主体,针对语料领域好企业、好产品,着力制定认证准则、开展品牌建设,连续扩大朋友圈,

语料运作平台1.0上线,最先批十大高质量语料产品发布,

对照最高准则、最卓著水平,打造世界最先屈一指语料枢纽,实行更全效、更高质量语料供给,会上发布"语料运作平台1.0",实行面向语料数据"采、洗、标、测、用"五位一体工具链本事,


为打响高质量语料品牌,进一步激发市场主体语料独创活血,增强供给侧能级,加速医疗健康、城市交通、消费零售、金融、影音等重点行业大模型产业发展,会上,库帕思携手咪咕影像、宝信软件、复旦大学智能医学研究院、上海工创腹地、汇纳科技、万达信息、DGC数传集团、文远知行、文因互联、上海电科智能、海天瑞生集中发布十大语料数据产品,


最先個语料库建设导则面世,金融、教育、生命健康三大领域技术白皮书发布

语料数据是人工智能研究、应用无法或缺资源,高质量语料库更是人工智能赋能新质生产力根本,大模型赋能千行百业须要构建与场景适配语料体系须要规则与实践"并跑",本次论坛中还发布金融、生命健康、教育三项行业语料术白皮书,

《高质量金融语料技术白皮书》聚焦银行、证券、确保、基金等行业实践,重新定义高质量金融语料数据集内涵、外延,形成根据金融领域知识体系"语料魔方"方法论,

《教育人工智能大模型数据治理与共享技术白皮书》对标国内外教育数据系列政策、准则,确立教育行业语料数据准则用例与价值体系,形成一套教育AI大模型数据治理与共享技术准则,

《高质量生命健康语料技术白皮书》从基石医学、药物研发、临床医学、健康管理、中医中药五個方向确立生命健康语料库路线图,独创从寻源、清洗到标注、测试工具体系,


为实行"语料数据资源共建共享""鼓舞多元主体一道推动高水平语料数据要素建设"意向,库帕思公司会同覆盖多模态数据资源供应、加工、应用、运作全链近二十家企业一道发布团体准则《语料库建设导则》,


50余单位一道发起语料倡议,10家企业入选2024语料风云榜

奠定模型训练、语料供给、学术研究、第三方服务等多方机构协作机制,携手打造资源共享、互利共赢、国际级融通"语料生态圈",是众多语料生态伙伴一道愿景,为进一步强化语料生态全产业链各主体间交流协作,营造有利于我国大模型产业生态健康发展环境,会上,50余家单位一道发起"语料生态服务大模型可持续发展倡议",一道倡导携手为我国大模型产业发展持续供应高质量语料,


为加速促进大模型语料生态企业根据高准则发现"好产品"、培育"好企业",本次论坛上,由大模型语料数据联盟正式发布"2024语料风云榜",本榜单经过两個月严格征集、评选,最后在众多参与企业中遴选出10家上榜企业,他们供应高质量、多样化数据集来持助模型训练、改良,承担中国大模型开发中数据收集、清洗、标注、管理,为AI算法供应必需语料资源,显著提升中国大模型性能、应用疗效,最先届语料风云榜上榜企业有:上海恒生聚源数据服务有限公司、上海本原智数科技有限公司、北京云测信息技术有限公司、上海蜜度科技股份有限公司、星环信息科技〔上海〕股份有限公司、数据堂〔北京〕科技股份有限公司、整数智能信息技术〔杭州〕有限责任公司、标贝〔青岛〕科技有限公司、北京海天瑞声科技股份有限公司、天娱数字科技〔大连〕集团股份有限公司,


大模型与大数据库双轮驱动人工智能方法

伴随AI技术连续进步、生态协作深化,后世数据库将更加智能、灵活、无敌,为人工赋能千行百业实体经济发展供应坚实基石,主旨演讲环节中,中国科学院院士鄂维南先生带来主题为"大模型与大数据库双轮驱动人工智能方法"精彩演讲,鄂院士共享如何将大模型方法、高性能通用AI数据库方法相结合,来奠定全效、高准确率、低门槛、低本钱人工智能系统,

根据价值对齐模型发展与语料数据独创供给

与价值对齐是大模型可持续演进基石主旨环节中,人民网党委书记、董事长叶蓁蓁先生共享"根据价值对齐模型发展与语料数据独创供给",他重点共享人民网在主流价值对齐方面实践与经验,根据多维度价值对齐体系语料库,让大模型像人一样"有德、有趣、有序、有品、有用"

大模型语料生态企业案例共享

企业案例共享环节中,两家大模型语料生态企业代表从企业如何在AIGC阶段经由提升高质量语料开发利用来赋能业务发展,

上海阶跃星辰智能科技有限公司副总裁李璟以"大模型阶段产业落地新路径"为题,共享阶跃在大模型语料生态领域独创应用,他表达大模型技术与语料是相辅相成,一道构建人工智能领域要紧基石,语料作为大模型养料,其质量、多样性直接影响模型智能水平,阶跃星辰将携手行业伙伴,共建多元开放协作关系,促进模型生态繁荣、发展,

随后,游族网络CEO陈芳以"王牌语料筑基,打造AI文化娱乐产业生态"为题共享游族在文化娱乐产业里大模型语料又将面对何种机遇、发展后世,他表达伴随AIGC阶段到来,人工智能技术正在变成数字文化产业发展根本要素、澎湃动能,高质量语料是人工智能突破式发展重心因素之一,其中互动娱乐语料具有极高经济、社会价值,游族正在经由"小游酱"AI玩伴、企业内知识库等多方面独创实践,将王牌语料多方位应用于文化娱乐产业,实行企业在AIGC阶段转型、加速发展,

共话后世-咱们须要怎样语料供给

语料数据在大模型开发中起到定夺性作用,是模型本事提升根本基石,那么到底在提升通用大模型及垂直行业模型应用本事方面什么样语料供给是最有价值又最被须要呢?在圆桌环节中,来自上海本原智数发明者李逆勇作为圆桌主持人提出大模型发生对于语料供给带来哪些新机遇、挑战、数据自动化标注与人工标注现况势头及合成数据后世三大难题,圆桌嘉宾华为上海代表处战略官房思哲、北京星尘纪元智能科技有限公司总裁章磊、标贝〔青岛〕科技有限公司联合发明者&最先席技术官李秀林、智境云创发明者&CEO王智武、中云开源数据技术〔上海〕有限公司发明者、CEO陈刚实行观点共享、思想碰撞,


本次会议由大模型语料数据联盟、上海库帕思科技有限公司、上海市数商协会、上海市人工智能行业协会、上海资产管理协会承办,中国联合网络通信有限公司上海市分公司、上海报业集团、中国信通院上海工创腹地、上海亿欧网络科技有限公司、上海市国资委系统中青年知识分子联谊会、民建上海科创工委协办,并得到商汤科技、游族网络、阶跃星辰、稀宇极智、智能投研技术联盟〔ITL〕等众多单位鼎力持助,

  作者:商慧

文:商慧 图:采访对象供应 编辑:徐晶卉 责任编辑:戎兵

转载此文请注明出处。

很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯