千行百业加速拥抱大模型(AI前沿观察)

2023-12-22 03:26    来源:人民资讯

本文转自:人民日报海外版

技术创新快 应用渗透强 国际竞争激烈

千行百业加速拥抱大模型(AI前沿观察)

潘旭涛 陈斯达

《 人民日报海外版 》( 2023年12月22日 第 08 版)

在湖南省长沙市举办的2023世界计算大会专题展上,参观者在了解AI大模型。

新华社记者 陈泽国摄

观众在2023杭州云栖大会上参观AI大模型相关应用。

龙 巍摄(人民图片)

近日,《联合国气候变化框架公约》第二十八次缔约方大会(COP28)在阿联酋迪拜举行。大会期间,中国研究团队展示的人工智能气候大模型引发广泛关注。此款名为“伏羲”的大模型,对气象进行预报的时间范围长、精度高。

当前,中国国产大模型进入高速发展期,千行百业加速拥抱大模型。科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,涌现出一批具有行业影响力的预训练大模型。

工业和信息化部新闻发言人陶青表示:“以大模型为代表的人工智能发展呈现出技术创新快、应用渗透强、国际竞争激烈等特点,深刻改变制造业生产模式和经济形态,展现出强大的赋能效应。”

垂直大模型密集“上新”

专家认为,大模型的长期价值将通过行业应用实现。随着技术不断迭代更新,大模型的应用场景日益广泛。

在北京经济技术开发区(北京亦庄),不少驾车的市民发现,遇到红灯的次数明显变少了,经常是“一路绿灯”。这背后,是全域信控与交通大模型在发挥作用。

据了解,北京亦庄联手百度,将路侧感知数据、互联网数据等多源时空数据进行融合。在此基础上,利用交通大模型研判拥堵发生的可能性,叠加仿真推演,生成全域信控方案,并自动优化信号灯配时方案,由“车看灯行”变为“灯随车动”。据测算,北京亦庄布局全域信控后,路口的平均通过时间缩短28%。

从交通到文旅,从教育到医疗,近期,垂直领域的各类大模型密集“上新”。相较于通用大模型,垂直大模型具有更强的专业性,能够更好地解决特定领域的问题和提供更加精准的服务。

携程集团发布的旅游行业垂直大模型“携程问道”,支持自然语言交互,可以辅助用户进行酒店、景点预定以及行程规划决策等。

科大讯飞发布的“讯飞晓医”APP,基于讯飞星火医疗大模型,可实现健康自查、体检报告解读、健康档案管理等功能,为用户提供健康咨询。

南京农业大学科研团队发布的古籍大语言模型,能够实现词法分析、信息抽取、智能作诗等功能,有望应用推广到古籍整理、数字文娱等领域。

数据显示,截至今年10月,中国拥有10亿参数规模以上大模型的厂商及高校院所超过250家,垂直行业应用成为大模型产业落地的关键赛道。上海财经大学校长刘元春认为,中国作为世界第二大经济体,拥有超大规模市场和数字资源优势,为大模型提供了更深入、更丰富的落地场景以及能够持续训练的环境。

“当前,大模型‘基础设施—底层技术—基础通用—垂直应用’的发展路线逐渐清晰。”中国工程院院士、湘江实验室主任陈晓红表示,大模型技术与实体经济加速融合,应用场景十分广泛。

数据“燃料”加快共建共享

数据是大模型训练的“燃料”,数据质量对大模型至关重要。国内大模型快速发展对高质量数据的迫切需求,推动中文语料数据资源加快共建共享。

今年7月,2023世界人工智能大会发起成立了中国大模型语料数据联盟。8月,上海人工智能实验室宣布,联合中国大模型语料数据联盟成员单位共同开源发布“书生·万卷”1.0多模态预训练语料。本次开源的数据总量超过2TB,包含超5亿个文本、2200万个图文交错文档、1000个影像视频。

在11月举行的2023人工智能计算大会上,智源研究院联合阿里云、中科创达、蚂蚁集团等17家企业发布《“中文互联网语料库”共建共享倡议书》。

数据交易日益兴起,为大模型获取语料资源提供了新途径。《上海市推动人工智能大模型创新发展若干措施(2023—2025年)》提出:“依托上海数据交易所建立语料数据交易板块。”当前,上海数据交易所挂牌的语料数据产品包含文本、音频、图像等多模态,覆盖金融、交通、医疗等领域。上海数据交易所总经理汤奇峰表示:“语料库采购已经在不少大模型企业成本中占据重要比重,上海数交所希望以市场配置的方式组织数据要素、推动语料库建设。”

建设智算中心增加算力供给

大模型进行训练和推理时,对算力的需求量巨大。算力是大模型的底座。算力通常分为通用算力、智能算力和超算算力,大模型需要的是智能算力。如何破解智能算力紧缺问题,成为大模型发展路上的必答题。

电信运营商、互联网企业等积极投入智算中心建设之中。去年至今,重庆移动智算中心、阿里云张北超级智算中心等陆续投入运营。今年以来,中国联通长三角(芜湖)智算中心、河北石家庄智算中心等相继启动建设。

当前,各地加速推动算力基础设施建设,提升算力供给能力。《北京市促进通用人工智能创新发展的若干措施》提出,加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心,形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。《河南省重大新型基础设施建设提速行动方案(2023—2025年)》提出,实施高性能算力提升工程,加快建设郑州、洛阳等全栈国产化智能计算中心,构建中原智能算力网。

在“东数西算”战略背景下,西部智算中心建设迎来发展机遇期。11月30日,青藏高原第一座智算中心——青海昆仑人工智能算力中心正式揭牌,依托三江源国家大数据基地,实现算力资源的托管运营。12月7日,宁夏回族自治区首个大规模集群智算中心建设项目签约,该中心以国产全功能GPU为底座,为大模型训练与推理、3D图形渲染等提供算力支撑。

今年10月,工业和信息化部等6部门印发《算力基础设施高质量发展行动计划》,提出到2025年,算力规模超过300EFLOPS(EFLOPS是指每秒百亿亿次浮点运算次数),智能算力占比达到35%。京津冀、长三角、粤港澳大湾区、成渝等节点面向重大区域发展战略实施需要,有序建设算力设施;贵州、内蒙古、甘肃、宁夏等节点推进数据中心集群建设的同时,着力提升算力设施利用效率,促进东西部高效互补和协同联动。

“算力尤其是智能算力已经成为驱动大模型进化的核心引擎。智算力就是创新力,已经成为产业共识。”浪潮信息董事长彭震表示,应大力发展普适普惠的智算中心,使智能算力成为城市的公共基础资源,用户可以选择自建算力集群,也可以采用智算中心提供的算力服务来完成大模型开发。



刑事诉讼中的数字化革新
科技

刑事诉讼中的数字化革新

本文转自:法治日报□ 王税 在数字化时代,刑事诉讼正经历一场深刻的数字化革新。这场变革不仅是技术设备的更新换代,更是法律体系与科技深度融合的体现。笔者认为,案件管理系统的优化、数字证据的广泛应用、在线法庭与远程听证的实践以及人工智能和预测性分析的引入,构成了这场革新的核心内容。随着技术的持续发展,需 [详情]

“祥龙贺岁”主题巴士 亮相滨州街头
科技

“祥龙贺岁”主题巴士 亮相滨州街头

本文转自:鲁中晨报“祥龙贺岁”主题巴士 亮相滨州街头 滨州1月22日讯继推出婚庆主题巴士之后,滨州公用事业集团权属公交公司在新春来临之际,又推出“祥龙贺岁”主题巴士,提升城市春节氛围。  [详情]

辣椒市场 交易火爆
科技

辣椒市场 交易火爆

本文转自:商丘日报 1月22日,柘城辣椒大市场内客商云集,交易火爆,满载辣椒的车辆进进出出,呈现出一派繁忙景象。据悉,该县有20万人聚集在辣椒产业链上,辣椒种植面积常年稳定在40万亩,年产干椒12万吨,每年有70万吨辣椒在此集散销售,交易额超百亿元,形成“全国辣椒进柘城、 [详情]

我国科学家成功实现无串扰的量子网络节点
科技

我国科学家成功实现无串扰的量子网络节点

本文转自:黄石日报 新华社北京1月23日电 量子网络是基于量子力学规律对量子信息进行存储、处理和传输的物理装置,是实现量子通讯和大规模量子计算的基础。清华大学研究团队利用同种离子的双类型量子比特编码,在国际上首次实现无串扰的量子网络节点,对未来实现量子通讯和大规模量子计算具有重要意义。该研究成果近日 [详情]

飞腾腾珑E2000助力天津地铁AFC系统投用
科技

飞腾腾珑E2000助力天津地铁AFC系统投用

本文转自:科技日报 科技日报天津1月23日电 (记者陈曦)记者23日获悉,随着天津地铁11号线一期东段开通运营,全线基于飞腾腾珑E2000 CPU的AFC自动售检票系统也投入使用。该线路也是国内首条全线路AFC系统采用飞腾腾珑E2000 CPU的轨道交通项目。 据介绍,本次开通的天津地铁11号线,是 [详情]

我科研团队研发出新型绿色速溶融雪剂
科技

我科研团队研发出新型绿色速溶融雪剂

本文转自:科技日报 ◎本报记者 俞慧友 1月23日,长沙理工大学教授贾传坤团队透露,团队近期研发出了一款可快速融雪且无污染的新型融雪剂,有望进一步加速“破冰”,降低冰雪气候下的交通风险。  [详情]