走进深圳智能电机制造工厂,车间内机器轰鸣,生产线上机械臂不断伸缩旋转、激光焊接高速运转。在人工智能大模型的赋能下,该工厂焊接设备能够自动调整焊接轨迹、功率等参数,完成各种工况下的焊接作业。
去年以来,人工智能热潮席卷全球。从GPT-4到Sora,大模型的发展如火如荼。从与人顺畅聊天到写脚本、合同,从检测程序安全漏洞到重塑软件开发、驱动自动驾驶……大模型技术正成为产业创新变革的重要驱动力。
今年全国两会期间,“人工智能+”首次被写入政府工作报告。对于大模型,小鹏汽车董事长、CEO何小鹏认为国内目前没有企业能利用好大模型;中国铁塔党委书记、董事长张志勇,长虹控股集团党委书记、董事长柳江强调算力资源不足制约大模型发展;360集团创始人兼董事长周鸿祎建议中国特色大模型应向垂直化产业化方向发展;科大讯飞董事长刘庆峰提出从国家层面整体规划.....
万众瞩目的大模型,如何真正赋能千行百业?
千行百业呼唤大模型
赛迪智库数据显示,在过去的2023年,国产大模型一时间呈现出爆发式的增长态势。据不完全统计,截至2023年11月,国产大模型已达近200个,目前已有超20个大模型获得备案,大多数已向全社会开放服务,大模型技术“百花齐放”。
“2024年将是大模型走向落地应用的关键之年。”今年两会期间,全国人大代表、科大讯飞董事长刘庆峰在接受记者采访时表示,以大模型为代表的通用人工智能将会深刻地改变当前以人力和时长为主要生产模式的产业形态,从根本上重塑产业的全球竞争力,是驱动形成新质生产力的强大动能。
全国政协委员、360集团创始人兼董事长周鸿祎同样认为,2024年,大模型在不同行业垂直领域的应用将大有可为。“场景很重要,通用大模型在企业级场景中无法直接应用,发展垂直化和企业化的大模型可以更好地满足企业的个性化需求,提高生产效率和服务质量,促进产业升级。”周鸿祎说道。
然而,随着大模型的应用与普及,其发展也面临着算力资源不足、高质量数据欠缺等问题。全国人大代表、中国铁塔党委书记、董事长张志勇指出,大模型在前期训练阶段和后期调优阶段都需要海量的数据支撑,数据质量直接影响大模型的“聪明”程度,训练数据集的分布特征和多样性也会影响大模型的能力。目前市场上缺少高质量的行业公开数据,很多大模型企业使用相同的开源数据集,无法快速帮助其构建契合行业特点、差异化的大模型;而掌握丰富行业数据的企业又缺乏大模型研发能力,掣肘了行业大模型的创新发展。
“我国在算力基础设施、数据完备性方面与国际先进水平存在差距。”全国人大代表、长虹控股集团党委书记兼董事长柳江建议,采取多种举措强化算力基础设施及产业数据平台建设,大幅改善算力、数据的公共资源服务供给能力,帮助企业低成本获取算力、数据和模型服务。
面对行业关切,工业和信息化部部长金壮龙在全国两会“部长通道”采访活动上回应称:“要促进制造业数字化、网络化、智能化发展,开展‘人工智能+’行动,推动人工智能赋能新型工业化。”
中国需要怎样的大模型?行业主管部门一直在思考。当前,我国人工智能发展迅速,总体处于全球第一梯队。我国拥有海量的数据、丰富的场景和庞大的内需市场,制造业智能化转型需求大,数字基础设施建设全球领先,这为大模型发展提供了重要支撑。工信部指出,下一步大模型技术发展最主要的一个侧重点是在生产领域的应用。这将是国际竞争非常激烈的一个新赛道。我们要以人工智能和制造业深度融合为主线、智能制造为主攻方向、场景应用为牵引,统筹布局通用大模型和垂直领域专用模型,从供需两端发力,营造创新生态,高水平赋能新型工业化。要加大创新投入,夯实算力、算法、模型、数据等技术底座,提升大模型性能水平。
大模型“落地为王”
科技的价值在于应用。百度创始人、董事长兼首席执行官李彦宏指出,AI原生应用要能解决过去解决不了、解决不好的问题,应用才是大模型存在的意义。业内专家一致认为,如今,大模型早已走过概念阶段,大模型产业化是大势所趋,必须落地产业才能释放大模型的深层价值。
同样是在今年全国两会上,全国人大代表,山东能源集团党委书记、董事长李伟的一句话引起了记者的注意。相比会场内外对大模型应用的展望,这位质朴的山东汉子,只是说他们已经成功用起了矿山大模型。
记者通过采访了解到,这个大模型并不简单,是山东能源集团与华为联合发布的全球首个能源行业商用AI大模型——盘古矿山大模型。该模型涵盖采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化等9大专业40个场景应用,将AI场景落地周期由2个月缩短为2周,AI精度比传统小模型提高10%、训练效率提高85%,已经初步形成了煤矿人工智能开发应用的产业化能力。
不仅是矿山,像华为云盘古大模型这样的垂直大模型,其实已经在政务、汽车、气象、医学等多个领域成功应用。
“通用大模型往往是通才,而不是专才,缺乏行业深度。对于企业来说,更需要与具体行业、具体领域结合,符合产业需要的垂直大模型。”在近日播出的央视网《中国神气局》两会特别策划节目中,工信部信息通信经济专家委员会委员刘兴亮说道。
在中国石油集团测井有限公司首席技术专家周军看来,企业领域级的大模型是大模型专家和业务专家联合形成的一个知识积累,它能让企业的核心业务走向极致,发挥出关键作用。
“中国发展大模型的一个重要方向应该是借助产业和场景的优势,将大模型与业务流程、产品功能相结合,寻求多场景应用、垂直化和产业化的落地,助力加快形成新质生产力,以‘人工智能+’推动我国自主可控的大模型产业生态蓬勃发展。”华为混合云副总裁胡玉海在节目中表示。
千里之行始于足下,以华为为代表的中国大模型探路者,秉持AI for Industries理念,致力于踏踏实实做好一个行业大模型,用大模型技术真正解决各行各业的难题。
一方面,华为云盘古大模型扎根垂直行业,深入千行万业。作为中国首个全栈自主、安全可靠的AI大模型,盘古大模型已经在为矿山、政务、汽车、气象、医学、数字人、研发等领域提供创新服务。在气象领域,华为云联合深圳市气象局,打造区域气象预报大模型,提高包括降雨在内的各气象要素精细预报能力和时效,助力大城市气象灾害预警和防灾减灾;在交通领域,盘古汽车大模型可通过构建数字孪生空间,生成复杂场景样本,让自动驾驶学习新复杂场景的周期从两周以上缩短到2天内;在医疗诊断领域,盘古医学大模型学习了1600万学术期刊等海量高质量数据和100多万结构化知识图谱,具备医学临床辅助能力,可有效支撑医学检验、临床辅助诊疗、个人健康管理等场景AI应用。
另一方面,华为面向万亿大模型时代,发布“大算力、大存力、大运力”解决方案,打造领先的AI大模型训练集群,保障底层算力。算力方面,华为通过架构和系统创新,构筑面向多场景的大算力平台,突破AI大模型训练的算力瓶颈。存力方面,华为发布领先的AI知识库存储OceanStor A800, 以创新架构构建高性能数据存储。运力方面,华为发布业界首款高运力DCN星河AI智算交换机和业界容量最大的超宽全光智能DCI方案,以大规模,大容量网络运力释放大算力。记者了解到,华为已经在乌兰察布、贵安、芜湖建立了三个AI的云服务中心,希望通过云服务的方式,把AI算力以较低的价格及时地提供给用户,成为他们稳定可靠的算力支撑。
同时为了真正听清行业业务需求的呼声,过去几年华为把一批又一批博士、专家、科学家派到“田间地头”,今年还将增派200名博士深入一线,真正解决各行各业的难题。正如胡玉海所说:“大模型使能千行百业的背后是持续的技术创新。我国拥有全球最丰富的行业应用场景,也拥有最大的软件创新人群。未来,大模型将融入我们生产生活的方方面面。华为将持续投入在大模型领域的技术,提供更普惠的AI算力和大模型,打造AI时代最好的云底座!”