智能网原创,转载请注明来源
从ChatGPT横空出世,引发了无数的猜想和商机,到拨开迷雾,积极寻找大模型应用落地的支点,短短1年多的时间,大模型市场就迎来了从狂热到冷静的理性回归。但是大模型与产业如何结合?开源模型和闭源模型如何选择?除了资金企业还应该做好哪些准备?在产业应用之前,大模型依然有很多待解的难题。

近日,一场围绕AI大模型的圆桌对话试图从不同维度对上述问题给出答案。
安筱鹏:安筱鹏 阿里云智能集团副总裁
讨论嘉宾:
殷宇辉 360集团副总裁、数智化集团CEO、人工智能研究院院长
周亚灵 华为云工业数字化首席产业架构师,总监
杜夏威 中科曙光总裁助理兼智能计算产品事业部总经理
马超 润和软件首席AI技术官
圆桌讨论实录
安筱鹏:欢迎大家来到圆桌对话环节!首先请4位嘉宾分别用一个关键词来分享对于当下火热的AI大模型的观察。
殷宇辉:如果说用一个词的话,我觉得是新质生产力的场明星场景。大模型是新质生产力的核心引擎,但基于 AI怎么样找到场景去落地,其实是今年百行千业都面临的问题。对此,每家企业都有自己的一些方法论和实践,但是这些实践怎么样变得更通用,推动大模型更完善,或者更行业化、更垂直化,可能是我们下一步要探索的重点。
周亚灵:如果用一个词的话,就是大模型代际技术升级带来的商业价值闭环。
通信从3G到4G,手机从功能机到智能机,汽车从燃油车到新能源汽车都是代际升级,那么大模型或者人工智能的代际升级在哪里?能否像新能源汽车一样带来代际上的差异。其次,人工智能的具身智能,能够真正带来大规模颗粒变现,颗粒正循环的场景在哪里?这对于对行业的示范意义和引导意义非常重大。
杜夏威 :用一个关键词的话,我个人会选择落地。大家都能够感知到现在大模型的火热程度,但是如何实现整个技术链条的闭环,形成产业级的应用,不仅是眼下的主要问题,也是决定大模型和AIGC技术持续可循环发展的一个关键问题。
马超:用一个词来形容大模型,我关注的是企业级应用。
企业应用大模型的时候会面临成本、数据收集,行业KNOW-HOW沉淀等很多问题。相比AI1.0时代,大模型让我们看到了人工智能的上限,同时也增加了企业级AI应用的落地成本,这个也是我今年比较关注的。
安筱鹏:AI大模型是一次技术的升级,还是会带来一次技术的产业革命,业界有不同的认识和判断。各位看来,这一轮的AI大模型跟5、6年前的传统AI或者说判别式人工智能的本质区别是什么?它会不会带来颠覆式的产业影响?
殷宇辉:AI大模型跟传统AI或者大数据技术不同的几个方面:第一在生成,第二是在逻辑性推理的增强,第三,也是最重要的是对交互方式的改变。
从Chat GPT开始,不管数字人还是各类问答,新的交互方式已经改变了我们的生活,这是大语言模型最本质的功能或特性。从GPT开始到现在文生视频,基于transform架构可以实现文本的对齐,图片的对齐,甚至视频拆成一个立体空间再小块的对齐,这和原来的技术架构是完全不一样的。所以我同意您讲的后半句,就是说这是一次产业革命,是产业革命一定是它给人们的使用带来了交互式的革新。
第二,AI大模型的技术能随着时间推演,逐步升维,同时成本还在持续降低。下一步,从泛互联网延伸到传统产业,这个模式最后会席卷所有产业,我觉得它会是一次真正的 AGI(通用人工智能)的革命。
马超:我认为大模型跟传统判别式模型的关键区别之一在开放域问题上。判别式模型要求在特定任务范围产生相应的能力,而生成式模型更擅长于对开放域的问题进行相应的解决。
另外的区别是大模型的参数量,训练数据量,还有智能化程度。比如,一些开源大模型,它不需要做任何的训练就可以直接用于实际的应用,而且能取得比较好的效果,传统的判别式模型需要从0开始训练。另外,从产业颠覆的角度来讲,AI的出现使得原本没有进入赛道的企业,有可能通过AI技术进入客户视野,可能会引起市场的重新洗牌。
其次,技术供应商的合作模式也发生了很大的改变。AI 1.0时代因为成本比较低,AI技术服务提供商可以一站式提供技术或方案。但是大模型出来之后,算力成本、数据成本、模型成本都在提高,不是一家供应商能够完成的,所以形成了算力服务商、数据标注服务商、基础模型服务商和解决方案服务商,4个角色共同为1家企业提供人工智能服务,技术供应商的体系结构分工更加明确。
安筱鹏:今年的汉诺威工业博览会上提出了一个问题,美国的大模型和德国的制造业在结合之后做什么。中国也在探讨大模型跟实体经济的结合,在结合融合落地的过程中面临哪些问题挑战?加速推进应该具备哪些基础?
周亚灵:大模型跟实体经济的结合跟制造业数字化转型一样,很难有一个放之四海而皆准的法则,但是我们可以从细枝末节里看到一些通用的方法。基于华为公司自身去做大模型和应用大模型过程中形成的一些经验,我们认为,做企业大模型首先要回答三个基本问题:第一,公司内部业务用大模型到底有没有达成统一的共识,有没有行动纲领。第二,公司有没有核心的业务场景。第三、有没有明确的组织,应用大模型一定要有组织和人才。
在应用大模型的过程中,华为形成了“四位一体”概念,即将业务场景、数据、算力和算法结合,在公司内部达成共识。
在核心业务场景方面,华为梳理了三大类的业务场景:第一类是价值最高的,生产力和竞争力提升的场景。第二类是防控风险防控场景,如合同大模型,供应链大模型。第三类是业务和体验效率提升的场景,如员工的数字助理。
此外,在服务客户的过程中又定义了“五有”,即有意愿、有场景、有数据、有人才、有计划,并形成场景应用的价值闭环,运营闭环,生态闭环。
杜夏威 :我觉得当下的大模型,如果仅仅作为一个技术研究领域,或者类似于一个纯娱乐性的东西,可能并不需要去考虑太多的可治理性和严谨性。一旦回到工业化应用层面,就会变成一个非常严肃的问题,比如,故障率,稳定性,容错率怎么做。
我觉得可能有两个层面需要严肃探讨。第一,如果做工业级的应用,工业领域的专家首先要思考清楚,到底打算把它用在什么场景上,或者什么样的场景适合和AI技术结合。并不是所有的场景都需要大模型,可能5年、10年前的AI技术完全可以把当前的问题解决掉。第二,原则上不存在一种万能的大模型,或者说可能存在但未必是最高效的。探讨工业级应用可能又是一个高度耦合的问题,需要复合型人才,需要多领域的协同来解决。
安筱鹏:下一个问题,当企业要解决特定行业发展中的问题时,基于一个基础模型,如何能够快速、低成本、高质量的训练符合自己业务需要的模型?在算力数据、人才算法上有没有什么样的挑战和问题?
殷宇辉 :坦白讲,在当前阶段要想快速、低成本还要高质量,会有一些悖论。
今天,泛互联网的业务基本上是在一个通用大模型上针对各种应用场景做微调。但是在to B场景里面,首先数据是一个特别大的壁垒,怎么懂专家知识,怎么让大模型懂行话,这个是必须得迈过去的一道坎。
还有几点我们在实际案例中摸索出来的经验,首先,企业不一定需要一个参数量特别大的通用大模型,可能是又小又专的大模型的组合,针对不同场景可以用最轻量的微调方式,得到一个最适合自身场景的大模型应用。
周亚灵:现在大模型成本还是比较高的,又快速又便宜目前还是有挑战的。
从我实际接触的项目来看,有几点观察和可以跟各位分享。第一,模型的选型要结合场景,看企业自身的技术路线是什么。第二、根据自身能力选择实施方式,选择开源意味着你有组织和能力去不断优化、调优,但是很多公司特别是中型企业或传统企业,如果没有这个能力,可以选择一些商用的大模型,由供应商来提供端到端的高质量服务。第三、实施的时候可以从从辅助场景开始,一方面能快速看到价值,另一方面也是让团队快速成长起来。
我个人认为,大模型最终要重构所有的企业,重构所有人员,公司无论规模大小,自己一定要有构建能力,如果完全依赖供应商,很难把大模型用到实处。因为大模型有一个特点,会根据数据积累,根据应用场景越用越好用,如果完全不清楚怎么用的话,企业很难发挥好这个特点,这样跟使用小模型相比,其实没有任何的竞争力了。
安筱鹏:好,第三个好我们再问4位嘉宾最后一个问题。现在数字技术体系的竞争是一个这个国家的竞争,生态的竞争,在这个过程中,怎么来看大模型的开源和闭源在整个产业发展中的作用?
马超:我说一句比较客观的话,闭源模型无论从数据投入还是算力投入,在通用的领域里面是要超越开源的。但是在在一些特定行业,经过微调后的开源模型能力不输于没法微调的商业模型。
商业模型可以生成一些数据,帮助引导训练开源模型开源模型可能更适合于解决固定的场景化、低成本的解决方案,而商业模型更适合去推动整个行业发展,然后去辅助落实这些解决方案。
杜夏威:开源模型还是闭源模型,如果从用的角度上说,最后一定会变成你适合的是哪个。
闭源模型有它自身的一些技术优势,毕竟它通过了很多数据资产的凝练打磨,还有技术迭代,但是未必所有人都支付得起。开源在一定维度上提升了大模型技术的覆盖面,让更多的领域和用户都有机会去尝试。所以我觉得这个问题可能还会延续下去,两者还是一个并存的状态。
周亚灵 :我个人觉得从整个信息产业来说,开源是个好事情。对于供应商来说,开源和闭源其实主要取决于商业决策,靠什么去变现,本质上它是商业行为,并不是技术路线的问题。开源也不意味着免费,闭源也并不意味着落后。
对用户来说,开源和闭源还是和组织能力和场景选择有关系。如果用户真正的想把大模型融入骨子里,做成产品的一部分,可能选择开源更好。从我们的经验来说,闭源其实更方便,因为有商业保障,有商业服务。
殷宇辉 :我特别赞同的说法是,开源真的改变了世界。
但是企业如果真正要用,还是要从自身定位出发,像互联网企业大多数的基础设施都是构建于开源软件,因为互联网场景多又复杂,如果基于闭源软件很多情况需要持续去调优。但是对于很多传统企业,坦白讲我觉得闭源可能用起来更放心,更稳定更好用。
安筱鹏:根据大家的讨论,我们的结论是:今天的AI大模型不是一次技术的简单升级,而是一次技术的革命。
如果再去追问到底是什么革命,我觉得是三场革命:第一场革命就是人机交互革命。第二个场革命叫做认知协作,互联网的本质是信息的供需精准匹配,而大模型带来的认知协作是从问题到答案给出了最短路径。第三个是计算范式的革命。今天我们看到全球芯片厂商市值在高速增长,这个革命如果是一场马拉松的话,我们可能才跑出一公里,这是一个长跑,在这个过程中需要有爆发力,需要有耐力,它不仅仅是一个大模型本身的竞争,也是一个整个产业生态体系的竞争。



