• 发文
  • 评论
  • 微博
  • 空间
  • 微信

大模型时代,MaaS重塑云计算服务范式

产业科技 2023-04-29 17:07 发布于北京 发文

来源 | 产业科技

大洋彼岸的AIGC热浪袭来,国内资本和AI玩家燥热一片。

相比多年以前的Alpha Go战胜世界围棋冠军,AI在消费互联网席卷渗透,ChatGPT的出圈更能代表AI迈向纵深发展,标志着人工智能大模型和超级应用起航的新节点。

由于中国在互联网数据上具备优势,AI场景开发及应用并不落后于欧美。与以往的copy模式不同,国内互联网巨头在面临AIGC浪潮时,凭借多年的人才和技术储备,已经从跟随的角色变为主动创新,甚至在中文语境中超越国际选手。

因此,一幅围绕AIGC和AI大模型的迭代镜像也在国内呈现。各家互联网公司掌门人亲自挂帅,你方唱罢我登场,都不愿舍弃在OpenAI掀起的大模型风口中分一杯羹。

就在ChatGPT咬紧C端,大模型混战之际,头部选手已经看到大模型对产业数字化的再造空间,纷纷押注B端场景,探索端到端的超级AI集成想象。

一如百度和阿里。

百度发布文心一言,打响中文大模型第一枪;二十余天后,阿里正式发布通义千问。在AI战略层面,阿里与百度同驱,把大模型置于“云智一体”架构中。

所谓“云智一体”,是三年前百度智能云在战略发布中提出的理念,通过云计算和人工智能融合创新,把算力、框架、模型,场景应用打造成标准化产品,进而降低企业获取和使用人工智能的门槛。

百度、阿里乃至更多云计算企业,此时将目光投向“云智一体”,印证了AI应用能力是云计算产业基础设施成熟后的核心能力。这种能力更在于“智”的水平,在智能基础设施之上的通用型AI产品能力。

从云计算服务范式看,大模型的迭代升级也重塑了传统的云计算服务。以往,云计算更专注算力能力,服务模型集中在IaaS、PaaS、SaaS三层;如今,云计算在大模型驱动下具备了更强的集成能力,在算力、算法和应用层中嵌入大模型,进而强化云计算的“智”,以智能底座集成应用并统一对外输出,实现场景端的生产力解放。

当然,AI赛道和云智一体本是一场科技马拉松,比拼的不是概念,而是真金白银的投入和持久的耐力,只有软硬底子皆强,才能真正成为产业所需的AI内核。

从C端到B端

云时代,向来讲究以快取胜,更快的迭代速度,更敏捷的需求响应,是云计算企业突围的关键。在大模型之争中,云的速度再次被验证。

仅一个月时间,各大厂,各AI产业分支,就完成了AIGC大模型的搭建。若将AIGC的主体分类,可大致分为ChatGPT和其他,其中ChatGPT背后站着芯片巨头英伟达和国际大厂微软,与其他AIGC玩家没有可比性。

放眼中文大模型市场,百度在ChatGPT之后,率先推出了自己的AIGC产品文心一言。在市场看来,文心一言问世的意义要比和ChatGPT作比较大得多,虽然尚存差距和不足,但它打开了与百度智能云联动的想象空间,并向外界展示中国科技和世界同步的能力。

一个细节是,李彦宏在文心一言发布会上至少说了三遍“文心一言还不完美”。在他看来,创业公司完全不用担心市场是不是足够大,只有出来之后才有机会更快地去迭代,去提升。

如果说百度打开了大厂自研生成式AI的缺口,那么自百度之后,阿里、360、商汤科技、腾讯、京东、华为、科大讯飞等企业则是一同补齐中文大模型的版图。

既是大厂自己推出的AIGC,与ChatGPT有何不同呢?从基因来看,大厂基于自身对业务的理解和技术模型沉淀,在AIGC价值创新层面,更注重场景穿透和服务能力,也就是各位掌门人口中的“产业能力”。

另外,中文大模型基于中文语义理解,相比ChatGPT等国际产品,更适配中国用户。如在语义问题表达,分析和答案归集层面,匹配度更高。

上线以来,各家大模型虽然在数据、算法积累上有所区别,模型决策能力不一,但一个共同的趋势显现:从C端到B端。

文心一言与百度智能云联动,探索大模型的多场景落地,所推出的企业服务板块涵盖企业办公场景、金融服务场景、政务服务场景、商旅服务场景及电商直播场景等。场景内测显示,文心一言企业服务功能能有效提升产业端服务效率,如自动生成PPT、自动生成直播带货文案等。

阿里董事局主席张勇在通义千问发布时喊出,智能化时代,所有的行业、所有的服务都值得重新做一遍,阿里巴巴所有产品未来都将接入通义千问大模型全面升级。

目前,阿里已经在企业办公等场景接入大模型,钉钉生态率先开启大模型赋能智能办公。接入通义千问后,钉钉能提供十多个AI能力,增强文档、视频会议和低代码开发的智能水平。

华为盘古大模型开源开放,在物流、药物研发、气象预测等多领域已探索落地。具体来看,盘古CV大模型触及物流仓库监控等领域;NLP大模型覆盖了智能文档检索、智能ERP和小语种大模型;科学计算大模型应用于气象预报、海浪预测等方面。

腾讯混元大模型落地内容创作、对话式智能助手等场景;字节跳动大模型从语言和图像两种模态发力,旗下飞书将推出智能AI助手“MyAI”,实现自动创建日程、搜索知识库等。

大模型企业纷纷将战略锚点落在B端,其AI模型的决策能力分化也比较明显。对于大模型而言,模型参数规模越大,模型结构设计越复杂,所承载的逻辑分析预测能力越强。

据了解,在GPT-3阶段,OpenAI为了使模型性能更接近人类,就使用了45TB的数据和近1万亿个单词对其进行训练,大约是1351万本牛津词典。

中文大模型也是如此。数据显示,文心一言的训练数据包括万亿级网页数据、数十亿搜索数据和图片数据、百亿级的语音日均调用数据、超5000亿事实的知识图谱。

万亿级数据加上海量用户频繁调用使用,大模型的学习能力进一步强化。数据背后,终极考验AI大模型的底层能力是算法和算力。如果说数据和参数是大模型搭建的基础,那么算法和算力决定了大模型性能有多强,能走多远。

这也会继续拉大大模型能力的差距,让GPT玩家们卷到天际。

大模型的终极角逐

AI大模型需要在海量数据的基础上,通过AI深度学习算法,训练出深度神经网络模型。从模型训练到模型优化再到应用扩展,都需要强大的算法和算力支撑。

ChatGPT触动AIGC产业爆发,是AI领域数据、算法、算力多年沉淀精进的结果。AIGC之所以能够站上潮头,算法的突破是第一步。

历经近十年迭代,AIGC的算法从第一代生成式对抗网络GAN过渡到深度学习模型CLIP、神经网络架构Transforme,打破了传统AI模型在文本图片关联、自然语言语义分析处理上的障碍。而后,Diffusion扩散模型向语音、图画、视频等领域延伸,进一步强化AI的模仿和创造力。ChatGPT当前采用的就是Transformer算法架构。

于国内AI大模型玩家而言,得益于基础数据和训练参数优势,AI应用探索速度更快,场景渗透更深,互联网巨头已经掌握了前沿的算法框架,算法支撑尚可。

如文心大模型在既有的神经网络模型架构之上,还加入了知识图谱,让模型能够通过先验知识和历史经验理解语义,更加精准地预测提问者的期待和目的。这在中文语境中优势更加明显。

算法之外,AI大模型最短缺的是算力。算力是提升模型性能的基本支撑,不只是AIGC领域,对于整个人工智能产业、产业数字化来讲都至关重要,以至于有不少科学家呼吁算力与电气化同等重要。

黄仁勋既然能喊出ChatGPT是AI的iPhone时刻,ChatGPT背后的英伟达高端芯片支撑是关键。即便有芯片巨头撑腰,ChatGPT发布数月版本几经迭代,仍然存在算力缺口,如ChatGPT付费版ChatGPT Plus暂停付费,OpenAI给出的解释是需求量过大。

AIGC的算力缺口到底有多大?当ChatGPT激起分布式大规模训练浪潮后,摩尔定律限制被打破,算力需求被提升至指数级增长。券商报告显示,训练AI大模型对算力成本消耗量巨大。

“GPT-3训练一次成本约140万美元,对于一些更大的LLM(大型语言模型),训练成本介于200万美元至1200万美元之间。以ChatGPT在1月的独立访客平均数1300万计算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。”

随着ChatGPT的版本迭代,GPT-4及4+以上版本对算力消耗显著增加,输入成本增加了50%以上,输出成本增加200%以上。因此,为了应付成本和算力缺口,ChatGPT不得不降低用户访问次数,乃至暂停测试项目。

ChatGPT带来的算力恐慌也在国内显现。一方面美国禁止高端芯片设备和人工智能芯片对华出口,直接影响英伟达和AMD等芯片厂商对国内高端芯片需求的供应。即使供应不受限,进口芯片的成本、个性化性能需求和信创安全性也是压力。

另一方面,IDC预测,未来三年新生产的数据量将超过过去三十年综合,未来五年国内智算规模的复合增长率超50%。从电商到直播,从金融到政务,从企服到医疗等,数字化转型提速对算力的需求也会呈现爆发式增长,云计算企业军备竞赛空前紧张。

可以说,目前AI算力缺口根本无法统计,从二级市场中芯片算力概念领涨,也能看出国内算力的紧缺。随着AIGC市场需求上升,比拼算力是大模型企业突围的立足之本,而算力主要技术载体芯片又是关键中的关键。

芯片的制造过程非常复杂,核心分为设计、制造过程,其中设计包含EDA、芯片IP授权、FPGA(万能芯片),制造技术要求高、流程多,往往以全球化、产业链形式呈现。

具体来看,芯片制造包含晶圆、光刻、离子注入、刻蚀、切割封装、量测等环节,每个环节涉及到不同设备,而且不仅技术要求高,投入成本也非常高。以光刻为例,目前国内直接做光刻机的公司几乎没有,一台光刻机需要10万个以上的零部件,价格在10亿元以上。

市场认为,一万枚英伟达A100高端芯片是做好AI大模型的算力门槛,但缺芯恰是中国大模型企业普遍面临的难题。

先发者破局

AIGC产品能力的优劣,源于大模型企业在核心技术储备上的强弱。从大厂的AI技术基座来看,领跑者的飞轮效应和非线性增长能力凸显,破局之势出现。

以中文大模型百度为例,文心一言背后,可见昆仑芯高端芯片、飞浆深度学习框架、文心预训练大模型技术基座。

百度芯片自研起步于2010年,是国内最早布局AI加速领域的芯片企业。彼时造芯还属于百度的高度保密项目,起初从FPGA架构研发AI芯片,起点较高,虽然没有完全自研,但对芯片的技术探索领先其他大厂。

2018年7月,百度发布自研芯片“昆仑芯”,2020年量产并应用于AIGC、搜索推荐、自动驾驶、智能终端等板块。

2021年,昆仑芯宣布独立运营,百度芯片首席架构师欧阳剑出任CEO。昆仑芯完成独立融资后,首轮估值达130亿元,中国国产芯片超级独角兽自此诞生。

作为大厂造芯项目,百度芯片的算力逻辑始于复杂场景的处理运算需求。上至百度智能云、无人驾驶,下到搜索基本盘和小度智能终端,百度自研芯片都已经开始跑起来。

支撑文心大模型的昆仑芯在综合算力和成本方面,甚至优于芯片厂商的高端芯片。尽管文心一言相较ChatGPT发布较晚,训练量和模型优化尚且不足,但自主可控的算力资源为模型迭代打下基础。

为了适应云智一体的算力需求,百度近年来还加紧布局云计算中心,目前拥有阳泉、徐水、定兴三个云计算中心,算力规模在国内大厂前列。

造芯计划,同样在阿里、腾讯等头部大厂的议程中。2015年,阿里开始于集成电路设计企业中天微合作,宣布进军芯片设计领域。中天微是大陆地区唯一大规模量产的自主嵌入式CPU IP核公司。

达摩院成立后,芯片被列为战略优先级。2018年,阿里宣布全资收购中天微,同时达摩院着手研发神经网络芯片——Ali-NPU,至此阿里通过自主研发和收购手段,切入芯片硬件设备。

彼时,阿里巴巴CTO张建锋表示,收购中天微是阿里巴巴芯片布局的重要一环。IP 核是基础芯片能力的核心,进入IP核领域是中国芯片实现自主可控的基础 。

此后,阿里还成立平头哥半导体芯片公司,陆续推出玄铁、倚天、含光、羽阵四大系列芯片产品,在对内支撑云计算项目算力的同时,对外构建外部算力生态。

腾讯虽然进场较晚,但通过投资和自研的组合拳,芯片项目快速启动。2020年,腾讯成立专注芯片研发的蓬莱实验室,意在实现芯片端到端设计、验证全覆盖。不过,腾讯的芯片方向主要集中在特定领域。

2021年年底,腾讯造芯蛰伏多年后,首次公开三款自研芯片“紫霄”、“沧海”和“玄灵”,这三款都属于专用芯片,分别用于AI计算、视频处理和高性能智能网络。

充足的算力为AI大模型训练及产业增智开辟空间,对于百度、阿里、华为,乃至AI后发选手腾讯、京东等大厂而言,面向产业的AIGC大模型输出才是最大的蛋糕。

大模型本为产业而生,是云智一体的产物。从产品功能扩展看,大模型采取了更为原始和非标的数据,基于深度学习算法组织自监督学习,在海量数据训练的基础上,实现智能表达和运算推测。

AI大模型技术应用非常广,包括语音技术、图像识别处理、自然语言处理及大数据分析预测等。在通用AI大模型的基础上,产业场景开发者只需要根据场景需求微调模型,再采用少量数据进行二次训练,就能满足垂直场景下的AI能力调用。

这也将加速云计算服务向大模型时代迁移,从模型驱动云服务到模型引领云服务转型。正如李彦宏所言,文心一言最大的故事其实是云计算。未来云计算的客户不仅仅是看算力有多少、存储有多少,更多要看模型好不好、框架好不好,以及模型、框架、芯片、应用之间的协同。

更进一步,基于大模型的MaaS将成为云计算的主流商业模式,以往的PaaS和SaaS架构都将被置于大模型的底层能力之上。云计算企业通过生态开放平台,把大模型能力输送给ERP、CRM等产业To B企业,以AI集成势能释放更大的产业数字化转型空间。

现阶段,具备大模型能力的云计算大厂已经开始借助大模型的易延展能力,把AIGC接入到产业。如微软将GPT-4整合到旗下的Bing搜索、office办公套件和聊天产品中;阿里计划将旗下所有产品都接入通义千问;百度除了布局百度系产品,把文心一言的战略重点落向了企业服务,强化云智一体的智能化水平,面向多场景输出大模型能力。

目前AI大模型更多集中在C端能力上的优化,未来大模型+产业模型的双模型驱动,会加速向产业数字化渗透,企业经营效率和生产力解放也会达到质的飞跃。

这一变化,领跑者最先看到。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    产业科技

    洞察产业数字化趋势。...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码