• 发文
  • 评论
  • 微博
  • 空间
  • 微信

智谱COO:大模型为我们带来了哪些商业新范式?

首席数智官 2024-04-26 17:57 发布于北京 发文

来源: @首席数智官

hello 大家好,我们是数字化领军者都在看的首席数智官。

关注我,每天给你讲一个商业案例。

今天我们要给你讲的是:大模型给我们带来了哪些新的商业机会?

在国内的一众AI大模型科技公司中,智谱AI被誉为“最像OpenAI”的那一家。

这说的不光是智谱多年专心AI技术研发,更说的是他们在AI技术上所取得的成绩。

近日,SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准正式发布,对国内外金融大模型的发展水平进行了全方位、多角度评估。

智谱AI自主研发的新一代基座大模型GLM-4脱颖而出,跻身国内首批获得A级评价的模型之列,依据模型表现,GLM-4位列第一梯队,在国内大模型中排名第一。

本次测评涵盖金融知识百科、金融理解认知、金融数理计算、合规与风险管理、投研应用以及投顾应用六大领域共计二十五项细分任务。

测评人员通过模拟真实用户与模型互动,采用单轮问答、多轮交互等多种形式,对模型的专业知识掌握、逻辑分析能力、语言表达清晰度、计算效率以及企业综合业务分析、风险预测与管控等能力进行了详尽检验。

测评结果显示,在六类应用场景的二十五项细分任务中,GLM-4斩获了一项A+及多项A级评价,彰显出其在国内金融智能解决方案领域的领先技术水平与广泛应用潜能。

前不久,智谱AI COO张帆向我们分享了关于大模型时代的商业新范式。

张帆认为,大模型是一个非常好的场景,能够帮助我们对这些数据进行二次加工,针对自己的问题给出一个精准回答,并且可以用自然语言进一步做追问。

1.为什么今天AI的爆发速度比过去快?

ChatGPT出现之后,两个月的时间基本上全球用户规模就破亿了,这个比历史上所有商业产品的爆发速度都要快。

为什么会有这样的突破呢?

AI本身不是一个很新的概念,最早的AI概念可追溯至20世纪40年代。但是历来无论是AI还是其它的技术产品,都是先从概念开始,让我们对它有期待,然后在不断假设的基础上落地落得很好。

这次完全相反,是先从应用切入的。

大家最早了解到大模型不是因为知道大模型这个概念,而是先看到了ChatGPT这样的工具给我们带来的一些震撼,所以是一个先落地后爆发的技术。

这次技术跟以往AI技术比起来为什么会不一样,我们可以做一个简单的分析,不说太远的,就从移动互联网时代。

当时做一个AI会发现任何一个任务都要有一个独立的语料,独立的算法、独立的模型去支撑这个业务,而不同的业务之间其实没有太多的关联的。

所以在这个时候应用技术是一个成本很高的事,当时也几乎只有大型互联网公司有能力应用大模型。

而到了后面AI1.0时代,也就是2013、2014年的时候,神经网络把算法层统一了,让AI应用成本大幅下降,以至于让所有企业都能够更加容易的使用AI,所以也产生了很多新的AI能力的业态,有各种各样的AI公司出现。

但是,我们最新的大模型跟以往都不一样,用一个模型就把一切问题解决了。用一套数据、一个算法、一个模型解决一切任务。不同的任务之间只需要举个例子,这个问题就解决了,让我们从训练模型的时代转变为应用模型的时代,这个时候AI将会变的更加低成本。

所以我们会发现,一方面,AI的能力跟以前不同,能够做到以前做不到的事;另一个方面,AI的应用门槛和成本下降两个数量级,也就是说AI几乎所有人都可以用。

应用成本极大的下降,使得AI变的无处不在,深深影响我们的生活和商业世界。

在内容生产方面,AI既能够提升内容生产和数据应用的效率,也能够提高内容质量的下限。

简单来说,因为人类个体之间存在差异,有些人可能只能做出20分的内容,而有些人则能够做出90分的内容。

但是,大模型可以将90分的内容制作得更快,同时也能将20分的内容提升到60分。

因此无论从质量还是效率上都能带来很大的提升。而且,这个提升的水准还在持续增长,目前只是一个开始,以非常快的速度来侵占到一些原来本来做不到的事情。

2.大模型的更新迭代

智谱是我们在2019年成立的一家专注于大模型研究的公司。到了2020年,我们已经成功训练了百亿级的大模型。到了2021年,我们开始训练千亿级的大模型。到了2022年9月份,我们已经拥有了1300亿参数的130B大模型,这是基于中文的。

与此同时,我们的大模型在国际上产生了广泛的影响力。

目前,已经有超过70个国家的1000个顶尖的研究机构在申请使用我们的模型,其中包括像微软、谷歌这样的公司,也包括斯坦福、MIT等著名研究机构。

此外,我们还率先在国内发布了第一个开源的ChatGM-6B模型。

至今为止,全球的下载量已经超过了1000万次,基本上可以说是全球最火爆的中文大模型的开源项目了。

此外,我们还在去年5月份率先发布了VisualGLM多模态大模型。之后我们不断对模型进行迭代和升级,从1代到2代再到3代,无论是在效果、工程能力、窗口展示还是推理成本上,都带来了极大的提升。

我们的代码模型和多模态模型都进行了2代迭代,这也体现了智谱是一个比较早期就成立并且在模型这一侧迭代速度比较快的公司。

目前,我们拥有一个最完整的模型矩阵,涵盖了文本、代码、图像、视频等多个领域。

在文本方面,我们有放在手机和汽车里的1.5B、3B模型,还有开源的6B和商业化的12B、32B、66B、130B模型,以及超拟人的CharacterGLM。

在代码方面,我们有6B、13B的模型,还有多模态的文生图、文生视频、图生文和Agent。

这个完备的模型矩阵的好处在于,我们在具体落地应用的时候,可以有足够多的选择。

在不同的场景里,我们可以根据需要选择不同大小的模型,以达到不同的成本和反应速度。

我们的基础模型从底层算法开始都是自研的。在当时的效果上,我们的模型与GPT3差不多甚至有略微的胜出。

此外,讲一下3代模型,这个模型可以免费商用。

在44个中英文的数据集中,我们的3代模型都做到了榜首,效果非常好。与市面上当前最好的VLM相比,我们的3代模型在推理速度和效率上还要快2-3倍。因此,有时候使用商业版本可能会比使用开源版本的成本更低。

另外,从去年3月份开源开始,我们自研的芯片的成长速度和数量比LlaMa还要高一点。

有些媒体会写到智谱在追赶LlaMa,但我们并不完全认同这种说法。从Github上的公平评价来看,我们的star数量实际上比LlaMa还要高一点。

当然,基本上两者是差不多的。我们也衍生出了对应的生态,包括Hugging Face上全球总下载量超过一千万,是国内最火爆的开源模型。

此外,我们的3代模型也是率先开始对标GPT-4V的技术。在这个技术中,无论是多模态能力的集成还是代码的解释模块,包括WebGLM的降低,帮助他获得实时数据,做检索增强,降低幻觉的能力,都已经涵盖了。

我们在国内已经适配了信创的芯片,国内信创主流的11家芯片厂商都发布了认证,我们的模型可以在这些芯片上运行。无论是在英伟达的高性价比方案上还是信创方案上,我们都已经有了对应的解决方案。

3.大模型为商业世界带来新机会

探讨一下大模型给我们的商业世界究竟带来了哪些新的机会。

大模型本质上是对人机交互的升级。

我们可以看到,人机交互的发展从最开始的纸带打孔到键盘、鼠标、触控到自然语言,交互效率越来越高,表达力越来越强。

而每一次交互革新的背后,人的需求并没有变化。

但是,每一次人机交互的提升都会给我们带来新的体验、新的成本、新的协作模式和新的商业模式和市场格局。

如何利用好大模型这样一种新的技术和契机,能够让我们在新一次迭代的时候在商业上带来先机,是我们需要思考的问题。

我们可能是国内最早专注于商业化大模型的公司。

至今为止,今年我们已经服务了超过2000家企业客户,并与大约200家企业进行了深度共创。

在这个过程中,我们发现大模型在各种场景中都有广泛的应用,并且需求非常多元化。

为了更好地理解这些需求并找出其中的共性,我们尝试抽象了几个维度来做一个简单的抛砖引玉,希望能够启发大家的思考和讨论。

这些维度涵盖了大模型在不同行业、不同场景中的应用和价值,以及如何利用大模型来提高效率、优化成本和创新商业模式。

第一个维度是文本生成。这是大模型最早实现商业化的领域之一。

在海外,最早看到成功的商业模式是利用大模型生成广告文案。因此,一些公司通过GPT-3等大模型实现了几千万美元的ARR(年度重复收入)。

在国内,许多广告厂商也已经与我们合作,以提高他们的创作效率和产出质量。这是一个可以明显观察到的趋势。

在大模型时代,大模型的出现改变了文案生成的规则。

以前,文案生成主要依靠规则和模板,表达力非常受限。然而,现在在大模型的帮助下,广告文案的创意和思考方式已经完全不同了。

例如,Jesfer新闻中使用大模型为鞋子取出了一个令人印象深刻的广告语:“每双脚都需要一个温暖的拥抱”。这表明大模型在NLP领域的表现已经超越了传统的NLP技术。

在广告领域,大模型的应用已经得到了商业验证。办公辅助场景中也一样,海外的Notion AI通过使用大模型,其收入翻了一倍。这些案例都在商业上验证了大模型的价值和应用潜力。

国内的WPS等办公软件也开始尝试类似的应用场景,包括新闻、小说生成和商品文案的生成。在电商领域,许多平台需要使用不同风格的口吻来吸引不同社交平台的用户,但很难找到一个对所有平台都了解的人。

而大模型可以作为一个很好的工具来帮助我们提高效率,包括日常办公中的会议纪要生成、图表生成、数据分析、分析报告结果的文本解释等等。这些应用场景已经有一些比较成熟的应用。

此外,信息抽取一直是一个重要需求。

在以前,计算机只能处理结构化数据,而无法应用非结构化数据。

但是,现在大模型的出现,使得我们可以用比原来低两个数量级的成本,也就是1%的成本,快速构建自己的信息抽取能力。

无论是将销售和客户的沟通转化为用户的需求提取、用户画像提取形成CRM,还是用于销售质检,大模型都可以非常高效地完成这些任务,并取得非常好的效果。

在信息检索领域,数据规模、媒介、存储方式和噪音密度等因素都会影响检索方法的选用。

随着互联网的发展,数据规模不断扩大,数据来源更加异构,媒介和噪音也变得更加复杂。因此,我们需要新的模式来应对这些挑战。

大模型是一个非常好的场景,能够帮助我们对这些数据进行二次加工,针对自己的问题给出一个精准回答,并且可以用自然语言进一步做追问。

Newbing就是一个典型的应用,在视频中结合多模态甚至能搜出场景来,包括文档去搜合同、商品、简历、房产等,都能够帮你解读完像一个自己的房产助理或者是猎头一样帮你做回复。

因此,大模型在信息检索领域的应用前景也非常广阔,可以帮助我们更好地利用互联网数据,提高工作效率和质量。

包括还有一些智能对话,原来的智能客服其实并不聪明,因为都是基于QA-based模式,而大模型不用这样的方式,它可以做很好的上下文的理解,进行答案的直接生成等等。

这些能力都很强,包括车载的、手机端的、虚拟社交、游戏NPC、情感陪伴等等,都有一些很好的效果。

此外,大模型还有一些指令代码的生成,自然语言到CODE一方面可以帮你写代码,帮你改代码,帮你生成测试用力,帮你做代码审查,另外还可以修改做RPA,原来是每一块钱RPA的产品就要配3块钱的交付,而今天用自然语言把这些事情都能极大的提高效率。

如果大家都有招分析师就知道这有多么高的成本,今天大模型可以帮你每个销售运营都具备自己的工程师可以来帮你带一个自己的分析师。

这个场景没办法一一罗列,只是把几个重要的场景跟大家做了简要的分享,我们其实在过程中还遇到了更多各种各样的需求,大模型的边界远远没有被看到。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    首席数智官

    数字化领军者都在看。...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码