• 发文
  • 评论
  • 微博
  • 空间
  • 微信

对话实在智能创始人&CEO孙林君:Agent应用的落地与未来 | 极新企服直播实录

极新 2024-03-29 16:27 发文

“ 在思考人工智能落地到产业时,要回归本源,给社会贡献温暖。 ”

整理 | 宇轩

编辑 | 云舒

出品|极新

2024年3月23日,实在智能创始人&CEO孙林君线下做客极新直播间,这是极新第二次面对面与行业大佬直播交流,孙林君从实在智能的初心与实践出发,对AI Agent的落地与未来给出了独到的见解。

孙林君,吉林大学数学系学士,大连理工大学人工神经网络计算方向硕士,历任摩托罗拉、阿里巴巴资深算法专家,深耕大数据智能领域近20年。阿里期间主持开发智能决策维权客服及智能运筹中枢产品,支撑集团核心业务。2018年创立AI科技公司“实在智能”,基于AGI大模型+超自动化技术(RPA/IPA/AI Agent等),领跑人机协同时代 。

AI Agent,或称人工智能代理,是人工智能领域中一个日益受到关注的分支。这些智能体模拟人类的决策过程,能够在半自主或完全自主的状态下执行任务,与环境进行交互,并根据经验学习优化其行为。

它们不仅仅是被动响应用户指令的工具,而是能够主动理解上下文、设定目标并执行复杂任务的实体。从简单的聊天机器人到复杂的业务流程自动化,再到专业领域的决策支持系统,AI Agent正在逐渐渗透到日常生活和商业运营的各个方面

根据报道,全球至少有100个项目致力于将AI智能体商业化,近10万名开发人员正在构建自主Agent。Meta、谷歌、微软等科技巨头都在AI Agent领域积极布局,表明了这一技术的热度和未来发展潜力。

那么,Agent应用最先会在哪些领域落地?哪些行业将被颠覆?未来的技术发展方向指向何方?

本文,极新对话实在智能创始人&CEO孙林君,深入探讨“Agent应用的落地与未来”。孙林君给出了关于这些板块的回答:

“我们想把AI做成实实在在的落地的技术,为商业化创造真实的价值。”“ 智能体所表现出来的专业能力跟企业当中的某种角色是很接近的。”“能够快速接受新事物,并且能够拥抱、掌握它的人,任何时候都不会过时。”“尽管产品想法不错,如果场景并未想清楚,技术再优秀也是伪命题。”

以下是问答整理(「视频号:极新企服」有直播回放):

极新:欢迎孙总做客极新直播间,请您先跟大家打个招呼,也给我们做个自我介绍和简单介绍下实在智能,热个场。

孙林君:大家好,我是实在智能的孙林君,实在智能是一家通过自研AGI大模型+超自动化技术(RPA/IPA/AI Agent等),领跑人机协同时代的人工智能科技公司。成立于2018年7月,到现在有五年半的时间了。创业时我们提出一个使命:AI赋能商业。实在智能要把AI做成实实在在的、能够落地的技术,为商业化创造真实的价值,因此叫做实在智能。

实在智能现在专注于RPA赛道,在北京、上海、广州、深圳及日本设有子公司,并在全国设立办事处。公司规模300余人,正处于快速发展阶段。

初期曾涉足法律领域的人工智能研发,在为客户开发模型时,我们意识到客户从系统获取数据成本高昂,因此选择了RPA技术作为解决方案。RPA能模拟人的操作,通过控制键盘和鼠标完成任务,这引领我们进入RPA领域。现在,实在智能的定位为数字员工厂商,专注于开发可替代重复、琐碎工作的软件机器人。

进入RPA赛道后,我们深入探索,不断加快技术创新和产品迭代,曾先后发布三代RPA软件,具备高度的易用性和稳定性。其中,第二代“点选用”IPA模式、第三代“所说即所得、你说PC做”的Agent产品在全球范围内实现技术超越和赛道领跑。

去年,大模型技术崭露头角,我们迅速展开行动,于6月发布自研垂直大模型TARS(塔斯),8月,实在智能在全行业首发产品级别的实在 AI Agent——“文生数字员工”,即通过一句话生成自动化流程、软件机器人,为个人用户带来解决长尾低频自动化需求的智能助理,为政府企业带来员工办公助手,实现对PC端、手机端各类应用软件的“你说PC做”,全面开启智能体时代,实在智能致力于为客户提供更高效、智能的解决方案,目前的核心方向仍是数字员工。

01

走在前方

“我们想把AI做成实实在在的落地的技术,为商业化创造真实的价值。”

极新:去年8月,实在智能发布“塔斯(TARS)”大模型,并推出行业首个基于大模型的Agent产品数字助理塔斯(TARS),哪些因素促使着咱们推出了Agent产品?看到了哪些趋势?孙林君:大模型问世后,我们始终密切关注。大模型的出现就像当时Chat GPT的出现一样,都展现了其在人机交互层面的卓越能力,尤其在艺术理解方面,已与人类无异,甚至可视为高情商个体。即便在信息量不足的情况下,它也能合理假设并解答诸多问题。大模型展现出的能力目前有限,这主要源于在当前的参数量达到一定量级时,模型所表现出的能力受限于训练时提供的数据和能力。尽管如此,我们仍观察到一些令人惊喜的推理能力。总之,大模型不只是一个生成模型,不只是能够生成一些比较高质量的素材,而是有能力帮大家进行推理、决策。这一点正好与实在智能想要深耕的方向一致。我们一直在思考数字员工未来能变成什么样子。数字员工是一个新的概念,很多行业也都在谈论数字员工,但我们所指的数字员工是软件机器人类别,它能够安装在电脑里,这种数据原则有助于解决流程性和事务性的问题。数字员工最开始只能做一些规则化重复的事情。实际上它要完成交给它的任务,主要依赖推理能力,而无法直接观察界面或画面。而实在智能的做法是:通过计算机视觉来扫描计算机屏幕,拆解出需要操作的部分,把画面上的内容通过视觉拆解成不同的的功能块,找到这个搜索的区域在哪里,并把参数传递给大模型。大模型是擅长推理的,只要表达意图大模型就能理解并执行相应动作。这实现了视觉与大模型推理的结合。

此外,结合大模型生成代码的能力,实在智能的数字员工可生成点击按钮等操作的代码,从而进入下一界面并重复前述过程。通过这种方式,大模型能基于当前上下文逐步推理,并在我们的引导下完成复杂任务。

这是去年8月16号实在智能发布产品时的构想,目前来看,会在三月底正式开放智能体产品公测,这会是国内第一款产品级别的智能体。我们期望通过智能技术,让产品真正提升办公效率,能够让搭建数字员工的成本降到最低并在未来达到真正的智能助理形态。

极新:我们迫切想知道,在当下AI应用领域里,实在智能的产品竞争力到底在哪?产品的独特性和差异化是什么?

孙林君:目前发布了智能体产品的公司也蛮多的,且大家对于智能体的理解不同。提到智能体,可以把它大致分成几类,第一层次是类似于GPTs的东西,比如在大模型上装一个插件让它扮演角色,它就可以按照角色的设定解决问题。这种智能体本身没有超出大模型的能力范围,就像扮演游戏里面的NPC,可以完成最简单最基本的动作。

第二层次是Flow。实在智能发布的智能体结合了计算机视觉。计算机视觉核心要解决“给大模型提供输入参数”的问题。大模型在生成代码时往往把参数空出来,而我们并没有给他添加这些参数。有些实体机器人,它本身具有很多的传感器,它就可以给它输入外部参数。

多智能体系统目前尚处于不成熟阶段。尽管单个智能体已能应对复杂任务,但多智能体协同工作的潜力在未来将极为可观。然而,目前这一系统还未进入实际操作阶段。

实在Agent智能体与其他Agent的不同之处在于,目前大多数AI Agent产品仍是基于语言模型的综合应用,实在Agent智能体是计算机视觉和大模型的结合,大大提升了Agent本身的落地执行过程中的精准度,这在全球Agent领域也是不多见的,也是RPA领域的首创。

极新:你觉得为什么是实在智能?

孙林君:其实这个问题挺有意思,刚进入到RPA赛道上时,我见过很多投资人,他们会问:为什么你们能做成?为什么你会觉得你们能做?

我内心的想法是:为什么不是我?

因为实在智能有相对清晰的愿景,足够的专注,足够的坚持,有非常多的持续性思考,要为全社会输出各种各样的数字员工,短期愿景是为全社会贡献100万个数字员工。

因此我们围绕这个目标进行创新、技术迭代、更新产品和服务,并且试图让用户和投资人理解数字员工不是简单的系统,而是像人一样能够工作。

为什么会是实在智能?因为实在智能有使命感,整个公司持续的围绕使命不断努力。同时也希望我们自己有舍我其谁的气势,真正通过踏踏实实的努力,来把别人认为不可能事情变到可能,让行业能够不断的向前推进,把数字员工真正变成企业必备的生产资料。

我相信在智能体的发展中,实在智能将留下独特印记。AI应用离不开机器视觉技术,这项技术吸引了许多新加入者,但也充满挑战。机器员工或机器人需在某方面取得突破才能进步。期待实在智能的技术助力数字员工深入企业、实体和产业,持续优化提升。

02

企业侧是落地点

“ 智能体所表现出来的专业能力跟企业当中的某种角色是很接近的。”

极新:广大网友对多智能体联合应用十分关注。请问按照目前的发展水平,智能体最快会在哪些行业或场景落地?选择这些行业和场景的原因是什么?

孙林君:现在并不是一个强人工智能的时代。想要一个大模型,或者一个人工智能就把所有的问题都搞定的话,现在的发展还有距离。

但纵观近两年的发展,得到的结论是:如果把应用的领域范围缩小到某个特定领域上,那么智能体所表现出来的专业能力跟企业当中的某种角色是很接近的。

基于这个层面来看,我们认为Agent智能体会优先在企业侧应用。毕竟做一个合理的推断对很多体量大的公司来讲,需要的人力非常密集,成本也非常高。基于这个判断,在客户侧会首先出现智能体的落地。当然从具体的行业来看,比如金融行业,一直接受新科技比较快,电商也是追求效率的行业,内部的演进非常快。

在这种情况下,我们认为在金融和电商这两个行业上可能会最早出现智能体落地的情况。

极新:未来Agent在技术或应用或其他层面,有何发展趋势?

孙林君:我分享一下关于保持产品领先的观点:要有足够的沉淀。

任何时候,罗马都不是一天能够建成的,我们的优势都会建立在长期积累的层面上。对于实在智能来说,在智能体方面之所以会有优势,跟过去几年持续的思考和积累有非常大的关系。

大家知道纯粹的、规则化的、重复的事情,占比是比较低的。但人经过训练,通过自己的经验去解决问题的占比是非常的高的。因此智能化的属性其实就是有足够的数据积累,能够代替人完成这项工作。

大模型出现后,数字员工的形象愈发清晰。借助模型的推理能力,数字员工能更像人一样去思考、判断和解决问题。高效流程构建方式能让客户更低门槛的使用产品搭建所需流程。

总体来看,用技术来改变RPA行业,本身就能够推进数字员工的演进层面更进一步

所以并不是我们去追逐浪潮,而是我们保持了自己的战略定力。“数字员工”是未来几十年甚至更长远的事业,当下就思考如何把人工智能技术用最现实、最可行的方式落地和应用,给客户创造价值。不管新技术怎么涌现,只要能够围绕客户的价值思考,就能给客户带来价值,从而让我们在这种纷繁复杂的表象当中有意识。

极新:别人说中国算力跟不上,AI没有前途的时候,您怎么想?

孙林君:我认为人工智能领域的竞争是一个长期过程,既不可过于悲观,也不可盲目乐观。

从当前的技术代际来看,我们确实存在一定的差距,并未处于领先地位。但随着算力的发展,国内产品如华为的生成系列已能用于训练大模型,显示出显著进步。

我们国家在应用层面拥有场景优势和丰富的互联网场景数据,因此能够迅速进行创新与海外竞争,并有望取得优势。

大模型的跟进速度也非常快,现在使用国产芯片训练大模型的成本已大幅降低,成功案例也层出不穷。我们有能力在这一领域竞争。中国在人工智能方面的人才并不稀缺,海外也有很多华人从事这一行业,并在学术机构中取得顶尖成果。所以,我们不必因为暂时的落后而丧失信心,应该对自己的能力保持足够的信心。

03

冷静才能伫立于洪流之中

“能够快速接受新事物,并且能够拥抱、掌握它的人,任何时候都不会过时。”

极新:去年我们已察觉AI行业出现泡沫,有些观点认为该行业如啤酒,泡沫与真材实料并存。今年以来,许多去年未显价值的AI面临挑战,Agent的出现似乎将加速戳破这些泡沫。请问Agent会最先戳破哪些泡沫?这些泡沫的破裂又将如何颠覆整个行业?

孙林君:确实,去年有一批投资人认为大模型的创始人可能会面临财务困境,甚至需要卖车卖房,他们都对这种情况感到十分担忧。

不论何时,尤其是投资人蜂拥而至的情况下,大家都普遍看好的事物一定会有泡沫的。我们还是要保持一个相对比较理智或者比较冷静的一个判断。但是卖车卖房,我觉得这已经陷入一种狂热里面了。从今年的情况看,好像还没有出现这种情况。

新技术出来时,我们对它的预期要么偏高,要么偏低,在保持相对冷静客观的态度来看待一件事物,是很重要的。有泡沫存在是很正常的。

说到不被淘汰,那些能够快速接受新事物,并且能够拥抱、掌握它的人,任何时候都不会过时。反而如果只是去批评它,或者只是看到它的缺点,拒绝用新的方式使用人工智能,这样的人确实会面临淘汰。

在这种效益时代,掌握工具是必须的,还要有一个开放、积极乐观的心态适应新的工具和事物。

极新:有没有担心过AI或者Agent会过气?

孙林君:其实不会。从我的视角来看,这个浪潮还没有到来。这是又一次的科技海啸,基本每十年、二十年都会有一次非常大的科技浪潮,这一次AI的能力突破也是类似的情况。

要去思考技术能够给我们带来的巨大价值是什么。之所以说智能体没有过气,原因是现在企业里的机器人密度处于非常低的水平。而且能够预见的是,人工智能一定会一代更比一代强,它是集人类知识于一身的集大成者。这种情况下,数字员工的应用力度一定会越来越高,这是一个合理的推断。

基于这一点我们还是非常有信心的,技术是一步一步的成熟,取决于像实在智能这样的科技企业一步一步的踏实努力,希望能和同行一起把我们的畅想变成给我们的客户创造价值的产品。

极新:如何看待最近舆论上的Sora?

孙林君:我有一个观点,大家开始以为Sora是基于物理原理的学习而生成的视频,必须要输入数据原料或者语料,但后来发现其实是数据。

人类习惯于将事物上升到科学层面后才认为它们是可以理解的、正确的、真实的。然而在人工智能领域,尤其是Sora这样的应用,却让我意识到,它并不一定需要先被完全理解或科学化。人工智能的发展速度超越了我们从科学上认知它和理解它的速度。某种程度上,它就像量子力学一样,仍有许多未解之谜。

Sora所展现的学习方式,更像是一种对万事万物的上下文理解。就像电影画面中的连续帧,通过前一帧预测下一帧,只要有足够的数据,它就能模拟并还原出一个类似真实世界的场景。这种学习方式实际上是基于大量数据的模拟,而这正是大模型能够学习到的核心所在。

从这一点来看,人工智能其实突破了人类原有的思维,让人类用全新的方式理解这个世界。

04

用户的需求是无限迭代的空间

“尽管产品想法不错,如果场景并未想清楚,技术再优秀也是伪命题。”

极新:AIGC、大语言模型、AGI还有现在的 Agent,AI行业发展及变化迅速,预判稍有不慎就有可能面临汰被颠覆式创新被淘的风险,作为企业,在巨变易变的时代,如何保持敏锐的判断力和执行力?如何在不确定中寻找确定并保持长久的领先?孙林君:可以从技术和应用两个层面来看。从技术上来看,实在智能非常关注多模态大模型的研究进展,我相信在很短的时期内多模态大模型会有进一步的爆发。在技术生成的可控性上,可控性越强,就意味着大模型来做智能决策这件事就越可行。两者强有力的结合,会是未来数字员工非常强力的支撑。从应用层面上看,则更关注企业侧的落地。技术从出现到成熟再到大范围应用,其实是有时间差的。在2019年,有些客户为RPA买单只是为了尝鲜。进入到2020-2022年,越来越多的企业意识到高人力成本和低效率不能抵抗竞争压力,要采用新的方式经营企业。我们有一个很重要的判断是:未来机器人的密度是企业的重要指标。纵观制造业几百年的发展,从纯人工到工具、流水线、机器人,直到现在的无人工厂、黑灯工厂,人越来越少,机器人越来越多。越先进的企业,机器人密度就越高。我们必须面对的一个问题是:如何用更少的人、更多的技术进入企业。所以对企业来讲,机器人的密度在特定应用场景下,优势会逐步显现出来,会有越来越多的领域和企业开始应用新的技术,今年有很多企业对RPA都有非常大的预算。回到Agent,今年也会有相当多的企业进入尝鲜阶段,到明年、后年可能会进入广泛应用阶段,后年有可能会进入某些公司的战略方面。之前做产品觉得AI加上各方面的场景就可以,但现在真正推动AI发展的,或者推动AI演进、迭代的,是产业端的用户需求。用户对于产品bug的体验带来了无限的迭代空间。极新:您觉得实在智能犯过低级错误吗?孙林君:对创业公司来讲,就是会经常犯错误,肯定也犯过低级错误。但是实在智能最擅长的是快速的从错误当中汲取经验,快速修正演进路线。比的就是谁犯的错更少,谁跑的更快。实在智能初创时,曾尝试法律相关的人工智能产品,面向消费者变现,但商业上遇到了困难。尽管产品想法不错,但法律场景并未想清楚,因此商业上成了伪命题。技术再优秀也无法成功,于是果断放弃。这次失败对我们而言仍有价值。对于创业公司,不怕失败,起初想法可能稚嫩,但迭代速度和能力强大,能从简单状态逐步演进到优秀水平。实在智能初入RPA行业时,产品并无明显优势。但随着对行业的深入理解,推出了融合拾取等技术,使任何软件都能通过计算视觉和底层能力实现完美识别。这奠定了RPA成为通用工具的基础。起点虽低,但我们相信通过努力,能够走得更远。极新:在团队管理、研发和业务战略设计等方面,如何权衡你的能量和体力?孙林君:确实是需要平衡,对于创始人来讲,并不是越忙越好,沉浸于某些细枝末节的东西已经很累了。相反而言,在公司产品的演进或公司战略层面需要很多深入思考。有不同的声音出来的时,要有决断能力,这是一个必备素质。日常生活中,无需亲力亲为完成别人也能胜任的事情,这并不会额外创造价值。相反应该将精力集中在最需要的事情上,这样才能保持高效率。同时洞察公司运营中的问题,兼顾系统性与细节。深入细节如同质检,发现岗位或工作不足要及时纠正,不合理的机制也要及时修改。我认为管理既是艺术又是科学,需结合公司状态和团队情况,把握原则并聚焦核心。确保团队和公司都专注于最重要的事务,这样才是成功的权衡。

极新:进入到今天的漂流瓶环节,问题来源上期嘉宾必优科技创始人周泽安,问题是:在您的行业领域里,怎样构建自己的行业 Agent? 又怎么看待大模型迭代对于构建的 Agent 产品的挤压和威胁?孙林君:从实在智能的角度来看,更多的是从自动化的角度构建智能体,更多思考的是怎样让大模型有足够强的推理能力、足够强的任务拆解的能力,以及足够强的使用RPA的API的能力。实在智能之所以用计算机视觉,是想让产品能够成为通用的产品,让Agent像人一样理解画面,快速识别画面里的内容,所以还是在自动化领域上发挥作用。实在智能训练了自己的大模型“塔斯”(TARS),在任务拆解、代码生成等方面,做了非常多的优化,另外给大客户也提供了私有化部署方案。这些都为企业的数字员工解决方案做了铺垫。极新:请您给下一位做客极新的嘉宾提一个问题。孙林君:一年前,我们认为大模型是一个遥远的未来和美好的愿景,如今我们则欣喜地见证着它的一路成长。AI进展完全非常超越我们的想象,下一位嘉宾可以想象,您所在的行业三年以后会变成什么样子。极新:希望孙总给我们留下寄语。孙林君:新技术出现,一定会有不同的声音,有些人会觉得为什么要用这种新的技术?但人类有一种特性:人的本性上是懒惰的。如果让人像机器人一样不断的做重复工作,会产生厌恶。用软件机器人后,就把人解放出来,被解放的人便再也不愿意回到那种工作状态了。因此,技术是给人带来减负或带来幸福的东西,如果应用得当,可以给人类创造价值,并把爱带到世界中。所以我的寄语是:在思考人工智能落地到产业时,要回归本源,给社会贡献温暖。更多干货分享敬请关注我们的公众号与视频号~超多精彩对话内容等待您的解锁!

本文原创:极新(jixintech)

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    极新

    专注科技趋势的研究型媒体...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码