APP推广合作
联系“鸟哥笔记小乔”
剑指「智能体」
2024-08-26 15:13:26

文:王智远

关于ChatGPT做搜索的新闻,我一直挺感兴趣。

上个月25号,OpenAI在当地推出了一个新产品,名叫“SearchGPT”。官方说,产品能给用户提供带链接的搜索结果,用户还可以继续问问题,系统会根据上下文给出回答。

我看到消息后,马上申请内测。但一个月过去,官方还没给我权限;现在网上办法多。我就通过特殊朋友渠道,弄到了一个测试账号,体验了一把。

体验之后什么感觉呢?

一句话总结即:perplexity AI解决不了的问题,SearchGPT也解决不了。

比如:AI幻觉。一千个观众有一千个哈姆雷特,不同的人看同一信息可能得出不同的结论。就算是同一个人,今天看到的东西和明天可能理解也会有所不同。

这就像AI面对复杂、多变的人类思维一样,如果AI不能真正地“站在你的角度”去理解问题,感受你的感受,那它很难独立地给出人们真正想要的答案。

因此,除非AI能达到这样高级的理解和适应能力,不然,AI永远无法避开幻觉问题。所以,怎么办呢?

01

来看看另一个新闻:

不久前,Twitter上有个名叫@iruletheworldmo的用户频繁爆料,谈到Project Strawberry(草莓计划),这是OpenAI的一个项目,以前叫Q-Star。

这个计划目标是让AI变得更聪明,更能自主。简单来说,他们希望训练出来的AI能自己处理很多事,不太要人来监督。

这意味着,AI将能自己搜索信息,深入研究问题,甚至自己创造数据,这样就能减少对人类的依赖。也就是说,AI可能会变得更像人,更会思考。

这条推文引起了不少人的关注,大家都在猜到底是不是OpenAI内部信息,但还没等到官方回复,就有人跳出来了,这人叫Div Garg,是MultiOn公司的创始人。

他说:

OpenAI的“Q”还没正式出来,但我们已经推出了一个新的智能体,叫“Agent Q”,并且邀请大家来试试,很多人怀疑他在利用OpenAI的秘密项目来做广告。

我查了查,发现MultiOn这家公司确实在2023年接受了OpenAI、DeepMind等公司、高管个人的投资;所以,让人不禁猜想,OpenAI做的搜索项目,和他们到底有没有关系?

好吧。姑且,不论这事,来看看MultiOn这家公司。

MultiOn专门做AI智能体,目标是,通过智能体帮助人们完成日常任务,比如:网页浏览、网购和邮件处理,他们希望构建一个能在数字世界里,能自主完成复杂任务的AI系统。

这么一看,两者之间确实有些相似。相似在哪呢?

我们换个角度:

请问,你解决不了AI搜索幻觉的问题,还要不要解决?作为普通人的我们当然觉得,要。必须解决。其实,单一视角往往会限制我们。

系统科学家罗素·艾可夫(Russell L. Ackoff),在作品《问题解决的艺术》中提到:

复杂问题往往源于问题定义本身,如果能够以新的视角、新框架重新定义问题,有时能发现原本看似复杂的问题,其实有更简单的解决之道,或者,原本的问题根本就不需要以传统的方式解决。

也就是说:解决一个复杂问题,最好的办法是,绕开把它转成一个非问题。

举个通俗的例子:

想象一下,你家厨房每次做完饭都一团糟。通常,你可能会选择在烹饪后进行一次大扫除,这样虽然能清理干净,但每次要花费大量时间和精力。

如果你换一个角度来看就不一样了。类似,重新组织厨房物品,把常用的厨具、调料放在容易拿到的地方,不常用的东西则收好。

改进烹饪流程,做饭时,边做边清洗用过的器具,甚至,在操作台上放一个垃圾桶,用于临时收集厨余和垃圾。

这样,是不是做饭过程中就能持续保持厨房整洁了?这就是,非问题化;重新定义问题和调整处理方式,使原本要解决的问题变得不再是问题。

02

那么,这和搜索与智能体之间有什么关系呢?来看看,OpenAI首席执行官Sam Altman在2024年4月25日斯坦福大学的演讲。

他说,AI实现通用人工智能(AGI)要经过五个阶段:

一级:能够进行对话交互的人工智能; 二级:系统能够解决博士级别的问题。三级:系统能够代表用户工作几天;四级:人工智能能够开发创新。五级:人工智能系统可以执行组织的工作。

他并指出,目前OpenAI处于第一级,接近第二级。

考虑到进展,请思考一下,这样一个AI行业巨头,如何从当前阶段过渡到更高级阶段,比如“三级或四级,或者说,如何让弱人工智能到强人工智能?让技术更能满足每个用户第一场景使用情况?

答案很明显:AI智能体。

因为,智能体是过度解决问题的最好办法。想象一下,在理想状态下,面对亿万用户时,如果能够展示数千万个AI解决方案,来帮助大家解决各种问题,那么,无疑是最有效的。

毕竟,每个人都能找到符合自己需求的解决方案,极大提到了解决问题的效率和质量。

为什么是智能体?

昨天,一个朋友抱怨说,买房后要还贷款,未来几十年每月都要还几千块钱;他让我帮忙算一算,到目前为止,他一共还了多少本金和利息,如果他想提前还款,根据现在的政策,可以节省多少钱。

这种复杂的问题我怎么能解决?于是,我把它给了豆包。

我先描述基本情况,让豆包记住,然后,再把其他想法和诉求告诉它。大概几十轮的对话后,豆包帮我详细计算了出来,并生成一份大约600字的详细分析报告。

这份报告包括了完整的背景信息、我的具体诉求、计算过程和对比分析等。

你用过豆包,或者其他可以和AI对话的工具么?不知道你有没有发现,现在此类对话工具,连续上下文逻辑能力变强了。

我再说一个贴身经历:

最近几天,经常接到一些奇怪的电话,涉及内容如贷款、房产购买、京东优惠等。

这些电话中,上来就问需要、不需要、行或者不行。我发现,对方语气很像真人,但当我给出它们设定范围以外的问题时,它无法回答了。

这说明,智能体已经在不知不觉中融入了日常生活,它们,能够在特定的环境中模仿人类的互动方式。

所以,一个完整智能体,能够充分与环境互动,这包括智能体自身和它所处的环境两个部分;就像人类在物理世界中的行为一样,智能体在其“外部环境”中也能执行任务。

说白了,我可以与它交互,也能设定好指令,界定范围,让它帮我完成目标。

对比下来,是不是不难看出,智能体无疑是绕过AI搜索中幻觉问题、并成功商用的有效方式之一?

为什么这么说?

你想想看,考虑传统AI搜索和提问时,AI搜索直接给出答案,这种答案比较扁平化,不具备连贯性。换言之,你提出一个问题,AI直接给你一个结论,结论会引用来自多个信息源的数据。就结束了。

智能体工作方式不同。

它不仅对单一问题做出反应,还会引入外部信息,在一连串多轮问答中,会反复接受来自你的信号,通过这种互动,它更能理解你的诉求。

在解决问题之后,它能生成一篇简短的文章、总结方案,把整个互动过程指标串联在一起;很明显,智能体不是一个简单的AI提问、总结工具,是一个完全符合每个人需求的系统。

因此,智能体能完美绕过AI幻觉,毕竟过程中,你不满意时,能一次次纠正它的错误。

03

纵观国内市场,目前谁在做智能体呢?我查阅了一下,据说有超过4500家,比如:大家耳熟能详的百度、科大讯飞、云从科技、字节跳动和腾讯等。

所以,谁在做智能体,这个问题不好解答。与其这样,不如换种思考方式:智能体类型有哪些?我们通过类型看各家所在的生态位。

我盘点结果是:

智能体(Agent)平台大体上分为两类:一类基于知识库和数据库的。就像聊天机器人(Chatbot)这种简单的平台;另一类是用来解决更复杂问题的。这种平台有多工作流编排的能力,比较高级。

国外Orkes Conductor、ControlFlow by Team Prefect、和 Flyte等平台,就是专为复杂工作流和数据处理设计的。

这些平台主要用户包括数据科学家、工程师、开发者,他们用平台来建立和优化复杂的工作流程,提高数据处理的效率和自动化水平。

国内也有类似的平台。像扣子Coze、百度智能云的千帆AgentBuilder、科大讯飞的星火智能体平台,还有腾讯的元气和阿里云的AgentScope等。

他们利用大模型搭建 AI 原生应用工作台,给开发者提供 RAG、Agent、GBI 等应用框架,赋能他们开发出来文生文、对话、文生表等垂直应用,以帮助企业和个人解决问题。

我根据对象、流程和代码复杂程度,把它细分成三类:

  • 面向公众和非开发人员

  • 面向开发者的平台

  • 企业级开发平台

第一种,主要偏向低代码平台,不要你懂太多编程。

像GPTs这样的工具,提供很标准的操作界面和流程,主要用来做基于知识库的聊天机器人。给你一个模板,你按步骤填信息就行,不用自己调整太多东西。

字节跳动的扣子(国内版),就是被设计来帮助人们轻松创建下一代的AI聊天机器人。

第二种平台功能更强大,可以让开发者用各种API、第三方库,还能自己编写代码和调整参数,来精细控制智能体的行为。

Coze海外版很受欢迎,它的功能全面,支持很多高级操作。像百度、阿里和亚马逊也提供这样的平台,让开发者可以用各种AI模型来做更复杂的应用。

企业开发平台,专为企业设计,重点是帮助企业自动化他们的工作流程。

比如:

实在智能的TARS-RPA-Agent和壹沓科技的“数字员工团队”CubeAgent,它们是用来自动化企业日常操作的。

还有国外的Torq和国内澜码科技的AskXbot平台,也提供了大模型结合企业知识库的解决方案,帮助企业自动化处理更多复杂任务。

三种类型各有千秋,这么说,是不是更清楚一些?那么,站在AI搜索和智能体中间来看,智能体属于那种呢?

04‍

解答该问题,不妨站在行业结构视角看。我盘了一下,智能体(Agent)行业结构有四层,分别为:基础工具层、运营平台层、开发工具层,以及服务与培训平台层。

组件是做智能体必不可少的基础。有各种智能模块、记忆模块,比如语言模型、数据库,还有一些安全工具和通信工具,就像盖房子的砖块和水泥。

运营层,包括制作Agent组件的厂商和各种运营集成平台。如GitHub这样的Agent框架发布平台,它们提供必要的环境和服务,支持智能体运行。

开发层相对容易理解了。

像Agent工具集成平台AgentLego、或提供专属云环境及沙盒环境的平台等,它们使开发者能够构建、测试和部署智能体。

值得一提的是,像NexusGPT、Relevance AI等平台,它们提供数字员工Agent的训练服务,目的帮助企业把智能体整合进现有的工作流程中,或者帮助个人创建能自动完成任务的AI团队,这反而是目前很多企业刚需。

国内也有类似的公司。例如:

金柚网的梧桐数字员工、壹沓科技的数字员工平台1Data Agent,以及实在智能的RPA Agent。

这些平台的特点是允许用户通过聊天,轻松与智能体互动,管理和优化各种业务流程,使智能体理解和执行复杂任务,让日常更高效。

不论怎么说,从短期发展看,智能体要解决两个问题:

一,丰富通用工作流和场景工作流,类似于AI搜索下的大搜,还要在处理数据训练、多轮对话的准确性上下功夫。

二,让智能体成为知识专家,形成可持续的服务能力。有点像针对特定领域进行深入挖掘。

比如,假设我是做消费品营销的,如果有一个专门的智能体,它学了很多关于社交媒体趋势、消费者行为的知识,那么,它就能真正帮到业务。

当然,智能体在其他行业也在不断爆发,像游戏,金融、医疗等,总体上说,基于LLM的能力,下一步基础智能体必将是绕不开的一步。

总结

让它光思考,远远不够。

想实现真正全面AGI,得把对话模型变成基本智能体,让它参与到实际使用中去;就像人们常说的,从实践中来,到实践中去一样。

所以,AI生成避免不了幻觉,但智能体的轮番交互,可以微调,可以解决具体问题,至少,使用场景下,这是闭环的正向反馈动作。

王智远
公众号二维码
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
王智远
王智远
发表文章575
畅销书《复利思维》作者;关注新电商零售、品牌、营销和认知学科等内容;陪你做穿越周期的成长者。
确认要消耗 羽毛购买
剑指「智能体」吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接