万博manbext网站登录 万博manbext体育官网注册账号  

你的位置:万博manbext网站登录 万博manbext体育官网注册账号 > 新闻中心 >

万博manbext网站登录娱乐网而况它真在 GAIA 测试里-万博manbext网站登录 万博manbext体育官网注册账号

发布日期:2025-08-14 09:11    点击次数:71

万博manbext网站登录娱乐网而况它真在 GAIA 测试里-万博manbext网站登录 万博manbext体育官网注册账号

"   又一国运级 AI 居品问世   ""   中国 AI 科技再一次颠簸全天下   " 万博manbext网站登录娱乐网。。。

"   拳打 GPT ,脚踢 DeepSeek "   " AI 透顶摄取了我的电脑 "   。。。

  就这些恐怖如此的标题,再加上一堆的爆火、炸裂、惊东谈主。

不是哥们,差评君就睡了个懒觉,难谈错过了什么天下性 AI 大打破?

麻溜赶到公司一看,各路媒体争相报谈的,原本是国内厂商发布了一款 Agent :Manus ,这家伙还自称全球首款通用型 Agent 。

而况它真在 GAIA 测试里,吊打了一众 OpenAI 们。

不外可惜的是,由于当今 Manus 还处于内测阶段,系统容量有限,只可通过邀请码给部分用户进行体验。

  这也栽植了一种,当年只在某些特地局面下才能看见的整皆队形。

由于官方给出的邀请码实在太少,在某鱼上,都出现了邀请码出售交易。

一个 Manus 的邀请码都标价几千上万。。。

致使在抖音上,有些直播间径直把   " Manus 测试   "   当成抖加用了。。。

是以这个让寰球都有些癫狂了的 Manus ,到底是个啥?

差评君今天就从 Manus 官方给的示例带寰球云评价一下。

  至于为什么无须实测,我怎么会说是因为差评君第一期间没搞到邀请码,好羁系易处治了收场东谈主家服务器炸了。

是以寰球先浮浅了解一哈子,等后续服务器归附了,咱再给寰球来详备评测。

该说不说,就从当今给出的官方演示案例来看, Manus 极端可以。

因为我们常用的 GPT 们,基本都只可一个个解决需求,而况大多都还局限在对话,输出个代码照旧是极限了。

而 Manus 则作念到了   "  用户提需求, AI 全自动、直至完成网页遐想、可视化数据整理等等复杂历程  "   获得的收场还能径直输出,浮浅省力。

举个栗子:

当向 Manus 发问   "   搜索 Qwen 系列的历史,他们望望开源了若干模子,并给我作念了一份他们相配漂亮的期间线可视化决议   "   后。

Manus 会凭据这个浮浅的需求,从多个渠谈搜索 Qwen 的开源历史信息等数据,汇集起来。

然后调处进行期间线可视化处理,并在这个过程中进行审核数据、完善期间线。

而当用户发现输出收场有问题时,径直告诉 Manus ,它就会进一按次整修改。

访佛的, Manus 还能帮用户筛选房产,官方的案例即是用户但愿在纽约购买房产,给出的舍弃条目是但愿有安全的社区环境、低违警率、以及优质的陶冶资源和不要超预算等。

Manus 会将该任务证实为一个个代劳动项,然后通过聚积搜索,汇集信息。

临了整合整个信息,归并用户需求,写出一份详备评释,嗅觉比楼下的房产小哥专科多了。

是不是照旧很牛了?

但你先别忻悦得太早,也别太缅思下岗的事儿,更别说 Manus 是新一个 DeepSeek 了。

因为 DeepSeek 是作念基础大模子的,可以说通盘 AI 发展都得成立在大模子本人才智的地基上;而 Manus 则是套壳居品(  肃肃这里说的套壳并不是贬义词  )。

更准确地说,哪怕是对话式的 GPT 们,亦然基于现存的大模子才智作念了一个 wrapper (  包装  ),来服务于寰球伙。

作念个不是很贴切的譬如, DeepSeek 是 Android 或者 iOS 这样的操作系统,那 Manus 即是 App ,两者就不是一个赛谈的,没啥可比性。

而况,凭据今天各大媒体的评测恶果来看, Manus 用起来还有几个问题:

  率先,它真的很慢,天然当作捏造机在云霄处理任务,统统可以关在后台等它任务完成,不影响我们同期干其他事。

但它如故太慢了,一个浮浅的任务十几分钟,复杂少许的几个小时都可能,万一需要屡次修改,那恭候的期间或许能让东谈主透顶跋扈。

其次, Manus 也太费 token 了。

就这样说吧,它拆解、解决一次复杂任务需要奢靡的 token ,可能是百万乃至更高的数目,这关于不少东谈主致使企业来说,都有点遭不住。

差评君和某位有码大佬的对话

天然了,大模子的通病 AI 幻觉 Manus 也搞不定。

不少内测用户就发现 Manus 在某些专考场景,举例金融分析时,很难称得上出色。

举例,它对股票关联性的分析就过于依赖单一数据源,短缺交叉考据机制,导致论断简直度不高。

此外,所谓的   "   自主蓄意   "   骨子上如故套壳,还拿股票分析来说,它其实即是独揽大模子琢磨你的酷好,然后调用雅虎金融 API 检索数据,再独揽 Python 剧本生成可视化图表。

  这些任务践诺高度依赖捏造机内照旧事先树立好的   "   器具库   "   和调用逻辑,一朝你的需求在这些以外,它就 GG 了。

临了亦然最焦躁的,  "   全球首款通用型 Agent "   这个说法更是很难喊得响亮,因为它当今并欠亨用,更不是首款。

因为 Manus 开动在捏造机中,没法达成装配新软件或者调用腹地软硬件资源等系统级操作。

比如我的需求是把桌面的 3 · 8 妇女节休假见告文献,通过微信发给世超,但当今的 Manus 就作念不到。

  是以它更像是市面上论千论万的浏览器插件,而非确切意旨上的通用 Agent 。

而早在前年 10   月, Claude 大模子的团队 Anthropic 就照旧推出过   " computer use " 。

它和 Manus 骨子上都是通过多代理捏造机环境完成复杂任务,从而给用户输出收场。

随后,各大 AI 厂商不绝都推出了自家居品,举例谷歌的 Project Astra 、智谱的 AutoGLM 、 OpenAI 的 Operator 等等。

但一码归一码,当今看下来,Manus 还简直当今 Agent 居品里作念得最佳的。

  而况它的破圈也给让 Agent 观点得胜在国内(  外洋当今还真没啥声量  )破圈,毕竟这岁首,酒香还怕胡同深呢。

对了,我们还发现了一个故酷好的事情, Manus 的开辟团队 Monica.im 的首创东谈主叫肖弘,他此前最得胜的创业口头即是壹伴微信公众号排版器具(我们裁剪部之前还用呢  ),一度有百万用户量。

等 2022 年大模子波澜袭来,他又创立了 Monica ,推出了 AI 插件 Monica ,前年 Monica 用户超过千万,一直保捏着可以的盈利,这样看来 Manus 也算是一种老树发新芽了。

而 Monica.im 的首席时刻官季逸超,早在 2019 年就曾开辟过 Magi AI 搜索引擎。

这家伙,除了没用上如今的大模子才智,几乎即是脚下 AI 搜索引擎的翻版。

是不是有种熟识的嗅觉

是以,有这样的时刻团队,作念出一个火爆出圈的 Manus 也挺合理的。

临了差评君思说的是,其实 AI 大模子吵杂了这样久,寰球也徐徐对对话式的 AI 有了疲倦,都在期待 AI 有时更进一风景和试验社会发生关联,比如确切地帮东谈主解决某件事情,而不是浮浅地替代搜索引擎,当个百科小助手。

是以,许多东谈主和团队纷繁下场,去作念多样各类的 Agent ,但愿有时在应用层面上搞点花活。

而从 Manus 官方给的示例,它无疑是当下各路英雄英雄中的杰出人物。

但愿咱能早点作念测试,嘿嘿   @Manus 官方。

撰文:八戒