【译文】Clawdbot向我们展示了个人AI助手的未来图景

admin 2026-01-30 18:22:29 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文章介绍开源AI代理Clawdbot,运行于本地Mac并通过Telegram交互。它具备Shell访问与自我改进能力,可集成多服务并替代传统自动化工具。作者认为这展示了未来个性化可塑性软件形态,能深度定制并执行复杂任务,建议极客尝试体验这种高效的个人AI助手模式。 综合评分: 78 文章分类: 产品介绍


cover_image

【译文】Clawdbot向我们展示了个人AI助手的未来图景

原创

诺多 诺多

高等精灵实验室

2026年1月29日 14:56 江苏

🦞 掌握了这种超能力后,就再也回不去了!

Clawdbot

2026年1月27日:应Anthropic的商标相关请求,Clawdbot已更名为Moltbot。

过去一周左右,我一直在使用一款数字助手,它了解我的名字、我早上例行事务的偏好、我如何使用Notion和Todoist,同时它也知道如何控制Spotify和我的Sonos音箱、我的Philips Hue灯光以及我的Gmail。它运行在Anthropic的Claude Opus 4.5模型上,但我通过Telegram与它聊天。我把这个助手叫做Navi(灵感来源于《塞尔达传说:时之笛》中的精灵伙伴,而非詹姆斯·卡梅隆科幻电影系列中被围困的外星种族),Navi甚至能接收我的语音消息,并用ElevenLabs最新文本转语音模型生成的语音消息回复我。哦,我有没有提到Navi可以自行改进并添加新功能,而且它正运行在我自己的M4 Mac mini服务器上?

如果这段介绍让你感到震惊,想象一下我第一次接触Clawdbot时的反应。Clawdbot是Peter Steinberger(MacStories的长期读者应该对这个名字很熟悉)开发的一款令人惊叹的开源项目,在过去几周里,它在某些AI社区中变得非常受欢迎。我一直看到我关注的人提及Clawdbot;最终,我屈服于同伴的压力,按照应用程序网站上那个有趣的甲壳类吉祥物提供的指示,将Clawdbot安装到我的新M4 Mac mini(它并非我的主要生产设备)上,并将其连接到Telegram。

说Clawdbot从根本上改变了我对2026年拥有一个智能个人AI助手意味着什么的看法,这绝非夸大其词。我使用Clawdbot的频率如此之高,以至于我在Anthropic API上消耗了1.8亿个Token(天哪),并且在此过程中,我与“普通”Claude和ChatGPT应用程序的对话越来越少。别误会:Clawdbot是一个极客项目,一个修补匠的实验室,它近期内不会取代消费级大型语言模型的流行度。然而,Clawdbot指明了数字助手一个引人入胜的未来,它正是MacStories读者会欣赏的那种前沿项目。

Clawdbot起初可能会让人不知所措,所以我会尽力解释它是什么,以及它为何如此令人兴奋和有趣。从宏观上看,Clawdbot是两样东西:

  • • 一个运行在你电脑上、由大型语言模型驱动的代理,可以使用Claude、Gemini等许多流行模型。
  • • 一个“网关”,让你能够通过你选择的消息应用(包括iMessage、Telegram、WhatsApp等)与这个代理对话。

第二个方面立刻吸引了我:Clawdbot与多种消息服务的集成意味着我可以在我已经熟悉的应用程序中使用它,而无需安装另一个应用。此外,让助手存在于信息或Telegram中,进一步增强了你正在向一个真正助手发送请求的感觉。

然而,Clawdbot的“代理”部分是关键。Clawdbot完全本地运行在你的电脑上,将其设置、偏好、用户记忆和其他指令以实际的文件夹和Markdown文档的形式保存在你的机器上。把它想象成Obsidian的等价物:虽然它背后有一个云服务(Obsidian是Sync;Clawdbot是你选择的大型语言模型提供商),但其他一切都本地运行、在设备上进行,并且你可以直接控制和无限调整,无论是手动操作,还是通过要求Clawdbot改变自身的某个特定方面以适应你的需求。

Clawdbot

这就引出了Clawdbot最重要也最强大的特性:因为代理运行在你的电脑上,所以它拥有对shell和文件系统的访问权限。在获得适当权限的情况下,Clawdbot可以执行终端命令,即时编写并执行脚本,安装技能以获得新功能,并设置MCP服务器来为自己提供新的外部集成。将所有这些与一个活跃的社区(为Clawdbot贡献技能和插件)以及Steinberger自己的命令行工具集合结合起来,你就拥有了一个自我改进、可操控且开放的个人代理,它了解你,可以访问网络,运行在你的本地机器上,并且几乎可以做任何你能想到的事情。所有这些都通过短信与它进行沟通。对于AI极客来说,这是一个梦想成真,起初确实需要一番消化。

为了让你了解其可能性:我让Clawdbot为自己添加了使用Google Nano Banana Pro模型生成图像的支持。完成这项工作后(Clawdbot甚至告诉我如何将我的Gemini凭据安全地存储在macOS原生的钥匙串中),我要求Navi为自己设置一个头像,将它原有的甲壳类动物形象与《塞尔达传说》中的Navi结合起来。结果是一只精灵蟹,上面印着游戏中那句流行的“Hey, Listen!”,这是它通过谷歌搜索预先在网上找到的:

Clawdbot

然后,我更进一步:我让Navi评估自己的功能状态,并使用Nano Banana制作了一张信息图来描述其结构。由于Clawdbot运行在我的电脑上,其功能都包含在文件夹中,Clawdbot扫描了自己在Finder中的目录,然后去了Nano Banana,生成了以下图片:/clawd

Clawdbot

正如你从图片中可以看到的,我在这里只是触及了Clawdbot能力的皮毛。“记忆文件”实际上是Clawdbot每天自动生成的Markdown格式的日记,用以记录我们交互的纯文本日志。这是它基于Markdown的记忆系统,如果我愿意,我可以将其插入Obsidian,用Raycast搜索,或者用Hazel以其他方式自动化。

Clawdbot

这些集成是我近年来在使用大型语言模型时获得的最大乐趣。秉承我们最近在AppStories上讨论的“你能想做就能做”的理念,如果你想让Clawdbot获得它默认不具备的功能,你只需提出要求,它就会为你完成。举个例子:前段时间,我为Club MacStories会员分享了一个快捷方式,它使用Groq上托管的Whisper模型快速转录语音消息。我获取了那篇文章的链接,把它提供给Clawd,并告诉它我希望它支持用那个系统转录Telegram的语音消息。两分钟后,它创建了一个技能,将我的快捷方式适配到运行在我Mac mini上的Clawd。

Clawdbot

接着,我又更进一步:像任何优秀的助手一样,我希望确保如果我用语音发出请求,Navi也用语音回应;如果我发送文本请求,Navi则用文本回复。那时,Clawdbot开始进行一番研究,找到了ElevenLabs新文本转语音模型的文档,向我索要了ElevenLabs的凭据,并为我创建了三种不同个性的测试声音供我选择。我选择了一种,稍微微调了一下,几分钟后,Navi就拥有了用于未来语音回复的“声音”。现在,当我想问我的助手什么但又忙着做别的事情无法打字时,我只需在Telegram上发送一个语音消息的“思绪倾泻”,几秒钟后,我就可以听到回复了。

Clawdbot

能够在Telegram中用意大利语或英语——或者两者混合!——向我的助手口述消息,这太棒了——尤其是考虑到iPhone自带的Siri至今仍不是多语言的,更不用说理解用户上下文或在后台执行长时间任务了。

还没被打动吗?那这个怎么样:

昨晚,我思考能否用Clawd在我的Mac mini上运行的等效操作,替换几年前我在Zapier上配置的一些自动化任务,从而每月节省一些额外开支。其中一个例子是,每当周五我们发送MacStories Weekly时,一个“zap”就会在我的Todoist中为下一期创建一个项目。它通过检查RSS订阅源、增加期号并通过Todoist API创建新项目来实现。我问Clawd是否可以复制它,果然,它概述了一个计划:我们可以在Mac mini上设置一个cron作业,每隔几个小时检查RSS订阅源,并在订阅源中出现新刊时创建一个新项目。经过五分钟的来回沟通,Clawd在我的Mac上创建了所有这些,没有云依赖,无需订阅——只是我要求的任务,由大型语言模型利用现有的shell工具和互联网访问拼凑而成。这让我不禁思考,如果我给Clawd一些提示和shell访问权限,我能替换掉多少自动化层和服务。

Clawdbot

所有这一切既令人兴奋又令人恐惧。相比于使用最新版本的Claude或ChatGPT,使用Clawdbot以及不断根据我的需求和偏好塑造它的过程,是我近期感受到的最高程度的数字智能。我现在理解了OpenAI应用程序首席执行官Fidji Simo为何撰文指出,AI实验室应更多地利用模型的能力(解决“能力过剩”问题)来构建个人超级助手。当我使用ChatGPT或Claude时,模型受限于开发者赋予它们的功能,我们用户无法对体验进行太多调整。相反,Clawdbot是新一代可塑性软件的终极体现,它是个性化和自适应的:我可以选择Clawdbot应该具备哪些能力,我也可以随时检查幕后发生了什么,如果我不喜欢,可以要求改变。只需与运行在电脑中的代理对话,就能让我的电脑做任何事情——这非常有趣、令人上瘾且富有教育意义:在过去一周里,我学到的关于SSH、cron、Web API和Tailscale的知识,比我近二十年来折腾电脑所学到的还要多。

Clawdbot是新一代可塑性软件的终极体现,它是个性化和自适应的。

Clawdbot

Clawdbot也提供了一个光辉的范例,展示了当给予现代代理(以及适当的工具)访问电脑的权限时会发生什么:它们可以仅仅通过准递归改进来构建事物,并为特定用户变得更智能(但并非普遍意义上的更智能)。难怪所有AI公司都注意到了这一点,如今每一次主要的功能发布都与虚拟文件系统沙箱或命令行接口访问有关。

正如我在AppStories上所说,我相信所有这一切的影响很快就会波及到各种应用商店,我们需要就应用开发者未来的角色进行认真讨论。Clawdbot目前是一个小众的极客项目,但请将其视为未来的一种潜在趋势:当主要的消费级大型语言模型变得足够智能和直观,能够根据你的需求实时适应任何功能——当你最终能够要求Claude或ChatGPT在你的电脑上完成或创建任何事情,而无需终端UI时——专业开发者创建的“应用”将何去何从?我尤其担心那些独立的实用工具应用:如果Clawdbot可以为我的LG电视创建一个虚拟遥控器(这是我做到的),或者每天早上用语音给我一个完全符合我要求的个性化报告(这是我设置的另一个任务),我为什么还要费心去App Store寻找别人预先构建好的解决方案呢?当我想精心创建的任何“自动化”实际上只需向数字助手发送一条短信就能完成时,快捷指令(Shortcuts)又会变成什么样呢?

我现在还不知道这些问题的答案,但我们将在今年在AppStories和MacStories上努力逐一探讨它们。

目前,我就说到这里:Clawdbot是一个杰出的项目,如果你对此概念哪怕只有一点点兴趣,我都强烈推荐你去尝试摆弄一番。Clawdbot向我展示了我们作为个人助手,对大型语言模型潜力的挖掘才刚刚开始。掌握了这种超能力后,就再也回不去了。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:高等精灵实验室 诺多 诺多《【译文】Clawdbot向我们展示了个人AI助手的未来图景》

评论:0   参与:  0