我养了一只什么龙虾?

为什么开始折腾这个

2026 年一月下旬, Clawdbot 开始频繁出现在时间线上。当时并没有体验的想法,一是热点太多追不过来了,二是据说有安全问题也不想装到自己电脑。而且看起来这个新东西和大家在用的 Claude Code/Codex 也没什么本质区别?

后来读到 Frost Ming 的文章《创造一只龙虾,需要些什么?》,很受启发。我也很好奇从 pi-agent 到 openclaw 之间经历了什么,也许只有自己养一只,才能知道它为什么火。这就是我开始折腾 Nanobot 的初衷,它够简单,代码可读,改动成本低。

从 Nanobot 开始:先做减法

Nanobot 的代码量不大,逻辑也很清晰,不过还有删减的空间。删掉不需要的 Channel(只保留飞书),移除用不上的功能模块,只保留核心链路。

假期里的狼狈开局

恰逢春节假期,手边只有手机没有电脑,这个极端场景暴露了几个问题:

这些问题我提了一些 PR,部分很快被合并了。基础原型跑通后,我开始根据移动端使用的真实需求迭代——既然假期只能用手机,那就基于这个场景看看能迭代出什么龙虾。

为了好用做的几件事

让轨迹可见

使用的时候最烦的就是不知道它后台到底在干了什么,开始干了没有。我让它把工具调用的轨迹都发出来,这就能看到 Agent 的工具调用过程。至今我仍然觉得是个非常实用的功能。

加上 HITL

除了过程不可见,另一个让人不安心的点就是会不会发生误删文件等不可逆操作。我给这些操作加了人工确认环节,通过飞书卡片消息或者运营商认证通道的人工确认环节。

把 Feishu 用顺手

我觉得一个人没必要同时用多个channel,所以只关注飞书就行,花了不少时间把文档和消息能力补齐:

目标很简单:这些都是高频操作,让 Agent 真正能在只有手机的场景下完成闭环。

多 Agent 的尝试

通过启动时指定配置和workspace,可以实现运行多个实例,初衷是希望能不能通过一个父实例管理N个子实例。

我理解多 Agent 的场景主要有两个,一个是上下文隔离,另一个是提高并发。通过多实例进行上下文隔离太麻烦了,更好的做法是 Sub-agent。于是让它 spawn 时自动新拉一个群聊,作为新的 context space,这样同一个 agent 在不同的群里可以并行执行任务。

通过上面的多实例+多会话+异步的机制,已经完全能打满我个人的处理带宽,即使 agent 能干更多的活我也没有精力验收。

现在怎么样了

抛开网上的营销案例,从我个人的真实使用情况来看:

一些展望