最近在玩一个工具,用了一周之后,我意识到一件事:我以前在浏览器里做的那些「复制、粘贴、格式化」工作,90%都是可以被替代的。

这个工具叫 OpenCLI。19K星,170个贡献者,95个release版本,作者 jackwener。

今天这篇,我分两段:前半段说说我怎么看它,后半段带跑一遍。思考和实操都有,缺一不可。

01|你在浏览器里浪费了多少时间?

先问一个问题:你每天在浏览器里做多少「重复性信息搬运」?比如:

  • 从知乎复制几个高赞回答,整理成一篇素材文档
  • 从小红书截图几张图,整理到 PPT 里
  • 从 B 站下载视频封面和字幕,整理成参考材料
  • 从 GitHub 复制一个 issue 的完整讨论
  • 从微信公众号复制文章内容做笔记

这些事有一个共同特点:它们本质上不是「创造」,是「搬运」。你不是在创造内容,你是在把信息从一个地方挪到另一个地方,加个格式,变成你能用的东西。

这个过程里,最耗时的不是「读」,是「搬」——复制、粘贴、格式化、去广告、调整排版……

这个问题我忍了很久。我总觉得「应该有什么办法让机器帮我做这些」。但一直没找到好方案——要么需要自己写爬虫(登录、反爬、验证码……),要么工具太复杂学不动,要么根本不支持我想要的那个平台。直到我用了 OpenCLI。

02|OpenCLI 在做的事,本质上是「把网页变成数据」

OpenCLI 的核心理念,我用一个比喻来说:它不是帮你在浏览器里「看」网页,它是在帮你从网页里「拿」数据。这两个的区别很大。

「看」网页,你得到的是一个渲染好的视觉页面。截图方便,但拿不到结构;复制粘贴方便,但带格式、丢内容;F12 打开 DevTools 方便,但得自己写选择器……

「拿」数据,你得到的是一个结构化结果。JSON、YAML、Markdown、纯文本——你想要什么格式,它给你什么格式,不带广告、不带 CSS、不带 JavaScript、不带乱七八糟的 HTML 标签。

OpenCLI 通过一个浏览器插件(Browser Bridge),直接读取你本地 Chrome 的登录态,然后模拟一个干净的 API 请求,把结构化数据提取出来。

举几个例子:

# 从知乎搜索,返回结构化 JSON
opencli zhihu search "AI Agent 框架 2026" --limit 5 --format json

# 从微信公众号下载文章内容(去广告版)
opencli weixin download "https://mp.weixin.qq.com/s/xxxx" --format md

# 从 B 站下载视频信息
opencli bilibili video BV1xx411c7mu --info

# 从 GitHub 拿一个 issue 的完整讨论
opencli github issue owner/repo 123 --comments

数据直接进你的文件,不需要再手动复制粘贴。这才是真正的「信息获取自动化」——不是帮你打开网页,是帮你把网页里的内容拿进你的工作流。

03|我看到的三个信号

信号一:「结构化数据」正在成为新的分水岭

过去,判断一个人获取信息能力强不强,看他会不会用 Google、会不会用高级搜索语法。现在,判断一个人获取信息能力强不强,看他能不能拿到「结构化的数据」,而不是只能看到渲染好的页面。

这个差距在快速拉大。你能在页面上看到一篇文章,叫「会搜」。你能把一篇文章提取成 Markdown,叫「会用」。你能把一个话题下所有高赞回答批量提取、汇总、分类,叫「会用 AI」。

OpenCLI 解决的,就是从「会搜」到「会用」这最后一公里的问题。它不替代你搜索,它替代你搬运。

信号二:「登录态复用」是一个被严重低估的设计

我见过很多爬虫/数据采集工具,大部分都踩过两个坑:

  1. 需要自己处理登录:你要么模拟登录拿 cookie,要么申请 API Key,要么用无头浏览器绕验证……每一个都是坑。
  2. 容易被反爬:平台一变规则,脚本就废了。

OpenCLI 的解法很聪明:它不自己去登录,它复用你 Chrome 已经登录好的状态。你已经在浏览器里登录了知乎、小红书、B站?它直接用这个状态,不需要你再做任何配置。反爬?你的真实浏览器能访问,它就能访问。

这个设计选择,让整个工具的可用性提升了一个量级——因为它把最难的部分(登录和反爬)直接绕过去了。

信号三:当信息获取可以被「脚本化」,你的工作流会发生质变

OpenCLI 最让我兴奋的地方,不是某个具体功能,而是它的使用模式:你可以把信息获取写成脚本,然后让 AI Agent 去调用。

比如,我最近在做一个技术 newsletter。以前的工作流是:打开十几个网页,搜索相关内容,手动复制粘贴,整理成文档,写文章。

用了 OpenCLI + AI Agent 之后,工作流变成了:

opencode "帮我完成以下任务:
1. 用 opencli 从知乎搜索 AI Agent 相关回答,取前 5 条,保存为素材.md
2. 用 opencli 从 B 站下载几个相关视频的字幕,保存到 ./subs/ 目录
3. 把素材整理成一篇 newsletter,保存为 draft.md"

你看到没有——我不需要手动去做信息获取这件事了。我只需要描述我想要什么结果,AI Agent 调用 OpenCLI 把数据拿回来,整理成我需要的格式。这不是「更快的复制粘贴」,这是「把信息获取这件事从我的工作流里拿掉了」。

04|我没有想清楚的事

说完我想清楚的,说一些我还没想清楚的。

第一件事:OpenCLI 的「登录态复用」,在法律和平台条款上处于什么位置?它不是在破解登录,它是在用你自己的浏览器状态访问你自己已经登录的网站。但平台方是否会认为这是「自动化爬取」?目前法律对这类工具的边界定义还很不清晰。

随着这类工具的普及,平台方会收紧 API 访问政策,工具方也需要在「功能便利」和「合规使用」之间找到平衡。

第二件事:当信息获取变得极度便利之后,「信息差」会消失吗?以前有些人靠「信息差」吃饭——他们知道去哪里找信息、怎么找到高质量信息,这本身就是一种能力。

现在如果工具让信息获取变得极度便利,信息差会消失吗?我的判断是:信息本身不值钱了,但「判断信息价值」这件事更值钱了。当所有人都能轻松获取同样的信息时,能判断「哪些信息值得关注、哪些是噪音」的人,壁垒反而更高了。

05|手把手跑一遍(30分钟搞完)

下面是实操指南。写得详细,是因为这一步最容易卡住。

第一步:确认环境

OpenCLI 基于 Node.js。确认你装了:

node -v
# 需要 v18+,建议 v20+

npm -v
# 通常随 Node 一起装好

如果没有,去 nodejs.org 下载最新版。

第二步:全局安装 OpenCLI

npm install -g @jackwener/opencli

# 或者用 pnpm
pnpm add -g @jackwener/opencli

装完验证:

opencli --version
# 应该看到 v1.7.x

第三步:安装浏览器插件(Browser Bridge)

这是关键一步。OpenCLI 需要一个 Chrome 插件来读取你的登录态。

  1. 打开 Chrome,进入扩展页面:chrome://extensions/
  2. 开启「开发者模式」(右上角)
  3. 打开官方插件目录:~/.opencli/bridge/chrome/(安装后自动生成)
  4. 点击「加载已解压的扩展程序」,选择这个目录
  5. 固定插件到工具栏,点击图标确保显示「Connected」

第四步:验证连接

opencli bridge status

如果显示 Connected,说明插件和 CLI 通讯正常。

第五步:跑第一个命令

opencli weixin download "https://mp.weixin.qq.com/s/xxxx" --format md

试试提取知乎搜索结果:

opencli zhihu search "OpenCLI" --limit 3 --format json

如果返回 JSON 数据,说明一切正常。就这么简单,你的信息获取工作流已经被彻底改造了。

小结

OpenCLI 不是那种「看起来很酷但用不上」的工具。它解决的是一个非常具体、每天都发生的痛点——信息搬运。如果你和我一样,每天都在浏览器里做大量复制粘贴、格式化、整理材料的工作,花 30 分钟装一下,不会后悔。

代码开源在 GitHub:https://github.com/jackwener/opencli,有兴趣可以去看看源码。