最近在玩一个工具,用了一周之后,我意识到一件事:我以前在浏览器里做的那些「复制、粘贴、格式化」工作,90%都是可以被替代的。
这个工具叫 OpenCLI。19K星,170个贡献者,95个release版本,作者 jackwener。
今天这篇,我分两段:前半段说说我怎么看它,后半段带跑一遍。思考和实操都有,缺一不可。
01|你在浏览器里浪费了多少时间?
先问一个问题:你每天在浏览器里做多少「重复性信息搬运」?比如:
- 从知乎复制几个高赞回答,整理成一篇素材文档
- 从小红书截图几张图,整理到 PPT 里
- 从 B 站下载视频封面和字幕,整理成参考材料
- 从 GitHub 复制一个 issue 的完整讨论
- 从微信公众号复制文章内容做笔记
这些事有一个共同特点:它们本质上不是「创造」,是「搬运」。你不是在创造内容,你是在把信息从一个地方挪到另一个地方,加个格式,变成你能用的东西。
这个过程里,最耗时的不是「读」,是「搬」——复制、粘贴、格式化、去广告、调整排版……
这个问题我忍了很久。我总觉得「应该有什么办法让机器帮我做这些」。但一直没找到好方案——要么需要自己写爬虫(登录、反爬、验证码……),要么工具太复杂学不动,要么根本不支持我想要的那个平台。直到我用了 OpenCLI。
02|OpenCLI 在做的事,本质上是「把网页变成数据」
OpenCLI 的核心理念,我用一个比喻来说:它不是帮你在浏览器里「看」网页,它是在帮你从网页里「拿」数据。这两个的区别很大。
「看」网页,你得到的是一个渲染好的视觉页面。截图方便,但拿不到结构;复制粘贴方便,但带格式、丢内容;F12 打开 DevTools 方便,但得自己写选择器……
「拿」数据,你得到的是一个结构化结果。JSON、YAML、Markdown、纯文本——你想要什么格式,它给你什么格式,不带广告、不带 CSS、不带 JavaScript、不带乱七八糟的 HTML 标签。
OpenCLI 通过一个浏览器插件(Browser Bridge),直接读取你本地 Chrome 的登录态,然后模拟一个干净的 API 请求,把结构化数据提取出来。
举几个例子:
# 从知乎搜索,返回结构化 JSON
opencli zhihu search "AI Agent 框架 2026" --limit 5 --format json
# 从微信公众号下载文章内容(去广告版)
opencli weixin download "https://mp.weixin.qq.com/s/xxxx" --format md
# 从 B 站下载视频信息
opencli bilibili video BV1xx411c7mu --info
# 从 GitHub 拿一个 issue 的完整讨论
opencli github issue owner/repo 123 --comments
数据直接进你的文件,不需要再手动复制粘贴。这才是真正的「信息获取自动化」——不是帮你打开网页,是帮你把网页里的内容拿进你的工作流。
03|我看到的三个信号
信号一:「结构化数据」正在成为新的分水岭
过去,判断一个人获取信息能力强不强,看他会不会用 Google、会不会用高级搜索语法。现在,判断一个人获取信息能力强不强,看他能不能拿到「结构化的数据」,而不是只能看到渲染好的页面。
这个差距在快速拉大。你能在页面上看到一篇文章,叫「会搜」。你能把一篇文章提取成 Markdown,叫「会用」。你能把一个话题下所有高赞回答批量提取、汇总、分类,叫「会用 AI」。
OpenCLI 解决的,就是从「会搜」到「会用」这最后一公里的问题。它不替代你搜索,它替代你搬运。
信号二:「登录态复用」是一个被严重低估的设计
我见过很多爬虫/数据采集工具,大部分都踩过两个坑:
- 需要自己处理登录:你要么模拟登录拿 cookie,要么申请 API Key,要么用无头浏览器绕验证……每一个都是坑。
- 容易被反爬:平台一变规则,脚本就废了。
OpenCLI 的解法很聪明:它不自己去登录,它复用你 Chrome 已经登录好的状态。你已经在浏览器里登录了知乎、小红书、B站?它直接用这个状态,不需要你再做任何配置。反爬?你的真实浏览器能访问,它就能访问。
这个设计选择,让整个工具的可用性提升了一个量级——因为它把最难的部分(登录和反爬)直接绕过去了。
信号三:当信息获取可以被「脚本化」,你的工作流会发生质变
OpenCLI 最让我兴奋的地方,不是某个具体功能,而是它的使用模式:你可以把信息获取写成脚本,然后让 AI Agent 去调用。
比如,我最近在做一个技术 newsletter。以前的工作流是:打开十几个网页,搜索相关内容,手动复制粘贴,整理成文档,写文章。
用了 OpenCLI + AI Agent 之后,工作流变成了:
opencode "帮我完成以下任务:
1. 用 opencli 从知乎搜索 AI Agent 相关回答,取前 5 条,保存为素材.md
2. 用 opencli 从 B 站下载几个相关视频的字幕,保存到 ./subs/ 目录
3. 把素材整理成一篇 newsletter,保存为 draft.md"
你看到没有——我不需要手动去做信息获取这件事了。我只需要描述我想要什么结果,AI Agent 调用 OpenCLI 把数据拿回来,整理成我需要的格式。这不是「更快的复制粘贴」,这是「把信息获取这件事从我的工作流里拿掉了」。
04|我没有想清楚的事
说完我想清楚的,说一些我还没想清楚的。
第一件事:OpenCLI 的「登录态复用」,在法律和平台条款上处于什么位置?它不是在破解登录,它是在用你自己的浏览器状态访问你自己已经登录的网站。但平台方是否会认为这是「自动化爬取」?目前法律对这类工具的边界定义还很不清晰。
随着这类工具的普及,平台方会收紧 API 访问政策,工具方也需要在「功能便利」和「合规使用」之间找到平衡。
第二件事:当信息获取变得极度便利之后,「信息差」会消失吗?以前有些人靠「信息差」吃饭——他们知道去哪里找信息、怎么找到高质量信息,这本身就是一种能力。
现在如果工具让信息获取变得极度便利,信息差会消失吗?我的判断是:信息本身不值钱了,但「判断信息价值」这件事更值钱了。当所有人都能轻松获取同样的信息时,能判断「哪些信息值得关注、哪些是噪音」的人,壁垒反而更高了。
05|手把手跑一遍(30分钟搞完)
下面是实操指南。写得详细,是因为这一步最容易卡住。
第一步:确认环境
OpenCLI 基于 Node.js。确认你装了:
node -v
# 需要 v18+,建议 v20+
npm -v
# 通常随 Node 一起装好
如果没有,去 nodejs.org 下载最新版。
第二步:全局安装 OpenCLI
npm install -g @jackwener/opencli
# 或者用 pnpm
pnpm add -g @jackwener/opencli
装完验证:
opencli --version
# 应该看到 v1.7.x
第三步:安装浏览器插件(Browser Bridge)
这是关键一步。OpenCLI 需要一个 Chrome 插件来读取你的登录态。
- 打开 Chrome,进入扩展页面:
chrome://extensions/ - 开启「开发者模式」(右上角)
- 打开官方插件目录:
~/.opencli/bridge/chrome/(安装后自动生成) - 点击「加载已解压的扩展程序」,选择这个目录
- 固定插件到工具栏,点击图标确保显示「Connected」
第四步:验证连接
opencli bridge status
如果显示 Connected,说明插件和 CLI 通讯正常。
第五步:跑第一个命令
opencli weixin download "https://mp.weixin.qq.com/s/xxxx" --format md
试试提取知乎搜索结果:
opencli zhihu search "OpenCLI" --limit 3 --format json
如果返回 JSON 数据,说明一切正常。就这么简单,你的信息获取工作流已经被彻底改造了。
小结
OpenCLI 不是那种「看起来很酷但用不上」的工具。它解决的是一个非常具体、每天都发生的痛点——信息搬运。如果你和我一样,每天都在浏览器里做大量复制粘贴、格式化、整理材料的工作,花 30 分钟装一下,不会后悔。
代码开源在 GitHub:https://github.com/jackwener/opencli,有兴趣可以去看看源码。