GitHub 19k星的开源项目 OpenCLI：90%的复制粘贴可以被替代

最近在玩一个工具，用了一周之后，我意识到一件事：我以前在浏览器里做的那些「复制、粘贴、格式化」工作，90%都是可以被替代的。

这个工具叫 OpenCLI。19K星，170个贡献者，95个release版本，作者 jackwener。

今天这篇，我分两段：前半段说说我怎么看它，后半段带跑一遍。思考和实操都有，缺一不可。

01｜你在浏览器里浪费了多少时间？

先问一个问题：你每天在浏览器里做多少「重复性信息搬运」？比如：

从知乎复制几个高赞回答，整理成一篇素材文档
从小红书截图几张图，整理到 PPT 里
从 B 站下载视频封面和字幕，整理成参考材料
从 GitHub 复制一个 issue 的完整讨论
从微信公众号复制文章内容做笔记

这些事有一个共同特点：它们本质上不是「创造」，是「搬运」。你不是在创造内容，你是在把信息从一个地方挪到另一个地方，加个格式，变成你能用的东西。

这个过程里，最耗时的不是「读」，是「搬」——复制、粘贴、格式化、去广告、调整排版……

这个问题我忍了很久。我总觉得「应该有什么办法让机器帮我做这些」。但一直没找到好方案——要么需要自己写爬虫（登录、反爬、验证码……），要么工具太复杂学不动，要么根本不支持我想要的那个平台。直到我用了 OpenCLI。

02｜OpenCLI 在做的事，本质上是「把网页变成数据」

OpenCLI 的核心理念，我用一个比喻来说：它不是帮你在浏览器里「看」网页，它是在帮你从网页里「拿」数据。这两个的区别很大。

「看」网页，你得到的是一个渲染好的视觉页面。截图方便，但拿不到结构；复制粘贴方便，但带格式、丢内容；F12 打开 DevTools 方便，但得自己写选择器……

「拿」数据，你得到的是一个结构化结果。JSON、YAML、Markdown、纯文本——你想要什么格式，它给你什么格式，不带广告、不带 CSS、不带 JavaScript、不带乱七八糟的 HTML 标签。

OpenCLI 通过一个浏览器插件（Browser Bridge），直接读取你本地 Chrome 的登录态，然后模拟一个干净的 API 请求，把结构化数据提取出来。

举几个例子：

# 从知乎搜索，返回结构化 JSON
opencli zhihu search "AI Agent 框架 2026" --limit 5 --format json

# 从微信公众号下载文章内容（去广告版）
opencli weixin download "https://mp.weixin.qq.com/s/xxxx" --format md

# 从 B 站下载视频信息
opencli bilibili video BV1xx411c7mu --info

# 从 GitHub 拿一个 issue 的完整讨论
opencli github issue owner/repo 123 --comments

数据直接进你的文件，不需要再手动复制粘贴。这才是真正的「信息获取自动化」——不是帮你打开网页，是帮你把网页里的内容拿进你的工作流。

03｜我看到的三个信号

信号一：「结构化数据」正在成为新的分水岭

过去，判断一个人获取信息能力强不强，看他会不会用 Google、会不会用高级搜索语法。现在，判断一个人获取信息能力强不强，看他能不能拿到「结构化的数据」，而不是只能看到渲染好的页面。

这个差距在快速拉大。你能在页面上看到一篇文章，叫「会搜」。你能把一篇文章提取成 Markdown，叫「会用」。你能把一个话题下所有高赞回答批量提取、汇总、分类，叫「会用 AI」。

OpenCLI 解决的，就是从「会搜」到「会用」这最后一公里的问题。它不替代你搜索，它替代你搬运。

信号二：「登录态复用」是一个被严重低估的设计

我见过很多爬虫/数据采集工具，大部分都踩过两个坑：

需要自己处理登录：你要么模拟登录拿 cookie，要么申请 API Key，要么用无头浏览器绕验证……每一个都是坑。
容易被反爬：平台一变规则，脚本就废了。

OpenCLI 的解法很聪明：它不自己去登录，它复用你 Chrome 已经登录好的状态。你已经在浏览器里登录了知乎、小红书、B站？它直接用这个状态，不需要你再做任何配置。反爬？你的真实浏览器能访问，它就能访问。

这个设计选择，让整个工具的可用性提升了一个量级——因为它把最难的部分（登录和反爬）直接绕过去了。

信号三：当信息获取可以被「脚本化」，你的工作流会发生质变

OpenCLI 最让我兴奋的地方，不是某个具体功能，而是它的使用模式：你可以把信息获取写成脚本，然后让 AI Agent 去调用。

比如，我最近在做一个技术 newsletter。以前的工作流是：打开十几个网页，搜索相关内容，手动复制粘贴，整理成文档，写文章。

用了 OpenCLI + AI Agent 之后，工作流变成了：

opencode "帮我完成以下任务：
1. 用 opencli 从知乎搜索 AI Agent 相关回答，取前 5 条，保存为素材.md
2. 用 opencli 从 B 站下载几个相关视频的字幕，保存到 ./subs/ 目录
3. 把素材整理成一篇 newsletter，保存为 draft.md"

你看到没有——我不需要手动去做信息获取这件事了。我只需要描述我想要什么结果，AI Agent 调用 OpenCLI 把数据拿回来，整理成我需要的格式。这不是「更快的复制粘贴」，这是「把信息获取这件事从我的工作流里拿掉了」。

04｜我没有想清楚的事

说完我想清楚的，说一些我还没想清楚的。

第一件事：OpenCLI 的「登录态复用」，在法律和平台条款上处于什么位置？它不是在破解登录，它是在用你自己的浏览器状态访问你自己已经登录的网站。但平台方是否会认为这是「自动化爬取」？目前法律对这类工具的边界定义还很不清晰。

随着这类工具的普及，平台方会收紧 API 访问政策，工具方也需要在「功能便利」和「合规使用」之间找到平衡。

第二件事：当信息获取变得极度便利之后，「信息差」会消失吗？以前有些人靠「信息差」吃饭——他们知道去哪里找信息、怎么找到高质量信息，这本身就是一种能力。

现在如果工具让信息获取变得极度便利，信息差会消失吗？我的判断是：信息本身不值钱了，但「判断信息价值」这件事更值钱了。当所有人都能轻松获取同样的信息时，能判断「哪些信息值得关注、哪些是噪音」的人，壁垒反而更高了。

05｜手把手跑一遍（30分钟搞完）

下面是实操指南。写得详细，是因为这一步最容易卡住。

第一步：确认环境

OpenCLI 基于 Node.js。确认你装了：

node -v
# 需要 v18+，建议 v20+

npm -v
# 通常随 Node 一起装好

如果没有，去 nodejs.org 下载最新版。

第二步：全局安装 OpenCLI

npm install -g @jackwener/opencli

# 或者用 pnpm
pnpm add -g @jackwener/opencli

装完验证：

opencli --version
# 应该看到 v1.7.x

第三步：安装浏览器插件（Browser Bridge）

这是关键一步。OpenCLI 需要一个 Chrome 插件来读取你的登录态。

打开 Chrome，进入扩展页面：chrome://extensions/
开启「开发者模式」（右上角）
打开官方插件目录：~/.opencli/bridge/chrome/（安装后自动生成）
点击「加载已解压的扩展程序」，选择这个目录
固定插件到工具栏，点击图标确保显示「Connected」

第四步：验证连接

opencli bridge status

如果显示 Connected，说明插件和 CLI 通讯正常。

第五步：跑第一个命令

opencli weixin download "https://mp.weixin.qq.com/s/xxxx" --format md

试试提取知乎搜索结果：

opencli zhihu search "OpenCLI" --limit 3 --format json

如果返回 JSON 数据，说明一切正常。就这么简单，你的信息获取工作流已经被彻底改造了。

小结

OpenCLI 不是那种「看起来很酷但用不上」的工具。它解决的是一个非常具体、每天都发生的痛点——信息搬运。如果你和我一样，每天都在浏览器里做大量复制粘贴、格式化、整理材料的工作，花 30 分钟装一下，不会后悔。

代码开源在 GitHub：https://github.com/jackwener/opencli，有兴趣可以去看看源码。