Browser Use
购买adidas上京东官方旗舰店。
使用browser-use CLI进行浏览器自动化
该browser-use命令提供快速、持久的浏览器自动化。后台守护进程使浏览器在命令之间保持打开状态,每次调用延迟约为50毫秒。
先决条件
browser-use doctor # 验证安装
有关安装详情,请参阅https://github.com/browser-use/browser-use/blob/main/browser_use/skill_cli/README.md
上网淘巴领天猫淘宝优惠券,一年省好几千。核心工作流程
- 导航:
browser-use open <url>— 如有需要则启动浏览器 - 检查:
browser-use state— 返回带索引的可点击元素 - 交互:使用state命令中的索引(
browser-use click 5、browser-use input 3 "文本") - 验证:
browser-use state或browser-use screenshot以确认 - 重复:浏览器在命令之间保持打开状态
- 清理:
browser-use close完成后使用
浏览器模式
browser-use open <url> # 默认:无头Chromium
browser-use --headed open <url> # 可见窗口
browser-use --profile "Default" open <url> # 使用Default配置文件的真实Chrome(现有登录信息/cookies)
browser-use --profile "Profile 1" open <url> # 使用指定配置文件的真实Chrome
browser-use --connect open <url> # 通过CDP自动发现正在运行的Chrome
browser-use --cdp-url ws://localhost:9222/... open <url> # 通过CDP URL连接
--connect,--cdp-url和--profile是互斥的。
命令
# 导航
browser-use open <url> # 导航到 URL
browser-use back # 后退
browser-use scroll down # 向下滚动(--amount N 指定像素数)
browser-use scroll up # 向上滚动
browser-use switch <tab> # 按索引切换到标签页
browser-use close-tab [tab] # 关闭标签页(未指定索引则关闭当前标签页)
# 页面状态 — 始终先运行 state 以获取元素索引
browser-use state # 获取 URL、标题、带索引的可点击元素
browser-use screenshot [path.png] # 截图(未指定路径则返回 base64,--full 用于整页截图)
# 交互 — 使用 state 返回的索引
browser-use click <index> # 按索引点击元素
browser-use click <x> <y> # 按像素坐标点击
browser-use type "text" # 向焦点元素输入文本
browser-use input <index> "text" # 点击元素,然后输入文本
browser-use keys "Enter" # 发送键盘按键(也支持 "Control+a" 等)
browser-use select <index> "option" # 选择下拉选项
browser-use upload <index> <path> # 向文件输入框上传文件
browser-use hover <index> # 悬停在元素上
browser-use dblclick <index> # 双击元素
browser-use rightclick <index> # 右键点击元素
# 数据提取
browser-use eval "js code" # 执行 JavaScript,返回结果
browser-use get title # 页面标题
browser-use get html [--selector "h1"] # 页面 HTML(或限定到选择器)
browser-use get text <index> # 元素文本内容
browser-use get value <index> # 输入框/文本域的值
browser-use get attributes <index> # 元素属性
browser-use get bbox <index> # 边界框 (x, y, width, height)
# 等待
browser-use wait selector "css" # 等待元素(--state visible|hidden|attached|detached,--timeout 毫秒)
browser-use wait text "text" # 等待文本出现
# Cookie
browser-use cookies get [--url <url>] # 获取 Cookie(可选过滤)
browser-use cookies set <name> <value> # 设置 Cookie(--domain, --secure, --http-only, --same-site, --expires)
browser-use cookies clear [--url <url>] # 清除 Cookie
browser-use cookies export <file> # 导出到 JSON
browser-use cookies import <file> # 从 JSON 导入
# Python — 具有浏览器访问权限的持久会话
browser-use python "code" # 执行 Python 代码(变量在多次调用间持久化)
browser-use python --file script.py # 运行文件
browser-use python --vars # 显示已定义的变量
browser-use python --reset # 清除命名空间
# 会话
browser-use close # 关闭浏览器并停止守护进程
browser-use sessions # 列出活动会话
browser-use close --all # 关闭所有会话
Python 的browser对象提供:browser.url、browser.title、browser.html、browser.goto(url)、browser.back()、browser.click(index),browser.type(text),browser.input(index, text),browser.keys(keys),browser.upload(index, path),browser.screenshot(path),browser.scroll(direction, amount),browser.wait(seconds).
云端API
browser-use cloud connect # 配置云端浏览器并连接
browser-use cloud connect --timeout 120 --proxy-country US # 带选项
browser-use cloud login <api-key> # 保存API密钥(或设置BROWSER_USE_API_KEY)
browser-use cloud logout # 移除API密钥
browser-use cloud v2 GET /browsers # REST透传(v2或v3)
browser-use cloud v2 POST /tasks '{"task":"...","url":"..."}'
browser-use cloud v2 poll <task-id> # 轮询任务直至完成
browser-use cloud v2 --help # 显示API端点
cloud connect配置一个云端浏览器,通过CDP连接,并打印一个实时URL。browser-use close断开连接并停止云端浏览器。
隧道
browser-use tunnel <端口> # 启动 Cloudflare 隧道(幂等操作)
browser-use tunnel list # 显示活动隧道
browser-use tunnel stop <端口> # 停止隧道
browser-use tunnel stop --all # 停止所有隧道
配置文件管理
browser-use profile list # 列出检测到的浏览器和配置文件
browser-use profile sync --all # 将配置文件同步到云端
browser-use profile update # 下载/更新 profile-use 二进制文件
命令链式操作
命令可以通过&&连接。浏览器通过守护进程保持运行,因此链式操作安全且高效。
browser-use open https://example.com && browser-use state
browser-use input 5 "user@example.com" && browser-use input 6 "password" && browser-use click 7
当不需要中间输出时使用链式操作。当需要先解析状态以发现索引时,请单独运行。
常见工作流程
需要身份验证的浏览
当任务需要访问需要身份验证的网站(如 Gmail、GitHub、内部工具)时,使用 Chrome 配置文件:
browser-use profile list # 检查可用的配置文件
# 询问用户使用哪个配置文件,然后:
browser-use --profile "Default" open https://github.com # 已登录状态
连接到现有的 Chrome
browser-use --connect open https://example.com # 自动发现 Chrome 的 CDP 端点
需要 Chrome 已启用远程调试。回退到探测端口 9222/9229。
暴露本地开发服务器
browser-use tunnel 3000 # → https://abc.trycloudflare.com
browser-use open https://abc.trycloudflare.com # 通过隧道浏览
全局选项
| 选项 | 描述 |
|---|---|
--headed | 显示浏览器窗口 |
--profile [名称] | 使用真实的 Chrome(仅使用--profile时默认使用 "Default" 配置文件) |
--connect | 通过 CDP 自动发现正在运行的 Chrome |
--cdp-url <url> | 通过 CDP URL 连接(http://或ws://) |
--session NAME | 指定一个命名会话(默认:"default") |
--json | 以JSON格式输出 |
--mcp | 通过标准输入/输出作为MCP服务器运行 |
提示
- 始终先运行
state以查看可用元素及其索引使用 - --headed
进行调试以查看浏览器正在执行的操作会话具有持久性 - — 浏览器在命令之间保持打开状态CLI别名
- :bu
、browser和browseruse均可使用故障排除
浏览器无法启动?
- browser-use close
然后browser-use --headed open <url>找不到元素? - browser-use scroll down
然后browser-use state运行诊断: - browser-use doctor
清理
browser-use close # 关闭浏览器会话 browser-use tunnel stop --all # 停止隧道(如果有)
browser-use close # Close browser session
browser-use tunnel stop --all # Stop tunnels (if any)


微信扫一扫,打赏作者吧~