网淘吧来吧,欢迎您!

返回首页 微信
微信
手机版
手机版

Fastest Browser Use

2026-03-25 新闻来源:网淘吧 围观:92
电脑广告
手机广告

最快的浏览器使用工具

这是一个基于 Rust 的浏览器自动化引擎,通过轻量级二进制文件直接经由 CDP 驱动 Chrome。它针对高效令牌的 DOM 提取、稳健的会话管理和速度进行了优化。

Terminal Demo

🧪 智能体使用配方

1. 通过人类仿真绕过“机器人检测”

模拟鼠标抖动和随机延迟来抓取受保护站点。

fast-browser-use navigate --url "https://protected-site.com" \
  --human-emulation \
  --wait-for-selector "#content"

2. “深度冻结”快照

捕获整个 DOM 状态以及计算样式,以便后续完美重建。

fast-browser-use snapshot --include-styles --output state.json

3. 登录与 Cookie 窃取

手动登录一次,然后窃取会话用于无头自动化。

步骤 1:打开非无头浏览器进行手动登录

fast-browser-use login --url "https://github.com/login" --save-session ./auth.json

步骤 2:稍后重用会话

fast-browser-use navigate --url "https://github.com/dashboard" --load-session ./auth.json

4. 🚜 无限滚动收割者

从无限滚动页面提取最新数据——非常适合获取最新帖子、新闻或社交媒体动态。

# 从 Hacker News 收割标题(滚动 3 次,每次间隔 800 毫秒)
fast-browser-use harvest \
  --url "https://news.ycombinator.com" \
  --selector ".titleline a" \
  --scrolls 3 \
  --delay 800 \
  --output headlines.json

实际输出(约 6 秒内获取 59 个不重复项):

[
  "Genode OS 是一个用于构建高度安全的专用操作系统的工具包",
  "移动运营商可以获取你的 GPS 位置",
  "学生使用'拟人化'程序来规避关于使用 AI 作弊的指控",
  "芬兰将通过禁止青少年使用社交媒体来结束'不受控制的人类实验'",
  ...
]

适用于任何无限滚动页面:Reddit、Twitter、LinkedIn 动态、搜索结果等。

5. 📸 快速截图

将任何页面捕获为 PNG:

fast-browser-use screenshot \
  --url "https://example.com" \
  --output page.png \
  --full-page  # 可选:捕获整个可滚动页面

6. 🗺️ 站点地图与页面结构分析器

通过解析站点地图和分析页面结构,了解网站的架构组织。

# 基础站点地图发现(检查 robots.txt + 常见站点地图 URL)
fast-browser-use sitemap --url "https://example.com"
# 包含页面结构的完整分析(标题、导航、区块)
fast-browser-use sitemap \
  --url "https://example.com" \
  --analyze-structure \
  --max-pages 10 \
  --max-sitemaps 5 \
  --output site-structure.json

选项:

  • --analyze-structure: 同时提取页面结构(标题、导航、区块、元数据)
  • --max-pages N: 将结构分析限制在 N 个页面内(默认值:5)
  • --max-sitemaps N: 将站点地图解析限制在 N 个站点地图内(默认值:10,适用于大型网站)

示例输出:

{
  "base_url": "https://example.com",
  "robots_txt": "User-agent: *\nSitemap: https://example.com/sitemap.xml",
  "sitemaps": ["https://example.com/sitemap.xml"],
  "pages": [
    "https://example.com/about",
    "https://example.com/products",
    "https://example.com/contact"
  ],
  "page_structures": [
    {
      "url": "https://example.com",
      "title": "Example - Home",
      "headings": [
        {"level": 1, "text": "欢迎来到 Example"},
        {"level": 2, "text": "我们的服务"}
      ],
      "nav_links": [
        {"text": "关于", "href": "/about"},
        {"text": "产品", "href": "/products"}
      ],
      "sections": [
        {"tag": "main", "id": "content", "role": "main"},
        {"tag": "footer", "id": "footer", "role": null}
      ],
      "main_content": {"tag": "main", "id": "content", "word_count": 450},
      "meta": {
        "description": "Example 公司主页",
        "canonical": "https://example.com/"
      }
    }
  ]
}

在抓取前使用此功能来理解网站架构,映射导航流程,或审核 SEO 结构。

⚡ 性能对比

特性Fast Browser Use (Rust)Puppeteer (Node)Selenium (Java)
启动时间< 50毫秒约800毫秒约2500毫秒
内存占用15 MB100 MB+200 MB+
DOM 提取零拷贝JSON序列化慢桥

功能与工具

视觉与提取

  • vision_map:返回一个带有编号边界框的屏幕截图叠加层,用于标记所有交互元素。
  • snapshot:捕获原始HTML快照(为AI优化的YAML/Markdown格式)。
  • screenshot:捕获页面的可视图像。
  • extract:从DOM中获取结构化数据。
  • markdown:将当前页面内容转换为Markdown格式。
  • sitemap:通过robots.txt、站点地图和页面语义分析来分析网站结构。

导航与生命周期

  • navigate:访问特定URL。
  • go_back/go_forward:遍历浏览器历史记录。
  • wait:暂停执行或等待特定条件。
  • new_tab:打开新的浏览器标签页。
  • switch_tab将焦点切换到指定标签页。
  • close_tab:关闭当前或指定的标签页。
  • tab_list:列出所有已打开的标签页。
  • close:终止浏览器会话。

交互操作

  • click:通过CSS选择器或DOM索引点击元素。
  • input:在输入框中输入文本。
  • press_key:发送特定的键盘事件。
  • hover:将鼠标悬停在元素上。
  • scroll:滚动视窗。
  • select:在下拉菜单中选择选项。

状态与调试

  • cookies:管理会话Cookie(获取/设置)。
  • local_storage:管理本地存储数据。
  • debug:访问控制台日志和调试信息。

使用说明

此技能专为需要保持状态(如保持登录)、处理动态JavaScript内容或同时管理多个页面的复杂网页交互而设计。与标准的基于获取的工具相比,它提供了更高的性能和控制能力。

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Linear 下一篇:Cron Mastery

相关文章

您是本站第257423名访客 今日有75篇新文章/评论