网淘吧来吧,欢迎您!

HackerNews Extract

2026-03-30 新闻来源:网淘吧 围观:14
电脑广告
手机广告

HackerNews 提取工具

将 HackerNews 帖子(文章 + 评论)提取为单一的、干净的 Markdown 格式,以便快速阅读或作为 LLM 输入。

查看示例

HackerNews Extract

功能说明

  • 接受一个 HackerNews 的 ID 或 URL
  • 下载链接文章的 HTML,进行清理和格式化。
  • 获取 HackerNews 帖子的元数据和评论。
  • 输出一个可读的组合 Markdown 文件,包含原始文章、线程化评论和关键元数据。

要求

  • uv已安装并在 PATH 中。

安装

除了拥有uv之外,无需额外安装。运行此脚本时,依赖项将由uv自动安装到一个专用的虚拟环境中。

使用流程(代理程序必须遵守)

当代理程序被要求提取 HackerNews 帖子时:

  1. 运行该脚本带有一个输出路径:uv run --script ${baseDir}/hn-extract.py <输入> -o /tmp/hn-<id>.md
  2. 发送一条合并的消息:在同一个工具调用中上传文件并提问。使用消息工具(action=发送filePath="/tmp/hn-<id>.md"message="提取完成。需要我为您总结吗?")。不要
  3. 在聊天中直接输出全文或摘要,除非有明确要求。用法

省略

# run as uv script
uv run --script ${baseDir}/hn-extract.py <hn-id|hn-url|path/to/item.json> [-o path/to/output.md]

# Examples
uv run --script ${baseDir}/hn-extract.py 46861313 -o /tmp/output.md
uv run --script ${baseDir}/hn-extract.py "https://news.ycombinator.com/item?id=46861313"
  • -o以打印到标准输出。用于
  • -o的目录会自动创建。are created automatically.

备注

  • HTTP请求已启用重试机制。
  • 评论内容按讨论深度进行缩进。
  • 需要身份验证或禁止爬取的网站仍可能抓取失败。

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Paperless 下一篇:Table Image

相关文章

您是本站第323059名访客 今日有153篇新文章/评论