HackerNews Extract
2026-03-30
新闻来源:网淘吧
围观:14
电脑广告
手机广告
HackerNews 提取工具
将 HackerNews 帖子(文章 + 评论)提取为单一的、干净的 Markdown 格式,以便快速阅读或作为 LLM 输入。
查看示例

功能说明
- 接受一个 HackerNews 的 ID 或 URL
- 下载链接文章的 HTML,进行清理和格式化。
- 获取 HackerNews 帖子的元数据和评论。
- 输出一个可读的组合 Markdown 文件,包含原始文章、线程化评论和关键元数据。
要求
uv已安装并在 PATH 中。
安装
除了拥有uv之外,无需额外安装。运行此脚本时,依赖项将由uv自动安装到一个专用的虚拟环境中。
使用流程(代理程序必须遵守)
当代理程序被要求提取 HackerNews 帖子时:
- 运行该脚本带有一个输出路径:
uv run --script ${baseDir}/hn-extract.py <输入> -o /tmp/hn-<id>.md。 - 发送一条合并的消息:在同一个工具调用中上传文件并提问。使用消息
工具(action=发送,filePath="/tmp/hn-<id>.md",message="提取完成。需要我为您总结吗?")。不要 - 在聊天中直接输出全文或摘要,除非有明确要求。用法
省略
# run as uv script
uv run --script ${baseDir}/hn-extract.py <hn-id|hn-url|path/to/item.json> [-o path/to/output.md]
# Examples
uv run --script ${baseDir}/hn-extract.py 46861313 -o /tmp/output.md
uv run --script ${baseDir}/hn-extract.py "https://news.ycombinator.com/item?id=46861313"
- -o
以打印到标准输出。用于 - -o
的目录会自动创建。are created automatically.
备注
- HTTP请求已启用重试机制。
- 评论内容按讨论深度进行缩进。
- 需要身份验证或禁止爬取的网站仍可能抓取失败。
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Paperless
下一篇:Table Image


微信扫一扫,打赏作者吧~