网淘吧来吧,欢迎您!

Paper Recommendation

2026-03-30 新闻来源:网淘吧 围观:15
电脑广告
手机广告

论文推荐技能

自动发现、深度阅读、生成简报 - 你的AI论文研究助手

一个用于AI研究论文发现、审阅和推荐的Clawdbot技能。

Paper Recommendation

概述

该技能为AI研究论文提供自动化的论文获取、子代理审阅和推荐生成功能。它遵循从arXiv论文发现到详细简报生成的完整工作流程。

功能

  • 自动论文发现:根据类别和关键词从arXiv获取最新论文
  • 并行审阅:使用子代理同时阅读和审阅多篇论文
  • 结构化输出:以一致的格式生成详细简报
  • 每日自动化:支持定时任务进行每日论文研究

脚本

1. fetch_papers.py

从arXiv获取最新论文,并可选择下载PDF文件。

使用方法:

# Fetch papers only
python3 scripts/fetch_papers.py --json

# Fetch and download PDFs
python3 scripts/fetch_papers.py --download --json

输出:

{
  "papers": [...],
  "total": 15,
  "fetched_at": "2026-01-29T17:00:00Z",
  "papers_dir": "/home/ubuntu/jarvis-research/papers",
  "pdfs_downloaded": ["/path/to/paper.pdf"]
}

2. review_papers.py

为并行论文评审生成子代理任务。

用法:

# With papers from fetch_papers.py
python3 scripts/fetch_papers.py --json | python3 scripts/review_papers.py --json

# Or directly
python3 scripts/review_papers.py --papers '<json-string>' --json

输出:

{
  "papers": [...],
  "subagent_tasks": [
    {
      "paper_id": "2601.19082",
      "task": "请完整阅读这篇论文并给出评分...",
      "label": "review-2601.19082"
    },
    ...
  ],
  "count": 5,
  "instructions": "使用 sessions_spawn 开子代理..."
}

3. read_pdf.py

读取PDF文件并提取文本进行分析。

用法:

# Extract text from PDF
python3 scripts/read_pdf.py ~/jarvis-research/papers/2601.19082.pdf

# Extract and output JSON
python3 scripts/read_pdf.py ~/jarvis-research/papers/2601.19082.pdf --json

# Extract specific sections (abstract, experiments, etc.)
python3 scripts/read_pdf.py ~/jarvis-research/papers/2601.19082.pdf --sections --json

输出:

{
  "success": true,
  "pdf_path": "/home/ubuntu/jarvis-research/papers/2601.19082.pdf",
  "text_length": 15000,
  "text": "Full PDF text...",
  "sections": {
    "abstract": "Abstract text...",
    "methodology": "Methodology text...",
    "experiments": "Experiments text...",
    "results": "Results text...",
    "conclusion": "Conclusion text..."
  },
  "extracted_at": "2026-01-29T17:00:00Z"
}

注意:使用pdftotext(Poppler) 进行PDF文本提取。


Jarvis的工作流程(代理操作)

当你要求Jarvis研究论文时,Jarvis应:

步骤 1:调用 fetch_papers.py

python3 scripts/fetch_papers.py --download --json

步骤 2:审阅论文

检查论文列表并决定审阅哪些。

步骤 3:生成子代理任务

python3 scripts/review_papers.py --papers '<papers-json>' --json

步骤 4:为论文审阅生成子代理

对于每篇论文,生成一个子代理来阅读和审阅:

# Example: Spawn one sub-agent per paper
clawdbot sessions spawn \
  --task "请完整阅读这篇论文并给出评分:..." \
  --label "review-2601.19082"

子代理任务要求:

  • 通过arXiv HTML页面阅读全文。
  • 提取项: 机构、完整摘要、贡献、结论、实验
  • 评分: 1-5
  • 推荐: 是/否
  • 以JSON格式回复

步骤5: 收集评审并决定

  • 收集所有子代理结果
  • 分析评分和推荐
  • Jarvis做出最终决定 (评分 >= 4 且 推荐 == 是)

步骤6: 生成详细简报

按照以下格式创建一份全面的简报标准简报格式(见下文)。

步骤7: 交付

通过Telegram或其他渠道发送简报。


📋 标准简报格式 (必需)

所有简报必须严格遵循此格式。没有例外。

强制结构

# 📚 论文简报 - TOPIC | YYYY年MM月DD日

---

## 📄 PAPER_TITLE

**标题:** Full paper title (英文原标题)  
**作者:** Author1, Author2, Author3... (所有作者,用逗号分隔)  
**机构:** Institution1; Institution2; Institution3... (真实机构名,不是作者名)  
**arXiv:** https://arxiv.org/abs/xxxx.xxxxx  
**PDF:** https://arxiv.org/pdf/xxxx.xxxxx.pdf  
**发布日期:** YYYY-MM-DD | **分类:** cs.XX (arXiv 分类)

### 摘要
Chinese translation of the abstract (full paragraph, ~200-400 characters). 必须是完整的中文翻译,不能是摘要片段。

### 核心贡献
1. Contribution 1 (一句话概括核心贡献)
2. Contribution 2
3. Contribution 3 (2-4个贡献点)

### 主要结论
1. Conclusion 1 (一句话概括主要结论)
2. Conclusion 2 (2-4个结论点)

### 实验结果
• Experiment setup 1 (实验设置)
• Experiment setup 2
• Key finding 1 (关键发现)
• Key finding 2 (3-5个要点)

### Jarvis 笔记
- **评分:** ⭐⭐⭐⭐ (X/5)
- **推荐度:** ⭐⭐⭐⭐⭐
- **适合研究方向:** Field1, Field2 (1-2个研究方向)
- **重要性:** One sentence summary (一句话说明为什么重要)

---

## 📊 统计
- 论文总数: N
- 平均评分: ⭐⭐⭐⭐ (X/5)
- 推荐指数: ⭐⭐⭐⭐⭐

---
*Generated by Jarvis | YYYY-MM-DD HH:MM | TOPIC*

⏰ 每日工作流程 (定时任务)

自动执行时间:每天 10:00 AM

添加定时任务 (Clawdbot)

# 添加每日完整论文调研任务
clawdbot cron add \
  --name "daily-paper-research" \
  --description "每日完整论文调研:获取→阅读→简报→发送" \
  --cron "0 10 * * *" \
  --system-event "请执行完整论文调研工作流:运行 python3 /home/ubuntu/skills/jarvis-research/scripts/daily_workflow.py。这会获取具身智能论文、下载 PDF、生成简报并发送到我的 Telegram。完成后告诉我结果。" \
  --deliver \
  --channel telegram \
  --to 8077045709

检查状态

# 列出所有 cron 任务
clawdbot cron list

# 查看任务详情
clawdbot cron status

功能描述

每天上午 10:00 自动执行完整工作流:

  1. 获取论文- 从 arXiv 获取具身智能相关论文(前 6 篇)
  2. 下载 PDF- 下载所有论文的 PDF 文件
  3. 生成简报- 按标准格式生成论文简报
  4. 发送 Telegram- 发送摘要到用户 Telegram

工作流脚本

# 手动执行完整工作流
python3 /home/ubuntu/skills/jarvis-research/scripts/daily_workflow.py

输出文件

  • 简报: ~/jarvis-research/papers/briefing-embodied-{YYYY-MM-DD}.md
  • PDF 文件: ~/jarvis-research/papers/{paper-id}.pdf
  • Telegram:摘要自动发送到用户

备注

  • Cron 触发 Agent 执行daily_workflow.py
  • 脚本自动完成:获取 → 下载 → 生成 → 发送
  • Agent 收到结果后可以继续深入分析(可选)

主题

默认主题:具身智能 (Embodied Intelligence)

关键词配置在scripts/fetch_papers.py

KEYWORDS = [
    'embodied', 'embodiment', 'embodied intelligence', 'embodied AI',
    'robotics', 'robot', 'manipulation', 'grasping',
    'vision-language-action', 'VLA', 'VLN',
    'reinforcement learning', 'sim2real', 'domain randomization',
    'sensorimotor', 'perception', 'motor control', 'action',
    'physical intelligence', 'embodied navigation'
]

字段定义与规则

字段描述必需规则
标题论文完整标题英文原标题,不要翻译
作者所有作者用逗号分隔,所有作者
机构真实机构必须是真正的机构名,从 arXiv HTML 页面提取,绝对不能是作者名
arXivarXiv 摘要 URLhttps://arxiv.org/abs/<id>
PDFPDF 直接链接https://arxiv.org/pdf/<id>.pdf
发布日期发布日期YYYY-MM-DD格式
分类arXiv 分类例如,cs.ROcs.AI
摘要中文翻译完整翻译,不是片段,约 200-400 字符
核心贡献核心贡献2-4 个要点,每点一句话
主要结论主要结论2-4 个要点,每点一句话
实验结果实验结果必须包含,3-5 个要点,包含实验设置和关键发现
Jarvis 笔记Jarvis 评估评分、推荐度、研究方向、重要性

关键规则 ⚠️

  1. 机构必须为真实机构- 从 arXiv HTML 页面获取 ( /abs/<id>),而非作者姓名摘要必须为中文
  2. - 完整翻译自英文摘要,而非片段必须包含实验结果
  3. - 必须包含实验设置和关键发现每篇论文单独成节
  4. - 每篇论文都有其独立的部分- Each paper gets its own## 📄章节
  5. 所有字段均为必填项- 切勿跳过任何字段
  6. 无占位符- 将所有示例文本替换为实际内容

如何获取信息

针对机构和作者:

# Fetch arXiv HTML page (recommended)
curl https://arxiv.org/abs/<paper-id>

# Or use web_fetch tool
web_fetch --url https://arxiv.org/abs/<paper-id> --extractMode text

获取完整摘要和内容:

# Fetch HTML full text
curl https://arxiv.org/html/<paper-id>

获取PDF(如果可用):

# Download and extract text
pdftotext <paper-id>.pdf -

示例代理提示

当您希望Jarvis研究论文时:

请执行论文调研任务:
1. 调用 fetch_papers.py 获取今天的多智能体相关论文(带 PDF 下载)
2. 查看论文列表,决定哪些值得深入阅读
3. 调用 review_papers.py 生成子代理任务
4. 使用 sessions_spawn 为每篇论文开一个子代理,要求:
   - 完整阅读论文(arXiv HTML 页面)
   - 提取机构、中文摘要、核心贡献、主要结论、实验结果
   - 给出 1-5 评分和推荐
   - 回复 JSON 格式
5. 收集所有子代理结果,分析评分,选出 3-5 篇推荐论文
6. 为每篇生成详细简报(必须包含:标题、作者、机构、中文摘要、核心贡献、主要结论、实验结果、Jarvis笔记)
7. 发送到我的 Telegram

配置

论文目录: ~/jarvis-research/papers/

监控类别:

  • cs.AI(人工智能)
  • cs.LG(机器学习)
  • cs.MA(多智能体系统)

关键词:多智能体、智能体、协作、协调、任务规划、大语言模型、推理、自主、群体、集体、强化、分层、分布式、涌现

子代理模型:

  • 默认:继承自主代理
  • 可通过以下方式覆盖:agents.defaults.subagents.modelsessions_spawn.model

注意事项

  • 技能即工具- Jarvis 按需使用
  • Jarvis 负责所有决策(审阅哪些论文,推荐哪些)
  • 子代理执行并行论文阅读(比顺序处理更快)
  • 技能输出结构化数据- Jarvis 解析并据此行动
  • 简报是 Jarvis 的创造性工作- 非自动化生成
  • 始终遵循标准简报格式- 切勿偏离

文件

~/skills/paper-recommendation/
├── SKILL.md              # This file (FULL DOCUMENTATION)
└── scripts/
    ├── fetch_papers.py   # Paper fetching + PDF download
    ├── review_papers.py  # Sub-agent task generation
    └── read_pdf.py       # PDF text extraction

PDF阅读

  • 使用pdftotext(Poppler) 进行文本提取
  • 可提取全文或特定部分(摘要、实验等)
  • 适用于子代理读取已下载的PDF文件

论文推荐技能 - AI研究助手

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Nutrient Openclaw 下一篇:Content Id Guide

相关文章

您是本站第320373名访客 今日有96篇新文章/评论