Markdown Converter技能使用说明

subsun 1个月前 (03-24) openclaw小龙虾 95 0

Markdown 转换器

使用以下命令将文件转换为 Markdownuvx markitdown— 无需安装。

基本用法

# 转换并输出到标准输出
uvx markitdown input.pdf

# 保存到文件
uvx markitdown input.pdf -o output.md
uvx markitdown input.docx > output.md

# 从标准输入读取
cat input.pdf | uvx markitdown

支持的格式

  • 文档: PDF, Word (.docx), PowerPoint (.pptx), Excel (.xlsx, .xls)
  • 网页/数据: HTML, CSV, JSON, XML
  • 媒体: 图像 (EXIF + OCR), 音频 (EXIF + 转录)
  • 其他: ZIP (遍历内容), YouTube 链接, EPub

选项

-o 输出文件      # 输出文件
-x 扩展名   # 提示文件扩展名 (用于标准输入)
-m MIME类型   # 提示 MIME 类型
-c 字符集     # 提示字符集 (例如,UTF-8)
-d             # 使用 Azure Document Intelligence
-e 端点    # Document Intelligence 端点
--use-plugins  # 启用第三方插件
--list-plugins # 显示已安装的插件

示例

# 转换 Word 文档
uvx markitdown report.docx -o report.md

# 转换 Excel 电子表格
uvx markitdown data.xlsx > data.md

# 转换 PowerPoint 演示文稿
uvx markitdown slides.pptx -o slides.md

# 转换时提供文件类型提示 (用于标准输入)
cat document | uvx markitdown -x .pdf > output.md

# 使用 Azure Document Intelligence 以获得更好的 PDF 提取效果
uvx markitdown scan.pdf -d -e "https://your-resource.cognitiveservices.azure.com/"

说明

  • 输出保留文档结构:标题、表格、列表、链接
  • 首次运行会缓存依赖项;后续运行速度更快
  • 对于提取效果不佳的复杂 PDF,请使用-d配合 Azure Document Intelligence

天猫隐藏优惠券

网淘吧

免责申明
部分文章来自各大搜索引擎,如有侵权,请与我联系删除。
打赏

相关推荐

网友评论

  • (*)

最新评论

用户管理

您好,欢迎到访网站!
    用户注册

上网淘巴领天猫淘宝优惠券,一年省好几千。

广告  ×

您是本站第817842名访客 今日有0篇新文章/评论