markitdown
✓将各种文件格式(PDF、Office 文档、图像、音频、网页内容、结构化数据)转换为针对 LLM 处理优化的 Markdown。将文档转换为 Markdown、从 PDF/Office 文件中提取文本、转录音频、对图像执行 OCR、提取 YouTube 转录本或处理批量文件时使用。支持 20 多种格式,包括 DOCX、XLSX、PPTX、PDF、HTML、EPUB、CSV、JSON、带 OCR 的图像以及带转录的音频。
SKILL.md
MarkItDown is a Python utility that converts various file formats into Markdown format, optimized for use with large language models and text analysis pipelines. It preserves document structure (headings, lists, tables, hyperlinks) while producing clean, token-efficient Markdown output.
Convert Office documents and PDFs to Markdown while preserving structure.
See references/documentconversion.md for detailed documentation on document-specific features.
将各种文件格式(PDF、Office 文档、图像、音频、网页内容、结构化数据)转换为针对 LLM 处理优化的 Markdown。将文档转换为 Markdown、从 PDF/Office 文件中提取文本、转录音频、对图像执行 OCR、提取 YouTube 转录本或处理批量文件时使用。支持 20 多种格式,包括 DOCX、XLSX、PPTX、PDF、HTML、EPUB、CSV、JSON、带 OCR 的图像以及带转录的音频。 来源:microck/ordinary-claude-skills。
可引用信息
为搜索与 AI 引用准备的稳定字段与命令。
- 安装命令
npx skills add https://github.com/microck/ordinary-claude-skills --skill markitdown- 分类
- #文档处理
- 认证
- ✓
- 收录时间
- 2026-02-01
- 更新时间
- 2026-02-18
快速解答
什么是 markitdown?
将各种文件格式(PDF、Office 文档、图像、音频、网页内容、结构化数据)转换为针对 LLM 处理优化的 Markdown。将文档转换为 Markdown、从 PDF/Office 文件中提取文本、转录音频、对图像执行 OCR、提取 YouTube 转录本或处理批量文件时使用。支持 20 多种格式,包括 DOCX、XLSX、PPTX、PDF、HTML、EPUB、CSV、JSON、带 OCR 的图像以及带转录的音频。 来源:microck/ordinary-claude-skills。
如何安装 markitdown?
打开你的终端或命令行工具(如 Terminal、iTerm、Windows Terminal 等) 复制并运行以下命令:npx skills add https://github.com/microck/ordinary-claude-skills --skill markitdown 安装完成后,技能将自动配置到你的 AI 编程环境中,可以在 Claude Code 或 Cursor 中使用
这个 Skill 的源码在哪?
https://github.com/microck/ordinary-claude-skills
详情
- 分类
- #文档处理
- 来源
- skills.sh
- 收录时间
- 2026-02-01