markitdown とは?
さまざまなファイル形式 (PDF、Office ドキュメント、画像、オーディオ、Web コンテンツ、構造化データ) を、LLM 処理用に最適化された Markdown に変換します。ドキュメントをマークダウンに変換する場合、PDF/Office ファイルからテキストを抽出する場合、音声を文字に起こす場合、画像に対して OCR を実行する場合、YouTube トランスクリプトを抽出する場合、またはファイルのバッチを処理する場合に使用します。 DOCX、XLSX、PPTX、PDF、HTML、EPUB、CSV、JSON、OCR 付きの画像、文字起こし付きの音声を含む 20 以上の形式をサポートします。 ソース: smallnest/langgraphgo。