pdf-extract-api是一款专注于将图像或PDF文档高效转换为Markdown文本和JSON结构文档的AI工具。其核心优势在于本地化部署,无需依赖云端服务,通过PyTorch的Marker模型和Ollama工具实现高精度OCR解析,支持表格、公式等复杂内容提取。适用于数据挖掘、文档自动化等场景 ...