| ================================== | |
| 安装 | |
| ================================== | |
| 本节中,我们将演示如何安装 PDF-Extract-Kit。 | |
| 最佳实践 | |
| ======== | |
| 我们推荐用户参照我们的最佳实践安装 PDF-Extract-Kit。 | |
| 推荐使用 Python-3.10 的 conda 虚拟环境安装 PDF-Extract-Kit。 | |
| **步骤 1.** 使用 conda 先构建一个 Python-3.10 的虚拟环境 | |
| .. code-block:: console | |
| $ conda create -n pdf-extract-kit-1.0 python=3.10 -y | |
| $ conda activate pdf-extract-kit-1.0 | |
| **步骤 2.** 安装 PDF-Extract-Kit 的依赖项 | |
| .. code-block:: console | |
| $ # 对于GPU设备 | |
| $ pip install -r requirements.txt | |
| $ # 对于CPU设备 | |
| $ pip install -r requirements-cpu.txt | |
| .. note:: | |
| 考虑到用户环境配置的便捷性,我们在requirements.txt只包含当前最好模型需要的环境,目前包含 | |
| - 布局检测:YOLO系列(YOLOv10, DocLayout-YOLO) | |
| - 公式检测:YOLO系列 (YOLOv8) | |
| - 公式识别:UniMERNet | |
| - OCR: PaddleOCR | |
| 对于其他模型请,如LayoutLMv3需要单独安装环境,具体见\ :ref:`布局检测算法 <algorithm_layout_detection>` |