| # 安装 | |
| ## 环境检查 | |
| ```shell | |
| # 首先,确信你的机器安装了 Python 3.8 及以上版本 | |
| $ python --version | |
| Python 3.8.13 | |
| # 如果低于这个版本,可使用conda安装环境 | |
| $ conda create -p /your_path/env_name python=3.8 | |
| # 激活环境 | |
| $ source activate /your_path/env_name | |
| $ pip3 install --upgrade pip | |
| # 关闭环境 | |
| $ source deactivate /your_path/env_name | |
| # 删除环境 | |
| $ conda env remove -p /your_path/env_name | |
| ``` | |
| ## 项目依赖 | |
| ```shell | |
| # 拉取仓库 | |
| $ git clone https://github.com/imClumsyPanda/langchain-ChatGLM.git | |
| # 进入目录 | |
| $ cd langchain-ChatGLM | |
| # 项目中 pdf 加载由先前的 detectron2 替换为使用 paddleocr,如果之前有安装过 detectron2 需要先完成卸载避免引发 tools 冲突 | |
| $ pip uninstall detectron2 | |
| # 检查paddleocr依赖,linux环境下paddleocr依赖libX11,libXext | |
| $ yum install libX11 | |
| $ yum install libXext | |
| # 安装依赖 | |
| $ pip install -r requirements.txt | |
| # 验证paddleocr是否成功,首次运行会下载约18M模型到~/.paddleocr | |
| $ python loader/image_loader.py | |
| ``` | |
| 注:使用 `langchain.document_loaders.UnstructuredFileLoader` 进行非结构化文件接入时,可能需要依据文档进行其他依赖包的安装,请参考 [langchain 文档](https://python.langchain.com/en/latest/modules/indexes/document_loaders/examples/unstructured_file.html)。 | |