Colabfold_batch(Alphafold) 的本地化记录 今日视点
文章网址:https://www.nature.com/articles/s41592-022-01488-1
(资料图片仅供参考)
Coblab可用于windows ubuntu 子系统;
安装教程网址:https://github.com/YoshitakaMo/localcolabfold
1、确保自己的子系统安装了wget,curl和git;
2、安装cuda>=11.1; 利用ncvv --version 检查CUDA是否安装;可按照提示利用apt-get安装;
3、利用apt 安装gcc;利用gcc --version 检查是否已安装;没有可按提示利用apt-get安装;
4、可以下载教程中的install_colabbatch_linux.sh;下载后运行安装;也可打开该文件一步步自己安装;由于网络问题,采用一步步安装的方法:
(1)conda创建colabfold环境; conda create -n colabfold python==3.9
(2)conda activate colabfold
(3)conda 安装python cudnn cudatoolkit openmm pdbfixer
(4)conda 安装kalign2 hhsuite mmseqs2
(5)pip 安装 colabfold ;利用git安装
(6)pip 本地利用轮子安装适用于gpu的jaxlib
(7)pip 安装jax 和 biopython
(8)创建一个文件夹下载参数:
cd ${COLABFOLDDIR}
python -m colabfold.download
cd ${CURRENTPATH}
(9)使matplotlib不依赖于gui运行;进入colabfold的安装位置,运行:
sed -i -e "s#from matplotlib import pyplot as plt#import matplotlib\nmatplotlib.use('Agg')\nimport matplotlib.pyplot as plt#g" plot.py
(10)关联参数
sed -i -e "s#appdirs.user_cache_dir(__package__ or \"colabfold\")#\"{放置参数的文件夹目录}"#g" download.py
# remove cache directory
rm -rf __pycache__
(10)激活环境后,运行colabfold_batch --help 检测是否安装好
5、在wsl中运行colabfold_batch需加环境变量:
export TF_FORCE_UNIFIED_MEMORY="1"
export XLA_PYTHON_CLIENT_MEM_FRACTION="4.0"
export XLA_PYTHON_CLIENT_ALLOCATOR="platform"
export TF_FORCE_GPU_ALLOW_GROWTH="true"
环境变量的具体详解见:https://parafold.sjtu.edu.cn/docs/quick-start/#4.2
可通过具体设置来XLA_PYTHON_CLIENT_MEM_FRACTION的大小解决内存问题
PS :1)笔记本的3060ti 可以预测大概800aa左右的蛋白结构,大约只需要20分钟;比用goole colab快;
2)好像并不支持本地的CPU与运行;可以通过卸载jax,重新安装jax[cpu]来运行,但是没有成功运行,报错推荐GPU运行();具体的可以查阅jax官网:https://jax.readthedocs.io/en/latest/notebooks/quickstart.html
3)很大的蛋白好像可以拆成具有重叠区域的几段,然后再在pymol中拼接
关键词: