最近项目组的服务器重新安装了操作系统,导致很多相关的配置都得重新设置。写一篇博客系统的记录一下配置服务器的步骤,防止下次出现问题还得上网瞎搜。
1)Linux版本。最稳定的版本一般都推崇ubuntu18,但是太久的版本支持不了新的第三方软件,所以跟运维同事协商的安装20.04,也算是一个比较新的版本,比如我们自己构建的工作流使用了greedy配准,就需要更高版本的系统文件,16或者18很容易运行报错。
2)显卡驱动。显卡驱动代表了服务器可以支持的最高CUDA版本。即如下截图:
显卡驱动版本515.105.01 最高能支持11.7的CUDA。意味着本机可以安装11.7及以下的CUDA来支持深度学习的计算。
3)安装CUDA。为了跟之前的旧代码兼容,我选择安装CUDA11.3,对应的Torch版本是1.12.0。另外:如果想要尝试torch的最新版本2.0,就要手动卸载已经安装的CUDA11.3,重新安装CUDA11.7。CUDA11.7对应的Torch版本有很多,如下图所示,最高可以选择2.0:
4)配置conda环境。经过前三步的努力,基本的驱动和依赖已经安装完毕。先去下一个anaconda然后在Linux安装(这步比较简单,去问百度)。安装好anaconda以后。因为我们的服务器只能通过代理访问外网,所以要配置conda代理。我是直接使用的root权限登录服务器,所以在/root目录下创建了一个.condarc文件,把镜像源和代理的账号密码写进去就好。如下:
/root/.condarc
show_channel_urls: true
default_channels:
- http://mirrors.aliyun.com/anaconda/pkgs/main
- http://mirrors.aliyun.com/anaconda/pkgs/r
- http://mirrors.aliyun.com/anaconda/pkgs/msys2
custom_channels:
conda-forge: http://mirrors.aliyun.com/anaconda/cloud
msys2: http://mirrors.aliyun.com/anaconda/cloud
bioconda: http://mirrors.aliyun.com/anaconda/cloud
menpo: http://mirrors.aliyun.com/anaconda/cloud
pytorch: http://mirrors.aliyun.com/anaconda/cloud
simpleitk: http://mirrors.aliyun.com/anaconda/cloud
proxy_servers:
http: http://name:password@proxy.xxx.com:8080
https: http://name:password@proxy.xxx.com:8080
ssl_verify: false
report_errors: false
restore_free_channel: false
envs_dirs:
- /root/anaconda3/envs
配置好镜像和代理后,就可以使用代码 新建环境:
conda create --name [环境名] python=3.8
同样的可以使用代码 安装各种包:
conda install pandas
5)pip镜像源设置。有的时候一些包用conda装不了,所以要配置pip。与conda配置类似,在/root目录下创建一个.pip文件夹,然后在该文件夹下创建一个pip.conf文件写入配置信息。
/root/.pip/pip.conf
[global]
timeout = 6000
index-url = https://mirrors.aliyun.com/pypi/simple/
trusted-host = mirrors.aliyun.com
这样镜像源就设置好了,可以连到国内阿里下载第三方包,速度杠杠的。
6)设置pip的代理。pip与conda不同的是,conda可以把代理和镜像源一起设置,而这里pip我使用的export,即设置了linux系统的代理。首先在cmd输入export查看当前系统设置。如下图所示。
最下面两行就是linux系统的代理。类似conda的配置,使用命令:
export http_proxy="http://name:password@proxy.xxx.com:8080"
export https_proxy="http://name:password@proxy.xxx.com:8080"
注意:直接使用export命令,只能保证当前这个终端窗口内可以正常使用pip,关闭以后重新开一个终端后输入命令export查看,http_proxy以及https_proxy就变回之前的设置。一劳永逸的方法是,打开/root/.bashrc文件,用记事本打开将上面两行代码写入文件里,然后使用命令更新设置。这样之后每次启动新的终端,都会保证代理是正常的。
source /root/.bashrc
最后,可以使用pip命令来安装第三方库。比如代码:
pip intall SimpleITK
文章链接
发表评论