Windows系统安装PyTorch(Python)详细步骤分享
文章目录
前言
pytorch和tensorflow是当前深度学习最重要的两种框架,目前来看,不论是哪一种深度学习模型,比如YOLO,SSD,RCNN,Pointnet都采用了二者中的一种来实现网络模型,开源代码也一般也会有Tensorflow和Pytorch两种版本。这篇文章主要记录我在安装pytorch深度学习框架的过程,作为日志,希望也能帮到正在阅读文章的你。
需要注意的是,由于深度学习的实验过程总是伴随着很多版本的模型,为了避免在实验过程中,各个模型需要的依赖包版本不一样,大部分情况下,安装pytorch都是在anaconda下创建一个虚拟环境来进行的。每一个虚拟环境下都有一个独立的python、一个独立的pip以及只能在这个虚拟环境下使用的python包。
详细过程
在撰写这篇博客时(2024年6月7日),pytorch相比tensorflow的部署要简单很多。以下windows系统下部署pytorch框架的详细过程。(GPU版本)
查看系统cuda支持的最高版本
如果你有NVIDIA显卡并且具有NVIDIA控制面板,可以打开NVIDIA控制面板,点击左下角“系统信息”——组件,就可以看到NVCUDA最高的支持版本。在这里我的显卡最高支持CUDA12.2。
,并进入,往下翻页面。由于我电脑最高支持CUDA12.2版本,在此pytorch还没推出12.2的安装命令,因此我选择稳定版本(stable)-Windows-Pip-Python-CUDA 11.8。如下图所示。
将代码复制到虚拟环境下即可。
在这里需要有几点说明:
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 -i https://pypi.mirrors.ustc.edu.cn/simple/
conda命令同样可以用于安装,因为我平时使用pip安装比较多,所以选择了pip。读者可自行尝试conda安装命令。
尽管pytorch官网将windows版本的安装命令和linux的安装命令分开来,但是我在ubuntu22.04系统下用windows的安装命令同样安装并成功了。
检查安装是否成功
初步检查
使用如下命令,检查pip安装的所有包里面有没有torch、torchvision、torchaudio
pip list
比如我的电脑输入该命令后成功找到了,如下图所示。可以看到,使用pytorch官方获取了你的cuda 版本,安装的pytorch自动就满足版本对应关系。
假如此处没有找到这三个包,则需要重新输入安装一次。或者实在不行就尝试conda安装。
检查是否成功运行
安装基本来说是没有问题的,但是需要仔细检查CUDA是否能在代码中成功运行。
在命令行下输入:
python
再输入:
import torch
再输入:
print(torch.cuda.is_available())
正常结果会输出一个Ture,则表示GPU可以在训练时使用,否则就只能使用CPU训练,到此为止pytorch即安装完成。正常结果如下图所示。
报错记录
import torch报错no module named torch
说明pytorch根本就没安装上,这种可能是网络中断导致的。去pytorch官网重新复制命令,并重新运行。最后还是用pip list检查是不是安装成功了。当然,你必须要确认你在你想要运行的那个虚拟环境下。
print(torch.cuda.is_available())输出为False
说明pytorch安装成功了。这种错误常见原因有:
使用的镜像源没有提供你想要的版本的pytorch,自动给你随便找了个CPU的版本。比如我安装时使用了清华镜像源,对应CUDA12.1版本的pytorch还没更新,就自动给我找了个CPU的pytorch安装了。需要换一个源。
电脑没有独立显卡是没有办法成功运行的。这种常出现在云服务器上,你没有占到显卡,但是你以为你占到了。
显卡最高只能支持CUDA11.8,但是你安装了一个基于CUDA12.1的pytorch,也会出现这种错误。需要pip使用pip工具卸载当前的pytorch重新安装。
其它说明
你知道的,运行别人的框架、跑别人的代码总是会出各种各样的错,如果愿意交流,或者发现了博客的不合理之处,可以发邮件到xlxlqqq@163.com,让我们一起探讨吧。
作者:xlxlqqq