python opencv gpu加速 cuda编译问题和设置
问题1.找不到BUILD_opencv_python3
当用vs2022 编译opencv4.10时,cmake里面找不到BUILD_opencv_python3这个选项,后来换成vs2019后就出现了,这个编译的麻烦就在于各个库和工具之间的版本匹配。
问题2:nvcuvid功能选择了的话,需要下载Video_Codec_SDK,并把文件复制到CUDA对应的目录
Video_Codec_SDK下载地址:
https://developer.nvidia.com/video-codec-sdk-archive
以下是一些设置参考
文件路径信息
python相关目录的设置,可以是anaconda中的虚拟环境,位置对应即可
CUDA_ARCH_BIN算力设置中把小于自己显卡算力的数字删除
显卡算力官方查询地址:
https://developer.nvidia.com/cuda-gpus
CUDA相关选择
contrib功能设置OPENCV_EXTRA_MODULES_PATH设置对应路径
OPENCV_ENABLE_NONFREE选择ON
BUILD_opencv_world:如果选择会只生成一个dll文件,比较好引用 ,使用功能上不影响,但有时选择后可能会有莫名错误
CMAKE_CONFIGURATION_TYPES后面如果用命令行编译可设置成Release,vs2019中编译是可以切换Debug或release的
可以不用选择的一些功能参考:test,java,js
如果Configure和Generate都没有问题,就可以开始编译
编译方法1:命令行编译
cmake --build "G:/PthonCuda/build2" --target INSTALL --config Release
估计得几个小时,看电脑性能,编译如果完成了并没有错误,就可以在命令窗口测试成功与否
或者在pycharm中测试
以下目录会生成相应文件
install目录如果移动,改一下第四行代码即可
import os
BINARIES_PATHS = [
os.path.join('G:/PthonCuda/build2/install', 'x64/vc16/bin'),
os.path.join(os.getenv('CUDA_PATH', 'C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.4'), 'bin')
] + BINARIES_PATHS
编译方法2:vs2019编译
模式选择Releasex64(根据需要)生成,完成之后没有报错,再右键INSTALL点生成
生成INSTALL后,D:\anaconda32024\envs\t39\Lib\site-packages\cv2目录下面会有文件产生
这虽然是为了python opencv编译,其实c++中也可以使用的,因为网上很少有python版本的opencv gpu加速代码,以下用c++代码测试下
如果有python版本的代码可留言分享下
使用方面遇到的错误
读取视频时出错 You should explicitly call download method for cuda::GpuMat object in function 'cv::_InputArray::getMat_'
尝试以下方法读取视频
import cv2
# 检查是否成功安装了CUDA支持的OpenCV
if not cv2.cuda.getCudaEnabledDeviceCount():
raise Exception("CUDA-enabled GPU not found or CUDA support is not available in your OpenCV build.")
# 打开视频文件
video_path = "your video.mp4" # 替换为你的视频文件路径
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():
print("Error: Could not open video.")
exit()
# 获取视频的宽度、高度和总帧数
frame_width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
frame_height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
total_frames = int(cap.get(cv2.CAP_PROP_FRAME_COUNT))
while True:
ret, frame = cap.read()
if not ret:
break
# 上传帧到GPU并直接显示
gpu_frame = cv2.cuda_GpuMat()
gpu_frame.upload(frame)
# 将帧下载回CPU内存并显示
result = gpu_frame.download()
cv2.imshow("GPU Video", result)
# 更新进度条(可以在实际应用中实现)
current_frame = int(cap.get(cv2.CAP_PROP_POS_FRAMES))
print(f"Progress: {current_frame}/{total_frames} frames")
if cv2.waitKey(1) & 0xFF == ord('q'):
break
# 释放资源
cap.release()
cv2.destroyAllWindows()
本机信息
cuda和cudnn的版本组合并非唯一,值得研究