Pycuda 学习笔记(二)gpuarray学习

Pycuda 学习笔记(二)gpuarray学习本博客参照学习文档https://documen.tician.de/pycuda/array.html通过GPUArray矩阵类可以将numpy中的数组和矩阵直接转换成cuda可处理类型,该步骤即将CPU中的数据复制到GPU中。导入gpuArray和numpyimportpycuda.gpuarrayasgpuarrayimportnumpyasnp将numpyndar

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全家桶1年46,售后保障稳定

本博客参照学习文档https://documen.tician.de/pycuda/array.html
通过GPUArray 矩阵类可以将numpy中的数组和矩阵直接转换成cuda可处理类型,该步骤即将CPU中的数据复制到GPU中。
导入gpuArray和numpy

import pycuda.gpuarray as gpuarray
import numpy as np

Jetbrains全家桶1年46,售后保障稳定

将numpy ndarray转成gpuArray,如下:

gpuarray.to_gpu(ary)

这里需要主要的是,由于gpu最支持的数据类型是单精度浮点类型,因此ary最好定义为np.float32类型,如:

gpu_ary = gpuarray.to_gpu(np.random.rand(m,n).astype(np.float32))

类似的,可以采用一下方式进行gpuArray创建

gpu_ary = gpuarray.zeros((m,n),dtype=np.float32)    # 开辟gpu内存空间,创建0矩阵
gpu_ary = gpuarray.empty((m,n),dtype=np.float32)    # 开辟gpu内存空间,创建空矩阵
gpu_ary = gpuarray.zeros_like(ary)  # 开辟gpu内存空间,创建一个类似于ary的0矩阵,因此ary最好
                                    # 也是np.float32类型
gpu_ary = gpuarray.empty_like(ary)  # 开辟gpu内存空间,创建一个类似于ary的空矩阵,因此ary最好 
                                    # 也是np.float32类型
gpu_ary = gpuarray.arange(start,stop,step,dtype=None) #创建顺序序列,类型最好指定为np.float32
gpu_ary = gpuarray.take(a,ind)  # 返回gpuArray[a[ind[0]],..., a[ind[n]]]

条件操作

根据判断条件,返回满足条件的矩阵,采用如下方法:

d = gpuarray.if_positive(a,b,c) #a,b,c都是gpuArray类型

上述语句完成的功能:当a中对应的元素大于0时,返回b中对应的元素值,否则返回c中对应的元素值,例如:

a = gpuarray.to_gpu(np.random.rand(1,10).astype(np.float32))
b = a-0.5
c = gpuarray(b,b,a)
print a, '\n', b, '\n', c

得到的结果如下:

[[ 0.7115196 0.00776439 0.33624706 0.60278761 0.07853988 0.0300534 0.8420729 0.37330294 0.41932908 0.70458138]]
[[ 0.2115196 -0.4922356 -0.16375294 0.10278761 -0.42146012 -0.46994659 0.3420729 -0.12669706 -0.08067092 0.20458138]]
[[ 0.2115196 0.00776439 0.33624706 0.10278761 0.07853988 0.0300534 0.3420729 0.37330294 0.41932908 0.20458138]]

对应的如下两种方法可以返回矩阵元素对应的最大和最小值

gpu_ary=gpuarray.maximum(a,b)   # gpu_ary 对应a和b中的较大元素
gpu_ary=gpuarray.minimum(a,b)   # gpu_ary 对应a和b中的较小元素

例如:

a = gpuarray.to_gpu(np.random.rand(1,10).astype(np.float32))
b = gpuarray.to_gpu(np.random.rand(1,10).astype(np.float32))
c = gpuarray.maximum(a,b)
print a, '\n', b, '\n', c

返回的结果如下:

[[ 0.70338213 0.67325777 0.04136072 0.49857542 0.9508003 0.97705019 0.09260399 0.29496953 0.42824832 0.4623526 ]] 
[[ 0.05996453 0.44795206 0.37730327 0.55207098 0.99745291 0.28655595 0.32621163 0.81231195 0.96985126 0.2867623 ]] 
[[ 0.70338213 0.67325777 0.37730327 0.55207098 0.99745291 0.97705019 0.32621163 0.81231195 0.96985126 0.4623526 ]]

## 归约操作 ##
归约操作中涉及到矩阵求和,点积,最大最小值等操作
如下:

gpuarray.max(gpu_ary)
gpuarray.min(gpu_ary)
gpuarray.sum(gpu_ary)
gpuarray.dot(gpu_ary1,gpu_ary2)

pycuda通过cumath模块提供了一些数学操作函数,具体参见https://documen.tician.de/pycuda/array.html

pycuda通过curandom模块提供有gpu产生随机数操作函数。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/234180.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • hibernate和mybatis的区别及特点_hibernate配置文件中,不包含下面的

    hibernate和mybatis的区别及特点_hibernate配置文件中,不包含下面的很长一段时间,网上有很多关于Hibernate与Mybatis孰优孰劣的争论,两个阵营的人谁也不能说服谁,每个人的理由都很有道理。今天,我分享的主题是:在一个项目中同时使用Hibernate和Mybatis两个ORM框架。作为一个开发者,没有必要花费过多的时间去证明技术无用论,当你开始指责某个框架垃圾,另外一个框架最好时,隐性的暴露出你对某个框架没有深入的研究,无知的指责对于技术的提升没有…

  • Apache <mark>Karaf</mark>用户指导

    Apache <mark>Karaf</mark>用户指导

  • height100%和100vh的区别

    height100%和100vh的区别1vh就是当前屏幕可见高度的1%,也就是说height:100vh==height:100%;重点:但是当元素没有内容时候,设置height:100%,该元素不会被撑开,此时高度为0,但是设置height:100vh,该元素会被撑开屏幕高度一致。…

  • 如何反编译小程序的源码(微信小程序反编译工具)

    网易Mumu模拟器安装下载地址:http://mumu.163.com/360/ 下载完安装包后直接安装 打开模拟器安装微信、RE文件管理器设置Root权限打开RE文件管理器,提示请求超级用户访问权限,选择允许到此准备工作完成。打开微信,然后打开小程序,获取小程序编译包先打开微信 搜索微博小程序打开 打开RE文件管理 按照/data/data/com.tencent.mm/MicroMsg/80b34bca4945f…

  • 下载whl文件,离线方式安装numpy包_python离线安装pip

    下载whl文件,离线方式安装numpy包_python离线安装pip一:单独下载文件1、下载whl离线文件到本地,放到c盘根目录(任意位置均可,只是方便安装)https://pypi.org/https://www.lfd.uci.edu/~gohlke/pythonlibs/(推荐用这个地址下载whl文件,国内源,速度快。ctrl+f找到自己需要的文件)2、cmd到存放whl文件的目录3、pip安装whl离线文件pipinstall****.whl(****.whl是我们下载的whl的文件名称)二、批量下载…

  • FRP内网穿透教程「建议收藏」

    FRP内网穿透教程「建议收藏」FRP内网穿透介绍frp是一个专注于内网穿透的高性能的反向代理应用,支持TCP、UDP、HTTP、HTTPS等多种协议。可以将内网服务以安全、便捷的方式通过具有公网IP节点的中转暴露到公网。为什么使用frp通过在具有公网IP的节点上部署frp服务端,可以轻松地将内网服务穿透到公网,同时提供诸多专业的功能特性,这包括:客户端服务端通信支持TCP、KCP以及Websocket等多种协议。采用TCP连接流式复用,在单个连接间承载更多请求,节省连接建立时间。代理组间的负

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号