AI智能
改变未来

Python数据分析 | Numpy与高维数组操作

作者:韩信子@ShowMeAI教程地址:http://www.showmeai.tech/tutorials/33本文地址:http://www.showmeai.tech/article-detail/144声明:版权所有,转载请联系平台与作者并注明出处

n维数组是NumPy的核心概念,大部分数据的操作都是基于n维数组完成的。本系列内容覆盖到1维数组操作、2维数组操作、3维数组操作方法,本篇讲解Numpy与3维、更高维数组的操作。

有时候我们会使用到3维或者更高维的NumPy数组(比如计算机视觉的应用中),通过重塑1维向量或转换嵌套Python列表来创建3维数组时,索引分别对应(z,y,x)。索引z是平面编号,(y,x)坐标在该平面上移动,如下图所示:

通过上述索引顺序,可以方便的保留灰度图像,a[i]表示第i个图像。
但这样的索引顺序并不具有广泛性,例如在处理RGB图像时,通常使用(y,x,z)顺序:首先是两个像素坐标,然后才是颜色坐标(Matplotlib中的RGB,OpenCV中的BGR):

这样可以方便地定位特定像素,如

a[i,j]

给出像素(i,j)的RGB元组。
因此,几何形状的创建实际取决于你对域的约定:

显然,hstack,vstack或dstack之类的NumPy函数并不一定满足这些约定,其默认的索引顺序是(y,x,z),RGB图像顺序如下:

如果数据不是这样的布局,使用concatenate命令可以方便的堆叠图像,并通过axis参数提供索引号:

如果不考虑轴数,可以将数组转换hstack和相应形式:

这种转换非常方便,该过程只是混合索引的顺序重排,并没有实际的复制操作。
通过混合索引顺序可实现数组转置,掌握该方法将加深你对3维数据的了解。根据确定的轴顺序,转置数组平面的命令有所不同:对于通用数组,交换索引1和2,对于RGB图像交换0和1:

注意,

transpose(a.T)

的默认轴参数会颠倒索引顺序,这不同于上述述两种索引顺序。
广播机制同样适用多维数组,更多详细信息可参阅笔记“ NumPy中的广播”。
最后介绍

einsum(Einstein summation)

函数,这将使你在处理多维数组时避免很多Python循环,代码更为简洁:

该函数对重复索引的数组求和。在一般情况下,使用

np.tensordot(a,b,axis=1)

就可以,但在更复杂的情况下,einsum速度更快,读写更容易。

资料与代码下载

本教程系列的代码可以在ShowMeAI对应的github中下载,可本地python环境运行,能访问Google的宝宝也可以直接借助google colab一键运行与交互操作学习哦!

本系列教程涉及的速查表可以在以下地址下载获取:

  • NumPy速查表
  • Pandas速查表
  • Matplotlib速查表
  • Seaborn速查表

拓展参考资料

  • NumPy教程
  • Python NumPy教程

ShowMeAI相关文章推荐

  • 数据分析介绍
  • 数据分析思维
  • 数据分析的数学基础
  • 业务认知与数据初探
  • 数据清洗与预处理
  • 业务分析与数据挖掘
  • 数据分析工具地图
  • 统计与数据科学计算工具库Numpy介绍
  • Numpy与1维数组操作
  • Numpy与2维数组操作
  • Numpy与高维数组操作
  • 数据分析工具库Pandas介绍
  • 图解Pandas核心操作函数大全
  • 图解Pandas数据变换高级函数
  • Pandas数据分组与操作
  • 数据可视化原则与方法
  • 基于Pandas的数据可视化
  • seaborn工具与数据可视化

ShowMeAI系列教程推荐

  • 图解Python编程:从入门到精通系列教程
  • 图解数据分析:从入门到精通系列教程
  • 图解AI数学基础:从入门到精通系列教程
  • 图解大数据技术:从入门到精通系列教程

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » Python数据分析 | Numpy与高维数组操作