Python NumPy数组创建方法详解

Numpy是Python中科学计算的基础包,其核心对象就是ndarray(n维数组)。利用数组可以快速执行逻辑,形状操作,统计和傅里叶变换等运算,其效率比Python原生的数组效率更高。因此使用Numpy的第一件事就是创建Numpy数组,本文总结了5种常用的创建NumPy数组方法。

文章目录

  • 一、使用NumPy内部功能函数
  • 1.1 使用arange函数
  • 1.2 创建多维数组
  • 1.3 使用zeros/zeros_like和ones/ones_like函数
  • 1.4 使用full/full_like函数
  • 1.5 使用empty/empty_like函数
  • 1.6 使用eye函数
  • 1.7 使用linspace函数
  • 1.8 使用copy函数
  • 二、从python序列对象转换
  • 三、使用库函数
  • 四、从文件读取数据
  • 五、从字符串或缓冲区创建
  • 一、使用NumPy内部功能函数

    1.1 使用arange函数

    Numpy的arange函数可以快速创建一个一维数组,功能和python的range函数很像,但它返回的是NumPy数组而不是列表。数组中元素的下标从0开始(和Python的列表相同):

    import numpy as np
    a = np.arrange(10)
    

    通过数组的shape属性可以查看数组的维度,返回的元组中只有1个数字,说明a是一个一维数组:

    a.shape
    

    1.2 创建多维数组

    在使用arange创建一维数组时,通过reshape函数可以将其转化为指定的维度,下面创建一个3行3列二维数组:

    a1 = np.arange(9).reshape(3,3)
    

    通过a1的shape属性可以看到返回了2个数字,说明这是二维数组(这个就是reshape的参数):

    a1.shape
    

    访问二维数组中的元素,需要2个索引值:

    a1[1][2]    # 访问第2行,第3列元素(索引从0开始)
    

    同理,三维数组就需要给reshape函数提供3个参数(访问元素也需要3个索引值),N维数组依次类推:

    a2 = np.arange(27).reshape(3,3,3)
    


    注意:arange函数返回的元素个数需要和reshape参数的乘积相同,示例中是27=3 X 3 X 3,否则无法生成N维数组。

    1.3 使用zeros/zeros_like和ones/ones_like函数

    通常数组中的元素最初值可能是未知的,但形状通常是已知的。NumPy提供了一系列函数来创建指定形状的数组,并用初始值填充,这样可以避免后期数组增长(NumPy数组变更形状代价很大,需要删除重建,这点和Python不同)。

    zeros和ones函数可以创建数组并分别用0和1预填充。zeros和ones传入的参数为数组的各个维度值组成的元组。下面示例使用zeros和ones分别创建一个3行3列的二维数组,注意各维度值是以元组的形式传入的,因此是双层括号:

    a3 = np.zeros((3,3))    # 以元组的形式传入
    a4 = np.ones((3,3))
    

    zeros_like和ones_like函数会复制指定数组对象的形状,同时采用0和1填充,下面示例复制a4的形状,但是填充从1变成了0:

    a4_like = np.zeros_like(a4)
    

    1.4 使用full/full_like函数

    full函数的效果和zeros和ones类似,但可以自己指定填充元素的值(zeros和ones只会使用0和1填充),下面创建一个3*3的二维数组,并使用9填充,第一个参数是元组(3,4),代表3行4列,第二个参数9代表填充值:

    a5 = np.full((3,4), 9)
    

    同样full_like函数可以复制指定数组的形状,并指定用7填充:

    a5_like = np.full_like(a5, 7)    # 复制a5的形状,并用7填充
    

    1.5 使用empty/empty_like函数

    empty函数效果和zeros和ones的也类似,但它不会初始化元素的值(值是随机的,取决于内存状态),下面创建一个2行2列的二维数组:

    a6 = np.empty((2,2))
    

    和zeros_like函数一样,empty_like函数也会复制的数组的形状,但填充值是随机的:

    a6_like = np.empty_like(a6)
    

    1.6 使用eye函数

    eye函数会创建一个的二维数组,其对角线元素值为1,其余元素值为0。

    仅传入1个参数N时,默认返回数组就是N行N列,对角线上的值全部为1:

    a7 = np.eye(3)
    

    你也可以传入第二个参数,显式指定数组的列数,例如3行4列:

    a8 = np.eye(3,4)
    

    1.7 使用linspace函数

    linspace函数会在两个数字之间,选择指定个数的数字,数字间的间隔相同(通过个数计算),并最终返回一个数组对象。

    在从0到10之间选择6个数字,相邻的元素间隔相同:

    a9 = np.linspace(0, 10, 6)    # 0, 10, 6 分别对应开始,结束,元素个数  
    

    1.8 使用copy函数

    对于任何数组对象,你都可以使用copy函数来返回一个相同的数组对象:

    a10 = np.copy(a9)
    

    二、从python序列对象转换

    array函数可以将序列类型的python对象转换成NumPy数组。

    例如,将列表对象转换为numpy数组:

    a11 = np.array([1,2,3,4])
    

    你也可以通过变量名来完成转换,示例将一个元组转换为数组:

    tuple = (5,6,7,8)
    a12 = np.array(tuple)
    

    对于多维数组,你需要自己完成嵌套的编写,示例将生成一个二维数组:

    list1 = [(1,2,3), (4,5,6), (7,8,9)]    # 元组组成的列表
    a13 = np.array(list1)
    

    三、使用库函数

    有一些库经常被用来初始化生成函数,例如random库,下面为random库几个常用的函数。

    np.random.randint可以在指定区间生成随机整数,下面示例会在半开区间[0,10)随机选择整数,配合size参数可以生成指定形状的数组,size=5表示挑选5个整数,生成一维数组:

    ar1 = np.random.randint(10, size=5)    # 在区间[0,10) 即0-9,随机挑选整数,生成的一维数组
    

    使用两个整数参数可以指定整数区间的上下限(上限不包含),这里并使用size指定生成一个3*3的数组:

    ar2 = np.random.randint(90, 100, size=(3,3))  # 在90-99(不含上限100)挑选整数,生成3*3的数组
    

    np.random.rand() 产生[0,1)的随机数,参数为数组的形状,例如,生成2行3列的数组:

    ar3 = np.random.rand(2,3)
    

    np.random.randn() 产生[0,1)的随机数,但是数值符合正态分布:

    ar4 = np.random.randn(3,4)
    

    四、从文件读取数据

    NumPy提供的fromfile函数可以直接从文件中读取数据,并转换为数组对象,文件可以是二进制或者文本格式,fromfile还有一个对应的函数tofile,可以将数组对象写入文件。

    我们先用tofile将一个数组写入文件array.bin,写入过程中你可以使用sep参数来指定分隔符:

    a = np.arange(9)
    a.tofile('array.bin')
    

    再使用fromfile函数,将这个数组从文件读回来,注意读取时默认的数据类型是float,会导致错误,必须显式使用dtype=int来指定以整型的方式读取:

    b = np.fromfile('array.bin', dtype=int)
    

    五、从字符串或缓冲区创建

    使用fromstring函数可以将python字符串直接转换为numpy数组,下面示例将2个字符串转换为数组,参数sep指定了元素的分隔符:

    a_str1 = np.fromstring('1 2 3', sep=' ')    # 元素以空格分隔    
    a_str2 = np.fromstring('1,2,3', sep=',')    # 元素以逗号分隔 
    

    使用frombuffer函数可以将缓冲区的内容转换为numpy数组,先创建一个字符串缓冲区,然后转换为数组。dtype='S1’表示缓冲区每个字符都转换为1个字节的字符串:

    buf_str = b'Hello, world!'
    a_buf = np.frombuffer(buf_str, dtype='S1')
    

    以上即是NumPy中常用的数组创建方法总结,熟悉各类创建方法是使用NumPy的基础。

    作者:V1ncent Chen

    物联沃分享整理
    物联沃-IOTWORD物联网 » Python NumPy数组创建方法详解

    发表回复