obsidian

Python切片与Numpy切片
Python切片Python可切片对象的索引方式包括:正索引和负索引两部分,如下图所示,以list对象a = [0...
扫描右侧二维码阅读全文
19
2019/12

Python切片与Numpy切片

Python切片

Python可切片对象的索引方式

包括:正索引和负索引两部分,如下图所示,以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:

python索引方式

python索引方式

Python切片操作的一般方式

一个完整的切片表达式包含两个:,用于分隔三个参数(start_index、end_index、step),当只有一个:时,当你不写时,默认第三个参数step=1

切片操作基本表达式:object[start_index:end_index:step]

step:正负数均可,其绝对值大小决定了切取数据时的“步长”,而正负号决定了“切取方向”,正表示“从左往右”取值,负表示“从右往左”取值。当step省略时,默认为1,即从左往右以步长1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情说三遍!

start_index:表示起始索引(包含该索引对应值),该参数省略时,表示从对象“端点”开始取值,至于是从“起点”还是从“终点”开始,则由step参数的正负决定,step为正从“起点”开始,为负从“终点”开始。

end_index:表示终止索引(不包含该索引对应值);该参数省略时,表示一直取到数据“端点”,至于是到“起点”还是到“终点”,同样由step参数的正负决定,step为正时直到“终点”,为负时直到“起点”。

Python切片操作详细例子

以下示例均以list对象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]为例:

>>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

切取单个值

>>>a[0]
0
>>>a[-4]
6

切取完整对象

>>>a[:] #从左往右
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[::] #从左往右
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>a[::-1] #从右往左
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

start_index和end_index全为正(+)索引的情况

>>>a[1:6]
[1, 2, 3, 4, 5]

默认step=1,从左往右取值,start_index=1到end_index=6同样表示从左往右取值。

>>>a[1:6:-1]
[]

输出为空列表,说明没取到数据。
step=-1,决定了从右往左取值,而start_index=1到end_index=6决定了从左往右取值,两者矛盾,所以为空。

>>>a[6:2]
[]

同样输出为空列表。
step=1,决定了从左往右取值,而start_index=6到end_index=2决定了从右往左取值,两者矛盾,所以为空。

>>>a[:6]
[0, 1, 2, 3, 4, 5]

step=1,表示从左往右取值,而start_index省略时,表示从端点开始,因此这里的端点是“起点”,即从“起点”值0开始一直取到end_index=6(该点不包括)。

>>>a[:6:-1]
[9, 8, 7]

step=-1,从右往左取值,而start_index省略时,表示从端点开始,因此这里的端点是“终点”,即从“终点”值9开始一直取到end_index=6(该点不包括)。

>>>a[6:]
[6, 7, 8, 9]

step=1,从左往右取值,从start_index=6开始,一直取到“终点”值9。

>>>a[6::-1]
[6, 5, 4, 3, 2, 1, 0]

step=-1,从右往左取值,从start_index=6开始,一直取到“起点”0。

start_index和end_index全为负(-)索引的情况

>>>a[-1:-6]
[]

step=1,从左往右取值,而start_index=-1到end_index=-6决定了从右往左取值,两者矛盾,所以为空。
索引-1在-6的右边(如上图)

>>>a[-1:-6:-1]
[9, 8, 7, 6, 5]

step=-1,从右往左取值,start_index=-1到end_index=-6同样是从右往左取值。
索引-1在6的右边(如上图)

>>>a[-6:-1]
[4, 5, 6, 7, 8]

step=1,从左往右取值,而start_index=-6到end_index=-1同样是从左往右取值。
索引-6在-1的左边(如上图)

>>>a[:-6]
[0, 1, 2, 3]

step=1,从左往右取值,从“起点”开始一直取到end_index=-6(该点不包括)。

>>>a[:-6:-1]
[9, 8, 7, 6, 5]

step=-1,从右往左取值,从“终点”开始一直取到end_index=-6(该点不包括)。

>>>a[-6:]
[4, 5, 6, 7, 8, 9]

step=1,从左往右取值,从start_index=-6开始,一直取到“终点”。

>>>a[-6::-1]
[4, 3, 2, 1, 0]

step=-1,从右往左取值,从start_index=-6开始,一直取到“起点”。

start_index和end_index正(+)负(-)混合索引的情况

>>>a[1:-6]
[1, 2, 3]

start_index=1在end_index=-6的左边,因此从左往右取值,而step=1同样决定了从左往右取值,因此结果正确.

>>>a[1:-6:-1]
[]

start_index=1在end_index=-6的左边,因此从左往右取值,但step=-则决定了从右往左取值,两者矛盾,因此为空。

>>>a[-1:6]
[]

start_index=-1在end_index=6的右边,因此从右往左取值,但step=1则决定了从左往右取值,两者矛盾,因此为空。

>>>a[-1:6:-1]
[9, 8, 7]

start_index=-1在end_index=6的右边,因此从右往左取值,而step=-1同样决定了从右往左取值,因此结果正确。

多层切片操作

>>>a[:8][2:5][-1:]
[4]
#相当于:
#a[:8]=[0, 1, 2, 3, 4, 5, 6, 7]
#a[:8][2:5]= [2, 3, 4]
#a[:8][2:5][-1:] = 4

理论上可无限次多层切片操作,只要上一次返回的是非空可切片对象即可。

切片操作的三个参数可以用表达式

>>>a[2+1:3*2:7%3]
[3, 4, 5]
# 即a[2+1:3*2:7%3] = a[3:6:1]

其他对象的切片操作

前面的切片操作说明都以list为例进行说明,但实际上可进行的切片操作的数据类型还有很多,包括元组、字符串等等。

元组的切片操作
>>> (0, 1, 2, 3, 4, 5)[:3]
(0, 1, 2)
字符串的切片操作
>>>'ABCDEFG'[::2]
'ACEG'
其他
>>>for i in range(1,100)[2::3][-10:]: 
       print(i)

就是利用range函数生成1-99的整数,然后取3的倍数,再取最后十个。

常用切片操作

还是以列表:a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 为说明对象。

取偶数位置

>>>b = a[::2]
[0, 2, 4, 6, 8]

取奇数位置

>>>b = a[1::2]
[1, 3, 5, 7, 9]

拷贝整个对象

>>>b = a[:] #
>>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #41946376
>>>print(id(b)) #41921864
或
>>>b = a.copy()
>>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>>print(id(a)) #39783752
>>>print(id(b)) #39759176

需要注意的是:[:].copy()都属于“浅拷贝”,只拷贝最外层元素,内层嵌套元素则通过引用,而不是独立分配内存。

>>>a = [1,2,['A','B']]
>>>print('a={}'.format(a))
>>>b = a[:]
>>>b[0] = 9 #修改b的最外层元素,将1变成9
>>>b[2][0] = 'D' #修改b的内嵌层元素
>>>print('a={}'.format(a))
>>>print('b={}'.format(b))
>>>print('id(a)={}'.format(id(a)))
>>>print('id(b)={}'.format(id(b)))
a=[1, 2, ['A', 'B']] #原始a
a=[1, 2, ['D', 'B']] #b修改内部元素A为D后,a中的A也变成了D,说明共享内部嵌套元素,但外部元素1没变。
b=[9, 2, ['D', 'B']] #修改后的b
id(a)=38669128
id(b)=38669192

修改单个元素

>>>a[3] = ['A','B']
[0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]

在某个位置插入元素

>>>a[3:3] = ['A','B','C']
[0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9]
>>>a[0:0] = ['A','B']
['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

替换一部分元素

>>>a[3:6] = ['A','B']
[0, 1, 2, 'A', 'B', 6, 7, 8, 9]

总结

  • start_index、end_index、step三者可同为正、同为负,或正负混合。但必须遵循一个原则,否则无法正确切取到数据,即:当start_index的位置在end_index的左边时,表示从左往右取值,此时step必须是正数(同样表示从左往右);当start_index的位置在end_index的右边时,表示从右往左取值,此时step必须是负数(同样表示从右往左),即两者的取值顺序必须是相同的。对于特殊情况,当start_index或end_index省略时,起始索引和终止索引由step的正负来决定,这种情况不会有取值方向矛盾(即不会返回空列表[]),但正和负取到的结果顺序是相反的,因为一个向左一个向右。
  • 在利用切片时,step的正负是必须要考虑的,尤其是当step省略时。比如a[-1:],很容易就误认为是从“终点”开始一直取到“起点”,即误认为a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但实际上a[-1:]=[9](注意不是9,而是[9]),原因在于step=1表示从左往右取值,而起始索引start_index=-1本身就是对象的最右边元素了,再往右已经没数据了。
  • 需要注意:“取单个元素(不带“:”)”时,返回的是对象的某个元素,其类型由元素本身的类型决定,而与母对象无关,如上面的a[0]=0、a[-4]=6,元素0和6都是“数值型”,而母对象a却是“list”型;“取连续切片(带“:”)”时,返回结果的类型与母对象相同,哪怕切取的连续切片只包含一个元素,如上面的a[-1:]=[9],返回的是一个只包含元素“9”的list,而非数值型“9”。对元组切片同理。

Numpy切片

简介

a[m,n]是通过 numpy 库引用二维数组或矩阵中的某一段数据集的一种写法。
类似的,b[x,y,z]表示取三维数组,取N维数组则有N个参数,N-1个逗号分隔

以二维数组为例:

import numpy as np
X = np.array([[0,1,2,3],[10,11,12,13],[20,21,22,23],[30,31,32,33]])

X 是一个二维数组,维度分别为 0 ,1;为了方便理解多维,采取数中括号的方式 [确定维数,例如:从左往右,第 0 层 [] 表示第 0 维;第 1 层 [] 表示第 1 维;…以此类推。

取元素 X[n0,n1]

这是最基本的情况,表示取 第0维 的第 n0 个元素,继续取 第1维 的第 n1个元素。如 X[2,2] 表示第0维第2个元素[20,21,22,23],然后取其第1维的第2个元素,即 22

切片 X[s0:e0,s1:e1]

这是最通用的切片操作,表示取 第0维第 s0 到 e0 个元素,继续取 第1维第 s1 到 e1 个元素(左闭右开)。如 X[1:3,1:3] 表示第0维第[1:3)个元素[[10,11,12,13],[20,21,22,23]],然后取其第1维的第[1:3)个元素即 [[11,12],[21,22]]

切片特殊情况 X[:e0,s1:]

特殊情况,即左边从0开始可以省略X[:e0,s1:e1],右边到结尾可以省略X[s0:,s1:e1],取某一维全部元素X[:,s1:e1],事实上和Python 的序列切片规则是一样的。

常见的 X[:,0] 则表示 第0维取全部,第1维取0号元素

示例代码

import numpy as np

X = np.array([[0,1,2,3],[10,11,12,13],[20,21,22,23],[30,31,32,33]])
# X 是一个二维数组,维度为0,1
# 第0层[]表示第0维;第1层[]表示第1维
# X[n0,n1] 表示第0维取第n0个元素,第1维取第n1个元素
>>> print(X[1,0])
10
# X[1:3,1:3] 表示第0维取[1:3)元素,第1维取第[1:3)个元素
>>> print(X[1:3,1:3])
[[11 12]
 [21 22]]
# X[:n0,:n1] 表示第0维取第0到第n0个元素,第1维取第0到第n1个元素
>>> print(X[:2,:2])
[[ 0  1]
 [10 11]]
# X[:,:n1] 表示第0维取全部元素,第1维取第0到第n1个元素
>>> print(X[:,:2])
[[ 0  1]
 [10 11]
 [20 21]
 [30 31]]
# X[:,0]) 表示第0维取全部元素,第1维取第0个元素
>>> print(X[:,0])
[ 0 10 20 30]

致谢

感谢以下两位博主的分享。

作者:马尔代夫Maldives
链接:https://www.jianshu.com/p/15715d6f4dad
来源:简书
————————————
作者:arry_lee
链接:https://blog.csdn.net/arry_lee/article/details/83108442
来源:CSDN

本文作者:Author:     文章标题:Python切片与Numpy切片
本文地址:https://www.alphalrx.cn/index.php/archives/110/     
版权说明:若无注明,本文皆为“LRX's Blog”原创,转载请保留文章出处。
Last modification:December 22nd, 2019 at 04:21 pm
给作者赏一杯奶茶吧!

Leave a Comment