Pandas是一个流行的Python数据处理库。其中,pandas中的.ix已经被弃用并从版本0.20.0开始已经不再被支持了。现在使用的方法是使用.loc和.iloc。
.loc和.iloc
.loc和.iloc都是用来选取数据中的一部分。.loc将基于标签选取行,而.iloc是基于整数位置选取行。具体怎么选取取决于使用的参数。
使用如下的数据框作为示例:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': np.random.randn(6),
'B': ['foo', 'bar'] * 3,
'C': np.random.randn(6)})
接下来的示例将演示如何使用.loc和.iloc。
1. 使用.loc选取特定行和列:
df.loc[[1,3,5], ['A','C']]
这将选取索引为1、3和5的行,以及“A”和“C”列的值。结果为:
A C
1 -1.469414 0.287359
3 0.367516 1.282432
5 -0.265673 0.885886
2. 使用.iloc选取特定范围的行和列:
df.iloc[1:4, 0:2]
这将选取索引为1、2和3的行,以及第0和第1列的值。结果为:
A B
1 -1.469414 bar
2 -0.423270 foo
3 0.367516 bar
在需要选取数据的时候,尽量使用.loc和.iloc,而不要使用已经被弃用的.ix,以免出现一些错误。