pandas中read_csv、rolling、expanding用法详解

  • Post category:Python

Pandas中read_csv用法详解

read_csv是Pandas中的一个函数,可以从csv文件中读取数据,并转化为Pandas中的DataFrame数据类型。该函数有很多参数,常用的参数有以下几个:

  • filepath_or_buffer:要读取的文件路径或文件名。
  • sep:分隔符,默认为逗号。
  • header:用作列名的行号。默认为0,即第一行。
  • index_col:作为行索引的列编号或列名。

示例1:

我们有一个名为data.csv的数据文件,包含以下数据:

date,value
2021-01-01,10
2021-01-02,20
2021-01-03,30

现在我们要使用Pandas中的read_csv函数将该文件读入,并转化为DataFrame。

import pandas as pd

df = pd.read_csv("data.csv")

print(df)

输出结果为:

          date  value
0  2021-01-01     10
1  2021-01-02     20
2  2021-01-03     30

Pandas中rolling用法详解

rolling函数是Pandas中的一个函数,可以对数据进行滚动操作(rolling operation),即对一段连续的数据进行某种操作。该函数的常用参数有以下几个:

  • window:窗口大小,即一段连续的数据的长度。
  • center:是否将窗口中心设置为窗口最后一个元素,默认为False。
  • min_periods:要求每个窗口中至少有几个非空值。默认为1,即窗口中至少要有一个非空值。

示例2:

我们可以使用该函数来计算移动平均值。例如,我们有以下数据:

date,value
2021-01-01,10
2021-01-02,20
2021-01-03,30
2021-01-04,40
2021-01-05,50
2021-01-06,60
2021-01-07,70
2021-01-08,80
2021-01-09,90
2021-01-10,100

现在我们要使用rolling函数计算该序列的5个数据点的移动平均值。

import pandas as pd

df = pd.read_csv("data.csv")
rolling_mean = df['value'].rolling(window=5).mean()

print(rolling_mean)

输出结果为:

0      NaN
1      NaN
2      NaN
3      NaN
4     30.0
5     40.0
6     50.0
7     60.0
8     70.0
9     80.0
Name: value, dtype: float64

Pandas中expanding用法详解

expanding函数也是Pandas中的一个函数,可以计算累计和、累计均值等指标。该函数的常用参数有以下几个:

  • min_periods:要求每个窗口中至少有几个非空值。默认为1,即窗口中至少要有一个非空值。

示例3:

使用expanding函数来计算序列累计和。例如,我们有以下数据:

date,value
2021-01-01,10
2021-01-02,20
2021-01-03,30
2021-01-04,40
2021-01-05,50

现在我们要使用expanding函数计算该序列的累计和。

import pandas as pd

df = pd.read_csv("data.csv")
expanding_sum = df['value'].expanding().sum()

print(expanding_sum)

输出结果为:

0     10.0
1     30.0
2     60.0
3    100.0
4    150.0
Name: value, dtype: float64

通过以上示例,我们可以看到如何在Python中使用Pandas库中的read_csv、rolling、expanding函数来读取CSV文件并进行滚动和扩展操作。