Pandas中read_csv用法详解
read_csv是Pandas中的一个函数,可以从csv文件中读取数据,并转化为Pandas中的DataFrame数据类型。该函数有很多参数,常用的参数有以下几个:
- filepath_or_buffer:要读取的文件路径或文件名。
- sep:分隔符,默认为逗号。
- header:用作列名的行号。默认为0,即第一行。
- index_col:作为行索引的列编号或列名。
示例1:
我们有一个名为data.csv的数据文件,包含以下数据:
date,value
2021-01-01,10
2021-01-02,20
2021-01-03,30
现在我们要使用Pandas中的read_csv函数将该文件读入,并转化为DataFrame。
import pandas as pd
df = pd.read_csv("data.csv")
print(df)
输出结果为:
date value
0 2021-01-01 10
1 2021-01-02 20
2 2021-01-03 30
Pandas中rolling用法详解
rolling函数是Pandas中的一个函数,可以对数据进行滚动操作(rolling operation),即对一段连续的数据进行某种操作。该函数的常用参数有以下几个:
- window:窗口大小,即一段连续的数据的长度。
- center:是否将窗口中心设置为窗口最后一个元素,默认为False。
- min_periods:要求每个窗口中至少有几个非空值。默认为1,即窗口中至少要有一个非空值。
示例2:
我们可以使用该函数来计算移动平均值。例如,我们有以下数据:
date,value
2021-01-01,10
2021-01-02,20
2021-01-03,30
2021-01-04,40
2021-01-05,50
2021-01-06,60
2021-01-07,70
2021-01-08,80
2021-01-09,90
2021-01-10,100
现在我们要使用rolling函数计算该序列的5个数据点的移动平均值。
import pandas as pd
df = pd.read_csv("data.csv")
rolling_mean = df['value'].rolling(window=5).mean()
print(rolling_mean)
输出结果为:
0 NaN
1 NaN
2 NaN
3 NaN
4 30.0
5 40.0
6 50.0
7 60.0
8 70.0
9 80.0
Name: value, dtype: float64
Pandas中expanding用法详解
expanding函数也是Pandas中的一个函数,可以计算累计和、累计均值等指标。该函数的常用参数有以下几个:
- min_periods:要求每个窗口中至少有几个非空值。默认为1,即窗口中至少要有一个非空值。
示例3:
使用expanding函数来计算序列累计和。例如,我们有以下数据:
date,value
2021-01-01,10
2021-01-02,20
2021-01-03,30
2021-01-04,40
2021-01-05,50
现在我们要使用expanding函数计算该序列的累计和。
import pandas as pd
df = pd.read_csv("data.csv")
expanding_sum = df['value'].expanding().sum()
print(expanding_sum)
输出结果为:
0 10.0
1 30.0
2 60.0
3 100.0
4 150.0
Name: value, dtype: float64
通过以上示例,我们可以看到如何在Python中使用Pandas库中的read_csv、rolling、expanding函数来读取CSV文件并进行滚动和扩展操作。