如何使用Pandas从Excel文件中提取日期

  • Post category:Python

提取Excel文件中的日期可以使用Python数据处理库Pandas的工具。下面是详细攻略:

  1. 安装Pandas库

我们可以使用pip命令安装Pandas库,具体运行以下命令:

pip install pandas
  1. 引入Pandas库

在我们的Python脚本中,需要使用import关键字引入Pandas库:

import pandas as pd
  1. 读取Excel文件

使用Pandas库的read_excel()函数来读取Excel文件。以下是示例代码:

df = pd.read_excel('file_name.xlsx')

这将导入Excel文件并将其存储在名为“df”的数据帧中。

  1. 检查数据帧

运行以下代码可以快速查看数据帧前面五行的内容:

print(df.head())

如果数据帧正常且包含日期列,则会打印出前五行,其中还会包含日期列。

  1. 提取日期

使用Pandas库的 to_datetime()函数把字符串格式日期转化为日期格式。然后再使用dt.date属性提取日期,示例代码如下:

df['Date'] = pd.to_datetime(df['Date'])
df['Date_only'] = df['Date'].dt.date

其中,上面的代码中,’Date’是包含日期字符串的列,’Date_only’是仅包含日期的新列,由于to_datetime函数会将日期与时间一起提取,仅提取日期可使用dt.date属性。

  1. 查看结果

运行以下代码查看新创建的仅包含日期的列:

print(df['Date_only'])

输出结果将只包含日期,且不包含时间,例如:

0     2022-01-01
1     2022-01-02
2     2022-01-03
3     2022-01-04
4     2022-01-05
         ...

这就是使用Pandas从Excel文件中提取日期的完整攻略。