在Pandas中,可以使用DatetimeIndex对象的hour属性获取一个时间戳中的小时数。具体的操作步骤如下所示:
- 首先,导入Pandas包和需要处理的数据集:
import pandas as pd
data = {'timestamp': ['2022-01-01 12:34:56', '2022-01-02 13:45:56', '2022-01-03 14:56:56']}
df = pd.DataFrame(data)
- 接下来,将DataFrame中的timestamp列转换成DatetimeIndex对象:
df['timestamp'] = pd.to_datetime(df['timestamp'])
df.set_index('timestamp', inplace=True)
这一步操作将DataFrame中的timestamp列转换成了DatetimeIndex对象,并将其设置为了DataFrame的索引。
- 最后,通过DatetimeIndex对象的hour属性获取每个时间戳中的小时数:
hour = df.index.hour
这一步操作将每个时间戳中的小时数存储在一个Series对象中,可以查看结果:
print(hour)
结果如下:
timestamp
2022-01-01 12:34:56 12
2022-01-02 13:45:56 13
2022-01-03 14:56:56 14
Name: timestamp, dtype: int64
在结果中可以看到,hour属性返回了每个时间戳中的小时数,并存储在了一个Series对象中。这个Series对象的索引是原来的时间戳,可以直接在Pandas中进行后续的数据处理和分析。