将Pandas Dataframe保存为gzip/zip文件的过程分为以下两个部分:
- 将Dataframe转换为压缩格式的数据
使用Pandas库中的to_csv()函数,可以将Dataframe保存为CSV格式的文件。默认情况下,该函数输出的CSV文件是未压缩的。要将输出的CSV文件压缩为gzip或zip文件,需要传递相应的压缩参数到to_csv()函数中。
压缩为gzip文件的实例:
import pandas as pd
# 创建一个Dataframe对象
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'gender': ['F', 'M', 'M']})
# 将Dataframe保存为gzip格式的文件
df.to_csv('dataframe.gz', compression='gzip', index=False)
上述代码将Dataframe保存为了名为”dataframe.gz”的gzip文件。
压缩为zip文件的实例:
import pandas as pd
# 创建一个Dataframe对象
df = pd.DataFrame({'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'gender': ['F', 'M', 'M']})
# 将Dataframe保存为zip格式的文件
df.to_csv('dataframe.zip', compression='zip', index=False)
上述代码将Dataframe保存为了名为”dataframe.zip”的zip文件。
- 解压缩压缩数据并读取Dataframe
保存为gzip/zip文件的Dataframe需要解压缩后才能读取。可以使用Pandas库中的read_csv()函数读取压缩文件并解压缩数据。
解压缩gzip文件的实例:
import pandas as pd
# 从gzip格式的文件中读取Dataframe
df_gzip = pd.read_csv('dataframe.gz', compression='gzip')
# 打印读取的Dataframe
print(df_gzip)
上述代码从名为”dataframe.gz”的gzip文件中读取Dataframe并打印。
解压缩zip文件的实例:
import pandas as pd
# 从zip格式的文件中读取Dataframe
df_zip = pd.read_csv('dataframe.zip', compression='zip')
# 打印读取的Dataframe
print(df_zip)
上述代码从名为”dataframe.zip”的zip文件中读取Dataframe并打印。
以上就是将Pandas Dataframe保存为gzip/zip文件的完整攻略。