如何使用Pandas从现有的CSV文件创建多个CSV文件

  • Post category:Python

首先介绍一下Pandas。Pandas是一个Python库,它提供了一个快速,灵活和富有表现力的数据结构,旨在使工作与“关系”或“标记”数据方便快捷。Pandas强大的数据处理和分析功能使其成为数据科学中必不可少的工具之一。

现在来讲一下如何使用Pandas从现有的CSV文件创建多个CSV文件。

假设我们现在有一个名为“sales.csv”的CSV文件,它看起来像这样:

Country,Year,Sales
USA,2018,1000
USA,2019,1200
USA,2020,1500
UK,2018,800
UK,2019,900
UK,2020,1100
China,2018,500
China,2019,700
China,2020,900

现在我们想按照国家拆分数据,创建一个名为“USA.csv”的文件,一个名为“UK.csv”的文件,一个名为“China.csv”的文件。

首先,我们需要导入Pandas库,并使用read_csv()函数读取“sales.csv”文件中的数据。

import pandas as pd

data = pd.read_csv('sales.csv')

接下来,我们可以使用groupby()函数将数据按照Country列进行分组,并将每个分组保存为一个新的DataFrame对象。

grouped_data = data.groupby('Country')

USA_data = grouped_data.get_group('USA')
UK_data = grouped_data.get_group('UK')
China_data = grouped_data.get_group('China')

现在,我们可以使用to_csv()函数将每个DataFrame对象保存为一个新的CSV文件。

USA_data.to_csv('USA.csv', index=False)
UK_data.to_csv('UK.csv', index=False)
China_data.to_csv('China.csv', index=False)

其中,index=False表示不要将默认的行索引保存为CSV文件中的一列。

最终,我们得到了三个新的CSV文件,分别为“USA.csv”、“UK.csv”和“China.csv”,它们的内容分别为:

USA.csv:

Country,Year,Sales
USA,2018,1000
USA,2019,1200
USA,2020,1500

UK.csv:

Country,Year,Sales
UK,2018,800
UK,2019,900
UK,2020,1100

China.csv:

Country,Year,Sales
China,2018,500
China,2019,700
China,2020,900

以上就是使用Pandas从现有的CSV文件创建多个CSV文件的完整攻略。