以下是使用CSV文件创建数据框架的完整攻略:
1.导入必要的库和文件
首先,我们需要导入 pandas 库,这是一个专门用于数据处理的强大工具。假设我们的 CSV 文件名为 data.csv,代码如下:
import pandas as pd
df = pd.read_csv('data.csv')
2.查看数据框架
在导入数据之后,一般要查看一下数据的情况,以确保数据被正确加载。可以使用以下代码查看数据框架的前几条数据:
print(df.head())
如果需要查看数据框架的所有列,可以使用以下代码:
print(df.columns)
3.选取数据
如果我们只对数据框架的某些列感兴趣,可以根据列名来选取数据。例如,如果我们只想选取列名为 ‘name’ 和 ‘age’ 的列,可以使用以下代码:
selected_df = df[['name', 'age']]
print(selected_df)
4.筛选数据
有时候我们只对特定条件下的数据感兴趣。例如,如果我们想筛选出 ‘age’ 大于等于 18 的数据,可以使用以下代码:
age_filter = df['age'] >= 18
selected_df = df[age_filter]
print(selected_df)
5.数据处理
有时候我们需要对数据进行一些加工处理。例如,如果我们想计算每个人的 BMI 值,可以使用以下代码:
bmi = df['weight'] / (df['height'] ** 2)
df['bmi'] = bmi
print(df)
6.保存数据
最后,如果我们想把处理过的数据保存成 CSV 文件,可以使用以下代码:
df.to_csv('processed_data.csv', index=False)
上述代码将所有处理后的数据保存在名为 ‘processed_data.csv’ 的文件中,其中参数 index=False 表示不保留原数据的索引。
以上就是使用 CSV 文件创建数据框架的完整攻略。