一、NumPy.npy的实例讲解
1. NumPy简介
NumPy是Python科学计算中很重要的一个库,它支持大量的高维数组与矩阵运算。其中 .npy 格式就是NumPy存储数据的二进制格式,它可以保存人工生成的流媒体、图像和数组等数据。 .npy 格式具有数据压缩的特点,因此我们可以在需要的时候把数据载入到内存中,而不必重新生成数据。
2. NumPy.npy文件的创建
将数据保存到.npy 文件中的代码如下:
import numpy as np
data = np.arange(10)
np.save('data.npy', data)
上面的代码中,我们生成了一个长度为10的NumPy数组,然后将数组保存为 data.npy
文件。
3. NumPy.npy文件的读取
读取.npy 文件的代码如下:
import numpy as np
data = np.load('data.npy')
print('data:', data)
当我们运行上面的代码时,输出的结果应该为:
data: [0 1 2 3 4 5 6 7 8 9]
这说明我们已经成功将.npy 文件读取到内存中了。
二、pandas.DataFrame的实例讲解
1. pandas简介
pandas是Python数据分析中非常重要的一个库,它支持各种数据格式(如表格或者CSV文件)的导入、清洗、操作、分析和可视化等。
2. pandas.DataFrame的创建
创建pandas.DataFrame的实例代码如下:
import pandas as pd
import numpy as np
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40],
'score': np.random.randint(0, 100, size=4)}
df = pd.DataFrame(data)
print('df: \n', df)
运行上述代码后,输出的结果应该是:
df:
name age score
0 Alice 25 94
1 Bob 30 77
2 Charlie 35 21
3 David 40 45
通过上面的代码,我们创建了一个pandas.DataFrame实例,其中包含了3列(name、age和score)的数据。
3. pandas.DataFrame的使用
pandas.DataFrame实例可以进行各种数据操作和分析,例如下列代码实现了根据成绩对学生进行排序的功能:
df = df.sort_values('score', ascending=False)
print('df_sorted:', df)
此时会得到一个按照分数从高到低排序后的学生表。
df_sorted:
name age score
0 Alice 25 94
1 Bob 30 77
3 David 40 45
2 Charlie 35 21
上述代码通过 sort_values
方法实现了根据列名进行排序的功能,它可以把相应的列进行升序或降序排列。