NumPy.npy与pandas DataFrame的实例讲解

  • Post category:Python

一、NumPy.npy的实例讲解

1. NumPy简介

NumPy是Python科学计算中很重要的一个库,它支持大量的高维数组与矩阵运算。其中 .npy 格式就是NumPy存储数据的二进制格式,它可以保存人工生成的流媒体、图像和数组等数据。 .npy 格式具有数据压缩的特点,因此我们可以在需要的时候把数据载入到内存中,而不必重新生成数据。

2. NumPy.npy文件的创建

将数据保存到.npy 文件中的代码如下:

import numpy as np

data = np.arange(10)
np.save('data.npy', data)

上面的代码中,我们生成了一个长度为10的NumPy数组,然后将数组保存为 data.npy 文件。

3. NumPy.npy文件的读取

读取.npy 文件的代码如下:

import numpy as np

data = np.load('data.npy')
print('data:', data)

当我们运行上面的代码时,输出的结果应该为:

data: [0 1 2 3 4 5 6 7 8 9]

这说明我们已经成功将.npy 文件读取到内存中了。

二、pandas.DataFrame的实例讲解

1. pandas简介

pandas是Python数据分析中非常重要的一个库,它支持各种数据格式(如表格或者CSV文件)的导入、清洗、操作、分析和可视化等。

2. pandas.DataFrame的创建

创建pandas.DataFrame的实例代码如下:

import pandas as pd
import numpy as np

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'score': np.random.randint(0, 100, size=4)}

df = pd.DataFrame(data)
print('df: \n', df)

运行上述代码后,输出的结果应该是:

df: 
        name  age  score
0     Alice   25     94
1       Bob   30     77
2   Charlie   35     21
3     David   40     45

通过上面的代码,我们创建了一个pandas.DataFrame实例,其中包含了3列(name、age和score)的数据。

3. pandas.DataFrame的使用

pandas.DataFrame实例可以进行各种数据操作和分析,例如下列代码实现了根据成绩对学生进行排序的功能:

df = df.sort_values('score', ascending=False)
print('df_sorted:', df)

此时会得到一个按照分数从高到低排序后的学生表。

df_sorted: 
        name  age  score
0     Alice   25     94
1       Bob   30     77
3     David   40     45
2   Charlie   35     21

上述代码通过 sort_values 方法实现了根据列名进行排序的功能,它可以把相应的列进行升序或降序排列。