下面我将详细讲解“详解pandas的外部数据导入与常用方法”的完整实例教程。
一、pandas的外部数据导入
pandas是一个强大的数据分析工具,可以轻松的导入多种外部数据,如CSV文件、Excel文件、SQL数据库等,具体方法如下:
1.1. 导入CSV文件
import pandas as pd
# 读取CSV文件
data = pd.read_csv('data.csv')
1.2. 导入Excel文件
import pandas as pd
# 读取Excel文件
data = pd.read_excel('data.xlsx')
1.3. 导入SQL数据库
import pandas as pd
import sqlite3
# 建立连接,获取数据
conn = sqlite3.connect('example.db')
data = pd.read_sql('SELECT * FROM table_name', conn)
二、pandas常用方法
pandas提供了多种方便的数据处理和统计方法,下面分别介绍其中的常用方法:
2.1. 对数据进行描述统计
import pandas as pd
# 读取CSV文件
data = pd.read_csv('data.csv')
# 对数据进行描述统计
# 查看数据的前5行
print(data.head())
# 查看数据的统计信息
print(data.describe())
2.2. 数据排序
import pandas as pd
# 读取CSV文件
data = pd.read_csv('data.csv')
# 对数据进行排序
# 按照指定行排序
data.sort_values(by=['column_name'])
# 按照指定列排序
data.sort_index(axis=1)
以上是pandas的外部数据导入与常用方法的例子说明。