在Pandas中导入csv文件的不同方法

  • Post category:Python

在Pandas中导入csv文件主要分为以下三种方法:

1. 使用read_csv函数导入

read_csv函数是Pandas中最常用的导入csv文件的方法,它可以从本地文件系统、URL、FTP等位置导入数据。

import pandas as pd 

# 从本地文件系统导入
df = pd.read_csv('data.csv')

# 从URL导入
url = 'https://example.com/data.csv'
df = pd.read_csv(url)

# 从FTP导入
ftp = 'ftp://example.com/data.csv'
df = pd.read_csv(ftp)

除了以上的常用参数外,read_csv函数支持许多其他配置,如指定column name、使用不同的分隔符、指定缺失值处理方式等等。

2. 使用pd.read_table函数导入

pd.read_table函数与pd.read_csv函数基本相同,唯一的不同是它默认的分隔符不同(是tab),如果csv文件中的数据是以“,”分隔的,则需要手动指定分隔符。

import pandas as pd

# 从本地文件系统导入
df = pd.read_table('data.csv', sep=',')

# 从URL导入
url = 'https://example.com/data.csv'
df = pd.read_table(url, sep=',')

# 从FTP导入
ftp = 'ftp://example.com/data.csv'
df = pd.read_table(ftp, sep=',')

3. 使用pandas方法从剪贴板导入

假设你已经有了CSV格式的数据,但是它存储在剪贴板中而不是文件中,这时可以使用Pandas中的read_clipboard方法来将数据直接从剪贴板中导入Pandas中。

首先,把数据复制到剪贴板中,然后运行以下代码:

import pandas as pd 

# 从剪贴板导入
df = pd.read_clipboard()

read_clipboard()不需要参数,它会自动将剪贴板中的内容读取为DataFrame对象,方便我们直接使用。该方法在需要快速读入少量数据时比较方便。

以上三种方法可以满足大部分导入CSV文件的需求,读者可以根据自己的需求选择合适的方法。