题目
使用Pandas读取CSV文件并显示前5行
信息
- 类型:问答
- 难度:⭐
考点
Pandas基础,文件读取,数据预览
快速回答
使用Pandas的read_csv()函数读取CSV文件,再通过head()方法显示前5行数据。核心步骤:
- 导入Pandas库:
import pandas as pd - 读取文件:
df = pd.read_csv('data.csv') - 显示数据:
df.head()
原理说明
Pandas是Python数据分析的核心库,read_csv()函数专门用于读取CSV格式数据,将其转换为DataFrame数据结构(二维表格)。head(n)方法默认返回DataFrame的前5行数据,用于快速预览数据集结构。
代码示例
import pandas as pd # 导入Pandas库
# 读取CSV文件(假设文件名为sales_data.csv)
df = pd.read_csv('sales_data.csv')
# 显示前5行数据
print(df.head()) # 等价于 df.head(5)
# 输出示例:
# OrderID Product Quantity
#0 1001 Apple 5
#1 1002 Banana 3
#2 1003 Orange 10
#3 1004 Grape 7
#4 1005 Mango 4最佳实践
- 路径处理:使用相对路径(如
'data/sales.csv')或绝对路径,确保文件存在 - 编码设置:中文数据需指定编码,如
pd.read_csv('data.csv', encoding='utf-8') - 大文件处理:结合
chunksize参数分块读取,避免内存溢出 - 即时验证:读取后立即用
df.head()检查数据结构是否正确
常见错误
- 文件路径错误:
FileNotFoundError- 检查文件路径和扩展名(Windows系统注意反斜杠转义) - 编码问题:
UnicodeDecodeError- 尝试encoding='latin1'或encoding='ISO-8859-1' - 分隔符错误:非逗号分隔的CSV需指定
sep参数,如sep=';' - 未导入库:
NameError: name 'pd' is not defined- 忘记执行import pandas as pd
扩展知识
- 查看更多数据:
df.tail()显示末尾5行,df.sample(3)随机抽样3行 - 基础信息获取:
df.shape获取行数和列数df.info()查看数据类型和内存占用df.describe()显示数值列统计摘要
- 读取其他格式:
- Excel:
pd.read_excel('data.xlsx') - JSON:
pd.read_json('data.json')
- Excel: