侧边栏壁纸
博主头像
colo

欲买桂花同载酒

  • 累计撰写 1823 篇文章
  • 累计收到 0 条评论

使用Pandas读取CSV文件并显示前5行

2025-12-12 / 0 评论 / 4 阅读

题目

使用Pandas读取CSV文件并显示前5行

信息

  • 类型:问答
  • 难度:⭐

考点

Pandas基础,文件读取,数据预览

快速回答

使用Pandas的read_csv()函数读取CSV文件,再通过head()方法显示前5行数据。核心步骤:

  1. 导入Pandas库:import pandas as pd
  2. 读取文件:df = pd.read_csv('data.csv')
  3. 显示数据:df.head()
## 解析

原理说明

Pandas是Python数据分析的核心库,read_csv()函数专门用于读取CSV格式数据,将其转换为DataFrame数据结构(二维表格)。head(n)方法默认返回DataFrame的前5行数据,用于快速预览数据集结构。

代码示例

import pandas as pd  # 导入Pandas库

# 读取CSV文件(假设文件名为sales_data.csv)
df = pd.read_csv('sales_data.csv')

# 显示前5行数据
print(df.head())  # 等价于 df.head(5)

# 输出示例:
#   OrderID  Product  Quantity
#0     1001    Apple         5
#1     1002   Banana         3
#2     1003  Orange         10
#3     1004    Grape         7
#4     1005   Mango         4

最佳实践

  • 路径处理:使用相对路径(如'data/sales.csv')或绝对路径,确保文件存在
  • 编码设置:中文数据需指定编码,如pd.read_csv('data.csv', encoding='utf-8')
  • 大文件处理:结合chunksize参数分块读取,避免内存溢出
  • 即时验证:读取后立即用df.head()检查数据结构是否正确

常见错误

  • 文件路径错误FileNotFoundError - 检查文件路径和扩展名(Windows系统注意反斜杠转义)
  • 编码问题UnicodeDecodeError - 尝试encoding='latin1'encoding='ISO-8859-1'
  • 分隔符错误:非逗号分隔的CSV需指定sep参数,如sep=';'
  • 未导入库NameError: name 'pd' is not defined - 忘记执行import pandas as pd

扩展知识

  • 查看更多数据df.tail()显示末尾5行,df.sample(3)随机抽样3行
  • 基础信息获取
    • df.shape获取行数和列数
    • df.info()查看数据类型和内存占用
    • df.describe()显示数值列统计摘要
  • 读取其他格式
    • Excel:pd.read_excel('data.xlsx')
    • JSON:pd.read_json('data.json')