如何使用 Python 和 Pandas 进行数据统计?
使用 Pandas 进行数据统计
- 读取数据:使用 pandas.read_csv() 函数读取 CSV 文件。
- 数据处理:使用 pandas 的各种方法对数据进行处理,例如数据清洗、数据转换、分组和聚合。
- 统计分析:使用 pandas 的统计分析方法进行数据统计,例如平均值、标准差、众数、分布图等。
- 数据可视化:使用 pandas 的数据可视化方法将统计结果可视化。
使用 Python 和 Pandas 进行数据统计
import pandas as pd
# 读取数据
data = pd.read_csv("data.csv")
# 数据处理
data["age"] = data["age"].fillna(25)
data["salary"] = data["salary"].fillna(10000)
# 统计分析
mean_age = data["age"].mean()
std_age = data["age"].std()
# 数据可视化
data.plot(x="age", y="salary")
其他资源
- pandas 文档:pandas.pydata.org
- pandas 教程:pandas.pydata.org/docs/user_guide/index.html
- 数据统计示例:pandas.pydata.org/docs/user_guide/statistics.html