如何使用 NumPy 进行数据分析?
NumPy 是一个用于 Python 数据分析的开源库。它提供了许多用于数据分析的工具,包括数组、矩阵、索引和函数。NumPy 也是 NumPy 的子库,它提供了一套更高级的功能。
使用 NumPy 进行数据分析的步骤:
- 导入 NumPy:
import numpy as np
- 创建数组:
# 创建一个包含数字的数组
arr = np.array([1, 2, 3, 4, 5])
# 创建一个包含字符串的数组
arr = np.array(["a", "b", "c", "d", "e"])
- 访问数组元素:
# 获取第一个元素
print(arr[0])
# 获取指定索引的元素
print(arr[2])
- 进行数据分析:
# 计算数组的平均值
print(np.mean(arr))
# 计算数组的标准差
print(np.std(arr))
# 创建一个新的数组,包含数组中所有元素的平方值
squared_arr = arr ** 2
- 使用函数:
# 使用 sum() 函数求数组中所有元素的总和
print(np.sum(arr))
# 使用 min() 函数求数组中最小元素
print(np.min(arr))
# 使用 max() 函数求数组中最大元素
print(np.max(arr))
示例:
import numpy as np
# 创建一个包含数字的数组
arr = np.array([1, 2, 3, 4, 5])
# 打印数组元素
print(arr[0])
# 打印数组中所有元素的平均值
print(np.mean(arr))
# 打印数组中所有元素的标准差
print(np.std(arr))
输出:
1
3
2.0
```