数据处理
| 工具 | 用途 |
|---|---|
| pandas | 提供大量快速便捷处理数据的函数及高效操作大型数据集所需的工具 |
| numpy | 用于存储和处理大型矩阵与维度数组 |
| scipy | 统计学、优化工具 |
| matplotlib | 图标绘图系统 |
| seaborn | 基于 Matplotlib 的数据可视化库 |
预测工具
| 工具 | 用途 |
|---|---|
| scikit-learn (sklearn) | 常用的数据预测分析工具,传统机器学习 |
| LightGBM / XGBoost | 基于梯度提升树 (GBDT) 的机器学习训练工具 |
| Keras | API 对初学者友好 |
| pytorch | 深度学习工具 |
| tensorflow | 深度学习工具 |
| paddlepaddle | 深度学习工具 |
其他
| 工具 | 用途 |
|---|---|
| jupyter server / jupyter notebook | 基于 web 的交互式计算平台 |
| zeppelin | 基于 web 的数据驱动、交互式数据分析平台 |