当前位置: 代码迷 >> 综合 >> Python数据分析 1. 准备工作
  详细解决方案

Python数据分析 1. 准备工作

热度:94   发布时间:2023-12-27 02:18:08.0

文章目录

      • 1 Numpy
      • 2 Pandas
      • 3 matplotlib
      • 4 IPython
      • 5 SciPy
      • 6 安装及配置
        • 6.1 安装ipython
        • 6.2 安装其他依赖包
      • 6.3 查看python中的模块,并简单验证环境

1 Numpy

Python科学计算的基础包。它提供了以下功能(不限于此):

  • 快速高效的多维数组对象ndarray。
  • 用于对数组执行元素级计算以及直接对数组执行数学运算的函数。
  • 用于读取硬盘上基于数组的数据集的工具。
  • 线性代数运算、傅立叶变换,以及随机数生成。
  • 用于将C、C++、Fortran代码集成到Python的工具。

除了为python提供快速的数组处理能力,Numpy在数据分析方面还有另外一个主要作用,即作为算法之间传递数据的容器。对于数值型数据,Numpy数组在存储喝处理数据时要比内置的Python数据结构高效得多。此外,由低级语言(比如C和Fortran)便携的库可以直接操作Numpy数组中的数据,无需进行任何数据复制工作。

2 Pandas

提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据库(如SQL)灵活的数据处理功能。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。

3 matplotlib

最流行的用于绘制数据图表的Python库。

4 IPython

它是一个增强的Python shell,目的是提高编写、测试、调试Python代码的速度。它主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。

5 SciPy

SciPy是一组专门解决科学计算中各种标准问题域的包的集合,主要包括下面这些包:

  • scipy.integrate:数值积分例程和微分方程求解器。
  • scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能。
  • scipy.optimize:函数优化器(最小化器)以及根查找算法。
  • scipy.signal:信号处理工具
  • scipy.sparse:稀疏矩阵和稀疏线性系统求解器。
  • scipy.special:SPECFUN(这是一个实现了许多常用数学函数(如伽玛函数)的Fortran库)的包装器。
  • scipy.stats:标准连续和离散概率分布(如密度函数、采样器、连续分布函数等)、各种统计检验方法,一哦更好的描述统计法。
  • scipy.weave:利用内联C++代码加速数组计算的工具。

Numpy和Scipy的有机结合完全可以替代MATLAB的计算功能(包括其插件工具箱)。

6 安装及配置

该书所用的插件包目前已经没有了,所以手动搭建环境。

前提已经配置好Python和pip。

6.1 安装ipython

我直接在conda内安装的,命令pip install ipython

6.2 安装其他依赖包

numpypandasscipymatplotlib

可以直接使用如下命令:

pip install numpy
pip install pandas
pip install scipy
pip install matplotlib

如果网速比较慢,可以选择:

pip intall -i https://pypi.mirrors.ustc.edu.cn/simple pandas
pip intall -i https://pypi.mirrors.ustc.edu.cn/simple scipy
pip intall -i https://pypi.mirrors.ustc.edu.cn/simple matplotlib

6.3 查看python中的模块,并简单验证环境

pydoc modules
ipython --pylab

进入ipython后输入

import pandas
plot(arange(10))

出现如下图形则为成功

在这里插入图片描述