Bootstrap

Python数据分析与挖掘实战学习14

一、Python主要数据预处理函数

函数名

函数功能

所属扩展库

interpolate

一维,高维数据插值

Scipy

unique

去除数据中的重复元素,得到单值元素列表,它是对象的方法名

Pandas/Numpy

isnull

判断是否为空值

Pandas

notnull

判断是否非空值

Pandas

PCA

对指标变量矩阵进行主成分分析

Scikit-Learn

random

生产随机矩阵

Numpy1.

1.interpolate

(1)功能:interpolate是Scipy的一个子库,包含大量的插值函数,如拉格朗日插值、样条插值、高维插值等。使用前需要用from scipy.interpolate import *引入相应的插值函数。

(2)使用格式:f=scipy.interpolate.lagrange(x, y)。这里所示为一位数据的拉格朗日插值的命令,其中x,y为对应的自变量和因变量数据。

;