实验目的

掌握Python语言中统计特征函数的用法

实验原理

统计特征函数用于计算数据的均值、方差、标准差、分位数、相关系数、协方差等,这些统计特征能反映数据的整体分布。

实验步骤

注意:python2中print语句不加括号,python3中print语句打印内容要加括号!

基本统计特征函数,data 为DataFrame 或者 Series

    \# sum\(\)

    \# mean\(\)

    \# var\(\) 样本方差

    \# std\(\) 计算数据样本的标准差

    \# corr\(\) Spearman\(Person,kenall\) 相关系数矩阵

        \# S1.corr\(S2,method = 'pearson'\) --> S1 和 S2 均为Series

D = pd.DataFrame([range(1,8),range(2,9)])

# 第一行为1~7,第二行为2~8

D.corr(method = 'pearson')

S1 = D.loc[0] # 提取第一行

S2 = D.loc[1] # 提取第二行

S1.corr(S2,method = 'pearson')

    \# cov\(\) 协方差矩阵 计算两个Series之间的协方差

import numpy as np

D = pd.DataFrame(np.random.randn(6.5)) # 产生6*5 随机矩阵

D.cov() #计算协方差矩阵

D[0].cov(D[1]) #计算第一列和第二类的协方差

    \# describe\(percentiles = \[0.2,0.4,0.6,0.8\]\) 计算 0.2 0.4 。。。分位数



\# 拓展统计特征函数 Pandas



\# 累积计算

    \# cumsum\(\) 依次给出1,2,...,n个数的和

    \# cumprod\(\)  依次给出1,2,...,n个数的积

    \# cummax\(\)  依次给出1,2,...,n个数的最大值

    \# cummin\(\)  依次给出1,2,...,n个数的最小值

        \# D 为DataFrame 或者 Series ,D.cumsum\(\)

\# 滚动计算

    \# rolling\_sum\(\) 计算样本数据量的总和\(按列计算\)

    \# rolling\_mean\(\) 数据样本的均值

    \# rolling\_var\(\) 计算数据样本的方差

    \# rolling\_std\(\) 计算数据样本的标准差

    \# rolling\_corr\(\) 计算数据样本的相关系数矩阵

    \# rolling\_cov\(\) 计算协方差矩阵

        \# 不是 D 为DataFrame 或者 Series 对象的方法

            \#使用方法为 pd.rolling\_mean\(D,k\) -->意思是每K列计算一次均值

D = pd.Series(range(0,20)) # 构造Series

D.sort(ascending = True)

D.sum()

pd.rolling_sum(D,2) #依次对相邻两项求和

results matching ""

    No results matching ""