数学和统计方法

news/2023/5/28 8:37:08

在这里插入图片描述

平均数,加权平均数,中位数,众数

1、平均数:所有数加在一起求平均
2、中位数:对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的
两个数值的平均数作为中位数。
3、众数:出现次数最多的那个数
4、加权平均数:加权平均值即将各数值乘以相应的权数,然后加总求和得到总体值,再除以总的单位数。加权平均值的大小不仅取决于
总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡
轻重的作用,因此叫做权数。 因为加权平均值是根据权数的不同进行的平均数的计算,所以又叫加权平均数。在日常生活中,人们常常
把“权数”理解为事物所占的“权重”
x占a% y占b% z占c% n占m%
加权平均数=(ax+by+cz+mn)/(x+y+z+n)

一维数组

沿轴向进行计算,一维数组只有一个0轴

import numpy as np
a = np.array([1,2,3,4,3,5,3,6])
print(f'数组:{a}')
print(np.sum(a))
print(np.prod(a))
print(np.cumsum(a)) # 从0开始元素的累积和
print(np.cumprod(a)) # 从1开始元素的累积积
print(np.max(a))
print(np.min(a))
print(np.argmax(a)) # 最大值所在的下标
print(np.argmin(a)) # 最小值所在的下标
print(np.mean(a)) # 平均数
print(np.median(a)) # 中位数
print(np.average(a)) # 加权平均
counts = np.bincount(a) # 统计非负整数的个数,不能统计浮点数
print(np.argmax(counts)) # 返回众数,此方法不能用于二维数组

Numpy中没有直接的方法求众数,但是可以这样实现:

import numpy as np
# bincount():统计非负整数的个数,不能统计浮点数
counts = np.bincount(nums)
#返回众数
np.argmax(counts)

二维数组

import numpy as np
from scipy import stats
a = np.array([[1,3,6],[9,2,3],[2,3,3]])
print(f'数组:\n{a}')
print('-'*30)
print(np.sum(a))
print(np.prod(a))
print(np.cumsum(a)) # 从0开始元素的累积和,返回一维数组
print(np.cumprod(a)) # 从1开始元素的累积积,返回一维数组
print(np.max(a))
print(np.min(a))
print(np.argmax(a)) 
print(np.argmin(a)) 
print(np.mean(a)) 
print(np.median(a)) 
print(np.average(a)) 

注意:数组的众数不建议在Numpy里面计算,在Pandas里面计算更简单。
将一维数组转成Pandas的Series,然后调用mode()方法

在这里插入图片描述
将二维数组转成Pandas的DataFrame,然后调用mode()方法
在这里插入图片描述

Numpy的axis参数的用途

axis=0代表行,axis=1代表列

所有的数学和统计函数都有这个参数,都可以使用

我们想按行或按列使用时使用这个参数

import numpy as np
a = np.array([[1,3,6],[9,3,2],[1,4,3]])
print(f'数组:\n{a}')
print('-'*30)
print(np.sum(a,axis=0)) # 每行中的每个对应元素相加,返回一维数组
print('-'*30)
print(np.sum(a,axis=1)) # 每列中的每个元素相加,返回一维数

其中思路正好是反的:axis=0 求每列的和。axis=1求每行的和。

• 行:每行对应一个样本数据
• 列:每列代表样本的一个特征

数组对应到现实中的一种解释:
• 对于机器学习、神经网络来说,不同列的量钢是相同的,收敛更快。
• 有两个特征,一个是商品单价1元至50元,另一个是销售数量3千个至1万个,这两个数字不可比,所以需要都做标准化。
• 比如在Excel里,单价一个列,销售数量一个列,不同列代表不同特征,所以用axis=0做计算
• 标准化一般使用:通过均值和方差实现
数组 = (数组 - mean(数组,axis=0))/ std(数组, axis=0)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.exyb.cn/news/show-4561417.html

如若内容造成侵权/违法违规/事实不符,请联系郑州代理记账网进行投诉反馈,一经查实,立即删除!

相关文章

java jar执行工具_如何使用Javac/Jar/Java工具对源代码进行编译打包执行

Javac/Jar/Java是JDK的发布包中带的三个基本工具,用于对Java源码进行编译打包运行,本文将介绍这几个工具的使用方法。1. 代码和演示环境下面的所有命令演示都是在目录./171221_java_compile_run/中进行,文件的目录结构如下, Simpl…

paper—HAWK: Rapid Android Malware Detection Through Heterogeneous Graph Attention Networks

通过异构图形注意网络快速检测Android恶意软件 目录 摘要 一、引言 二、背景和概述 A.动机和问题范围 B.我们的HAWK方法 三、基于HIN的数据建模 A.特征工程 B.构建HIN C.从HIN构建应用程序图​ 四、结点嵌入模型 A.MSGAT: In-Sample Node Embedding B.MSGAT: In…

使用IMPUTE2进行基因型填充

欢迎关注”生信修炼手册”!impute2是一款基因型填充软件,和其他软件相比,其填充的准确率最高,网址如下https://mathgen.stats.ox.ac.uk/impute/impute_v2.html提供了以下两大功能haplotype phasing,单倍型分析genotype imputation,基因型填充…

ssm整合redis和mysql_redis与ssm整合(用 redis 替代mybatis二级缓存)

SSMredis整合这里主要是利用redis去做mybatis的二级缓存,mybaits映射文件中所有的select都会刷新已有缓存,如果不存在就会新建缓存,所有的insert,update操作都会更新缓存。redis的好处也显而易见,可以使系统的数据访问…

ssm整合redis和mysql_redis与ssm整合方法(mybatis二级缓存)

SSMredis整合ssm框架之前已经搭建过了,这里不再做代码复制工作。这里主要是利用redis去做mybatis的二级缓存,mybaits映射文件中所有的select都会刷新已有缓存,如果不存在就会新建缓存,所有的insert,update操作都会更新…

鸿蒙应用调测助手,想不到吧,鸿蒙上可以开发小游戏了!

11 月 4 日,首批 HarmonyOS 系统课程开发者张荣超老师为大家带来了一场主题为《从零开发鸿蒙小游戏APP》的精彩公开课,课上很多网友提出了自己关心的问题,下面我们就来和大家分享其中的精华部分:01如何将开发的 Lite Wearable 项目…

实战 MySQL 高可用架构

这是悟空的第 147 篇原创文章 ​官网:www.passjava.cn 你好,我是悟空。 业界流传一句话:没有做过运维的程序员不是好架构师。 不知是真是假。 前言 对于 MySQL 数据库作为各个业务系统的存储介质,在系统中承担着非常重要的职责…

内推|底层翻身的机会来了,快来看一看!

hi,大家好,又到了黄金的跳槽季节,喜欢底层技术的同学,可以看一看机会,不跳槽的也可以看一下自己能力是否满足市场需求,随时准备好,机会总是留给有准备的人。做底层技术有些优势:低层…

鸿蒙 华为watch gt3手表hello world

1新建liteWerable项目helloworld,生成.p12文件 生成csr文件 2发邮件给agconnecthuawei.com,写明,开发者名称:,申请背景:Developer ID:(Developer ID:在appgallery connect里的我的项目里获取,当…

一文看懂FPGA原型验证的技术进阶之路

reference: https://www.eefocus.com/eda-pcb/470325 电子设计自动化—— Electronic Design Automation,简称 EDA。作为芯片设计最上游,EDA 软件的工作,是要在芯片那么小的空间进行布局布线、版图、设计规则检查等,好比在米粒上…

fpga arm 通讯_自研VS商业,实测主流FPGA原型验证平台

由于工作的关系,我一直在FPGA上进行芯片的原型验证。所以不自谦地说,作为一个拥有深厚FPGA背景的芯片工程师,原先都一直在用公司自研的FPGA平台(1颗Xilinx VU440 FPGA),也练就了扎实的芯片剪裁,手动分割,后…

女朋友今年想要特别的礼物,来块鸿蒙(HarmonyOS)运动表如何!顺便教女朋友开发鸿蒙App,结果却掉链子了,太尴尬了

目录 1. 创建Lite Wearable工程 2. 用预览器运行Lite Wearable app 3. 用模拟器运行Lite Wearable App 4. 在真机上部署Lite Wearable App 20年没带手表的我,为了鸿蒙(HarmonyOS),花了2000多买了块华为运动表,赶紧…

Zebu基本使用说明

1. ZS4一块module共有12块VU440,其基本架构如下: 2. 主要特性 ZeBu Server 支持多种软硬件调试模式: 支持原型验证支持验证加速,及带宽分析支持低功耗仿真 服务器每个module都通过PCIE与runtime机器互连, 可以支持多用…

2023CUPT第七题 法拉第波 思路和解法

本文未完原题A droplet of less viscous liquid floating in a bath of a more viscous liquid develops surprising wave- like patterns when the entire system is set into vertical oscillation. Investigate this phenomenon and the parameters relevant to the product…

zabbix 快速入门

zabbix 快速入门 zabbix介绍 ​ Zabbix是由 Alexei Vladishev 开发的一种网络监视,管理系统,基于Server-Client架构。可以使用多种方式监视。可以只使用 Simple Check 不需要安装 Client 端,亦可基于 SMTP 或 HTTP … 各种协议定制监视。 …

Linux命令整理(二)

Linux命令整理(二) 文章目录Linux命令整理(二)8、正则表达式与文件格式化处理8.1、基础正则表达式8.2、grep 的一些进阶选项8.3、sed 工具8.4、延伸的正则表达式9、文件格式化与相关处理9.1、格式化打印:printf9.2、aw…

图卷积在语义分割上的应用(论文集)

文章目录2018Graph-Based Global Reasoning Networks2019Graph-FCN for image semantic segmentationDual Graph Convolutional Network for Semantic SegmentationCCNet: Criss-Cross Attention for Semantic Segmentation2020GINet: Graph Interaction Network for Scene Par…

fNIRS 公开数据集整理

关注“心仪脑”查看更多脑科学知识的分享。 关键词:数据整理、fNIRS 之前我们向大家推送了 Public Neuroscience Dataset 系列主题的第一期: 《EEG公开数据集》,我们同时意识到大家对于神经科学公开数据集的需求。本期是该系列主题的第二期…

python基础训练—字符串

文章目录 1、字符串的理解 2、字符串是数组 3、获取字符串的长度 4、检查字符串 5、修改字符串 6、字符串的其他处理方法 字符串的理解 python中的字符串是被单引号或是双引号(英文输入法)所包围(python中的单引号和双引号的作用相同),我们可以用print()显示字符串…

javascript学习之路1

web发展史 Mosaic,是互联网历史上第一个获普遍使用和能够显示图片的网页浏览器。于1993年问世。 1994年11月,Mosaic浏览器的开发人员创建了网景公司(Netscape Communications Corp.),并发布了Mosaic Netscape 1.0 beta浏览器&am…