卡方检验的基本原理详解

news/2023/5/28 7:08:38

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 一、卡方检验基本原理
    • 1. 1 χ2统计量计算公式
    • 1.2 理论频数如何计算?
    • 1.3 χ2值的结果如何理解?
    • 1.4 χ2检验的自由度如何理解?
    • 1.5 χ2检验的步骤
    • 1.6 四格表专用公式
    • 1.7 为什么在样本量较小或理论频数较小时,不能使用χ2检验?
  • 二、配对χ2检验
    • 2.1 什么是配对?
    • 2.2 配对χ2的统计量
    • 2.2 配对χ2检验的步骤
  • 三、行*列资料的χ2检验
    • 3.1 行*列资料的χ2检验统计量
    • 3.2 行*列资料的χ2检验步骤
    • 3.3 行*列资料的χ2检验的应用
    • 3.4 R*C表χ2检验的注意事项
    • 3.5 R*C表资料的检验方法选择
  • 四、多样本率间的多重比较
  • 五、CMH χ2统计量(Cochran-Mantel-Haenszel χ2检验)
    • 5.1 CMH χ2统计量的分类
  • 五、拟合优度检验


一、卡方检验基本原理

比较试验组和对照组的疗效(有效率),将200例患者1:1随机分配为两组,结果如下:
在这里插入图片描述
abcd的四个数组成了四格表(fourfold table),也称列联表(contingency table)。
比较试验组和对照组的有效率是否有差异?即试验组85.29%的有效率与对照组66.33%之间是否有统计学差异?(目的)
两样本率的比较,用chi-square检验两样本总体率是否有差异。(方法)

1. 1 χ2统计量计算公式

在这里插入图片描述

1.2 理论频数如何计算?

基于原假设H0:π1=π2确定。即试验组和对照组的有效率相等。
总体的有效率:(a+c)/(a+b+c+d) 152/200=76%
a理论频数:(a+b)76% 10276%=77.52
c理论频数:(c+d)76% 9876%=74.48
理论频数计算公式:
在这里插入图片描述
在这里插入图片描述

1.3 χ2值的结果如何理解?

在这里插入图片描述

1.4 χ2检验的自由度如何理解?

χ2检验的自由度v取决于自由取值的格子数,不是样本量。四格表只有两行两列,v=1。当周边合计固定的情况下,4个数只有一个可以自由取值。计算出一个理论频数后,其他3个可以通过周边合计计算出来。

1.5 χ2检验的步骤

Step1:建立假设
H0:π1=π2 即试验组与对照组有效率相等
H1:π1≠π2 即试验组与对照组有效率不相等
α=0.05

Step2:计算理论频数,统计量
χ2= 9.8582
Step3:根据自由度查χ2检验界值表,在α水平下,得出结论
p=0.0017 p<0.05
拒绝H0,接受H1,试验组和对照组有效率不相等。

1.6 四格表专用公式

在这里插入图片描述
在这里插入图片描述
公式的使用方法
(1) n≥40,且所有的T≥5(理论频数)时,用χ2基本公式或四格表专用公式。P≈α,采用Fisher确切概率法。
(2) n≥40,且所有的1≤T≤5时,用校正公式,或用Fisher确切概率法。
(3) n<40,或T<1时,用Fisher确切概率法。

1.7 为什么在样本量较小或理论频数较小时,不能使用χ2检验?

χ2分布是一个连续的分布,只有一个参数,自由度。
计数资料的实际频数是分类资料,是不连续的,计算的χ2值是离散型分布。当样本量很小的时候,计算出的概率偏小。因此需要校正。
在这里插入图片描述

二、配对χ2检验

2.1 什么是配对?

对样本中各观察单位(每个患者)分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。处理包括:两种检验方法、培养方法、诊断方法等。
a:A方法和B方法均检验为阳性的例数
b:A方法阳性,B方法阴性的例数
c:A方法阴性,B方法阳性的例数
d:A方法和B方法均检验为阴性的例数
a和d为两种方法一致的情况,c和b为两种方法不一致的情况。
两种方法无差别时,b=c。
在这里插入图片描述

2.2 配对χ2的统计量

在这里插入图片描述

说明:当n很大且a和d的数值很大(两方法抑制率较高),b和c的数值相对较小,即便检验结果有统计学意义,其实际意义往往不大,该方法不适用。因为该方法仅考虑了两方法不一致的情况(b、c),未考虑样本含量n和两方法一致的情况(a、d)。

2.2 配对χ2检验的步骤

Step1:建立假设
H0:B=C 即两种方法检测结果相同
H1:B≠C 即两种方法检测结果不相同
α=0.05

Step2:计算理论频数,统计量
因b+c<40,所以采用校正公式。
χ2=(|12-2|-1)^2/(12+2) = 5.79
Step3:根据自由度查χ2检验界值表,在α水平下,得出结论
p<0.05,拒绝H0,接受H1,试验组和对照组有效率不相等。

三、行*列资料的χ2检验

3.1 行*列资料的χ2检验统计量

在这里插入图片描述

3.2 行*列资料的χ2检验步骤

Step1:建立假设
H0:π1=π2 =π3 即3种方法的有效率相等
H1:π1≠π2≠π3 即3种方法的有效率不全相等
α=0.05

Step2:计算统计量
χ2= 21.04 v=(3-1)*(2-1)=2
Step3:根据自由度查χ2检验界值表,在α水平下,得出结论
p<0.05
拒绝H0,接受H1,3种治疗方法有差别。

3.3 行*列资料的χ2检验的应用

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3.4 R*C表χ2检验的注意事项

(1) 行列表中理论频数太小(T<1,1≤T≤5的格子数超过1/5),解决方法:
1、 增加样本量,扩大理论频数;
2、 根据专业知识合并或删除
3、 双向无序R*C表的Fisher确切概率法。

(2) 多样本率的比较,拒绝H0,仅认为各总体率之间总的来说是有差异的,不能说明任一两个样本之间存在差异。

(3) 有序分类资料不宜用χ2检验,因为行列表的χ2检验与分类变量的顺序无关,行列的频数互换,所得的χ2值是不变的,但对于有序分类变量这是不妥的。根据分类类型和研究目的选择恰当的检验方法(秩和检验)。

3.5 R*C表资料的检验方法选择

(1) 双向无序:多样本率、构成比的比较,两分类变量之间的关联性(独立性)检验。

(2) 单向有序(看指标变量是否是有序的)
1、 R有序,C无序:分组变量(年龄)有序,指标变量(疾病种类)无序,研究分析不同年龄组各疾病的构成情况,采用χ2检验。
2、 R无序,C有序:分组变量(治疗方法)无序,指标变量(严重程度)有序,比较不同治疗方法的疗效,采用秩和检验。

(3) 双向有序(属性相同):四格表配对资料的扩展,两种方法同时对一批样本的测定结果。研究目的是分析两种检测方法的一致性,采用一致性检验或Kappa检验。

(4) 双向有序(属性不同)
1、 分析目的与分组的序列无关,将其视为单项有序R*C资料。不同年龄组患者之间疗效是否有差异。采用秩和检验。
2、 分析两个有序分类变量之间是否存在相关关系,采用等级相关分析。
3、 分析两个有序分类变量之间是否存在线性变化趋势,采用线性趋势检验。

四、多样本率间的多重比较

多样本率的比较的R*C表χ2检验,拒绝H0,接受H1时,只能认为总体率有差别,不能认为任一两两有差异。进一步推断具体哪两个有差异,不能直接进行两两χ2检验,会增加I类错误。采用χ2分割法,Scheffe’可信区间法,SNK法。

χ2分割法基本原理
重新规定检验水准,目的是控制I类错误,保证α不变。
α^'=α/比较次数
(1)多个实验组两两比较
比较次数=(k(k-1))/2+1 k=组别数
(2)多个实验组与同一个对照组比较
比较次数=2(k-1) k=组别数
在这里插入图片描述

五、CMH χ2统计量(Cochran-Mantel-Haenszel χ2检验)

高维列联表的分析,控制了某一个或几个混杂因素(分层变量)之后,检验二维R*C表中行变量X与列变量Y之间是否存在统计学关联。
H0:任一层的行变量与列变量均不相关
H1:至少存在一层行变量与列变量均相关
当各层行变量与列变量相关的方向不一致时,CMH统计量的检验效能较低。

5.1 CMH χ2统计量的分类

(1) 相关统计量
X、Y均为有序变量,自由度为1。

(2) 方差分析统计量(行平均得分统计量)
Y为有序变量,自由度为R-1。
H0:所有层的各行Y变量平均得分均相等
H1:至少又一层各行Y变量平均得分均不相等
一维R*C列联表=各行Y变量平均得分的方差分析
秩和检验:Kruskal-Wallis检验。

(3) 一般关联统计量
X、Y均为无序分类资料,目的是检验是否有关联性。
分层变量校正的Pearson χ2统计量。自由度(R-1)*(C-1)。
CMH χ2统计量(以四格表为例)
第h层的四格表
在这里插入图片描述
在这里插入图片描述

五、拟合优度检验

推断频率分布是否符合某一理论分布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.exyb.cn/news/show-4559268.html

如若内容造成侵权/违法违规/事实不符,请联系郑州代理记账网进行投诉反馈,一经查实,立即删除!

相关文章

contos7设置固定ip和dns_Centos7最小安装后,静态ip、dns设置

cd /etc/sysconfig/network-scripts/vi ifcfg-eth0TYPEEthernetBOOTPROTOstaticIPADDR192.168.1.199NETMASK255.255.255.0GATEWAY192.168.1.1取消networkmanager 管理NM_CONTROLLEDnoDEFROUTEyesPEERDNSyesPEERROUTESyesIPV4_FAILURE_FATALnoIPV6INITyesIPV6_AUTOCONFyesIPV6_D…

Golang 从菜鸟到大咖的必经之路_GO 语言的转义字符、注释、规范和代码风格要求

目录 一、GO 语言转义字符 A.Golang 常用的转义字符&#xff08;escape char&#xff09;: B.课程练习 二、Go 语言注释&#xff1a; A.注释&#xff08;Comment&#xff09;: B.Go 语言中的注释类型&#xff1a; C.注释不会被编译 D.shifttab 三、规范的代码风格要求…

为什么?win10 浏览器打不开网页,显示,DNS服务器可能不可用,但能登录qq和微信,

有些朋友可能会发现&#xff0c;为什么我可能登陆QQ、微信&#xff0c;但却打不开网页呢&#xff1f; 解决方法&#xff1a; 当前状态下&#xff1a;进入命令行—输入ipconfig/all——记住返回的DNS服务器后的地址例如&#xff1a;8.8.8.8 控制面板 \ 所有控制面板项 \ 网络连…

dns劫持!导致微信jssdk上挂广告

这几天在做一个微信的投票网页&#xff0c;用的是vuequasar UI框架&#xff0c;结果这几天发现偶尔上网页后有广告&#xff0c;如下图红色方框 以为自己的虚拟主机被攻击&#xff0c;但反复检查了都感觉没啥问题&#xff0c;然后怀疑是不是quasar这个框架有问题&#xff0c;因为…

微信打开网页竟然走微信自己的DNS

2019独角兽企业重金招聘Python工程师标准>>> 终于知道为什么第一次在微信里打开一个网页为啥那么慢了&#xff0c;竟然走了一遍它自己的DNS。 今天局域网内做测试&#xff0c;用了DNS劫持&#xff0c;在wifi环境的手机浏览器打开一切正常&#xff0c;按照劫持的走&a…

Java内存模型和线程安全

Java内存模型和线程安全Java内存模型引言volatile关键字synchronized关键字Java线程Java线程安全synchronized锁优化锁优化技巧列举自旋锁锁消除锁粗化具体实现轻量级锁偏向锁Java内存模型 引言 对于多核处理器而言,每个核都会有自己单独的高速缓存,又因为这多个处理器共享同一…

高德地图目前是哪个集团下的公司?

其实在2014年02月&#xff0c;阿里巴巴就斥资11亿美元&#xff0c;完成对高德地图的全资收购&#xff0c;所以高德地图目前是属于阿里巴巴集团下的公司了。 在这个路痴众多的时代&#xff0c;高德地图的出现可谓是拯救了一大波路痴者。 人人手机上几乎都安装了高德地图&#…

SNARK原理示例

1. 引言 前序博客有&#xff1a; SNARK DesignRollup项目的SNARK景观 SNARK方案由 Polynomial IOP ➕多项式承诺方案 组成。 当前的Polynomial IOP主要分为三大类&#xff1a; 1&#xff09;基于interactive proofs&#xff08;IPs&#xff09;的Polynomial IOP&#xff1…

win7系统数据库服务器,win7数据库服务器怎么开启

win7数据库服务器怎么开启 内容精选换一换CDC(Change Data Capture)&#xff0c;即数据变更抓取&#xff0c;通过为源端数据源开启CDC&#xff0c;ROMA Connect可实现数据源的实时数据同步以及数据表的物理删除同步。ROMA Connect支持Oracle的XStream和LogMiner两种CDC模式&…

进程概念理解

既然要了解计算机的进程&#xff0c;那么就需要先了解一下计算机的底层结构 目录 冯洛伊曼体系结构 操作系统 系统调用接口 进程 PCB task_struct 内容 操作系统如何组织进程 冯洛伊曼体系结构 想了解计算机的底层结构&#xff0c;那么必定绕不开冯洛伊曼体系结构&…

win7系统iis建立ftp服务器,win7 iis建立ftp服务器

win7 iis建立ftp服务器 内容精选换一换当完成创建外部服务器后&#xff0c;在GaussDB(DWS)数据库中创建一个OBS/HDFS只写外表&#xff0c;用来访问存储在OBS/HDFS上的数据。此外表是只写的&#xff0c;只能用于导出操作。创建外表创建外表的语法格式如下&#xff0c;详细的描述…

1125和855最小公倍数C语言,2016衢州省考行测数量关系送分题:最小公倍数和最大公约数...

二、真题回顾1.如图&#xff0c;街道XYZ在Y处拐弯&#xff0c;XY1125米&#xff0c;YZ855米&#xff0c;在街道一侧等距装路灯&#xff0c;要求X、Y、Z处各装一盏路灯&#xff0c;这条街道最少要安装多少盏路灯?A.47 B.46 C.45 D.44【中公解析】要使X、Y、Z处各装一盏路灯&…

做到这些,再长高10厘米不是梦

标题想长高的盆友就私信我&#xff0c;危害长高的要素有什么&#xff1f;吃的社会学取决于营养均衡&#xff0c;营养成分充足很容易&#xff0c;难的是要确保关键原素的摄取能够 做到是配备。 因此&#xff0c;营养成分篇便是千万不要挑食&#xff0c;提高的关键窍门便是要尤其…

新房装修|厨房台面给我做高了10公分,做饭不方便

真的太想哭了&#xff0c;千算万算&#xff0c;工人竟然把厨房台面做高了&#xff0c;就不知道长点心么&#xff01;而且还不止一点点&#xff0c;足足有10公分&#xff0c;做饭不方便这可咋整啊&#xff0c;以后可是要一直用下去的啊&#xff0c;急急急&#xff01;&#xff0…

kicad最小布线宽度默认是多少_常见停车场管理系统项目的安装布线及注意事项...

现在很多现代化的智能停车场系统都广泛应用于各大小型停车场、地下车库、公寓小区进出口、公司单位的大门口等&#xff0c;智能停车场的主要组成部分是&#xff1a;系统由出口控制机、入口控制机、电动道闸机、车辆检测器、地感、通讯转换器、IC读卡器&#xff0c;停车场管理软…

怎么判断30公分?看我的图文传教就清楚了

想当年&#xff0c;我学车的时候也是糊里糊涂啊&#xff0c;练了一天都没练好&#xff0c;30公分到底是什么鬼&#xff1f;而且不仅是科目二要30公分&#xff0c;科目三也要用到30公分&#xff01;&#xff01;&#xff01;所以说&#xff0c;学会判断30公分&#xff0c;是考车…

75寸的电视机长和宽是多少 75寸电视长宽多少厘米

75寸电视的长和宽&#xff0c;精确为166.03厘米、93.38厘米&#xff0c;大约为166厘米、93厘米。 家里的电视就是活动时8折抢购太给力了 http://www.adiannao.cn/dy 电视的尺寸一般都是代表电视屏幕对角线的长度&#xff0c;所以这里的75寸&#xff0c;其实就是电视屏幕对角线的…

Stream的使用和原理分析

Stream的使用和原理分析1 背景2 基本逻辑原理3 惰性求值4 操作类型5 并行遍历Spliterators6 实现原理初探6.1 代码初步分析6.2 求和的顺序6.3 怎么设计代码按照求和顺序7 源码分析8 Stream idea调试9 原理实现图小结1 背景 Spliterator&#xff08;splitable iterator可分割迭…

Linux常用指令及Web程序的部署

作者&#xff1a;~小明学编程 文章专栏&#xff1a;Linux 格言&#xff1a;热爱编程的&#xff0c;终将被编程所厚爱。 目录 Linux中的常见指令 ls pwd cd 文件操作 touch cat mkdir echo rm cp mv man less vim head tail grep ps netstat Linux权限 搭建Ja…

“华为杯”研究生数学建模竞赛2004年-【华为杯】B题:实用下料的数学模型(附优秀论文)

赛题描述 “下料问题(cutting stock problem)”是把相同形状的一些原材料分割加工成若干个不同规格大小的零件的问题,此类问题在工程技术和工业生产中有着重要和广泛的应用. 这里的“实用下料问题”则是在某企业的实际条件限制下的单一材料的下料问题。 一个好的下料方案首先…