P值又叫概率值,是让科学家验证猜想是否成功的一个数值。这个值和显著性水平有直接关系,后者是验证科学研究的数据是否有统计上的显著性的重要指标。可以画个表,在计算其他统计值以后来找出P值。卡方是其中要先找出的统计值之一。
步骤
1:计算卡方,比较两组数据。表达式是: (|o-e|-.05)^2/e 。o是观察数据或实际数据,e是期望值。比如要验证“红车司机比蓝车司机要更容易得超速罚单”。
要按过去的研究调查来决定期望值。比如,你过去发现红车得罚单的几率是蓝车的两倍,所以在总数150的数据假设中,你期望的是100辆红车得罚单,50辆蓝车得罚单。
用卡方式。由于观察到90辆红车、60辆蓝车得罚单,得出卡方为2.970075。
2:决定数据自由度。自由度是研究中涉及的变量个数,变量个数受到总类别数的限制。
这里例子中自由度是1,因为卡方中自由度= n-1,n就是数据类别数(两种不同的车,红的和蓝的。)
3:选择显著度。显著度由你决定,一般定为0.05,或5%。这表示5%的总时间内研究结果会因为完全随机而偏离你的猜想,而剩余95%的时间内都符合你的猜想。
这个例子里,5%时间内会数据因为完全随机而偏离猜想,95%时间内的结果都符合你的猜想。
4:用一个卡方分布表来找到P值。卡方分布表会基于自由度和卡方值给出你的P值。这个表在网上或统计教科书中都有。不是所有卡方值都在分布表上有,所以找出最接近你卡方值的卡方值吧。
例子中卡方值是 2.970075。按照表中信息,P值是 0.10。因此样本研究不会显著偏于期望值,因此不能证明“红车拿罚单比蓝车拿得多”的猜想是假的。
小提示
用个科学计算器可以让计算过程快得多。在网上也可以找到计算器。
可以用各种软件计算P值。包括一般使用的制表软件或更专业的统计软件等等。