统计代写|Testing Independence 抽样理论代考
统计代写
In this section we will test whether two variables are independent.
Example 1 Is there a relation between the level of education and smoking? Assume that a random sample of 200 was taken with the following results:
\begin{tabular}{l|l|l}
\hline Education & Smoker & Non-smoker \
\hline 8 years or less & 9 & 38 \
\hline 12 years & 21 & 80 \
\hline 16 years & 5 & 47 \
\hline
\end{tabular}
In this test the null hypothesis $H_{0}$ will be that education level and smoking are independent. The alternative hypothesis $H_{a}$ is that there is an association between the two variables. In order to decide whether to reject the null hypothesis we will compare the counts in our sample to the expected counts under the null hypothesis.
We now explain how to compute the expected counts under the null hypothesis. The probability that someone in the sample has 8 years or less of education is
$$
\frac{9+38}{200}=\frac{47}{200}
$$
The probability that someone in the sample be a smoker is
$$
\frac{9+21+5}{200}=\frac{35}{200}
$$
Recall that the events $A$ and $B$ are independent if and only if
$$
P(A \cap B)=P(A) P(B) .
$$
(1) Springer Nature Switzerland AG 2022
R. B. Schinazi, Probability with Statistical Applications,
Thus, under the assumption that level of education and smoking are independent the probability that someone taken at random in the sample has 8 years or less of education and smoke is
$$
\frac{47}{200} \times \frac{35}{200}
$$
The expected number among 200 people who have 8 years or less of education and smoke is therefore
$$
200 \times \frac{47}{200} \times \frac{35}{200}=\frac{47 \times 35}{200}
$$
More generally,
- The expected count in a cell under the independence assumption is given by
$$
\text { expected count }=\frac{\text { row total } \times \text { column total }}{\text { sample size }}
$$
We now go back to the data of Example 1 and compute the expected counts for all the cells.
Expected Counts
\begin{tabular}{l|l|l}
\hline Education & Smoker & Non-smoker \
\hline 8 years or less & $8.225$ & $38.775$ \
\hline 12 years & $17.675$ & $83.325$ \
\hline 16 years & $9.1$ & $42.9$ \
\hline
\end{tabular}
To compute the $\mathrm{P}$ value of this test we use
$$
X^{2}=\sum \frac{(\text { observed-expected })^{2}}{\text { expected }}
$$
Intuitively, since $X^{2}$ measures how far away each count in the sample is from the expected count under $H_{0}$, we should reject independence if $X^{2}$ is large enough. More precisely, - To tcst whether two variables arc rclated we use the statistic $X^{2}$. Let $r$ and $c$ bc the number of rows and columns. resnectively. The $P$ value for this test is given
在本节中,我们将测试两个变量是否独立。
例 1 受教育程度与吸烟有关系吗?假设随机抽取 200 个样本,结果如下:
\begin{表格}{l|l|l}
\hline 教育 & 吸烟者 & 非吸烟者 \
\hline 8 年或更少 & 9 & 38 \
\hline 12 年 & 21 & 80 \
\hline 16 年 & 5 & 47 \
\hline
\end{表格}
在这个测试中,原假设 $H_{0}$ 将是教育水平和吸烟是独立的。备择假设 $H_{a}$ 是两个变量之间存在关联。为了决定是否拒绝原假设,我们将样本中的计数与原假设下的预期计数进行比较。
我们现在解释如何在零假设下计算预期计数。样本中某人受教育年限为 8 年或以下的概率为
$$
\frac{9+38}{200}=\frac{47}{200}
$$
样本中某人是吸烟者的概率是
$$
\frac{9+21+5}{200}=\frac{35}{200}
$$
回想一下,事件 $A$ 和 $B$ 是独立的当且仅当
$$
P(A \cap B)=P(A) P(B) 。
$$
(1) Springer Nature Switzerland AG 2022
R. B. Schinazi,概率与统计应用,
因此,在教育水平和吸烟独立的假设下,随机抽取的样本中某人的教育和吸烟年龄为 8 年或更少的概率为
$$
\frac{47}{200} \times \frac{35}{200}
$$
因此,在 200 名受教育年限为 8 年或以下且吸烟的人中的预期人数为
$$
200 \times \frac{47}{200} \times \frac{35}{200}=\frac{47 \times 35}{200}
$$
更普遍,
- 在独立假设下,单元格中的预期计数由下式给出
$$
\text { 预期计数 }=\frac{\text { 行总数 } \times \text { 列总数 }}{\text { 样本大小 }}
$$
我们现在回到示例 1 的数据并计算所有单元格的预期计数。
预期计数
\begin{表格}{l|l|l}
\hline 教育 & 吸烟者 & 非吸烟者 \
\hline 8 年或更少 & $8.225$ & $38.775$ \
\hline 12 年 & $17.675$ & $83.325$ \
\hline 16 年 & $9.1$ & $42.9$ \
\hline
\end{表格}
为了计算这个测试的 $\mathrm{P}$ 值,我们使用
$$
X^{2}=\sum \frac{(\text { 观察到预期 })^{2}}{\text { 预期 }}
$$
直观地说,由于 $X^{2}$ 衡量样本中每个计数与 $H_{0}$ 下的预期计数的距离,如果 $X^{2}$ 足够大,我们应该拒绝独立性。更确切地说, - 为了判断两个变量是否相互关联,我们使用统计量 $X^{2}$。让 $r$ 和 $c$ bc 为行数和列数。相应地。给出了此测试的 $P$ 值
统计代考
其他相关科目课程代写:组合学Combinatorics集合论Set Theory概率论Probability组合生物学Combinatorial Biology组合化学Combinatorial Chemistry组合数据分析Combinatorial Data Analysis
my-assignmentexpert愿做同学们坚强的后盾,助同学们顺利完成学业,同学们如果在学业上遇到任何问题,请联系my-assignmentexpert™,我们随时为您服务!
抽样理论(sampling theory)是关于从总体中抽取具有代表性的和适当的样本以得出有效推论的原则和分析技术的一种统计学理论。包括两个主题:(1)样本如何抽取,即抽样方法的问题。如随机抽样、分层抽样、分层等比抽样、系统抽样、群类抽样、有限总体抽样等;(2)样本大小的问题。
计量经济学代考
计量经济学是以一定的经济理论和统计资料为基础,运用数学、统计学方法与电脑技术,以建立经济计量模型为主要手段,定量分析研究具有随机性特性的经济变量关系的一门经济学学科。 主要内容包括理论计量经济学和应用经济计量学。 理论经济计量学主要研究如何运用、改造和发展数理统计的方法,使之成为经济关系测定的特殊方法。
相对论代考
相对论(英語:Theory of relativity)是关于时空和引力的理论,主要由愛因斯坦创立,依其研究对象的不同可分为狭义相对论和广义相对论。 相对论和量子力学的提出给物理学带来了革命性的变化,它们共同奠定了现代物理学的基础。
编码理论代写
编码理论(英语:Coding theory)是研究编码的性质以及它们在具体应用中的性能的理论。编码用于数据压缩、加密、纠错,最近也用于网络编码中。不同学科(如信息论、电机工程学、数学、语言学以及计算机科学)都研究编码是为了设计出高效、可靠的数据传输方法。这通常需要去除冗余并校正(或检测)数据传输中的错误。
编码共分四类:[1]
数据压缩和前向错误更正可以一起考虑。
复分析代考
学习易分析也已经很冬年了,七七八人的也续了圧少的书籍和论文。略作总结工作,方便后来人学 Đ参考。
复分析是一门历史悠久的学科,主要是研究解析函数,亚纯函数在复球面的性质。下面一昭这 些基本内容。
(1) 提到复变函数 ,首先需要了解复数的基本性左和四则运算规则。怎么样计算复数的平方根, 极坐标与 $x y$ 坐标的转换,复数的模之类的。这些在高中的时候囸本上都会学过。
(2) 复变函数自然是在复平面上来研究问题,此时数学分析里面的求导数之尖的运算就会很自然的 引入到复平面里面,从而引出解析函数的定义。那/研究解析函数的性贡就是关楗所在。最关键的 地方就是所谓的Cauchy一Riemann公式,这个是判断一个函数是否是解析函数的关键所在。
(3) 明白解析函数的定义以及性质之后,就会把数学分析里面的曲线积分 $a$ 的概念引入复分析中, 定义几乎是一致的。在引入了闭曲线和曲线积分之后,就会有出现复分析中的重要的定理: Cauchy 积分公式。 这个是易分析的第一个重要定理。