hello,大家好
这里是第八期概率论与数理统计的学习,我将用这篇博客去总结这期的知识点以及实现用C语言去做题的过程。
本期知识点:
- 条件分布
- 条件分布的概念
- 离散型随机变量的条件概率分布
- 连续型随机变量的条件概率密度
- 随机变量的独立性
那么首先进入知识总结的环节
💦 条件分布
☁️ 条件分布的概念
请大家先回忆一下,我们最开始是不是也学过这个啥条件的东西?
对的,在前面的那叫条件概率,是对随机事件而言的,因为那时还没引入随机变量。(在这里呢大家可以看看前面那期有关条件概率的博客→\rightarrow→条件概率)
注意了嗷,但这个知识点的标题是条件分布,其实两者概念上是差不多的,只是针对的知识点不同而已。
那么什么是条件分布呢?“分布”一词是与随机变量绑定在一起的,所以,也就是说条件分布一定是与随机变量有关的。
🌱 定义:设有两个随机变量XXX和YYY,在给定了YYY取某个值或某些值的条件下,XXX的分布称为XXX的条件分布。同时也要注意❗️,这两个随机变量是有联系的,即它们之间可以构成随机向量的关系。
既然概念已经搞清楚了,又因为它还是涉及到随机变量,而我们所学习的随机变量又分为两种情况:离散型和连续型。所以下面又是对这两种情况分别讲解。
☁️ 离散型随机变量的条件概率分布
首先,我们需要借鉴一下下条件概率的知识点。对于两个事件AAA和BBB,我们知道在BBB已发生的条件下AAA发生的概率的求法为:P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB),它表示的是A、BA、BA、B同时发生的概率除以BBB发生的概率。
那么根据这个知识点,我们可以推出,对于给定YYY值,求XXX的分布列的求法为:X、YX、YX、Y两个值都给定的概率(对照上面的说法),除以YYY给定值的概率(就是不管XXX的值是多少),即P{X=xi∣Y=yi}=P{X=xi,Y=yi}P{Y=yi}P\{X=x_{i}|Y=y_{i}\}=\frac{P\{X=x_{i},Y=y_{i}\}}{P\{Y=y_{i}\}}P{X=xi∣Y=yi}=P{Y=yi}P{X=xi,Y=yi}
是不是这样子捏?
又由上一节可以知道啊,P{X=xi,Y=yi}=pijP\{X=x_{i},Y=y_{i}\}=p_{ij}P{X=xi,Y=yi}=pij,P{Y=yi}=p⋅jP\{Y=y_{i}\}=p_{·j}P{Y=yi}=p⋅j。于是👇
🌱 定义:对于给定的jjj,在Y=yjY=y_{j}Y=yj条件下随机变量的条件概率分布为:P{X=xi∣Y=yi}=pijp⋅ji=1,2...P\{X=x_{i}|Y=y_{i}\}=\frac{p_{ij}}{p_{·j}}~~~~~~~~i=1,2...P{X=xi∣Y=yi}=p⋅jpij i=1,2...
同样,对于给定的iii,在X=xiX=x_{i}X=xi条件下随机变量的条件概率分布为:P{Y=yj∣X=xi}=pijpi⋅j=1,2...P\{Y=y_{j}|X=x_{i}\}=\frac{p_{ij}}{p_{i·}}~~~~~~~~j=1,2...P{Y=yj∣X=xi}=pi⋅pij j=1,2...
那么离散型随机变量的条件概率分布就搞定啦!
☁️ 连续型随机变量的条件概率密度
注意注意噢!上一个标题是条件概率分布,这个标题是条件概率密度了,这是为啥?
概率分布是离散型随机变量的性质,概率密度是连续型随机变量的性质(把离散型和连续型分清楚就好了)。
对于一个随机变量的给定值,求它的概率在连续型这是行不通的,由连续型随机变量的性质可知:对任意x,yx,yx,y,P{X=x}=0,P{Y=y}=0P\{X=x\}=0,P\{Y=y\}=0P{X=x}=0,P{Y=y}=0。所以我们这里要把这个点扩散到一个范围,使它“连续”。也就是使这个点处于一个很小很小很小的一个范围内就行了。总之就是要使它有个范围!
🌱 定义:给定yyy,设对于任意固定的ϵ>0\epsilon >0ϵ>0,P{y−ϵ<Y≤y+ϵ}>0P\{y-\epsilon <Y\leq y+\epsilon\}>0P{y−ϵ<Y≤y+ϵ}>0,且若对于任意实数xxx,极限limϵ→0+P{X≤x∣y−ϵ<Y≤y+ϵ}=limϵ→0+P{X≤x,y−ϵ<Y≤y+ϵ}P{y−ϵ<Y≤y+ϵ}\lim_{\epsilon\to0^+}P\{X\leq x|y-\epsilon<Y\leq y+\epsilon\}=\lim_{\epsilon\to0+}\frac{P\{X\leq x,y-\epsilon<Y\leq y+\epsilon\}}{P\{y-\epsilon<Y\leq y+\epsilon\}}ϵ→0+limP{X≤x∣y−ϵ<Y≤y+ϵ}=ϵ→0+limP{y−ϵ<Y≤y+ϵ}P{X≤x,y−ϵ<Y≤y+ϵ}
存在,则称此极限为在条件Y=yY=yY=y下XXX的条件分布函数,记为P{X≤x∣Y=y}P\{X\leq x|Y=y\}P{X≤x∣Y=y}或FX∣Y(x∣y)F_{X|Y}(x|y)FX∣Y(x∣y)。
同样注意注意!
到这里,我们先清楚清除,这期的标题:连续型随机变量的条件概率密度,据我所知,概率密度好像是一个类型f(x)f(x)f(x)这样的“fff”开头的函数吧?
OK,从上面定义的结论可知,我们得到了条件分布函数,又由前面的知识可知啊,条件分布函数的导数就是概率密度函数(大概是这样,具体情况具体分析),也就是说有FX∣Y(x∣y)=∫−∞xfX∣Y(u∣y)duF_{X|Y}(x|y)=\int_{-\infty}^{x}f_{X|Y}(u|y)duFX∣Y(x∣y)=∫−∞xfX∣Y(u∣y)du
那么,这个fX∣Y(x∣y)f_{X|Y}(x|y)fX∣Y(x∣y)就是我们要找的概率密度函数啦!(上面的uuu是为了区分变量xxx和值xxx)
好了,真正的定义它来了!!
🌱 定义:设二维连续型随机变量(X,Y)(X,Y)(X,Y)的概率密度函数为f(x,y)f(x,y)f(x,y),YYY的边缘概率密度函数为f(y)f(y)f(y),若f(x,y)f(x,y)f(x,y)在点(x,y)(x,y)(x,y)处连续,f(y)f(y)f(y)在yyy处连续,则有:fX∣Y(x∣y)=f(x,y)f(y)f_{X|Y}(x|y)=\frac{f(x,y)}{f(y)}fX∣Y(x∣y)=f(y)f(x,y)
同样的有:fY∣X(y∣x)=f(x,y)f(x)f_{Y|X}(y|x)=\frac{f(x,y)}{f(x)}fY∣X(y∣x)=f(x)f(x,y)
这里就不对它们进行证明咯,有兴趣的大家下去了解吧!
💦 随机变量的独立性
之前我们学过了两个随机事件的相互独立性,可表示为P(AB)=P(A)P(B)P(AB)=P(A)P(B)P(AB)=P(A)P(B)
那么又来对比,P{X≤x,Y≤y}=P{X≤x}P{Y≤y}P\{X\leq x,Y\leq y\}=P\{X\leq x\}P\{Y\leq y\}P{X≤x,Y≤y}=P{X≤x}P{Y≤y},而这个式子又可以写成为F(x,y)=F(x)F(y)F(x,y)=F(x)F(y)F(x,y)=F(x)F(y)
通常在题目中,有可能要根据F(x,y)F(x,y)F(x,y)求F(x)F(x)F(x)或F(y)F(y)F(y),这里可以介样子求:F(x)=F(x,+∞)F(x)=F(x,+\infty)F(x)=F(x,+∞),然后带入+∞+\infty+∞到yyy中即可,同理可求得F(y)F(y)F(y)。
(别问为啥要说一下这个,问就是今天做题想了半天)
由前面的知识可知,分布函数是随机变量(随机向量)的特性,也就是说适用于离散型和连续型,于是乎,下面又要分两种情况来介绍~~
不过这次就比较简单易懂了。
☁️ 离散型随即变量的独立性
依照随机事件的独立性直接给出公式:P{X=xi,Y=yi}=P{X=xi}P{Y=yi}P\{X=x_{i},Y=y_{i}\}=P\{X=x_{i}\}P\{Y=y_{i}\}P{X=xi,Y=yi}=P{X=xi}P{Y=yi}
☁️ 连续型随机变量的独立性
f(x,y)=f(x)f(y)f(x,y)=f(x)f(y)f(x,y)=f(x)f(y)
时刻牢记离散型于连续型的区别和特性!!!!!!
💦 C语言实现案例
先来一个简单的练练手
- 设二维随机向量(X,Y)(X,Y)(X,Y)的概率分布如下表所示,它的条件概率分布
X\Y | 0 | 2 | 5 |
---|---|---|---|
1 | 0.15 | 0.25 | 0.35 |
3 | 0.05 | 0.18 | 0.02 |
题目分析:做题的话这个题直接按照公式套就行了,十分简单
#include <stdio.h>
#include <malloc.h>
int main()
{float **XY; // use a two-dimensional array to restore the probability of (X,Y) ——用二维数组来存储(X,Y)的概率分布int row; // 行int column; // 列printf("Please input the values of the row and column:"); // 请输入行和列的值 scanf("%d,%d",&row,&column);printf("\n");// allocate space for the two-dimensional array ——为二维数组分配空间XY = (float **) malloc (sizeof(float *) * row);// allocate space for the columns of each line ——为每一行分配列的空间for(int i = 0 ; i < row ; i++)XY[i] = (float *) malloc (sizeof(float) * column);printf("Please input the datas according to the line:\n"); // 请按行输入数据for(int i = 0 ; i < row ; i++){for(int j = 0 ; j < column ; j++){scanf("%f",*(XY + i) + j);}}// use two arraies X and Y to restore the serial numbers of X and Y ——用两个一维数组去存储X、Y的序号int *X = (int *) malloc (sizeof(int) * row);int *Y = (int *) malloc (sizeof(int) * column);printf("Please input the serial numbers of X:"); // 请输入X的序号scanf("%d,%d",X,X + 1);printf("Please input the serial numbers of Y:"); // 请输入Y的序号scanf("%d,%d,%d",Y,Y + 1,Y + 2);printf("\n");printf("The distribution of (X,Y) is:\n"); // (X,Y)的概率分布为for(int i = 0 ; i < row ; i++){for(int j = 0 ; j < column ; j++)printf("%.2f ",XY[i][j]);printf("\n");}printf("\n");// start to calculate according to the distribution of conditional probability ——开始按照条件概率分布计算for(int i = 0 ; i < row ; i++){float sum = 0;for(int j = 0 ; j < column ; j++)sum += XY[i][j];for(int j = 0 ; j < column ; j++){float p = XY[i][j] / sum;printf("P{Y=%d|X=%d}=%.3f\n",Y[j],X[i],p);}}for(int j = 0 ; j < column ; j++){float sum = 0;for(int i = 0 ; i < row ; i++)sum += XY[i][j];for(int i = 0 ; i < row ; i++){float p = XY[i][j] / sum;printf("P{X=%d|Y=%d}=%.3f\n",X[i],Y[j],p);}}return 0;
}
代码分析:整体来说代码都挺简单的,就是在输出的时候,XXX的值不是0,1而是1,3,YYY的值不是0,1,2而是0,2,5。这里呢我们就需令设两个数组来存储它们的序号。
- 求上题中的XXX和YYY是否相互独立?
题目分析:将数据带入公式判断即可。
#include <stdio.h>
#include <malloc.h>
#include <stdbool.h>
int main()
{int row;int column;printf("Please input the values of row and column:");scanf("%d,%d",&row,&column);float **XY;XY = (float **) malloc (sizeof(float *) * row);for(int i = 0 ; i < row ; i++)XY[i] = (float *) malloc (sizeof(float) * column);printf("Then please input the datas:\n");for(int i = 0 ; i < row ; i++)for(int j = 0 ; j < column ; j++)scanf("%f",&XY[i][j]);printf("The distrubution of (X,Y) is displayed as below:\n");for(int i = 0 ; i < row ; i++){for(int j = 0 ; j < column ; j++){printf("%.2f ",XY[i][j]);}printf("\n");}printf("\n");bool pos = true;int i = 0,j = 0;while(pos == true && i < row && j < column){float sum1 = 0,sum2 = 0;for(int k = 0 ; k < column ; k++)sum1 += XY[i][k];for(int k = 0 ; k < row ; k++)sum2 += XY[k][j];if(sum1 * sum2 != XY[i][j])pos = false;i++;j++;}if(pos == true)printf("X and Y are relatively independent."); // X和Y相对独立elseprintf("X and Y aren't relatetively independent."); // X和Y不相互独立return 0;
}
代码分析:代码其实跟上个题差不多的,就是算题的方法不太一样。
这期学习就到这里啦,下期再见