随机变量(random variable)表示随机现象(在一定条件下,并不总是出现相同结果的现象称为随机现象)中各种结果的实值函数(一切可能的样本点)。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等,都是随机变量的实例。随机变量与模糊变量的不确定性的本质差别在于,后者的测定结果仍具有不确定性,即模糊性。随机事件不论与数量是否直接有关,都可以数量化,即都能用数量化的方式表达。随机事件数量化的好处是可以用数学分析的方法来研究随机现象。例如某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数,灯泡的寿命等等,都是随机变量的实例。
详细分析
表示方法
随机试验结果的量的表示。例如掷一颗子出现的点数,电话交换台在一定时间内收到的呼叫次数,随机抽查的一个人的身高,悬浮在液体中的微粒沿某一方向的位移,等等,都是随机变量的实例。
一个随机试验的可能结果(称为基本事件)的全体组成一个基本空间Ω(见概率)。随机变量x是定义于Ω上的函数,即对每一基本事件,有一数值与之对应。以掷一颗骰子的随机试验为例,它的所有可能结果见,共6个,分别记作这时,,而出现的点数这个随机变量x,就是Ω上的函数,。又如设是要进行抽查的n个人的全体,那么随意抽查其中一人的身高和体重,就构成两个随机变量和Y,它们分别是Ω上的函数:”,,。一般说来,一个随机变量所取的值可以是离散的(如掷一颗骰子的点数只取1到6的整数,电话台收到的呼叫次数只取
自然数),也可以充满一个数值区间,或整个实数轴(如液体中悬浮的微粒沿某一方向的位移)。
研究方法
在研究随机变量的性质时,确定和计算它取某个数值或落入某个数值区间内的概率是特别重要的。因此,随机变量取某个数值或落入某个数值区间这样的基本事件的集合,应当属于所考虑的事件域。根据这样的直观想法,利用
概率论公理化的语言,取
实数值的随机变量的数学定义可确切地表述如下:概率空间上的随机变量x是定义于Ω上的实值
可测函数,即对任意, 为实数,且对任意实数x,使的一切ω组成的Ω的
子集是事件,也即是F中的元素。事件 常简记作,并称函数为x的分布函数。
设,Y是概率空间(Ω,F,p)上的两个随机变量,如果除去一个零概率事件外, 与相同,则称以概率1成立,也记作或(α.s.意即几乎必然)。
有些随机现象需要同时用多个随机变量来描述。例如对地面目标射击,弹着点的位置需要两个坐标才能确定,因此研究它要同时考虑两个随机变量,一般称同一概率空间 上的n个随机变量构成的n维
向量为n维随机向量。随机变量可以看作一维随机向量。称n元的函数为X的(联合)分布函数。又如果为二维随机向量,则称为复随机变量。
随机变量的独立性 独立性是
概率论所独有的一个重要概念。设 是n个随机变量,如果对任何n个
实数 都有 即它们的
联合分布函数 等于它们各自的分布函数的乘积,即则称 是独立的。这一定义可以直接推广到每一是随机
向量的情形。独立性的直观意义是: 中的任何一个取值的概率规律,并不随其中的其他随机变量取什么值而改变。在实际问题中通常用它来
表征多个独立操作的
随机试验结果或多种有独立来源的随机因素的概率特性,因此它对于概率统计的应用是十分重要的。
从随机变量(或向量) 的独立性还可以推出:设是取值的空间中的任意
波莱尔集,,则有设 是独立的,则它们中的任意个都是独立的。但逆之即使其中任何个是独立的,也不保证 是独立的。又如果是n个
连续函数或初等函数(或更一般的
波莱尔可测函数),则从 的独立性可推出也独立。如果随机变量(随机
向量)序列 中任何有限个都独立,则称之为独立随机变量(随机向量)序列。
关于随机变量的矩、特征函数、母函数及半不变量,分别见数学期望、
方差、矩及
概率分布。
概念
在做实验时,常常是相对于试验结果本身而言,我们主要还是对结果的某些函数感兴趣。例如,在掷骰子时,我们常常关心的是两颗骰子的点和数,而并不真正关心其实际结果,就是说,我们关心的也许是其点和数为7,而并不关心其实际结果是否是(1,6)或(2,5)或(3,4)或(4,3)或(5,2)或(6,1)。我们关注的这些量,或者更形式的说,这些定义在
样本空间上的实值函数,称为随机变量。
因为随机变量的值是由试验结果决定的,所以我们可以给随机变量的可能值指定概率。
基本类型
简单地说,随机变量是指随机事件的数量表现。例如一批注入某种毒物的动物,在一定时间内死亡的只数;某地若干名男性健康成人中,每人
血色素量的测定值;等等。另有一些现象并不直接表现为数量,例如人口的男女性别、试验结果的阳性或阴性等,但我们可以规定男性为1,女性为0,则非数量标志也可以用数量来表示。这些例子中所提到的量,尽管它们的具体内容是各式各样的,但从数学观点来看,它们表现了同一种情况,这就是每个变量都可以随机地取得不同的数值,而在进行试验或测量之前,我们要
预言这个变量将取得某个确定的数值是不可能的。
按照随机变量可能取得的值,可以把它们分为两种基本类型:
离散型(discrete)随机变量即在一定区间内变量取值为有限个或可数个。例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。离散型随机变量通常依据
概率质量函数分类,主要分为:
雅各布·伯努利随机变量、二项随机变量、几何随机变量和泊松随机变量。
连续型
连续型(continuous)随机变量即在一定区间内变量取值有无限个,或数值无法一一列举出来。例如某地区男性健康成人的身长值、体重值,一批传染性
肝炎患者的
血清转氨酶测定值等。有几个重要的连续随机变量常常出现在
概率论中,如:均匀随机变量、指数随机变量、伽马随机变量和正态随机变量。
期望
离散情形
如果X是离散随机变量,具有
概率质量函数,那么X的
期望值定义为。换句话说,X的期望是X可能取的值的加权平均,每个值被X取此值的概率所加权。
连续情形
我们也可以定义连续随机变量的期望值。如果X是具有概率密度函数f(x)的连续随机变量,那么X的期望就定义为。换句话说,在 上
均匀分布的随机变量的
期望值正是区间的
中点。
性质
随机变量在不同的条件下由于偶然因素影响,可能取各种随机变量不同的值,故其具有不确定性和
随机性,但这些取值落在某个范围的概率是一定的,此种变量称为随机变量。随机变量可以是
离散型的,也可以是连续型的。如分析测试中的测定值就是一个以概率取值的随机变量,被测定量的取值可能在某一范围内随机变化,具体取什么值在测定之前是无法确定的,但测定的结果是确定的,多次重复测定所得到的测定值具有统计规律性。随机变量与模糊变量的不确定性的本质差别在于,后者的测定结果仍具有不确定性,即模糊性。