幂律分布及性质

幂律分布及性质

一、幂律分布及其检验

在上篇文章中说到,许多实际网络的度分布曲线都具有长尾形状。那么什么样的分布函数具有长尾形状呢?答案就是幂律分布。

1、幂律分布定义

很多实际网络的度分布并不服从具有均匀特征的泊松分布,而是可以较好的用如下形式的幂律分布来表示:

其中λ\lambdaλ>0为幂指数,通常取值在2与3之间。

2、幂律分布的检验

2.1 双对数坐标系中的直线

判断一个网络的度分布P(k)是否是幂律分布可以看双对数坐标系中的直线。

假设我们要验证是否存在比例常数C和幂指数λ\lambdaλ,使得近似的有

可以对上式两边取对数,则有

这说明lnP(k)是lnk的线性函数,斜率为-λ\lambdaλ,lnC为纵轴的截距。因此,直观上,如果根据给定的数据,在双对数坐标系中看到近似有一条直线,那么就可以推断所处理的数据近似符合幂律,并且可以从该直线的斜率中得到对应的幂指数。

2.2 累积度分布

直接在双对数坐标系的度分布图中判断是否存在幂律还有另外一个问题:即使我们说网络的度分布在某段范围内服从幂律,实际情形往往会在其中的一些度值处(特别是尾部的一些地方)有明显的类似于噪声扰动的偏差。一种常见的光滑化的处理方法是绘制累积度分布Pk_kk​,它表示的是度不小于k的节点在整个网络中所占的比例,也就是网络中随机选取的一个节点的度不小于k的概率,即有

有些研究也把度小于k的节点在整个网络中所占的比例1-Pk_kk​称为累积度分布。

如果一个网络的度分布为幂律分布,那么累积度分布函数近似符合幂指数为λ\lambdaλ-1的幂律:

注意到由于当k值较大时幂函数变化较为缓慢,所以上式中把离散的求和用连续的积分来近似。为了保证积分收敛 ,这里假设λ\lambdaλ>1。

二、幂律分布的性质

1、无标度性质

定理: 考虑一个概率分布函数 f(x),假设f(1)f’(1)≠0。如果对任意给定常数a,存在常数b使得函数f(x)满足如下“无标度条件”:f(ax) = bf(x),那么必有f(x)=f(1)x−λ^{-\lambda}−λ,λ\lambdaλ=-f’(1)/f(1)。也就是说,幂律分布函数是唯一满足无标度条件的概率分布函数。

2、归一化

幂函数P(k)=CK−λ^{-\lambda}−λ要成为概率分布必须满足如下基本条件:

此外,度值k不能为0,否则p0_00​为无穷大。因此,我们不妨假设幂律分布是当k>=kmin_{min}min​>0时才成立,于是有:

从而得到:

其中

成为广义ζ\zetaζ函数,

称为标准黎曼ζ\zetaζ函数。通过把求和用积分近似,我们可以用如下公式近似计算归一化常数:

从而幂律律分布可以写为:

相应的,累积度分布可以写为:

3、矩的性质

定理:幂律分布P(k)=CK−λ^{-\lambda}−λ存在有限的m阶矩的充要条件为λ\lambdaλ>m+1

相关推荐

手机碎屏险保多长时间?
365bet主页器

手机碎屏险保多长时间?

📅 08-06 👁️ 8387
【花点时间】怎么样?听听用户怎么说
365bet主页器

【花点时间】怎么样?听听用户怎么说

📅 08-14 👁️ 4147
十大葡萄酒最佳搭配排名 红酒兑什么好喝并且健康
开罗游戏哪个好玩 高人气开罗游戏排行榜前十
菠菜365定位

开罗游戏哪个好玩 高人气开罗游戏排行榜前十

📅 09-25 👁️ 514