在模拟的4个基本步骤中,(1)、(2)和(4)是依赖于特定问题的,而第(3)步中随机数的生成则是任何模型的基本要素。实际问题中,由于影响系统的因素很多,在建立系统模型时常作某些假设,而对某些因素则需要忽略不计或将几个因素合并考虑。为了使分析结果更加切合实际,还要进行灵敏度分析,即在固定其他因素不变的条件下分别对感兴趣的因素作变动,并观察其对最后结果的影响。这样就能对真实结果与分析结果的偏离有所认知并预先采取相应对策。
(三)短期风险模型概述
短期风险模型主要有短期聚合风险模型与短期个别风险模型两种,两者的最大区别在于前者中的损失次数变量是一个随机变量,而后者是一个普通常量。因此,在讨论短期聚合风险模型之前,有必要先介绍一下短期个别风险模型,这对于认识聚合风险模型是非常有必要的。
1.短期个别风险模型。假设保险人在某个时间段内,比如一个会计年度内已售出n张保单,保单持有者若遭遇损失则可以根据投保内容向保险人索赔,保险人则按保单的承诺赔付被保险人,即理赔。对第i张保单来说,在这段时间内可能发生索赔也可能不发生,若发生索赔,则赔付额可能是一个确定的数目也可能按损失程度大小和保单承诺的具体条款而定,假定第i张保单可能发生的理赔(或理解为保险人的赔付)为Xi,则Xi应视作随机变量,在所考虑时间段内的理赔或赔付总量为,个别风险就是要研究随机变量S的分布情况。但在一般情况下要获得S的分布是十分复杂的,只能在一些特殊假设下讨论S的分布。个别风险模型通常作如下假设:
(1)每张保单是否发生理赔以及理赔额大小是相互独立的、互不影响的,即X1,X2,…,Xn是一列相互独立的随机变量。
(2)每张保单至多发生一次理赔。若用随机变量I表示一张保单可能发生的理赔次数,则I的取值范围为0或1,亦即I服从0-1分布或贝努利分布。
(3)保单组合中的风险都为同质风险,理解为同类保单,数学上则反映为每张保单的理赔具有相同的分布。
(4)所考虑的保单总数是一个确定的正整数,又称所考虑的个别风险模型为封闭模型。
以上假设都是对实际情况的简化和理想化,精算学并不试图用一个模型来概括全部真实和适应各种类型的实际问题。独立性假设(1)是保险学能应用大数法则作为其基本原理的前提,可以看成一条最基本的假设,尽管它并不概括所有的情况如水灾保险和传染病保险等等;假设(2)在某些寿险和非寿险问题中可能具有一定的代表性,但显然不是每一种保单都只允许索赔一次,如汽车保险、健康保险等;假设(3)和(4)似乎离实际情况更远,几乎是为了数学处理上的方便而设置的,但可以把它们看成是研究实际问题的基础,实际的保单组合可能包含一系列保单子类,而某些保单子类可能满足假设(3)和(4)两种情况。事实上,个别风险模型的局限性正是导致风险理论发展的动力。
卷积方法和矩母函数法都可以用于获得独立随机变量和的精确分布,但对于数目较大的保单组合来说,更实用的方法则是寻求组合理赔量的近似分布。从概率论还知道,在一定条件下独立随机变量系列不断累加后,和的分布将趋于正态,这正是经典概率论的中心内容——中心极限定理。
2.短期聚合风险模型。若用Ci来表示对某类保单的第i次理赔,N表示在单位时间比如一个会计年度内所有这类保单发生理赔的次数,记这一年中对这类保单的理赔总量为S。
为理赔次数,与短期个别风险模型不同,是与理赔发生频率有关的一个随机变量;Ci是测量每个独立理赔量额度大小的随机变量。为了使该模型在理论上具有可操作性,通常对其中的随机变量给予以下假设:
(1)随机变量N,C1,C2,…,CN是相互独立的。
(2)C1,C2,…,CN是具有相同分布的随机变量,即Ci中的风险都为同质风险。
关于独立性假设是较为普遍的假设,是对实际问题的简单化,关于理赔同分布的假设显然只能适应于具有同质风险的同类保单,对于不同的保单类型,可以结合上一章中介绍的求独立变量和分布的方法来达到目的。
不难看出,研究聚合风险模型的第一步就是研究如何用N的分布和独立理赔量的分布Ci来表示的分布,那么显然只有明确了N的分布与的分布,才能研究,所以首先要寻求的是N和Ci的分布。对于N,通常我们会选择泊松分布或负二项分布等离散型分布;对于Ci,通常用正态分布、伽玛分布或者其他分布。
如果我们用泊松分布来描述理赔次数的分布,则的分布称为复合泊松分布,它在风险理论中占有相当重要的地位。我们也常用负二项分布来描述理赔次数的分布,这时称的分布为复合负二项分布。值得一提的是,矩母函数对于研究理赔总量将带来很大的方便。
(四)森林火灾保险的保费精算原理
如前所述,把风险理解为理赔或损失随机变量,则保险定价在形式上就是要建立一种(价格)尺度,使得可以用一种确定的量(保费)去衡量一个不确定的损失。但随之产生的问题便是由谁来决定这种价格尺度以及它的合理性体现在什么地方。现在可从经济学中的效用理论、从合理决策的角度来看待保险定价问题。
设某人拥有财产价值为w,这笔财产面临的风险损失为随机变量X,并且满足0≤X≤w,X的概率分布函数记为F(x),并且假设该人付出保费H去投保这笔财产。根据效用原理,保费H对财产拥有人来说是付得越少越好,所愿意付出的最高保费(临界值)是当“投保”等于“不投保的效用”时所对应的解。
因此,只有当投保人愿意付出的最高保费H*大于保险人愿意接受的最低保费G*时,一份保险合同才能够在介于G*和H*之间的价位成交,这样的价格才是互利的,因而是合理的。
二、建立福建省森林火灾个别损失分布函数
(一)数据来源及整理
《福建省林业统计年鉴》记录了福建省各县(市、区)每年森林火灾的发生情况。该表中的数据采用了汇总的记录形式,即每个县、区、市的各次森林火灾情况没有分次记录,而记录的是年度总次数,以及其他一些总损失情况。然而,精算要求每单次损失的具体情况。因此可以采取随机模拟法将这些总损失分解为各次的具体损失。
然后再讨论Sij的性质(S严格限定在1000公顷以内):
对于S1j:(1)当n1=1,n2=n3=0时,有S1j=S;
(2)当n1=1,n2≠0或n3≠0时,有0≤S1j≤1;
(3)当n1>;1,n2=n3=0时,有0≤S1j≤S。
(4)当n1>;1,n2≠0或n3≠0时,有0≤S1j≤2;
对于(1)已经满足了森林火警的分级需求,对于(2)、(3)、(4)则只需重新产生r1j,使得0 对于S2j:(1)当n2=1,n1=n3=0时,有S2j=S;
(2)当n2=1,n1≠0或n3≠0时,有0≤S2j≤100;
(3)当n2>;1,n1=n3=0时,有0≤S2j≤S。
(4)当n2>;1,n1≠0或n3≠0时,有0≤S2j≤200;
对于(1)已经满足了一般森林火灾的分级需求,对于(2)、(3)、(4)则只需重新产生r2j,使得1≤S1j<;100。
对于S3j:(1)当n3=1,n1=n2=0时,有S3j=S;
(2)当n3=1,n1≠0或n2≠0时,有0≤S3j≤1000;
(3)当n3>;1,n1=n2=0时,有0≤S3j≤S。
(4)当n3>;1,n1≠0或n2≠0时,有0≤S3j≤2000;
对于(1)已经满足了重大森林火灾的分级需求,对于(2)、(3)、(4)则只需重新产生r3j,使得100≤S3j即可。
还需要指出的是,这里通过随机模拟得到福建省所有县、区、市的单次森林火场面积Sij之后,便可以描述出该年内福建省森林火灾的损失分布函数。同时,还可以重新再做本试验,得到一个新的损失分布函数。最后可采取多次模拟,得到多个损失分布函数,并将这些损失分布函数参数平均值作为最终参数估计值。
(二)损失分布函数的建立
1.关于损失的界定。一次森林火灾发生之后,到底损失了多少林木?损失严重程度如何?哪些损失可以作为保险责任进行投保?目前来讲,这些都是颇受争议的问题。从《中国林业统计年鉴》以及《福建省林业统计年鉴》来看,一次火灾记录主要包括该次火灾的火场总面积、受害森林面积以及其中人工林的受害面积、损失的成林蓄积量和幼林株数、扑火经费、动员扑火人工数(工日)、受伤人数和死亡人数。然而,目前,保险公司可以承保的责任是很有限的,人员伤亡一般要投与森林保险相关的人身意外伤害险。而扑火经费、动员扑火人工数目前承保的还比较少。因此,这里主要将损失界定为过火面积或受害人工林面积即可,因为天然林一般也不承保。另外,根据调查还了解到,福建省过去几年的做法一般是一亩林子承保金额为400元,故可以求出林子的损失变量。
2.建立火场面积的损失分布函数。将一次森林火灾的火场面积损失量记为T,为了建立其损失分布函数,可以按照以下步骤进行。
(1)直观描述。首先利用前一章讲述的办法,将2000-2006年的数据综合在一起后,产生第一组分解后的火场总面积数据。此时有n=3794。
(2)经验分布曲线描述。为了分析的简便,这里并不具体计算出火场损失面积的经验分布函数,而且直接描述出该经验分布函数的图形,通过图形判断随机变量所属的分布族。于是[0,120]取组距为5,并作出火灾损失面积的经验分布曲线。
(3)选择分布类型。它是一个上凸函数,即F"(x)>;0,即说明F(x)没有拐点,且它是一个只有一个单调曲间的减函数,因此,指数分布及帕累托分布比较适合用来描述火场面积的分布情况。另外,其直方图也大致可用指数分布或帕累托分布来描述。但是,其在较小值处有上升的趋势,而且[0,1]内的柱形明显高出很多,因此,可以检验一下[0,1]区间里是否有上升的趋势。将损失级别为森林火警的数据挑出后,做出相应的频率直方图。
(4)参数估计。
①指数分布的参数估计。设T表示未分解的火场损失面积,NT表示分解后的火场损失面积,NTi表示分解数据第i次的损失面积,无论采取矩方法,或是极大似然法,都可求出指数分布的参数估计为,该表达式表明参数的最终估计值与未分解的火场损失面积有关,而与分解损失值的具体分解情况无关。因此,无论如何分解NS,都不会影响指数分布的最终参数估计值。综上可知,指数分布的参数估计是唯一确定的。
②帕累托分布的参数估计。参数估计的方法大致有分位点、极大似然估计法和矩法等,为了计算的简便性,拟采用矩方法作参数估计。
很明显,本次的参数估计与方差有关,即与不同分解次数有关。因此,为了得到更加稳健的参数估计值,可以采取多次分解,多次估计,最后求估计的平均值作为最终参数估计值。
(5)拟合优度检验。
①指数分布的拟合优度检验。
为了检验损失分布的拟合优度,可首先作其频率直方图和拟合密度函数图像,直观观察一下拟合的优劣性。
说明:[0,120]等分为120份,此时组间距为1,即柱高正好与密度函数的高低相同,(120,+∞]为一份。因此,可以看到图形右侧有一个较高的柱子,这是因为对于大于120的数据没有再进行分组的缘故。指数分布拟合达到了很好的效果。
由此可见,此时也取得了较好的拟合效果。
用观察数据来检验对损失分布的拟合是否适当,常用的方法还有数理统计学中的检验。假设火场总面积(原假设H0),如前所述,无论采取矩方法或极大似然估计法都可以估计出。仍然采取前边的分组方式,将X轴上的[0,120]等分为120份,(120,+∞]作为一份,则有Ei,i=1,2,…,121。为了计算Ei,先计算X落入每一档次的概率,比如在[20,21]内的概率为:
则此时E21=n×0.0179=3794×0.0179=67.98次。类似的,可以计算出其他所有的Ei,i=1,2,…,121。
②帕累托分布的拟合优度检验。为了检验损失分布的拟合优度,可首先作其频率直方图和拟合密度函数图像,直观观察一下拟合的优劣性。
该图的分组方式为:[0,120]等分为120份,此时组间距为1,即正好与密度函数的高低相同,(120,+∞]为一份。因此,可以看到图形右侧有一个较高的柱子,这是因为对于大于120的数据没有再进行分组的缘故。采用帕累分布拟合也达到了很好的效果。
若将X轴上的[0,120]等分为24份,此时组间距为5,(120,+∞]作为一份,则相应的密度函数之前扩大5倍,此时也具有较好的拟合效果,下面再来采用卡方检验法检验帕累托分布的拟合优度。