书城社会科学国际传播受众研究
19693700000025

第25章 定量受众研究方法(2)

二、抽样过程与样本量

抽样过程主要包括如下步骤:一是界定总体并尽可能收集总体名单;二是确定样本量(样本容量);三是抽取样本个体。

(一)界定总体并收集总体名单

抽样调查首先必须对研究总体进行界定,清晰地说明研究对象的范围,包括时间、地点和人物三要素。即在某一时间段或某个时间截面上,对某一区域或地点的某一群体进行调查。总体的界定越清晰越好,由样本得出的结果,一般也只能推及所界定的这个总体。

例如,某一跨国电视频道有一档针对在校大学生的电视栏目,想了解大学生的收看情况。如何界定总体呢?如果总体界定为在校大学生,可能包括住读大学生和非住读的函授或走读大学生。如果大学生在这里泛指所有正在大学读书的学生,那么可能不仅包括专科生、本科生,还包括硕士生和博士生。虽然在校大学生这个群体,本身范围已经很窄,同质性也较强,但是这个群体内部仍然存在相当的差异。在抽样调查中,只有界定好总体,才能为样本的代表性奠定基础,使得研究具有针对性和科学性。

总体界定完毕,下一步要做的工作是尽可能收集和编制符合总体定义的全部个体名单。比如上述研究中收集在学籍的大学生名册,还有诸如户口登记表、企业名录、电话号码簿等资料。这份名单又称为抽样框。确定抽样总体范围和结构的工作,又称为编制样本框,其要求是完整而不重复。没有抽样框,则不能计算概率,也就无法进行随机抽样。

(二)确定样本量

确定样本量首先要考虑的是采用什么样的抽样方法,是随机抽样还是非随机抽样。非随机抽样样本量的确定,通常取决于主观因素和现有财力的许可。由于总体中的每一个体被抽中的概率不一样,因此不适于进行统计推断。相反,随机抽样则可以估算抽样误差,进行统计推断。以下主要讲解随机抽样样本量的确定。

确定样本量是一项在人、财、物的投入与满足调查要求之间寻求最佳契合点的艺术。如果所能容忍的抽样误差小,精度要求高,样本量便要较大;如果研究投入有限,样本量便要适当控制。另外,还要考虑置信度(又称置信水平)。置信度是指从样本推断总体时,样本有多大的可能在容许的误差范围内正确地反映总体。通常,置信度取值为95%或99%。当置信度从95%提高到99%时,在同样的容许误差水平上,样本量会大幅攀升。当然,是否符合统计需要,也在考虑之列。多变量研究比单一变量(或少量变量)研究需要更多的样本,这样才会包括更多可供分析的“原料”。在实际操作中,要酌情增加样本,即所抽取的样本比计算所需的样本更多一些,以弥补研究过程中样本的失效、退出等所带来的损失。

在95%和99%置信度下,简单随机抽样不同容许误差下的样本量。传播研究通常选择95%的置信度。当容许误差为5%时,样本量为384;当容许误差下降为3%时,样本量上升为1067,几乎是前者的3倍。显然,容许误差小则要求的样本量较大;反过来,加大样本量,研究成本提高,却不一定能显著降低抽样误差。这里,研究者要考虑的是,投入的增加是否能够与调查精度的提高相平衡。

一般来说,当总体很大时,样本量大小不受总体的影响,亦即在同样的容许误差下,3000万的总体所需要的样本量与300万的总体所需要的样本量基本相同。而当总体很小,样本量占总体的5%以上时,样本量大小受总体的影响。有研究者结合数理统计原理和实际操作经验提出了决定样本量的一些原则。比如,样本量一般应占总体的1/1000~1/10000;当总体较小时,不得少于200~400,当总体较大时,样本量不要超过10000;样本量在100以下时,只宜作探讨式研究,在30以下时,只能作为个案或特殊研究处理。

(三)抽取样本

即按照不同的抽样方法从总体中抽取所需要的样本个体。确定样本量后,采用什么样的方法,以较少的人、财、物和时间投入以及较低的误差来完成抽样,就需要仔细权衡考虑。比如,面对较大的总体,一般采用复合型抽样,如视听率调查便采用多阶段分层、概率与规模成比例抽样、系统抽样、整群抽样或简单随机抽样相结合的方式进行抽样。其优点是有利于简化抽样程序,降低抽样操作难度,同时保证一定的抽样精度。

三、抽样误差与样本加权

任何抽样调查,样本与总体之间都或多或少存在若干差异,这是由抽样这种非全面性调查的特点所决定的。

抽样调查误差可以分为抽样误差和非抽样误差两种。抽样误差是由抽样方法本身所决定的,又称为标准误差。它无法消除,但可以控制。而非抽样误差则是在实际调查过程中产生的误差,与抽样方法本身没有关系。非抽样误差无法用概率方法进行计算和控制,只能通过认真规划、严格培训访问员和加强质量控制来削减。以下我们简介抽样误差和样本加权方法。

(一)抽样误差

计算抽样误差是确定样本与总体之间差异大小的过程,只有随机抽样才能计算抽样误差。

抽样误差的大小,因样本量大小和抽样方法的不同而有差别。一般来说,抽样方法相同时,样本量越大,抽样误差越小。当样本量相同时,抽样方法不同,抽样误差也不一样。

由于抽样调查一般是在总体未知的情况下,以对样本情况的调查去推断总体,样本资料与总体资料的实际误差无法计算,因此,通常只能用起代表值作用的抽样平均误差来代替抽样的实际误差。按照统计原理和方法,抽样的平均误差是可以计算出来的。

抽样误差包括均值抽样误差和比例抽样误差。这里,均值一般指算术平均数,比例则指所调查的标识值在总体中的比例(比重)。

在简单不重复的随机抽样中,计算均值抽样误差和比例抽样误差。其中,S为样本标准差,N为总体量,n表示样本量,P表示样本比例,(为无放回抽样的修正系数,当N>>n时,该系数近似为1。

(二)样本加权

加权是抽样调查中经常使用的一种方法,当样本结构与实际总体的某些特征出现偏差时,往往需要对样本进行加权处理。比如,当样本的年龄、性别、文化程度等特征与总体有出入,而研究者又没有足够的时间和经费重新抽样时,就需要采取加权的方式,加重(或削弱)被弱化(或强化)了的那部分样本的权值,以使结果如实反映总体。

进行样本加权时,可以用如下公式计算加权值。

加权值=总体中的比例/样本中的比例(公式4.3)

当某一特征的样本过多时,加权值会小于1,反之则会大于1。理想的加权值是等于1,也就是抽样恰如其分地反映了总体特征,但是这种情况是非常难得的,一般都需要对某些指标进行加权,以便更准确地反映总体。

比如,一项听众调查显示,在1000位受访者中,400位是男性,600位是女性,而有关的人口统计资料显示,男性与女性的比例是48∶52。也就是说,样本中男性与女性的性别构成与人口统计资料显示的不一致,女性比例偏高,男性比例偏低。采用上述公式分别计算男性与女性的加权值:男性加权值=0.48÷0.40=1.2;女性加权值=0.52÷0.6=0.87。

如果这些样本中收听某节目的听众是100人,其中女性40人,男性60人,则加权后该节目的实际收听人数=样本中女性收听人数×女性加权值+样本中男性收听人数×男性加权值=40×0.87+60×1.2=34.8+72.0=106.8,该节目的实际收听率为106.8÷1000×100%=10.68%,而非原来的10%。

第二节 视听率测量

所谓视听率,一般是指收看或收听某一节目的受众人数占总体受众的百分比。视听率是反映受众视听效果的一个基本指标,也是广播电视传播者、广告商和广告主之间彼此对话的一座平台。

视听率测量是一种常规性的受众行为调查,包括抽样、测量、数据统计等程序,主要指采用日记法和仪器法,对经随机抽样选定的固定样本组进行测量,得出有关受众规模、结构、流动等方面的数据资料。这种测量一般以一天为单位周期性进行,只反映受众的一般视听行为,不涉及内容评价和观点诉求,也不涉及变量之间的关系探讨。确切地说,视听率测量是一种以描述性为主、一般周期性进行的受众视听情况调查。从基本原理和程序上看,视听率测量与一般受众调查区别不大,但是在样本框确定、测量手段、指标体系等方面,仍然形成了自己的一些特点。

一、收视率:抽样和测量

收视率测量是一种随机抽样调查。根据电视人口特征,科学地设计抽样方案并有效地实施,采用适切的方法进行测量,是决定收视率数据质量的关键。

(一)确定调查对象和抽样框

收视率的调查对象,一般被界定为目标地区内被电视信号所覆盖的电视家庭户中4岁及以上的家庭成员。

这个界定包括三个要素:一是目标地区;二是收视条件;三是年龄下限。第一,目标地区由所要调查的市场范围决定,可以是全国、省、市、县或某一特定区域;第二,调查将不在信号覆盖范围内和没有电视接收条件的家庭排除在调查对象之外,排除在外的还包括集体宿舍和公共场合的收视情况;第三,调查对象的年龄不得低于某一下限。原因在于,收视率调查通常采用日记法或人员测量仪法,两者对受访对象的自主能力和行为能力都有一定的要求,年龄太小难以达到这些要求。

收视率调查确立抽样框的依据主要有三:一是人口普查统计资料;二是人口抽查统计资料;三是各种民政或社会管理机构名录、电话号码簿等。这些统计资料中包括人口数量、家庭规模、职业、性别、年龄等特征。

收视率调查通常采用二重抽样确定样本对象,即先进行基础研究,从总体中抽取一个大样本(一重抽样),然后将这个大样本作为次级抽样框,从中抽出用于连续性收视率测量的固定样本组(二重抽样)。如果样本户确定为300户,基础研究的样本量可能在2000户以上。基础研究的大样本一方面为固定样本组的选取奠定了基础,另一方面也为样本调整和样本轮换提供了样本库。

(二)抽样与样本量

收视率抽样有两个特点:其一是采用复合型抽样;其二是采用配额抽样更换和调整样本。

收视率调查一般采用多种抽样方式相结合的复合型抽样。比如,对大的市场总体而言,常常需要采用多级抽样、概率与规模成比例抽样(PPS)、系统抽样、整群抽样等方式来确定样本户。采用复合型抽样会在有效降低操作难度和简化抽样程序的同时,保证一定的抽样精度,是一个有效而稳妥的方法。

固定样本组时间一长,难免出现调查对象松懈、倦怠、失去耐心或拒绝继续合作等情况,样本户也可能因为搬迁、移居等原因自然流失。为了保证样本对象的反馈质量,调查机构一般会定期主动更换样本户,主要采用配额抽样方式进行。具体操作中,主要在年龄、性别等几个主要指标上进行配额,控制样本的各项特征,使之与总体相接近。日记法调查一般每周更换全部样本的1/50,即每周更换2%,一年内全部样本可更新一次。人员测量仪调查则因换户成本较高,每年换户比例大约在20%左右。

至于样本量的确定,需要综合考虑人力、物力和时间的投入,以及调查区域的实际状况、精度要求、服务对象的特殊要求、经费预算等因素。样本量的选择既要符合抽样统计原理,又要靠经验去调控。一般来说,抽样精度要求越高,所需要的样本量就越大,经费也越多,而后者往往成为制约样本规模的一大瓶颈。

收视率调查一般先决定可以容许的抽样误差,再决定样本量,然后综合各种因素进行调整(样本量的选择可)。目前,一般选择95%的置信度、3%或5%的容许误差下的样本量,即1067人(约300户)和384人(约100户)是比较常见的样本规模。需要注意的是,目前我国收视率调查抽样的最后单元是家庭户,但是调查的对象是家庭户中的每一个人,由此得出人员收视率数据。

(三)测量方法

日记法和人员测量仪法是目前最常用的两种收视率测量方法。

1.日记法

日记法是指让样本户中4岁及以上的家庭成员填写日记卡,以此采集人们收视信息的方法。具体操作流程是:首先按照随机抽样原则抽取一定数量的样本户,然后由访问员上门为样本户家庭的每一位成员留置一份日记卡,让对方在未来一周时间内随时记录其收视情况。为保证质量,一般对新样本有一到两周的试验考察期。接下来,每周在固定时间内(通常是星期天)由访问员到样本户家中收取上一周填好的日记卡,同时留置一份新的空白日记卡,以备下周记录之需。为表示对样本户的感谢和鼓励,调查机构一般会给予一定的礼品或礼金。

日记卡上所列的记录的时间单位为15分钟。为了帮助被调查者更直观地识别其正在观看的频道,访问员会给每个样本户留下一份日记卡专用夹,除了日记卡和“频道代码、频道名称、台标提示卡”,专用夹中还有“日记卡填写细则”和“日记卡填写方法举例”。