经过整理之后的调查资料,含有许多描述调查总体属性的分布态势和相互间关系的信息,市场调查人员应该进行一些基本的数据分析,对这些资料进行有效的表述,使之能够清晰明了地反映出调查的成果,有助于后续的分析与预测等工作。表列、图表和频数分布形态就是描述这些资料的简单方法,它们的任务就是根据市场调查的目标,把这些资料按照一定的组合规律,用表格、图形或简单的统计方法展现出来。
一、频数分布
有时调查人员需要调查有关单个变量的信息,例如:
(1)本品牌的使用者中有多少称得上是品牌忠诚者?
(2)市场中频繁使用者、普通使用者、少量使用者以及非使用者的百分比各有多少?
(3)有多少顾客对该品牌很熟悉?多少顾客比较熟悉、知道一些或者不熟悉该品牌?顾客平均熟悉程度如何?顾客对该品牌的熟悉程度是否差距很大?
(4)该品牌使用者的收入分布情况如何?其中低收入者比例是否较大?
要想获得这些问题的答案,可以使用频数分布对数据进行分析。在频数分布中,一次只考察一个变量,目的是了解对一个变量选择不同取值的调查对象数量。这变量中不同取值的出现频率以百分比的形式展现。对一个变量的频数分布会产生频数、百分比和累计百分比几个数据。
给出了对该品牌熟悉程度的频数分布表。表中第1列是变量各个类别的标签,第2列是变量取值的编码,注意代码9代表的是缺失值。第3列给出了选择每个取值的人数。例如,有3个调查对象选择了取值5,说明他们对该品牌有一定的了解。第4列显示了选择每个取值的调查对象比例。第5列表示实际有效的每个取值的调查对象比例。最后一列表示除去缺失样本之后的累计比例。可以看出,在接受调查的30个人中,有10%的人选择了5,如果除去那个选择缺失值的调查对象,这个比例应变为10.3%。累计到5的百分比为58.6%,换句话说,58.6%的合格调查对象对该品牌的熟悉程度小于或等于5.
频数分布有助于明确未回答者的多少,同时也能显示不合格答案的多少,如0和8的取值都是不合格回答或错误。找出这些样本后,可以采取补救行动。奇异值和极端值也能够被检验出来。在一个家庭规模的频数分布表中,家庭成员超过9个的家庭可能被视为奇异值。频数分布还可以显示变量的经验分布形状;根据频数数据可以画与频数分布有关的最常用的统计量包括集中趋势指标(均值、中位数、众数)、差异性指标(全距、四分互差、标准差、变异系数)和分布形状指标(偏度和峰度)。
(一)集中趋势指标
集中趋势指标用于描述分布的中心。如果整体样本被同时加上一个固定值,均值、中位数、众数也以同一幅度变化。
1.均值
均值或平均数是集中趋势指标中最常用的一个统计量,用于评估一个用定距或定比尺度衡量的数据的均值。数据应该具有一定的集中趋势,大部分回答应该分布在均值附近。
均值X的计算公式为
X
式中:Xi――X变量的观察值;
n――观察值数量(样本规模)。
对于其平均值计算如下:
X≈4.724
2.众数
众数就是出现最频繁的数值,代表分布中的高峰。当数据为分组数据或被重新分为几类时,众数是一个很好的集中趋势指标。对于中的众数为6.
3.中位数
样本的中位数就是把所有数据按照升序或降序顺序排列后居中的数值。如果样本数为偶数,则中位数为居中的两个数值的均值――二者相加再除以2.中位数是定序数据的集中趋势指标。对于的中位数是5.
(二)差异性指标
差异性指标用于定距或定比数据,包括全距、四分互差、方差或标准差以及变异系数。
1.全距
全距测量的是数据的分散程度,就是样本中最大值与最小值之差。因此,全距直接受到奇异值的影响。
全距X最大值-X最小值
如果数据中所有取值乘以一个常数,那么全距也会以相同的幅度变化。中的全距是7-25.
2.四分互差
四分互差是第75百分位数与第25百分位数之间的差值。对于一组按照大小排列的数据,第p个百分位数就是指有p%的数据点小于它,有(100-p)%的数据点少于它的那个值。如果所有数值乘以一个常数,四分互差也乘以这个常数。中的四分互差是6-33.
3.方差和标准差
一个观察值与均值之间的差被称为离均差,方差就是离均差平方的均值,因此方差不能为负。当数据集中在均值周围时,方差很小;当数据点分布分散时,方差就大;如果有数据值乘以一个常数,方差就乘以这个常数的平方。标准差就是方差的平方根,因此标准差与数据的单位相同,而不是平方单位。
(三)分布形状指标
除了差异性指标,分布形状指标也被用于了解数据分布的形态。数据分布形状通过偏度和峰度来测量。
1.偏度
数据分布可能是对称的,也可能是有偏的。在对称式分布中,位于中心两侧的数据值一样多,并且均值、中位数、众数也相等,对于均值的正负偏差也应该相等。而在有偏的数据分布中,对于均值的正负偏差是不相等的。偏度就是指中心一侧的均值偏差趋势比另一侧大。可以认为分布图一侧的尾部大于另一侧。
2.峰度
峰度是测量频数分布曲线相对平滑或突起程度的指标。正态分布的峰度应该是0.如果峰度为正,说明曲线分布比正态分布突出,峰度为负说明曲线分布比正态分布平缓。
二、表列
表列一般有单向表列和交叉表列之分,仅计数一个变量和不同数值的出现次数的,称为单向表列;而同时计数两个或多个变量的不同数值联合出现的次数,这种表列就是交叉表列。
单向表列只有一个变量参加分组,对于离散型变量或变量数值较少,变动幅度不大,且总体单位数不多的情况下,是比较适宜编制单向表列的。然而对事物的描述与分析,有时不能满足于仅仅考虑一个变量的情况,而要综合分析相互联系的多个变量之间的变动关系,这就需要更加复杂的表列形式来说明这类关系,这种形式就是交叉表列。交叉表列是研究变量间关系的最重要工具,在作交叉分析时,总是要把样本分成几个组,以便研究因变量是如何变化的。在商务调查中,交叉表列是使用最频繁、最广泛的一种方法。
(一)双向交叉表列
双向交叉表列是复杂形式交叉表列的基础,它描述的是当有两个变量同时产生影响作用时,频数分布的情况,这种参数分布表称为列联表。
某市场研究公司对2007年上半年全国大都市冰箱市场进行了调查,调查地点为北京、上海、广州、成都四个大城市,采用随机电话访问的方法,样本量为2177.要研究四大都市的家庭中拥有冰箱台数情况,该公司以消费者所在城市为标志,将消费者划分为北京、成都、上海、广州四组,再按拥有冰箱的台数将拥有1台的归为第一组,拥有2台的归为第二组,拥有3台或3台以上的归为第三组。这样就得到一份消费者城市分布与冰箱拥有量的交叉列表。
若要研究冰箱品牌占有率的城市差异,则为简明起见,只选取了有代表性的四大冰箱的品牌进行分组,将其划分为海尔、华凌、伊莱克斯、上菱等四组,再以消费者所在城市为标志,将消费者划分为北京、成都、上海、广州等四组,得到冰箱品牌与城市分布的交叉列表。
在交叉表列中,要注意自变量和因变量的关系,一般来说,交叉表列都将自变量沿横向展开,将因变量沿纵向展开,相对频数计算行百分比。这种行百分比就相当于一种条件概率,例如,在中,表芯第一行第一列表示,在居住于北京的消费者中,有44%的家庭偏好于海尔品牌的冰箱。
(二)三向交叉表列
从上面的分析可知,消费者所居住的城市不同,其家庭拥有冰箱的台数、对品牌的偏好程度都有所不同,那么,能不能把这几个因素综合起来分析,这就要通过三向交叉表列来进行。
三向交叉表列的构成,是首先选中其中的一个变量,将其值稳定在各种变量值中的一个值上,然后对另外的一个自变量和因变量作双向交叉分组;第二步再将第一个变量稳定在其下一个变量值上,作另外两个变量的交叉列表,以此类推,直到第一个变量的所有变量值被一一列举完毕。
以某项调查时装购买和婚姻状态之间关系的市场调查项目为例。变量时装购买情况分为高和低两种状态。变量婚姻状态也分为两种状态:已婚和未婚。对1000个消费者样本的调查资料以三变量交叉列表分析得到。
中每一个局部双向交叉,都存在着三列,对于这样的结构,只要抽出其中的两类变量,就可以形成满足各种统计分析需要的其他表列形式。通过对变量值的变动分析,可以研究几个变量分别会对研究目标产生什么影响,影响的程度有多大。例如,根据可以进行讨论:人群的地域分布和人们的收入水平这两个因素,究竟哪一个对人们的品牌偏好影响较大?
对于一个双向交叉表列,可以得到一个两变量间有关系或无关系的结论。双向交叉表列所能传达的信息是表面性的。其结论可能真实,也可能会引起误解或曲解。判断这种初始结论正确性的办法是引入第三个变量,作三向交叉分析,检查一下引入新变量之后原有自变量与因变量之间的关系的变化情况,由此认清和深化对初始关系的认识。
第三个变量的引入有助于人们深化对两变量间关系的认识。以此类推,如果继续引入第四个变量,第五个变量……问题会更加清楚明了。然而新变量的引入是受到一些因素制约的。一方面,要新引入的变量必须是在设计调查方案时就已经存在的调查项目,而调查人员在设计时尽管从多方面考虑问题,也可能满足不了在事后提出的新要求;另一方面,引入变量过多就要求有更多的样本数据,这必然会增加调查的成本。因此,在调查实践中一般只延伸到三向交叉分析,而且引入的中介变量一般来说应该是与原有的因变量之间有某种联系的。
三、图形描述
图形描述使用“图”而不是“表”来展示调查的结果,正如俗语所说“一图抵千字”。特别重要的结果,可以用图形更充分有效地表达。交叉分组表有助于我们识别重要的发现,而图形则是将那些发现提供给客户的最好的办法。
(一)折线图
折线图或许是所有图形中最简单的一种,尤其适用于显示在不同时点上进行的测量。显示了2006年上半年我国数码摄像机的销售情况。从中可以看出,2月是最高峰,3~4月是淡季。这家零售商可根据这些销售数据来分析可能增加的产品线,以便改进淡季销售。
(二)直方图
直方图是由同样宽度的条形构成的图形,其长度与代表的数值成正比。可用于单选问题的直观显示。直方图能适合于反映多项比较复杂的关系,为比较一张图中几组不同的数据,可以使用群组直方图。群组的条形,就好像报告的提纲,它们把一般的话题分组,然后把信息分到特定的类别中,可以用来反映一段时间内,不同组但是相关的数据类型,如用于多选题。显示了某家零售商四种家电产品在前半年每月的销量对比分析。可以看出电脑产品在所有家电产品中销量最好,但所有家电产品销量增长缓慢,基本无明显变化。
(三)条形图
条形图是用水平的条形来表示数据,与直方图的功能类似,用于表示绝对和相对数量、差异和改变。展示了某种产品的已购者和欲购者获得产品信息途径的百分比情况。
(四)饼状图
饼状图是另一种常用的图形,适合于许多情形。饼状图是把一个圆饼分为多个组成部分,用各个部分占总和的百分比来显示总体的内部结构。
在一般情况下,饼状图不超过七个分割部分。如果数据分为许多小的部分,可以考虑把最小的部分或最不重要的部分(通常小于5%)并入“其他”类。因为细小部分的标注很难读出,这些部分的标注只能放在圆圈之外。为某药店连锁店四个分店的营业额占总营业额的百分比比较。也可以用的形式表现,更为直观。
(五)柱形图
柱形图是几类图形描述中最灵活的形式。任何可在线形图、饼状图中表现的数据结果均可在柱形图中表达,而且,许多用其他类型的图不能表达或不能有效表达的结果,也能在柱形图中方便地表达出来。为三维柱形图更直观地展示出各连锁药店每季度及全年的营业额情况。
调查资料整理是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。
资料的验收是对资料的总体检查,发现资料中是否出现重大问题,以决定是否采纳此份资料。资料的编辑是对资料进行细致的检查,发现资料中是否出现具体的错误或疏漏,以保证资料的正确性和完整性的过程。
资料的分组是根据市场调查的需要,按照一定的标志,将调查总体划分为若干个组成部分的资料整理方法。资料的编码就是使用一个规定的数字或符号代表一个种类回答,即将资料中的信息数字化。对资料进行编码是为了便于进行统计分析,有助于计算机进一步存储和分析。
资料的转换是指将经过编码的资料输入并储存在计算机中,以便于计算机分析的过程。将资料输入计算机,一般可以使用计算机卡、光电扫描仪等设备。
经过整理之后的调查资料,含有许多描述调查总体属性的分布态势和相互间关系的信息,市场调查人员应该进行一些基本的数据分析,对这些资料进行有效的表述,使之能够清晰明了地反映出调查的成果,有助于后续的分析与预测等工作。表列、图表和频数分布就是描述这些资料的简单方法。
资料整理
资料的验收
资料的编辑
资料的分组
资料的编码
资料的图形化与表格化
一、简答题
1.简述市场调查资料整理的过程。
2.市场调查资料的验收主要有哪些方面?
3.简述资料的验收与编辑之间的区别。
4.不合格问卷的处理方式有哪些?
5.后编码应该遵循什么样的方式进行?
6.举例说明如何综合利用各种图形进行描述?
二、选择题
1.资料的()是对问卷进行细致的检查,发现资料中是否出现具体的错误或疏漏,以保证资料的正确性和完整性的过程。
A.分组与编码
B.验收
C.整理
D.编辑
2.对于超过调查规定时间收回的问卷、不属于调查范围的人员填写的问卷、前后答案没有变化的问卷等问题较多的资料应予以()。
A.补救
B.作废
C.重新调查
D.同等对待
3.一个观察值与均值之间的差被称为()
A.方差
B.标准差
C.离均差
D.均差
三、判断题
1.资料的整理是指将经过编码的资料输入并储存在计算机中,以便于计算机分析的过程。()
2.样本的中位数就是把所有数据按照升序顺序排列后居中的数值。()
3.如果无法把问卷返回调查现场,编辑人员不可填补不合格问卷中的缺失值。()
四、案例分析
某糖酒公司经营5种品牌的白酒(用A、B、C、D、E代表),这5种白酒各有特色。但市场销售中A、B有些滞销,积压量大,而C、D是平销,E畅销,库存量较少。为进一步研究市场需求,加快企业资金周转,调节市场供求,决定对商品的价格进行调整,调低A、B两种白酒的价格,适当提高C、D、E的价格。为获得良好的市场销售结果,在调价过程中进行试验。调价前先分别测定5种品牌白酒的销售数量及市场占有率,然后再调整价格进行销售。试验一个月后,再测量5种品牌白酒的商品销售量及其构成。这样来观察判断商品调价后的市场需求情况和销售趋势。经试验调查测定,试验前后数据。
阅读以上资料,按上述文字表述来进行统计,看是否能得出同样结论。
五、实训设计
“实训项目”
问卷编码及资料整理方法运用。
“实训目的”
通过实训使同学们掌握问卷编码及编码说明书的运用,并综合运用资料整理方法学会资料的整理和分析工作。
“实训内容”
某调查公司2007年对家电产品的购买情况进行了一次调查。在广州、深圳、佛山、中山四个城市,采用邮寄问卷调查的方式进行。调查问卷的部分内容如下:
1.您的性别是()。
A.男B.女
2.您的年龄是()。
3.您的文化程度是()。
A.小学及以下B.初中C.高中或中专D.大学专科
E.大学本科F.研究生或以上
4.请问您在购买时主要考虑的因素是(限选三项)。()
A.商品的功能B.商品的品质C.商品的外观D.商品的价格
E.商品的品牌F.商品的售后服务G.朋友介绍H.其他
5.真正的好产品是不需要广告的,您同意这种说法吗?()
A.非常同意B.同意C.无所谓D.不同意
E.非常不同意
6.买东西时要货比三家,您同意这种说法吗?()
A.非常同意B.同意C.无所谓D.不同意
E.非常不同意
对上述问卷的编码如下:
1.完善此调查问卷和编码说明书。
2.分组自由选择调查方式开展调查活动。
3.对回收的问卷进行全面整理并进行简单的分析。
“实训要求”
1.以5~6人为一小组开展实训,分工进行合作。
2.提交的实训成果包括一份完整的调查问卷和说明书、回收的调查问卷以及调查分析报告。
3.调查分析报告必须用图形化以及表格化的方式表现。
1.灵活掌握市场调查报告撰写的基本格式和具体方法
2.学会运用市场调查报告撰写和口头报告的基本技巧
3.学会市场调查口头报告的基本技巧1.理解市场调查报告撰写的意义及其类型
2.理解市场调查报告撰写的基本要求
一份不完善的调查报告
近日,某调查公司对某市果汁饮料市场进行了一次市场调查,根据统计数据,对调查结果进行了简要的分析。
追求绿色、天然、营养成为消费者和果汁饮料的主要目的。品种多、口味多是果汁饮料行业的显著特点,据该市场调查显示,每家大型超市内,果汁饮料的品种都在120种左右,厂家达十几家,竞争十分激烈,果汁的品质及创新成为果汁企业获利的关键因素,品牌果汁饮料的淡旺季销量无明显区分。
目标消费群――调查显示,在选择果汁饮料的消费群中,15~24岁年龄段的占了34.3%,25~34岁年龄段的占了28.4%,其中,又以女性消费者居多。
影响购买因素――口味:酸甜口味的销得最好,低糖营养性果汁饮品是市场需求的主流;包装:家庭消费首选750ml和1L装的塑料瓶大包装;260ml的小瓶装和利乐包为即买即饮或旅游时的首选;礼品装是家庭送礼时的选择;喝完饮料后新颖别致的瓶子可当茶杯用,所以也影响了部分消费者购买的决定。
饮料种类选择习惯――71.2%的消费者表示不会仅限于一种,会喝多种饮料;有什么喝什么的占了20.5%;表示就喝一种的占了8.3%。
品牌选择习惯――调查显示,习惯于多品牌选择的消费者占了54.6%;习惯于单品牌选择的占13.2%;因品牌忠诚性做出单品牌选择的占14.2%;价格导向占了2.5%追求方便的比例为15.5%。
饮料品牌认知渠道――广告:58.4%;自己喝过才知道:24.5%;卖饮料的地方:11.1%;亲友介绍:6%。
购买渠道选择――在超市购买:61.2%;随时购买:2.5%;个体商店购买:28.4%;批发市场:2.5%;大中型商场:5.4%;酒店、快餐厅等餐饮场所也具有较大的购买潜力。
一次购买量――选择喝多少就买多少的占62.4%;选择一次性批发很多的占7.6%;会多买一点存着的占29.9%。
本调查报告还缺少哪些重要部分吗?应该如何对其进行修改?
一份市场调查报告即使再简单,也必须保证它的完整性,否则就算是很有价值的调查数据也显得很苍白无说服力,降低它的使用价值。市场调查人员应该认识到一篇专业的市场调查报告的写作需要掌握一定的方式和技巧。