应用统计学:经济与管理中的数据分析2

发布时间:2021-09-25 20:54:12

第二章统计数据的收集、整理与展示
? ? ? ? ? 统计资料的收集 统计数据的整理 统计表与统计图 品质数据的图形展示 数量数据的图形展示

§2.1 统计数据的收集
? ? ? ? ? 统计数据的来源 统计资料的收集方法 统计资料收集的技术工具 统计调查的组织方式 统计调查方案设计

一、统计数据的来源
? (1)直接来源 ? 直接的调查和科学试验,称为第一手资料和原 始资料( raw data ) ? ①专门组织的调查 资料要求丗 准确性丆及时性丆全面性丆系统性 ? ② 科学试验 ? (2) 间接来源 ? 他人调查或试验的数据,称为第二手资料和次 级资料( secondary data ) ? 公开出版和公开报道的数据 ? 引用时一定要注明数据的来源

2-3

二、统计资料的收集方法
? (1) 原始资料
? ? ? ? ? ① 直接观察法 ② 报告法 ③ 登记法 ④ 访问法 ⑤ 实验法 ? (2) 次级资料 ? ? ① 直接引用法 ② 参考文献查找法

?

③ 检索工具查找法

2-4

三、统计资料收集的技术工具
? (1)调查表 ? 根据统计调查目的所确定的调查项目按照一定 的顺序排列而成的表格形式。 ? 调查表一般是由表头、表体和表外附加三部分 组成的。 ? (2)问卷 ? 调查者根据调查的目的和要求,预先设计的有 详细问题及备选答案的调查测试和记录清单。 ? 问卷一般由标题、引言和注释、问题和答案、 统计编码、被调查者的基本情况和结束语等部 分组成。
2-5

四、统计调查的组织方式 ? (1)统计报表(statistical report forms) ? (2)专门调查 ? ① 普查(census) ? ② 重点调查(key point survey) ? ③ 典型调查(model survey) ? ④ 抽样调查(sampling survey) ? ⑤ 网上调查 (internet survey )
2-6

五、统计调查的方案设计 ? (1)确定调查的目的和内容 ? (2)确定调查对象、调查单位

?

和填报单位

? (3)确定调查项目,拟定调查表和问卷 ? (4)确定调查的方式和方法 ? (5)确定调查的时间和期限

? (6)制定调查的组织实施计划
2-7

§2.2 统计数据的整理
? ? ? ? 统计数据的审核 统计分组 频数分布 累积频数分布

一、统计数据的审核
? 数据审核,保证统计数据的质量。

? 从不同渠道取得的统计数据,在审核内容和方 法上都有所不同。

2-9

二、统计分组(Statistical Classification)
?

统计分组:现象的内在特点和统计研究的要求, 将搜集到的数据资*凑找欢ǖ谋曛净治舾 组的一种统计方法。
简单分组 分组标志 的多少 分组体系 复合分组体系 品质标志分组 分组标志 的性质 数量标志分组 变量值组距分组
2-10

*行分组体系

组内的“同 质性” 组间的“差 异性”

单变量值分组

数量标志统计分组
?
? ? ? ? ?

(1)单变量值分组
一个变量值作为一组,形成单项式变量数列。 一般适用于离散型变量,且变量变动范围不大 的场合。 (2)变量值组距分组(等距和不等距) 将变量依次划分为几个区段,把一个区段内的 所有变量值归为一组,形成组距式变量数列。 一般适用于连续型变量,或变量变动范围较大 的离散型变量。
2-11

变量值组距分组
? ?

① 考察数据集,确定最大值和最小值; ② 确定分组数; k ? 1 ? 3.3 log n
样本个数n <50 50~100 100~250 >100 分组数k 5~7 6~10 7~12 10~20

分组的目的是 找出数据分布 的规律性。

? ?

③ 计算组距; ④ 决定分组界限。
2-12

三、频数分布(Frequency Distribution)
? 频数分布:在统计分组的基础上,将总体(或 样本)中每个单位按组进行归类排列,形成总 体(或样本)各个单位在各组间的分布。

2-13

(1)频数分布(品质变量分布数列)
? 例:某公司开发了一种新型香水,为了测试目标消费 群对该香水的接受程度,设计了5种香型的香水,随机 选取200名消费者进行测试,其中的一个问题是“五种 香水中你最喜欢哪一种? ? (1)A;(2)B;(3)C;(4)D;(5)E
消费者对不同香型香水偏好的频数分布表

香水类型 A B C D E 合计

青年 64 9 2 4 8 87

中年 40 25 3 8 5 81

老年 20 8 1 2 1 32

总人数 124 42 6 14 14 200

比例 62.0% 21.0% 3.0% 7.0% 7.0% 100.0%
2-14

(2)频数分布(单项式变量分布数列)
例:某企业生产某种型号的三极管,以100个为一批进 行质量检验,记录每批产品中的不合格品数,其可能的 取值为0,1,2,…,100,共检查了500批。
批不合格品数分布表
不合格数 频数(批数) 频率 0 71 14.2% 1 139 27.8% 2 130 26.0% 3 90 18.0% 4 45 9.0% 5 18 3.6% 6 6 1.2% 7 0 0.0% 8 1 0.2% 500 100.0% 合计
160 140 120 100
批数

139

130 90

80 60 40 20 0

71 45 18 6 6

0 7

1 8

0

1

2

3

4

5

不合格品数

批不合格品数柱形图
2-15

(3)频数分布(组距式变量分布数列)
50只灯泡的耐用时数数据如下:(单位:小时)
886 1027 866 893 946
组号 (1) 1 2 3 4 5 6 7 8 合计

928 928 905 900 926
组限区间 (2) [750,800) [800,850) [850,900) [900,950) [950,1000) [1000,1050) [1050,1100) [1100,1150] —

999 978 954 800 895
组中值 (3) 775 825 875 925 975 1025 1075 1125 —

946 816 890 938 967
频数 (4) 1 4 12 18 8 4 1 2 50

950 1000 1006 864 920
频率 (5) 2.0% 8.0% 24.0% 36.0% 16.0% 8.0% 2.0% 4.0% 100.0%

864 918 926 919 978

1050 1040 900 853 821

927 854 999 981 924

949 1100 886 916 798

852 900 1120 818 850

max ? 1120 ,min ? 798 R ? max ? min ? 322 k ? 6 ~ 10 R 322 h? ? ? 32 ~ 53 k 6 ~ 10 h ? 50
2-16

四、累积频数分 ( Cumulative Frequency Distribution)
? (1) 品质变量累积频数(频率)分布
某品牌洗发水信任度调查结果统计表

顺 序 数 据

回答类别 人数(人) 比率 向上累积比率 向下累积比率 (1) (2) (3) (4) (5) 21 7.00% 7.00% 100.00% 非常不信任 64 21.33% 28.33% 93.00% 不信任 78 26.00% 71.67% 54.33% 一般 99 33.00% 87.33% 45.67% 信任 38 12.67% 100.00% 12.67% 非常信任 300 100.00% — — 合计
2-17

?
组号 (1) 1 2 3 4 5 6 7 8

(2)数量变量累积频数(频率)分布

组限区间 频数 向上累积频数 向下累积频数 频率 向上累积频率 向下累积频率 (3) (4) (5) (2) (6) (7) (8) 1 50 1 2.0% 2.00% 100.00% [750,800) 5 49 4 8.0% 10.00% 98.00% [800,850) 45 17 12 24.0% 90.00% 34.00% [850,900) 35 33 18 36.0% 70.00% 66.00% [900,950) 43 15 8 16.0% 86.00% 30.00% [950,1000) 47 7 8.0% 94.40% 14.00% [1000,1050) 4 48 3 2.0% 98.40% 6.00% [1050,1100) 1 50 2 4.0% 100.00% 4.00% [1100,1150] 2 50 — — 合计 100.0% — —

2-18

§2.3 统计表与统计图
? 统计表
? 统计图

一、统计表(Statistical Table)
表2-8 2004~2005年我国税收收入基本情况表 (单位:亿元) 表头

纵行标题
税收按税种分组 工商税 2004年 8 885.44 526.23 423.50 639.00 172.41 10 682.58 2005年 10 366.09 750.48 465.31 827.41 172.22 12 581.51 增长速度(%) 116.7 133.5 109.9 129.5 99.9 117.8

横 行 标 题

关税 农业税 国有企业所得税 集体企业所得税 合 计

数 字 资 料

主词栏 附 注

宾词栏

本表按当年价格计算 资料来源:《2006年中国统计年鉴》.中国统计出版社,2006

2-20

二、统计图(Statistical Chart) ? ⒈ 几何图 ? ⒉ 象形图 ? ⒊ 统计地图

2-21

§2.4 品质数据的图形展示
? 条形图 ? 饼图 ? 累积频数(频率)分布图

一、条形图(Bar Graph)
E D
香水类型

14 14 6 42 124 0 20 40 60 80 100 120 140

单式条形图

C B A

人数(人) E
香水类型

D C B A 0 10 20

老年 中年 青年

复式条形图

香水类型 青年 中年 老年 人数 比例 A 64 40 20 124 62.0% B 9 25 8 42 21.0% C 2 3 1 6 3.0% D 4 8 2 14 7.0% E 8 5 1 14 7.0% 87 81 32 200 100.0% 合计
60 70
2-23

30

40

50

人数(人)

二、饼图(Pie Chart)

3%

7%

7%

A B C D E 62%

21%

消费者对不同香型香水偏好分布饼图

2-24

三、累积频数(频率)分布图
绘制折线图—分类数据
120% 100% 80% 60% 40% 20% 0%
任 信 不 常 非
累积比率

累积比率

100.00% 87.33% 54.33% 28.33% 7.00%
任 信 不 般 一 任 信 任 信 常 非

120% 100% 80% 60% 40% 20% 0%
非 常 不 信 任

100.00% 93.00% 71.67% 45.67% 12.67%
不 信 任 一 般 信 任 非 常 信 任

信任度分类值

信任度分类值

向上累积分布图

向下累积分布图

消费者对某品牌洗发水信任度评价累积分布图
2-25

§2.5 数量数据的图形展示
? ? ? ? ? 直方图 折线图 累积折线图 茎叶图 频数(频率)分布曲线

一、直方图(Histogram)
40% 35% 30% 25% 20% 15% 10% 5% 0% 36.0% 24.0% 16.0% 8.0% 2.0% 750800 800850 850900 900950 8.0% 2.0% 4.0%

950- 1000- 1050- 11001000 1050 1100 1150 耐用时数组限(小时)

组号 (1) 1 2 3 4 5 6 7 8 合计

组限区间 组中值 频数 频率 (2) (3) (4) (5) 750-800 775 1 2.0% 800-850 825 4 8.0% 850-900 875 12 24.0% 900-950 925 18 36.0% 950-1000 975 8 16.0% 1000-1050 1025 4 8.0% 1050-1100 1075 1 2.0% 1100-1150 1125 2 4.0% — — 50 100.0%

比率

?

直方图的解释:落在某一特定区间内的观察值总数在 全部观察值中所占的百分比,与绘制在此区间上的矩 形的面积成比例。
2-27

二、折线图(Polygon)
?

折线图:在直方图的基础上,用线段顺次连接各直方 形顶边的中点,并延伸到直方图左右两侧的位于横轴 上的假想组中点,使线段与横轴相交所形成的图形。
20 16

频数

12 8 4 0 725 775 825 875 925 975 1025 1075 1125 1175 耐用时数组中值(小时)

50个灯泡的耐用时数频数直方图与折线图

2-28

三、累积折线图
绘制散点图—数量数据
坐标点 组限(x ) 向上累积频率(y) 1 797 0.0% 2 800 2.0% 3 850 10.0% 4 900 34.0% 5 950 70.0% 6 1000 86.0% 7 1050 94.4% 8 1100 98.4% 9 1120 100.0%
120% 100%
累积频率

94.4% 86.0% 70.0% 34.0% 0.0% 2.0% 10.0%

100.0% 98.4%

80% 60% 40% 20% 0%

750 800 850 900 950 1000 1050 1100 1150 耐用时数(小时)

向上累积频率分布折线图
2-29

绘制散点图—数量数据
坐标点 组限(x ) 向下累积频率(y ) 1 798 100.0% 2 800 98.0% 3 850 90.0% 4 900 66.0% 5 950 30.0% 6 1000 14.0% 7 1050 6.0% 8 1100 4.0% 9 1121 0.0%
120% 100%
累积频率

100.0% 98.0% 90.0% 66.0% 30.0% 6.0% 4.0% 0.0% 950 1000 1050 1100 1150 耐用时数(小时) 14.0%

80% 60% 40% 20% 0% 750 800

850

900

向下累积频率分布折线图
2-30

四、茎叶图(Stem-and-leaf Displays)
例:某公司最*应聘生产 职位的50人的150个能力测 验问题的结果如下表,数 据表示回答正确的问题数 (已排序)。
68 75 81 86 94 98 104 108 118 127 69 76 82 91 95 98 106 112 119 128 72 76 83 92 95 100 106 113 119 132 73 80 84 92 96 100 106 115 124 134 73 81 85 92 97 102 107 115 126 141
正确个数 Stem-and-Leaf Plot Frequency Stem & Leaf

2.00 6.00 8.00 11.00 9.00 7.00 4.00 2.00 1.00

6 . 89 7 . 233566 8 . 01123456 9 . 12224556788 10 . 002466678 11 . 2355899 12 . 4678 13 . 24 14 . 1

Stem width: 10 Each leaf: 1 case(s)
2-31

五、频数(频率)分布曲线

钟型分布 (对称)

钟型分布 (右偏)

钟型分布 (左偏)

U型分布

正J型分布

反J型分布

2-32

本章小结
一、统计数据的来源渠道分为直接来源渠道和间接来源 渠道。原始资料的收集方法有直接观察法、报告法、登记 法、访问法和实验法;次级资料收集的方法有直接引用法、 参考文献查找法和检索工具查找法。调查表和问卷是统计 资料收集的重要技术工具。 二、统计调查按组织方式可分为统计报表和专门调查两 种,其中专门调查又包括普查、重点调查、抽样调查、典 型调查、网上调查。 三、统计调查方案设计包括:确定调查的目的和内容; 确定调查对象、调查单位和填报单位;确定调查项目,拟 定调查表和问卷;确定调查的方式和方法;确定调查的时 间和期限;制定调查的组织实施计划。

本章小结
四、统计数据整理是将调查收集到统计资料,进行科 学的加工和综合汇总,使之系统化、条理化,以符合统 计分析与推断的要求。统计数据整理的内容主要包括统 计资料的审核、统计资料的分组和汇总、编制统计表或 绘制统计图。
五、统计分组是统计整理的核心。根据分组标志的多 少,可分为简单分组和分组体系分组;按照分组标志的 性质不同,可分为品质标志分组和数量标志分组,数量 标志分组又可分为单变量值分组和变量值组距分组。

本章小结
六、频数分布是表现统计分组的一种重要形式。根据 分组标志的不同,可形成品质变量分布数列和数量变量 分布数列。频数(频率)分布曲线在统计分析中具有广 泛的应用,根据曲线形状的特点,大致有钟型分布、U 型分布和J型分布三种类型。 七、统计表和统计图是整理、表达和分析统计资料的 重要工具。品质数据可以用条形图、饼图和累积频数分 布图等图形来展示数据分布的特征。数量数据可以用直 方图、折线图和茎叶图等图形来展示数据分布的特征。


相关文档

  • 应用统计学:经济与管理中的数据分析11
  • 应用统计学:经济与管理中的数据分析10
  • 应用统计学:经济与管理中的数据分析9
  • 应用统计学:经济与管理中的数据分析7
  • 应用统计学:经济与管理中的数据分析3
  • 应用统计学:经济与管理中的数据分析6
  • 应用统计学:经济与管理中的数据分析4
  • 应用统计学:经济与管理中的数据分析1
  • 应用统计学:经济与管理中的数据分析5
  • 应用统计学:经济与管理中的数据分析14
  • 猜你喜欢

  • “让文明礼仪之花开满校园”活动方案
  • 新余市新萍金属材料有限公司企业信用报告-天眼查
  • 佛山市【部编人教版】2019语文六年级上册-第二单元提升练*-附答案
  • 2019年小学上学期德育工作总结
  • 信息中心安全检查情况汇报
  • 关于山西省发展低碳经济的思考
  • 2017年中级统计师《统计实务》讲义:统计的过程
  • Android Material Design新UI控件使用大全 三
  • 岑巩县李妹子食品有限公司(企业信用报告)- 天眼查
  • 黑龙江省2020年(春秋版)六年级下册期中测试数学试卷A卷
  • 2018年秋人教版九年级数学上册课件:双休作业(六) (共26张PPT)
  • 山东省淄博第一中学2017-2018学年高二下学期阶段性检测(4月)化学试题
  • 五年级英语下册Unit3《Askingtheway》 优秀课件1(新版)牛津版(1)
  • 学习师德师风心得体会(精选多篇)
  • 2019学年沪教版九年级上册化学 第五章 金属的冶炼与利用 章节测试【精品】
  • 微型计算机原理与接口技术第二版-刘彦文等-第章
  • 会计电算化实务操作题
  • 超简单的勤洗手简笔画原创教程步骤
  • 一个利用“永恒之蓝”漏洞传播的挖矿程序分析
  • 2020版高考地理一轮复*课后限时集训9全球气候变化与气候类型的判读含解析新人教版
  • 重庆市人口与计划生育条例2016
  • 内蒙古钦钰电子科技有限公司企业信用报告-天眼查
  • 一种激光多用干涉仪的光学系统设计
  • 冀教版三年级英语下册Unit 2 Lesson10 Exercise课后作业课件【新版】
  • 入党介绍人的评语意见-2页文档资料
  • 儿童学素描的利与弊
  • 演讲致辞-儿童节国旗下讲话稿六一畅想 精品
  • 无机化工生产技术与操作
  • 天津惠瑞源汽车销售有限公司企业信用报告-天眼查
  • Spring事务管理只对出现运行期异常进行回滚
  • 【最新文档】社区助人为乐好人事迹,100字word版本 (14页)
  • 成都蔷薇电子科技有限公司企业信用报告-天眼查
  • 结婚娃娃怎么摆放
  • The test of Unit5 Topic1
  • 政府和社会资本合作(PPP)-县城城区改造及停车场建设项目物有所值评价报告(编制大纲)
  • 考试须知:金融理财师AFP考试详情分析
  • 九年级历史上学期期中教学质量评估测试试题
  • 防男人脱发必试六个妙招
  • 宜兴市电工厂宜城经营部企业信用报告-天眼查
  • 全国计算机试题
  • Spark为什么比MapReduce快
  • 银监会引导银行规范发展表外业务
  • 电脑版