标签:华理研究案例
统计分析中最常见的原始数据形式是类似于数据库表或Excel数据表的形式。 这样形式的数据在R中叫做数据框(data.frame)。 数据框类似于一个矩阵,有个横行、个纵列, 但各列允许有不同类型:数值型向量、因子、字符型向量、日期时间向量。 同一列的数据类型相同。 在R中数据框是一个特殊的列表, 其...
该门户网站数据集由不同的政府部门、公共或私人组织提供。你可以免费用于下载,分发,复制,重复使用或链接等。来源网址:https://data.gov.hk/en
为统计方法的一种,包含了许多的方法,最基本的为单指标,再延伸出来的多指标分析。统计资料中有多个指标同时存在时的统计分析,是统计学的重要分支,是单指标统计的发展。 例如某公司经营综合情况就可以使用多指标分析,见下图示例:
R中列表(list)类型来保存不同类型的数据。 一个主要目的是提供R分析结果输出包装: 输出一个变量, 这个变量包括回归系数、预测值、残差、检验结果等等一系列不能放到规则形状数据结构中的内容。 实际上,数据框也是列表的一种, 但是数据框要求各列等长, 而列表不要求。列表可以有多个元素, 但是与向量不...
上面汇集了海量的各级政府各年度的经济和社会发展统计信息,可在上面找到统计年鉴、统计分析、主要统计指标排行等。来源网址:http://www.tjcn.org
指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。例如某年对国内各城市人均GDP与商品住宅成交均价的相关性分析,见下图示例:
在lubridate的支持下日期可以相减, 可以进行加法、除法。 lubridate包提供了如下的三种与时间长短有关的数据类型:时间长度(duration),按整秒计算时间周期(period),如日、周时间区间(interval),包括一个开始时间和一个结束时间来源:《统计软件》-李东风
平台主要发布安徽省统计年鉴、统计公报、进度数据等内容。来源网址:http://tjj.ah.gov.cn
指将客体(问卷、特征、现实)按研究要求进行分类编组,使得同组客体之间的差别小于各种客体之间的差别,进而进行分析研究的方法。其特点在于不依赖于原始资料分布的正常性假设,可以按任意规律分布,在分析既包括数量资料,又包括质量资料的混合资料时尤为重要。例如某公司上半年每月销量与收入情况分析,见下图示例:
lubridate包提供了floor_date(), round_date(), ceiling_date()等函数, 对日期可以用unit=指定一个时间单位进行舍入。 时间单位为字符串, 如seconds, 5 seconds, minutes, 2 minutes, hours, days, w...
所谓象限分析是时间管理理论的一个重要观念是重点地把主要的精力和时间集中地放在处理那些重要但不紧急的工作上,这样可以做到未雨绸缪,防患于未然。在人们的日常工作中,很多时候往往有机会去很好地计划和完成一件事。但常常却又没有及时地去做,随着时间的推移,造成工作质量的下降。因此,应把主要的精力有重点地放在重...
lubridate包的如下函数可以取出日期型或日期时间型数据中的组成部分:year()取出年month()取出月份数值mday()取出日数值yday()取出日期在一年中的序号,元旦为1wday()取出日期在一个星期内的序号, 但是一个星期从星期天开始, 星期天为1,星期一为2,星期六为7。hour(...
平台主要发布河南省统计数据、普查数据、数据公报等数据信息。来源网址:http://file.henan.gov.cn/4500000032/html/top.html
所谓大型管理模型分析,是指依据各种成熟的、经过实践论证的大型管理模型对问题进行分析的方法。这些管理模型有的是由高校研究机构建立的,也有一部分是由大企业或者管理咨询机构建立的,它们在长时间的企业管理理论研究和实践过程中,将企业经营管理中一些经典的相关关系以一个固定模型的方式描述出来,揭示企业系统内部很...
R日期可以保存为Date类型, 一般用整数保存,数值为从1970-1-1经过的天数。R中用一种叫做POSIXct和POSIXlt的特殊数据类型保存日期和时间, 可以仅包含日期部分,也可以同时有日期和时间。 技术上,POSIXct把日期时间保存为从1970年1月1日零时到该日期时间的时间间隔秒数, 所...
平台主要发布山东省各项年度数据、统计公报、普查公报等数据。来源网址:http://tjj.shandong.gov.cn/
RCV模型以资源(R)、能力(C)、价值(V)3个方面建立的价值链分析体系。例如要了解某大型制造企业,从供应商采购到物流中心到干线运输以及门店的一系列情况,我们可以通过分析人员数量,设备成本,备选供应商总量,活跃供应商数量,采购量,新品导入量等来了解供应商采购这一环节情况;从交易面积,建筑成本,收货...
正则表达式(regular expression)是一种匹配某种字符串模式的方法。 用这样的方法,可以从字符串中查找某种模式的出现位置, 替换某种模式,等等。 这样的技术可以用于文本数据的预处理, 比如用网络爬虫下载的大量网页文本数据。 R中支持perl语言格式的正则表达式, grep()和grep...
天津统计信息网以服务社会各界、促进经济发展为宗旨,利用现代化的信息手段实现统计的信息、监督、咨询三大职能。目前网站设有“政务公开”、“经济信息”、“统计工作”、“数据查询”、“统计法制”、“统计监督”、“统计指南”、“民意调查”等主要栏目,内容包含了大量的统计数据、统计分析。同时,为了使公众对统计有...