标签:面试经验
创建矩阵In:#方法一、通过将二维列表传给Numpy来创建矩阵print(np.array([[1,2],[3,4]]))#方法二、传入一个元组来描述矩阵的维度print(np.ones((3,2))) #3行2列矩阵print(np.zeros((3,2))) print(np.random.ra...
狭义的多重共线性(multicollinearity): 自变量的数据存在线性组合近似地等于零, 使得解线性方程组求解回归系数时结果不稳定, 回归结果很差。广义的多重共线性: 自变量之间存在较强的相关性, 这样自变量是联动的, 互相之间有替代作用。 甚至于斜率项的正负号都因为这种替代作用而可能是错误...
亚马逊提供的各种类型的开放数据集,包括电商交易,比特币交易等来源网址:https://aws.amazon.com/cn/opendata/?wwps-cards.sort-by=item.additionalFields.sortDate&wwps-cards.sort-order=des...
矩阵运算In:#相同大小矩阵的加减乘除data5 = np.array([[1,2],[3,4]])data6 = np.ones((2,2))jia1 = data5 + data6cheng1 = data5 * data6print(jia1,'',cheng1)Out:[[2...
残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话, 我们可以将残差看作误差的观测值。它应符合模型的假设条件,且具有误差的一些性质。利用残差所提供的信息,来考察模型假设的合理性及数据的可靠性称为残差分析。有多少对数据,就有多少个残...
Open Data 500是首个以开放政府数据来产生新的业务和开发新的产品和服务的综合研究性美国公司。来源网址:http://www.opendata500.com/us/
矩阵切片和聚合In:#可以在不同维度上使用索引操作来对数据进行切片data12 = np.array([[1,2],[3,4],[5,6]])print(data12)print(data12[0,1]) #1行2列数据print(data12[1:3]) #2-3行print(data12[0:2...
DW检验用于检验随机误差项具有一阶自回归形式的序列相关问题,也是就自相关检验。(1)如果0<DW< L D ,则拒绝零假设,扰动项存在一阶正自相关。DW 越接近于0,正自相关性越强。(2)如果L D <DW< U D ,则无法判断是否有自相关。(3)如果U D <DW&...
最完整的超过128个国家的经济数据,能够精确查找GDP, CPI, 进口,出口,外资直接投资,零售,销售等深度数据。来源网址:https://opendatainception.io/
矩阵转置和重构In:#NumPy数组的属性T可用于获取矩阵的转置print('转置前:',data12)print('转置后:',data12.T)Out:转置前: [[1 2] [3 4] [5 6]]转置后: [[1 3 5] [2 4 6]]In:#在较为复杂的...
主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。当解释变量为多元时,要使用调整的拟合优度,以解决变量元素增加对拟合优度的影响。假定一个总体可分为r类,现从该总体获得了一个样本——这是一批分类数据,需要我们从这些分类数据中出发,去判断总体各类出现的概率是否与已知的概率相符。譬如要检验一...
最完整的超过128个国家的经济数据,能够精确查找GDP, CPI, 进口,出口,外资直接投资,零售,销售等深度数据。来源网址:https://www.ceicdata.com/zh-hans
要使各种结构化的、非结构化的、海量的数据实现标准化、信息化,能够提供业务绩效评估、业务决策支持等要求,我们首先需要进行数据分析。针对不同数据分析对象所采用的6大类分析方法,每类里面包含各种小方法。常见的六大类分析方法主要包含:分解主体分析、钻取分析、常规比较分析、大型管理模型分析、财务和因子分析、专...
拟合优度(Goodness of Fit)是指回归直线对观测值的拟合程度。度量拟合优度的统计量是可决系数(亦称确定系数)R²。R²最大值为1。R²的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R²的值越小,说明回归直线对观测值的拟合程度越差。来源:百度百科来源网址:https://baik...
世界银行数据库列出了世界银行数据库的七千多个指标,也可以按照国家、指标、专题和数据目录浏览数据。来源网址:https://data.worldbank.org.cn/?year_high_desc=false
所谓分解主题分析,是指对于不同分析要求,我们可以初步分为营销主题、财务主题、灵活主题等,然后将这些大的主题逐步拆解为不同小的方面来进行分析。1.营销主题针对销售业务的分析,可以分解为客户分析、品类分析、区域分析、消费频率、价值链分析、促销、渠道、经销商、门店分析、同比环比、社交大数据分析、行业市场分...
相关系数绝对值在0.8以上认为高度相关。在0.5到0.8之间认为中度相关。在0.3到0.5之间认为低度相关。在0.3以下认为不相关或相关性很弱以至于没有实际价值。当然,在特别重要的问题中, 只要经过检验显著不等于零的相关都认为是有意义的。
用户可以在这个网站上查到最新的保险统计数据报告,保险业经营情况,保险公司保费收入情况等保险相关的数据信息。来源网址:http://www.circ.gov.cn/web/site0/tab5179/
针对财务业务的分析,可以分解为成本费用分析、利润、历史对比、财务法定报告及分析、资本性支出分析、财务预算分析、营销投入产出效率分析、会计核算分析、企业合并分析、偿债能力分析、盈利能力分析、经营现金流量分析等。例如财物主题预算分析可以分解为以下不同方面来分析,见下图:
相关系数是从数据中得到的x和y个变量关系的一种描述, 不能直接引申为因果关系。例如,增加身高,不一定增长体重。实际中有许多错误理解相关与因果性的例子。 例如:研究发现喝咖啡的人群比不喝咖啡的人群心脏病发病率高。 于是断言喝咖啡导致心脏病危险增加。 进一步研究更多的因素发现, 喝咖啡放糖很多的人心脏病...