标签:面试经验
源程序文件存在编码问题。 对于源程序编码与系统默认编码不同的情况, 在source()函数中可以添加encoding=选项。 例如, 保存为UTF-8编码的源程序在简体中文MS Windows系统的R中运行, 可以在source()函数中可以添加encoding="UTF-8"选...
平台拥有免费数据集和专门用于数据科学的丰富信息文章,他们使用硬数据和统计分析来讲述有关政治,体育,社会问题等的故事。来源网址:https://github.com/fivethirtyeight/data
字符串是 Python 中的另一种基本数据类型。它通常是指人类可以阅读的文本,但更广泛地说,它是一个字符序列,并且字符只有在组成这个序列时才有意义。很多商业应用中都有字符串类型的数据,比如供应商和客户的名字及地址、评价和反馈数据、事件日志和文档记录。一些对象看上去是整数,但实际上是字符串,比如邮政编...
用source()函数可以运行保存在一个文本文件中的源程序。 比如,如下内容保存在文件ssq.r中:sum.of.squares <- function(x){ sum(x^2)}用如下source()命令运行:source("ssq.r")运行后就可以调用自定义函数su...
BuzzFeed是一家提供新闻和娱乐内容的跨平台数字媒体公司,同时也提供免费数据集,是搜索机器学习和数据科学公共数据集的绝佳来源,可以在线获取不同主题 - 从顶级健身趋势和啤酒配方到农药中毒率。来源网址:https://www.buzzfeed.com
Python 中包含了 datetime 模块,它提供了非常强大的功能来处理日期和时间。要想在脚本中使用 datetime 模块提供的功能,需要在脚本上方加入 from datetime import date,time, datetime, timedelta ,放在之前的 import 语句下面...
数值型变量可以计算各种不同的统计量, 如平均值、标准差和各个分位数。 summary()可以给出最小值、最大值、中位数、四分之一分位数、四分之三分位数和平均值。如summary(tax.tab[["营业额"]])## Min. 1st Qu. Median Mean...
是一个大型数据集聚合器,是美国政府开放数据的所在地。有14个不同的主题(从农业,公共安全到地方政府),因此很有可能找到非常有趣的数据集。来源网址:https://www.data.gov
# 使用方括号创建一个列表# 用len()计算列表中元素的数量# 用max()和min()找出最大值和最小值# 用count()计算出列表中某个值出现的次数a_list = [1, 2, 3]print("Output #58: {}".format(a_list))print(...
R使用经常是在命令行逐行输入命令(程序), 结果紧接着显示在命令后面。 如何保存这些命令和显示结果? 在R命令行中运行过的命令会被保存在运行的工作文件夹中的一个名为.Rhistory的文件中。 用sink()函数打开一个文本文件开始记录文本型输出结果。 结束记录时用空的sink()即可关闭文件不再记...
UCI是机器学习方面最著之一名的数据存储库。如果正在寻找与机器学习库相关的数据集,通常是第一个去的地方。除此之外还包括各种各样的数据集,如Iris和泰坦尼克号的生存、空气质量和GPS轨迹等。 来源网址:https://archive.ics.uci.edu/ml/index.php
# 使用索引值访问列表中的特定元素# [0]是第1个元素,[-1]是最后一个元素print("Output #65: {}".format(a_list[0]))print("Output #66: {}".format(a_list[1]))print(&q...
命令行的计算结果直接显示在命令的后面。 在用source()运行程序文件时, 需要用print()函数显示一个表达式的结果,如:print(sin(pi/2))## [1] 1用cat()函数显示多项内容, 包括数值和文本, 文本包在两个单撇号或两个双撇号中,如:cat("sin(pi/2...
该平台主要提供学术数据集和论文,主要侧重于从科学论文中共享数据集。来源网址:http://academictorrents.com
round(1.1234, 2)## [1] 1.12round(-1.9876, 2)## [1] -1.99floor(1.1234)## [1] 1floor(-1.1234)## [1] -2ceiling(1.1234)## [1] 2ceiling(-1.1234)## [1] -1ro...
聚数力平台是一个大数据应用要素的托管与交易平台,名称源自 “聚集数据的力量” 核心理念。旨在为大数据应用要素建立交易市场、制定交易规则、定义构建产品标准。平台提供大数据应用过程中领域知识、数据资源、分析要素等各类要素的发布和托管,以及由此衍生出的交易市场和交易规则。用户可通过平台发布或托管的方式,将...
# 使用[:]复制一个列表a_new_list = a_list[:]print("Output #77: {}".format(a_new_list))这个示例展示了如何复制一个列表。如果你需要对列表进行某种操作,比如添加或删除元素,或对列表进行排序,但你还希望原始列表保持不变...
非商业、个性化的电影推荐平台,拥有两万余部电影及数十万用户,平台提供1100个标签上1200万个相关分数的标签基因组数据。来源网址:MovieLens.org