R: 是一种编程语言,在统计计算方面很出色。如果你不知道 R,你就称不上是数据科学家。R 是数据科学中最受欢迎的语言之一。

再识别(Re-identification): 将多个数据集合并在一起,从匿名化的数据中识别出个人信息。

回归分析(Regression analysis): 确定两个变量间的依赖关系。这种方法假设两个变量之间存在单向的因果关系(译者注:自变量,因变量,二者不可互换)。

实时数据(Real-time data): 指在几毫秒内被创建、处理、存储、分析并显示的数据。

推荐引擎(Recommendation engine): 推荐引擎算法根据用户之前的购买行为或其他购买行为向用户推荐某种产品。

路径分析(Routing analysis): –针对某种运输方法通过使用多种不同的变量分析从而找到一条最优路径,以达到降低燃料费用,提高效率的目的。