【答案】 R语言编程技术第三章高级数据管理测验：期中测验

第1题单选题

R语言来自哪门语言？

A. B

B. S

D. Java

第2题单选题

KDnuggets 网站每年都会做一些数据分析和数据挖掘软件使用的专题问卷调查。据KDnuggets 网站2011 年对570 个数据挖掘和数据分析的工作者关于过去 12 个月数据挖掘和数据分析所使用的编程语言的调查显示，排行榜首的是哪门语言？

A. C++

B. C

C. R

D. Java

第3题单选题

除了R 之外，现在还有许多人使用SPSS、SAS、MatLab，在这些统计软件中免费使用的是

A. SAS

B. SPSS

C. R

D. MatLab

第4题单选题

R几乎囊括了所有统计方法，当其他软件还不能完成一些最新的统计方法，在R中几乎都可以完成。R 的更新速度是以多久来计算的？

A. 月

B. 年

周

D. 日

第5题单选题

R的官方网站是

A. www.r.org

B. www.r.com

C. www.r-project.com

D. www.r-project.org

第6题单选题

R除了自己的主程序，还有5000多个用户贡献的扩展（附加）包，以及各种文档被复制到世界各地几十台服务器上供用户下载。作为中国用户，一般都会选择一个国内的镜像。目前中国大陆的镜像有几个

A. 2

B. 1

C. 4

D. 6

第7题单选题

R语言作为一门强大的面向对象的数据统计语言，除了免费之外，其出色的图形功能、丰富的统计方法、超强的建模能力、种类繁多的分析包，相对简捷的操作也都是R的优势。但是，R本身默认的IDE 不是很友好，甚至可以用粗糙来形容。它不具备哪个功能？

A. 查看help

B. 简单的命令行窗口

C. 自动缩进

D. 图形结果

第8题单选题

与其他计算机程序语言一样，R也有一个记录当前工作环境的工作空间(Workspace)，里面保存了所有用户定义的向量、矩阵、函数、数据框、列表等一系列对象。在一个R的会话结束时，可以选择(自动)保存当前的工作空间并在下次启动R 是自动载入。当前工作路径(Working Directory)是R用来读取和保存文件的默认路径。一般使用哪个函数来查看？

A. getwd()

B. setwd()

C. ls()

D. rm()

第9题单选题

退出。并询问是否保存当前工作空间的命令是？

A. quit()

B. exit()

C. q()

D. poweroff()

第10题单选题

R语言不能用于哪个操作系统？

A. 黑莓

B. Android

C. iphone

D. Linux

第11题单选题

以下哪个不是R的存储数据类型

A. 指针

B. 向量

C. 数组

D. 数据框

第12题单选题

R语言的数据类型包括数值型，数值型默认是

A. 单精度数据

B. 整数

C. 小数

D. 双精度数据

第13题单选题

有些统计资料是不完整的。当一个元素或值在统计的时候发生缺失的时候用什么表示？

A. NA

B. 空格字符

C. 空字符

D. 0

第14题单选题

x <- seq(0, 1, by = 0.2)；y <- seq(0, 1, by = 0.2);y[4] > 1 - x[3]的结果是

A. 0

B. TRUE

C. NA

D. FALSE

第15题单选题

在R语言中，赋值号不正确的表示方式是

A. ==

B. <-

C. =

D. ->

第16题单选题

以下向量赋值语句不正确的是

A. u=c(TRUE,FALSE,TRUE,FALSE,FALSE)

B. c(1,3,5,7,9)->y

C. x<-c(1,3,5,7,9)

D. z<-c("Male","Female",3,"Male","Male")

第17题单选题

y<-matrix(1:20,nrow=5,ncol=4)，y[4,2]的值为

A. 9

B. 17

C. 18

D. 20

第18题单选题

用函数seq()产生有规律的各种序列，其句法是：seq(from,to,by)，from表示序列的起始值，to表示序列的终止值，by表示步长,默认值是

A. 0.5

B. 0

C. 0.1

D. 1

第19题单选题

运行rep(1:3,rep(2,3))，结果是

A. 112233

B. 123

C. 111222333

D. Errorinrep(1:3,rep(2,3)):invalid'times'argument

第20题单选题

y <- c(2,6,7,3,5);append(y,10:15,after=3)结果是

A. 26731011121314155

B. 10111213141526735

C. 26710111213141535

D. 26735101112131415

第21题单选题

在线安装。必须需要使用哪个命令按照扩展包？

A. install.library()

B. install.package()

C. install.packages()

D. install.liabraries()

第22题单选题

repeat语句依赖哪个语句跳出循环体？

A. continue

B. stop

C. break

D. end

第23题单选题

关于下面代码的说法正确的是: sim.clt <- function (m=100,n=10,p=0.25) { z = rbinom(m,n,p) x = (z-n*p)/sqrt(n*p*(1-p)) hist(x,prob=T,breaks=20,main=paste("n =",n,”p =”,p)) curve(dnorm(x),add=T) }

A. 通过随机变量标准化作图显示概率密度走向

B. 将二项分布随机变量标准化后做柱状图

C. 利用二项分布标准化验证中心极限定理

D. 产生二项分布的随机数

第24题单选题

产生泊松分布的函数为

A. rpois()

B. runif()

C. rexp()

D. rbinom()

第25题单选题

在数据挖掘和机器学习领域，从更大的数据集中抽样是很常见的做法。举例来说，你可能希望选择两份随机样本，使用其中一份样本构建预测模型，使用另一份样本验证模型的有效性。调用哪个函数能够让你从数据集中（有放回或无放回地）抽取大小为n的一个机样本。

A. rnorm()

B. sample()

C. example()

D. seq()

第26题单选题

正态分布式古典统计学的核心，涉及到两个参数：位置参数均值mu和尺度参数标准差sigma，正态分布的图形倒立如钟，对称分布。生成100个标准正态分布的语句为

A. rnorm(100)

B. rnorm(0,100,1)

C. rnorm(1,0,100)

D. rnorm(0,1,100)

第27题单选题

均匀分布的逆变换函数是

A. -logU

B. log(1-U)

C. -log(1-e)

D. logU

第28题单选题

在一行布局3张图，应使用

A. par(mfcol=c(1,3))

B. par(mfrow=c(2,3))

C. par(mfrow=c(3,1))

D. par(mfrow=c(1,3))

第29题单选题

为了统计方便，生成同样的随机数，在产生随机数之前需调用哪个函数？

A. seeds()

B. seed()

C. set.seed()

D. set.seeds()

第30题单选题

调用runif()函数默认均匀分布区间为

A. [0,1]

B. [-1,1]

C. [0,5]

D. [0,10]

第31题单选题

R语言采用哪种方式产生随机数？

A. 物理装置或随机数发生器

B. 特定算法

C. 伪随机数

D. 专门的随机数表

第32题单选题

由于不同类型值的评价标准不同（均值和标准差相去甚远），在组合之前需要先让它们变得可以比较。一种方法是将变量进行标准化，这样每科考试的成绩就都用单位标准差来表示，而不是以原始的尺度来表示了。此时应调用哪个函数？

A. scale()

B. quantile()

C. apply()

D. cast()

第33题单选题

在实际的应用中，多元函数优化需要调用哪个函数？

A. optimize

B. optimization

C. optimize

D. optim

第34题单选题

reshape包是一套重构和整合数据集的绝妙的万能工具。由于它的这种万能特性，数据在重构之前往往需要进行融合，融合函数为

A. melt()

B. cbind()

C. rbind()

D. cast()

第35题单选题

在整合数据时，往往将多组观测替换为根据这些观测计算的描述性统计量。在重塑数据时，则会通过修改数据的结构（行和列）来决定数据的组织方式。整合数据函数为

A. aggregate()

B. cbind()

C. rbind()

D. t()

第36题单选题

R的最大优点之一就是用户可以自行添加函数。事实上，R中的许多函数都是由已有函数构成的。函数中的对象只在函数内部使用。返回对象的数据类型是任意的，从标量到列表皆可。定义函数的关键字为

A. function

B. method

C. procedure

D. record

第37题单选题

概率函数也属于统计类，但是它们非常独特，应独立设一节进行讲解。概率函数通常用来生成特征已知的模拟数据，以及在用户编写的统计函数中计算概率值。概率密度函数以哪个字母开头？

A. d

B. p

C. q

D. r

第38题单选题

下列哪个不是条件控制语句？

A. switch

B. ifelse

C. for

D. if/else

第39题单选题

大的数据对象常常是从外部文件读入，而不是在R 中直接键入的。读入文本文件数据的命令是

A. read.table()

B. c()

C. scan()

D. read.xport()

第40题单选题

数据框的主要用途是保存统计建模的数据。R 软件的统计建模功能都需要以数据框为输入数据。我们也可以把数据框当成一种矩阵来处理。在使用数据框的变量时可以用“数据框名$变量名”的记法。但是，这样使用较麻烦，R软件提供了attach()函数可以把数据框中的变量“链接”到内存中，将数据框“连接（绑定）”入当前的名字空间，解绑调用哪个函数？

A. within()

B. 再调用attach()

C. with()

D. detach()

第41题单选题

在矩阵运算中还有求特征值和特征向量的运算，在R中可以通过哪个函数得到

A. solve()

B. t()

C. outer()

D. eigen()

第42题单选题

在R中可以使用哪个函数得到矩阵的维数？

A. dim()

B. nrow()

C. ncol()

D. colSums()

第43题单选题

A <- matrix(1:16,4);lower.tri(A)的结果是

A. 逻辑值的下三角矩阵

B. 上三角矩阵

C. 下三角矩阵

D. 逻辑值的上三角矩阵

第44题单选题

大的数据对象常常是从外部文件读入，而不是在R 中直接键入的。读入文本文件数据的命令是

A. scan()

B. c()

C. read.table()

D. read.xport()

第45题单选题

下列哪个不是条件控制语句？

A. for

B. ifelse

C. switch

D. if/else

第46题单选题

A. function

B. method

C. procedure

D. record

第47题单选题

生成数据框的函数是

A. frame()

B. data.frame()

C. data()

D. data()

第48题单选题

A <- matrix(1:12,3,4);apply(A,2,sum)的结果是

A. 14710

B. 6152433

C. 25811

D. NANANANA

第49题单选题

分类型数据经常要把数据分成不同的水平或因子（factor）。比如，学生的性别包含男和女两个因子。因子代表变量的不同可能的水平（即使在数据中不出现）。在统计模型中十分有用，如果把数据分成若干个因子。可以利用哪个函数列出因子水平？

A. levels()

B. factor()

C. sum()

D. ordered()

获取答案请阅读全文

未经允许不得转载！【答案】 R语言编程技术第三章高级数据管理测验：期中测验

【答案】 R语言编程技术 第三章 高级数据管理 测验：期中测验

【答案】 R语言编程技术第三章高级数据管理测验：期中测验