国家开放大学25春《大数据技术概论》形考任务2[答案] 题目类型: 判断题 题目: 大数据预处理阶段不包括数据插补步骤. 选项: √ × 题目类型: 判断题 题目: 在大数据分析过程中,无论数据采
题目类型:
判断题
题目:
大数据预处理阶段不包括数据插补步骤.
选项:
√
×
题目类型:
判断题
题目:
在大数据分析过程中,无论数据采集还是预处理都是不可或缺的环节,它们决定了分析结果的质量.
选项:
√
×
题目类型:
判断题
题目:
缺失值的处理方法只有直接删除,没有其他的处理方法.
选项:
√
×
题目类型:
判断题
题目:
特征选择是指选择对预测结果影响力较大的特征,以改善学习算法的性能和解释性.
选项:
√
×
题目类型:
判断题
题目:
数据的收集过程中,数据采集的工具和方法对数据质量、全面性和后续处理没有影响.
选项:
√
×
题目类型:
判断题
题目:
数据降维是一种能有效减少数据复杂度,简化模型计算的技术.
选项:
√
×
题目类型:
判断题
题目:
在hdfs中,namenode为主节点,负责元数据管理和块位置的索引.
选项:
√
×
题目类型:
判断题
题目:
sql数据库在定义关系时不需要定义属性的大小,从而避免了存储空间的浪费.
选项:
√
×
题目类型:
判断题
题目:
在分布式文件系统hdfs中,数据丢失的问题可以通过在多个数据节点上复制相同的数据块来解决.
选项:
√
×
题目类型:
判断题
题目:
当数据的结构发生变化时,使用sql数据库进行相应调整的成本相对较低.
选项:
√
×
题目类型:
单选题
题目:
按照预先设定的搜索规则,编写程序自动浏览并下载目标网页信息的数据采集方法称作
选项:
系统日志信息数据采集方法
etl工具数据采集方法
网络爬虫数据采集方法
传感器数据采集方法
题目类型:
单选题
题目:
下列关于数据预处理的描述中,错误的是
选项:
数据预处理是数据挖掘过程中很重要的一步
数据预处理可以提高后续数据分析的准确率
数据预处理中,无论何时数据都需要降维处理
数据预处理包括数据清洗、数据集成等步骤
题目类型:
单选题
题目:
数据的整理是根据分析目的对数据格式、形态和结构进行处理,其中( )能够在不损失或损失较少数据本身价值的情况下压缩数据.
选项:
数据的聚合
数据的提取
数据的连接
数据的变换
题目类型:
单选题
题目:
下列关于异常值的描述中,错误的是
选项:
可以使用箱线图检测异常值
当异常值的数量不是很多时,可以直接将含有异常值的观测记录删除
可以将异常值视为缺失值,按处理缺失值的方法处理异常值
异常值的存在不属于数据质量问题,不会影响模型的预测能力
题目类型:
单选题
题目:
大数据预处理中,下列哪一项是用来处理噪声数据的?
选项:
数据清洗
数据转化
数据归约
数据抽样
题目类型:
单选题
题目:
数据预处理的主要目的是
选项:
确定数据的来源
改变数据的存储位置
提高数据的质量和挖掘效率
增加原始数据的数量
题目类型:
单选题
题目:
分位数分组的基本思想是将样本( ),各组所包含的样本个数相同.
选项:
等分成若干份
按属性值大小排序
随机分组
按序分组
题目类型:
单选题
题目:
下列哪一项不是常用的数据预处理步骤
选项:
数据清洗
数据集成
数据归约
数据可视化
题目类型:
单选题
题目:
以下哪种方法不适宜处理大数据中的异常值
选项:
直接删除异常值
将异常值替换为平均值
将异常值视为缺失值,用插值法处理
直接将异常值赋值为极大值
题目类型:
单选题
题目:
下列哪一项不属于数据预处理的目标
选项:
提高数据质量
提高数据安全性
提高数据的可利用性
减少数据处理的复杂性
题目类型:
单选题
题目:
下列关于缺失值的描述中,错误的是
选项:
缺失值是指数据集中有些变量的一个或多个取值无法获得
数据缺失的现象大量存在
回归插补的方法不会改变数据分布
当缺失数据的记录所占比例在数据集中少于10%时,可以将缺失值直接删除
题目类型:
单选题
题目:
下列有关sql数据库的局限性,描述错误的是
选项:
结构化数据建模
已有数据结构的变化成本高
空间利用率低
无法保证事务处理的可靠性
题目类型:
单选题
题目:
数据仓库为什么可以帮助企业保持竞争力( )?
选项:
提供数据分析功能以及数据可视化和演示功能
数据仓库可以自动清理垃圾数据
使用数据仓库可以节省存储空间
数据仓库提供了大量质量低下的数据供企业使用
题目类型:
单选题
题目:
下列数据库中,属于文档数据库的是
选项:
redis
neo4j
hbase
mongodb
题目类型:
单选题
题目:
下列各项属于数据仓库的特点的是
选项:
数据以主题为导向,提供决策支持
数据源单一
数据质量低
不支持历史数据分析
国家开放大学25春《大数据技术概论》形考任务 2[答案]相关练习题:
【判断题】西方文明强调个体与个体之间的关系。()
金融机构贷款的借款合同是诺成合同,自双方当事人表示一致时成立;自然人之间的借款合同为实践合同,自贷款人提供借款时生效。()
周邦彦的词作有何特点?
5 猝死、昏迷的病人应该注意打开呼吸道。()
求职信的写作方法不包括( )。
1中国语言文字有何特质?(D)
3、Horror and doubt _ his troubled thoughts.
近代粒子物理学研究表明,物质构成的最小单元是()。
在Excel工作表的一个单元格中输入了一个公式,关于该单元格,以下说法中错误的是( )。
“跟神摔跤的人”是以色列人的字面意思
下面哪一项不属于世界的三大雕塑体系?()
国际收支平衡,是指国际收支差额处于一个相对合理的范围内,既()。
宗白华认为,艺术家表现的是主观的生命情调和客观的自然风景交融互渗。()
发现食物中毒后,自己能采取的最有效的一项应急措施是什么?()
在查找算法中,主关键字是指组成记录的若干数据项中能够()一条记录的数据项。
按皮亚杰的认知发展阶段可以将儿童发展阶段分为()。
3、【单选题】对位于伦敦奥林匹克公园的公共艺术作品《RUN》,描述正确的是(B)。
欲测量河外星系的距离,如执意用啥法根本就是 瞎折腾 ?
2、大学生常用的3D建模软件有( )。
()是指被摄主体在画面中所呈现的范围,根据视距(摄影机与被摄主体之间的距离)来划分,其作用为排出或包含注意力范围。
【多选题】25.党的十五大上,江泽民将新时期党的建设新的伟大工程的总目标,高度概括为( )。 A. 把党建设成为用邓小平理论武装起来、全心全意为人民服务 B. 思想上政治上组织上完全巩固、能够经受住各种风险 C. 始终走在时代前列 D. 领导全国人民建设有中国特色社会主义的马克思主义政党。
某劳动者跟用人单位签了三年的劳动合同,试用期应为()
1919年五四运动至1949年新中国成立以前这个时期,中国的社会性质是_____。
哮喘是遗传因素和环境因素共同作用的结果。
飞机的升限是多少?