东财21秋《数据挖掘概论》单元作业三[答案]
时间:2021-11-27 07:27 来源:奥鹏教育 作者:奥鹏作业答案 点击:次
东财21秋《数据挖掘概论》单元作业三[答案]答案 东财《数据挖掘概论》单元作业三 试卷总分:100 得分:100 一、单选题 (共 10 道试题,共 50 分) 1.线性回归通常通过( )方法进行参数估计。 A.最小二乘法 B.牛顿法 C.聚类 D.拉格朗日法 正确答案:-----
2.简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作( )。 A.层次聚类 B.划分聚类 C.非互斥聚类 D.模糊聚类 正确答案:-----
3.ID3、C4.5和CART都采用的是( )方法。 正确答案:----- A.贪心 B.回溯 C.动态规划 D.递归 正确答案:-----
4.表示簇内距离与簇间距离之比的指标为( )。 A.DBI指数 正确答案:----- B.Jaccard系数 正确答案:----- C.rand指数 正确答案:----- D.轮廓系数 正确答案:-----
5.存在噪声和离群点时,( )是更鲁棒的划分聚类方法。 A.k-中心点方法 B.AGNES C.k-均值方法 D.BIRCH 正确答案:-----
6.在决策树中,树的最顶层结点是( )。 A.内部结点 B.树叶结点 C.分支 D.根结点 正确答案:-----
7.垃圾邮件检测通常通过( )方法实现。 A.线性回归 B.岭回归 C.Lasso D.逻辑回归 正确答案:-----
8.对于有n个数据点的数据集,经验上通常设置簇数为( )。 A.√(2n) 正确答案:----- B.√n 正确答案:----- C.√2 正确答案:----- D.√(n/2) 正确答案:-----
9.在基本k-均值算法里,当邻近度函数采用( )的时候,合适的质心是簇中各点的中位数。 A.曼哈顿距离 B.平方欧几里德距离 C.余弦距离 D.Bregman散度 正确答案:-----
10.事件的优势比(odds)的取值范围是( )。 正确答案:----- A.(0,+∞) B.(0,1) C.(-∞,+∞) D.(-1,1) 正确答案:-----
东财21秋《数据挖掘概论》单元作业三[答案]多选题答案 二、多选题 (共 5 道试题,共 25 分) 11.( )可能成为k-均值的终止条件。 A.对固定数量的迭代 B.在局部最小值不是特别差的情况下,在迭代中对簇观测值的分配不发生变化 C.在连续迭代中质心不发生变化 D.RRS下降到阈值以下 正确答案:-----
12.以下属于分类器评价或比较尺度的有( )。 A.预测准确度 B.召回率 C.模型描述的简洁度 D.计算复杂度 正确答案:-----
13.k-均值聚类分析在( )情况下无法得出好的结果。 A.具有异常值的数据点 B.具有不同密度的数据点 C.具有非凹形的数据点 D.具有非环形的数据点 正确答案:-----
14.具有相同的时间复杂度的聚类算法有( )。 A.BIRCH B.k-均值 C.DBSCAN 正确答案:----- D.OPTICS 正确答案:-----
15.回归方法主要分为( )。 A.线性回归 B.非线性回归 C.岭回归 D.Lasso 正确答案:-----
三、判断题 (共 5 道试题,共 25 分) 16.分类是无监督学习,即每个训练样本的类编号是未知的,要学习的类集合或数量也可能是事先未知的。( )
17.精准率是分类器正确分类的检验元组所占的百分比。( )
21.给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。( )
19.在基于密度的聚类方法中,当“领域”中密度超过某一阈值会继续增长给定的簇。( ) 正确答案:-----
20.轮廓系数的数值越小说明模型的聚类效果越好。( ) 东财21秋《数据挖掘概论》单元作业三[答案]历年参考题目如下: (责任编辑:admin) |
![东财21秋《数据挖掘概论》单元作业三[答案]](/uploads/allimg/240109/37d699895b3444be6d3c099a47fbcbb9.jpg)