大工21秋《数据挖掘》大作业题目及要求[答案]

作者:奥鹏作业答案 字体:[增加 减小] 来源:大工离线 时间:2021-12-01 09:00

网络教育学院 《数据挖掘》课 程 大 作 业 题 目: 姓 名: 学习中心: 第一大题:讲述自己在完成大作业过程中遇到的困难,解决问题的思路,以及相关感想,或者对这个项目的认识,或者对

大工21秋《数据挖掘》大作业题目及要求[答案]

大工21秋《数据挖掘》大作业题目及要求[答案]答案

                         网络教育学院
《数据挖掘》课 程 大 作 业
                                          
题    目:                                   
姓    名:                                   
学习中心:                                   
第一大题:讲述自己在完成大作业过程中遇到的困难,解决问题的思路,以及相关感想,或者对这个项目的认识,或者对Python与数据挖掘的认识等等,300-500字。
                                                                    
                                                                    
                                                                    

第二大题:完成下面一项大作业题目。











2021《数据挖掘》课程大作业
注意:从以下5个题目中任选其一作答。
题目一:Knn算法原理以及python实现
要    求:文档用使用word撰写即可。
   主要内容必须包括:
(1)算法介绍。
(2)算法流程。
(3)python实现算法以及预测。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交:
大作业上交时文件名写法为:[姓名 奥鹏卡号 学习中心](如:戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。


注意事项:
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
 
题目二:朴素贝叶斯算法原理以及python实现
要    求:文档用使用word撰写即可。
   主要内容必须包括:
(1)算法介绍。
(2)算法流程。
(3)python实现算法以及预测。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交:
大作业上交时文件名写法为:[姓名 奥鹏卡号 学习中心](如:戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。


注意事项:
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!
题目三:SVM算法原理以及python实现
要    求:文档用使用word撰写即可。
   主要内容必须包括:
(1)算法介绍。
(2)算法流程。
(3)python实现算法以及预测。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交:
大作业上交时文件名写法为:[姓名 奥鹏卡号 学习中心](如:戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。


注意事项:
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!

题目四:中华古诗词分析
要    求:编写程序爬取中华古诗词网站
https://so.gushiwen.org/authors/上诗人的诗词信息,至少500首诗词,抽取诗词信息的诗人名字、朝代、诗词标题、诗词内容存储在json文件中,自选某一角度完成对诗词的处理分析。如:
(1)杜甫、李白的诗词用字、用词的对比分析;
(2)唐宋代表性诗词的用词对比分析;
(3)使用sklearn对不同诗人的诗词进行训练,训练得到的模型能用于对诗词的作者的判别。对比不同算法判别的准确率。
(4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交:
大作业上交时文件名写法为:[姓名 奥鹏卡号 学习中心](如:戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。


注意事项:
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!

题目五:歌词分析
要    求:自选有音乐歌词的网站,编写爬虫程序下载不同类型的歌曲歌词,至少3种以上类型,每种类型至少100首歌曲,抽取其中的歌曲名称、歌曲类型、歌词信息存储在json文件中,自选某一角度对歌词进行处理分析。如:
(1)不同类型的歌曲用词分析,如下图所示(自行学习使用jieba库和wordcloud库的使用)。
(2)使用sklearn库对不同类型的歌词进行训练,训练得到的模型能用于对歌词类型的判别。对比不同算法判别的准确率。
(3)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP )
作业提交:
大作业上交时文件名写法为:[姓名 奥鹏卡号 学习中心](如:戴卫东101410013979浙江台州奥鹏学习中心[1]VIP)
以附件形式上交离线作业(附件的大小限制在10M以内),选择已完成的作业(注意命名),点提交即可。如下图所示。


注意事项:
独立完成作业,不准抄袭其他人或者请人代做,如有雷同作业,成绩以零分计!

大工21秋《数据挖掘》大作业题目及要求[答案]历年参考题目如下:




东财《网上创业实务X》综合作业

试卷总分:100  得分:100

一、单选题 (共 15 道试题,共 30 分)

1.关于Outlook Express的说法错误的是()。

A.允许用户通过目录服务检索数字标识

B.Outlook Express使用标准S/MIME

C.可以建立电子邮件列表

D.不能使用签名文件

 

2.以下不可以运用RFM法的情形是()。

A.公司为某项直邮寻求目标受众

B.公司为提高知名度

C.公司为目录营销活动寻求目标受众

D.对所有潜在顾客进行排序以识别目标客户

 

3.以下不属于物流成本的是( )。

A.运输成本

B.仓储成本

C.包装成本

D.促销成本

 

4.以下不属于企业选择自营物流模式原因的是( )。

A.提高服务质量

B.降低物流成本

C.追求全面发展

D.掌握经营主动权

 

5.世界上最有名的软件公司是()。

A.BMC软件

B.甲骨文

C.萨普

D.微软

 

6.在搜索引擎中,()优先级最高。

A.网站域名

B.网站IP地址

C.网站标题

D.Meta标签

 

7.网上市场调查的特点不包括()。

A.网上信息资源海量但分散

B.垃圾信息较多

C.各种检索软件检索方法统一

D.隐私性

 

8.根据中华人民共和国国务院令第291号《中华人民共和国电信条例》、第292号《互联网信息服务管理办法》,国家对提供互联网信息服务的ICP实行()制度。

A.授权

B.委托

C.许可

D.管制

 

9.以下不适合在网上出售的的商品是()。

A.化妆品类

B.生鲜食品

C.服装

D.书籍

 

10.()策略对短期交易商品、季节性商品、过时、滞销、易腐、易损商品的销售比较适宜。

A.贸易折扣

B.累计数量折扣

C.一次性数量折扣

D.商业折扣

 

11.以下( )网上商城不以C2C模式为主。

A.京东商城

B.淘宝网

C.易趣网

D.拍拍网

 

12.下列关于RFM法的说法中错误的是( )。

A.它是对数据库记录进行管理的一个重要法则

B.运用它的三个指标能对客户数据库做数据挖掘

C.它能够识别公司营销活动的目标顾客

D.它能够将公司的顾客进行分类

 

13.网络营销发展的最高阶段是()。

A.门户网站

B.信息代理人

C.商业网站

D.个人网站

 

14.网店加盟是针对()提出的概念。

A.货源

B.商品类型

C.商品价格

D.商品生产商

 

15.客户关系管理是以()为中心。

A.产品

B.销售

C.客户

D.生产

 

二、多选题 (共 20 道试题,共 60 分)

16.企业市场营销因素包括()。

A.营销战略

B.产品策略

C.价格策略

D.渠道策略和促销策略

 

17.下列选项中,网店可选的支付方式有( )。

A.第三方支付平台支付

B.网上银行支付

C.货到付款

D.消费卡付款

 

18.目前,()是实现网络出版的技术。

A.在线阅读

B.电子邮件的订阅

C.电子出版物的网站应用

D.电子书

 

19.下列关于搜索引擎优化SEO说法错误的是()。

A.SEO是运行网站的前期准备工作

B.利用HTML代码可单独为搜索引擎的spider设置一套meta标签

C.Meta标签应嵌入大量描述网站的关键词,防止信息遗漏

D.Description中通常用包含关键词的语句形成长尾关键词

 

20.根据布尔塞模型,以下适合在网上销售的商品是()。

A.高科技产品

B.名牌商品

C.价格高的商品

D.数字化产品

 

21.下对客户关系管理的理解正确的有( )。

A.不等于CRM软件

B.客户关系管理的目的不是与所有客户建立稳定的关系

C.以服务为中心

D.不仅是销售商与客户的关系管理

 

22.百度有啊的信用度与()因素有关。

A.卖家支付的平台费用

B.买卖次数

C.提供的商品种类

D.成交金额

 

23.以下有关淘宝助理说法正确的是()。

A.是一款客户端软件工具

B.不可以离线使用

C.可以批量编辑商品信息

D.可以用以与客户之间的即时通讯

 

24.下面那种定价策略不是建立在低价基础上的新产品定价策略为( )。

A.声望定价

B.渗透定价

C.折扣定价

D.差别定价

 

25.经营者可通过以下( )方式中的获取网站空间。

A.购买服务器

B.租用虚拟主机

C.工商部门进行注册

D.购买.com域名

 

26.以下属于电子商务常见模式的是()。

A.B2B模式

B.B2C模式

C.B2G模式

D.C2C模式

 

27.下列()是以概率样本为基础的在线调查方法。

A.混合调查法

B.娱乐性调查法

C.截取调查

D.事先确定样本法

 

28.对于积极的客户群体,企业应当在以下几个方面予以加强,它们包括( )。

A.促使他们购买相关产品

B.增加购买数量及频率

C.请他们介绍ABC准客户

D.维持这些客户对企业的忠诚度

 

29.以下属于自建网站风险的是()。

A.注册程序复杂

B.缺少独立的客户资源数据库

C.较高的推广成本

D.不能拥有独立域名

 

30.对网站有利的网络广告收费模式是()。

A.CPA

B.CPP

C.CPM

D.包月方式

 

31.Outlook Express具有内置安全电子邮件,并提供具有下列特性的易用界面()。

A.发送签名的邮件

B.接收签名的邮件

C.发送加密的邮件

D.接收加密的邮件

 

32.客户关系管理的作用有()。

A.识别客户的忠诚度

B.确定客户的价值

C.分析客户的行为特征

D.做出相应的决策

 

33.共享软件市场发展遇到的问题有()。

A.盗版猖獗

B.利润低

C.软件共享使信息的自由传播,导致信息安全问题

D.网民对软件价值的认识不高

 

34.下列选项中,属于物流联盟模式优点的是( )。

A.加强与客户的直接沟通

B.分担风险

C.利润共享

D.企业间优势互补

 

35.产品组合策略主要有()。

A.产品价格型

B.市场专业型

C.产品系列专业型

D.多系列全面型

 

三、判断题 (共 5 道试题,共 10 分)

36.网上家教是最好的教学方法。( )

 

37.货到付款不能先验货后付款。( )

 

38.易趣网平台从创立时起,就对所有商家实行全免费。()

 

39.为防止商标侵权,网店经营者在注册商业网站可同时申请.cn域名。( )

 

40.网络咨询的人群主要集中在北京、上海、广东等发展水平很高的城市。( )

 

作业咨询:
点击这里给我发消息

论文咨询:
点击这里给我发消息

合作加盟:
点击这里给我发消息

服务时间:
8:30-24:00(工作日)