欧非资源网:安全、免费、专业放心的资源下载站! 最新软件|软件分类

您的位置:欧非资源网 > 电脑专区 > 电脑教程 > 数据挖掘的基本步骤是什么

数据挖掘的基本步骤是什么

时间:2022-01-04 09:05作者:admin来源:未知人气:262我要评论(0)

具体步骤如下:

1、定义问题

在开始知识发现之前最先的也是最重要的要求就是了解数据和业务问题。必须要对目标有一个清晰明确的定义,即决定到底想干什么。比如,想提高电子信箱的利用率时,想做的可能是“提高用户使用率”,也可能是“提高一次用户使用的价值”,要解决这两个问题而建立的模型几乎是完全不同的,必须做出决定。

数据挖掘的基本步骤是什么

2、建立数据挖掘库

建立数据挖掘库包括以下几个步骤:数据收集,数据描述,选择,数据质量评估和数据清理,合并与整合,构建元数据,加载数据挖掘库,维护数据挖掘库。

3、分析数据

分析的目的是找到对预测输出影响最大的数据字段,和决定是否需要定义导出字段。如果数据集包含成百上千的字段,那么浏览分析这些数据将是一件非常耗时和累人的事情,这时需要选择一个具有好的界面和功能强大的工具软件来协助你完成这些事情。

4、准备数据

这是建立模型之前的最后一步数据准备工作。可以把此步骤分为四个部分:选择变量,选择记录,创建新变量,转换变量。

5、建立模型

建立模型是一个反复的过程。需要仔细考察不同的模型以判断哪个模型对面对的商业问题最有用。先用一部分数据建立模型,然后再用剩下的数据来测试和验证这个得到的模型。有时还有第三个数据集,称为验证集,因为测试集可能受模型的特性的影响,这时需要一个独立的数据集来验证模型的准确性。训练和测试数据挖掘模型需要把数据至少分成两个部分,一个用于模型训练,另一个用于模型测试。

6、评价模型

模型建立好之后,必须评价得到的结果、解释模型的价值。从测试集中得到的准确率只对用于建立模型的数据有意义。在实际应用中,需要进一步了解错误的类型和由此带来的相关费用的多少。经验证明,有效的模型并不一定是正确的模型。造成这一点的直接原因就是模型建立中隐含的各种假定,因此,直接在现实世界中测试模型很重要。先在小范围内应用,取得测试数据,觉得满意之后再向大范围推广。

7、实施

模型建立并经验证之后,可以有两种主要的使用方法。第一种是提供给分析人员做参考;另一种是把此模型应用到不同的数据集上。

相关阅读 ​万彩动画大师怎么添加一个场景的进场特效​剪映怎么提速视频声音不变调​剪映怎么压缩视频大小​剪映如何设置视频的区域范围​mindmaster如何使用分支箭头样式功能​mindmaster如何给主题添加优先级图标​mindmaster怎么在两个框框之间添加一个框框​美图秀秀怎么把照片变成黑白​美图秀秀镜面翻转怎么弄​美图秀秀如何消除红眼

文章评论
发表评论

热门文章 电脑上圈11怎么打_⑪_圈11如何输入?A4纸与16K纸的区别如何利用“工信部12300”微信公众号投诉移动、联通、电信的方法海康摄像头忘记密码,自己如何快速重置密码

最新文章 ​万彩动画大师怎么添加一个场景的进场特效​剪映怎么提速视频声音不变调 ​剪映怎么压缩视频大小​剪映如何设置视频的区域范围​mindmaster如何使用分支箭头样式功能​mindmaster如何给主题添加优先级图标

人气排行 电脑上圈11怎么打_⑪_圈11如何输入?A4纸与16K纸的区别如何利用“工信部12300”微信公众号投诉移动、联通、电信的方法海康摄像头忘记密码,自己如何快速重置密码海康威视网络摄像头接网线的线序与接法Secure Boot安全启动开启关闭方法手动设置IP地址和DNS的方法小米手机 如何安装谷歌服务框架,最简单的方法

盖楼回复X

(您的评论需要经过审核才能显示)