数据挖掘技术的基本步骤

文 | Smartbi大数据百科 2021-09-24 阅读次数:7252 次浏览

商业智能BI产品更多介绍:https://www.smartbi.com.cn/

商业智能BI产品更多介绍:点击前往

    1.解释需求

    大多数数据挖掘项目都是针对特定领域的。数据采集者不应该沉浸在算法模型的世界里,而应该与具体领域的专家进行沟通和合作,正确地解释项目需求,这样才能贯穿整个项目生命周期。


    2.收集资料

    对于大型企业,数据收集主要从其他业务系统数据库中抽取。我们经常收集资料。因此,必须了解数据采样过程是如何影响采样分布的,才能确保训练(train)和(test)模型所用的数据都来自相同的分布。


    3.预处理数据

    预处理数据可以分为数据准备和数据归约两大部分。这些方法包括:缺值处理、离群值处理、归一化、平滑化、时间序列加权等;后一种方法主要包括维度归约、值归约和案例归约等。


    4.评估模式

    具体来说,这一步就是选择不同的模型,并寻找最好的模型。很多人将此步骤视为数据挖掘的全部步骤,但这显然只是泛化。尽管大多数情况下,这一步在整个过程中所花费的时间和精力都很少。


    5.解释模式

    多数情况下使用数据挖掘模型来辅助决策。很明显,人们不会根据“黑模式”来做决定。在此基础上,如何根据环境对模型作出合理的解释也是一个重要课题。


    6.数据挖掘在各行各业的应用

    零售业者可以利用数据挖掘来更好地识别人们可以根据过去的购买习惯购买哪些产品,或者哪一种产品在一年中的某一天可能销售得好。这样可以帮助企业计划库存和存储布局,还可以利用数据挖掘技术对线下零售商店进行智能定位。

     

    银行业和其他金融服务供应商可以挖掘与客户帐户、交易和渠道偏好相关的数据,从而更好地满足他们的需求。它们也可以通过分析网站和社会媒体中的交互数据来提高现有客户的忠诚度,吸引新客户。

     

    通过数据挖掘,制造企业能够有效地发现生产过程中的瓶颈问题和缺陷,从而提高生产效率。学生们也可以将数据挖掘的知识应用到产品设计中,并根据顾客经验的反馈进行调整。

     

    教育界可以从数据挖掘中获益,比如分析数据集来预测学生将来的学习行为和表现,然后利用这些数据改进教学方法或课程。

     

    卫生保健提供者可以挖掘和分析数据,找出更好的方法来为病人提供照顾,并降低费用。利用数据挖掘技术,可以预测病人需要护理的人数和所需服务类型。数据挖掘技术可以用来从大量的生物学数据中获得洞察力,并且有助于开发新的药物和其他的治疗方法。

     

    在很多行业,包括医疗保健和零售业,你可以使用数据挖掘来发现欺诈和其他滥用行为,比用传统的方法识别这些行为要快得多。


申请试用 了解更多

2024年度精选《思迈特制造行业BI最佳实践合集》

立即下载
Copyright© 广州思迈特软件有限公司  粤ICP备11104361号

电话咨询

售前咨询
400-878-3819 转1

售后咨询
400-878-3819 转2
服务时间:工作日9:00-18:00

微信咨询

添加企业微信 1V1专属服务