数据价值-DataValues

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 539|回复: 0

[R语言] R语言缺失值处理_r语言缺失值处理

[复制链接]

1万

主题

1万

帖子

3万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
39797
发表于 2017-3-3 13:22:54 | 显示全部楼层 |阅读模式
R语言缺失值处理_r语言缺失值处理,
数据缺失有多种原因,而大部分统计方法都假定处理的是完整矩阵、向量和数据框。,
缺失数据的分类:,
完全随机缺失:若某变量的缺失数据与其他任何观测或未观测变量都不相关,则数据为完全随机缺失(MCAR)。,
随机缺失:若某变量上的缺失数据与其他观测变量相关,与它自己的未观测值不相关,则数据为随机缺失(MAR)。,
非随机缺失:若缺失数据不属于MCAR或MAR,则数据为非随机缺失(NMAR) 。,
处理缺失数据的方法有很多,但哪种最适合你,需要在实践中检验。,
下面一副图形展示处理缺失数据的方法:,


处理数据缺失的一般步骤:,
1、识别缺失数据,
2、检测导致数据缺失的原因,
3、删除包含缺失值的实例或用合理的数值代替(插补)缺失值。,
1、识别缺失数据:,
R语言中,NA代表缺失值,NaN代表不可能值,Inf-Inf代表正无穷和负无穷。,
在这里,推荐使用is.nais.nanis.finiteis.infinite4个函数去处理。,
xkNN插值法:knnImputation函数使用k近邻方法来填充缺失值。对于需要插值的记录,基于欧氏距离计算k个和它最近的观测。接着将这k个近邻的数据利用距离逆加权算出填充值,最后用该值替代缺失值。,
library(DMwR)
newdata,目前,处理缺失值还有其他方法:,

,
当前,还有成对删除方法,但已经过时,虽然看起来,成对比较应用了所有的数据,但每次两组比较计算都是用到的不同数据集,这将会最终结果造成一定影响!!!
,
转载请注明:数据分析 » R语言缺失值处理_r语言缺失值处理
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|Archiver|手机版|DataValues ( 赣ICP备16006919号-3 点击这里给我发消息 DataValues

GMT+8, 2019-2-17 14:33 , Processed in 0.101589 second(s), 32 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表