要检查数据框列是否包含重复值,我们可以将重复函数与任何重复函数一起使用。例如,如果我们有一个名为df的数据帧,其中包含一个列ID,则可以使用以下命令检查ID是否包含重复值-
any(duplicated(df$ID))
考虑以下数据帧-
ID<-1:20 x<-rpois(20,1) df1<-data.frame(ID,x) df1输出结果
ID x 1 1 4 2 2 1 3 3 2 4 4 2 5 5 1 6 6 0 7 7 1 8 8 1 9 9 0 10 10 1 11 11 1 12 12 2 13 13 1 14 14 3 15 15 1 16 16 0 17 17 0 18 18 3 19 19 2 20 20 2
检查x是否包含任何重复项-
任何(重复(df1 $x))
[1] TRUE
S.No<-1:20 y<-round(rnorm(20,5,3),1) df2<-data.frame(S.No,y) df2输出结果
S.No y 1 1 5.1 2 2 5.8 3 3 4.4 4 4 10.1 5 5 3.3 6 6 6.1 7 7 4.8 8 8 12.6 9 9 6.4 10 10 8.7 11 11 1.5 12 12 2.5 13 13 2.1 14 14 8.7 15 15 5.5 16 16 2.0 17 17 2.1 18 18 5.5 19 19 5.4 20 20 3.4
检查y是否包含任何重复项-
任何(重复(df2 $y))
[1] TRUE