博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
第四章 基本数据管理
阅读量:4684 次
发布时间:2019-06-09

本文共 1480 字,大约阅读时间需要 4 分钟。

4 基本数据管理

4.1一个示例(创建leadership数据框)

manager<-c(1,2,3,4,5)data<-c("10/24/08","10/28/08","10/1/08","10/12/08","5/1/09")country<-c("US","US","UK","UK","UK")gender<-c("M","F","F","M","F")age<-c(32,45,25,39,99)q1<-c(5,3,3,3,2)q2<-c(4,5,5,3,2)q3<-c(5,2,5,4,1)q4<-c(5,5,5,NA,2)q5<-c(5,5,2,NA,1)leadership<-data.frame(manager,data,country,gender,age,q1,q2,q3,q4,q5,stringASFactors=FALSE)

4.2 创建新变量

4.3变量的重编码

将leadship数据集中经理人的年龄变量age重编码为类别型变量

leadership within <-(leadership,{  agecat <-NA  agecat[age>75]<-"Elder"  agecat[age>=55&age<=75]<-"Middle Age"  agecat[age<55]<-"Young" })

4.4 变量的重命名

fix(leadship)#交互的方式修改变量的名称

reshape内的rename函数

ibrary(reshape)leadership<-rename(leadership,                   c(manage="mamanageID",data="testdata")                   )#通过reshape库将名字更改

name()函数来重命名

names(leadship)[2]<"testdata"

4.5缺失值

> y<-c(1,2,3,NA)

> is.na(y)
[1] FALSE FALSE FALSE TRUE #检测y内是否有空值存在

4.6 在分析中排除缺失值

x<-(1,2,3,NA)y<-sum(x,na.rm = TRUE)#na.rm计算之前排除缺失值,并使用剩余值进行计算

  删除不完整的数据

newdata<-na.omit(leadership)#使用na.omit 函数

4.7日期值

  

4.8 数据类型转换

4.9 数据排序

newdata<-leadership[order(leadership$age),]#按照年龄排序
attach(leadership)newdata<-leadership[order(gender,-age),]detach(leadership)#性别 年龄降序排列

4.10 数据集的合并

 

4.11 数据集取子集

4.12 选入观测

attach(leadership)newdata<-leadership[which(gender=='M'&age>30),]detach(leadership)newdata #挑选性别为男且年龄大于30岁的人

4.13 sunset()函数

4.14 随机抽样

mysample<-leadership[sample(1:nrow(leadership),3,replace=FALSE),]

  

4.15 SQL

 

 

 

  

 

转载于:https://www.cnblogs.com/py-Tom/p/4803835.html

你可能感兴趣的文章
16 乘法口诀输出
查看>>
mac 常用地址
查看>>
鼠标经过切换图片
查看>>
流程控制 Day06
查看>>
Linux下安装Tomcat
查看>>
windows live writer 2012 0x80070643
查看>>
C程序的启动和终止
查看>>
asp.net web 定时执行任务
查看>>
tomcat 和MySQL的安装
查看>>
11.5 内部类
查看>>
Cosine Similarity
查看>>
浅谈JAVA集合框架
查看>>
halt和shutdown 的区别
查看>>
git常用操作
查看>>
京东SSO单点登陆实现分析
查看>>
render()方法是render_to_response
查看>>
u-boot启动第一阶段
查看>>
北京大学2019年数学分析考研试题
查看>>
MySQL批量SQL插入性能优化
查看>>
定义列属性:null,default,PK,auto_increment
查看>>