1. r语言怎么提取表格中的部分数据
方法一: 前提背景:一字符串在双引号之间,这里可以默认以双引号开头,双引号结尾,那么 1、可以用startsWith()这个方法来判断是否以双引号其中一个开头 2、可以用endsWith()这个方法来判断是否以双引号其中一个结尾 方法二: 前提背景:只有一组双引号引起来的字符串,且一字符串在双引号之间,这里可以默认以双引号开头,双引号结尾,那么 1、可以直接通过循环来将读取字符串,用charAt()来规避第一个和字符串最后一位的引号 2、这样也能够获取双引号之间的字符串 总结: 还有许多方法可以使用,这里只是举例来开拓思路,具体实现还需要自己试行。加油
2. r语言提取数据表中部分数据
读取文件行数, 可以逐个字符读取文件,到文件尾,统计bai\n的个数
参考代码如下
#include <stdio.h>
int main()
{
int c;
FILE *fp;
int lines=0;
fp=fopen("in.txt", "rb");
if(fp)
{
while((c=fgetc(fp)) != EOF)
if(c=='\n') lines++;
printf("%d\n",lines);
fclose(fp);
}
return 0;
}
也可以通过fgets函数,每次读取一行,到文件尾,然后计算读取的次数
#include <stdio.h>
#include <string.h>
int main()
{
char s[100];
FILE *fp;
int lines=0;
fp=fopen("in.txt", "r");
if(fp)
{
while((fgets(s,100,fp)) != NULL)
if(s[strlen(s)-1]=='\n') lines++;
printf("%d\n",lines);
fclose(fp);
}
return 0;
}
3. r语言提取函数
利用R语言中的语言向量取全部或部分元素很简单,具体步骤如下:
1、为向量的每个元素命名
vn <- c(11,22,33,44)
names(vn) <- c("one","two","three","four") #对应元素的名字分别为one, two, three, four
本部分的执行情况见下图:
2、向量的引用
vc <- c(11,22,33,44,55,66) #创建一个向量
使用元素的位置引用
vc[1] #提取第一个元素值:11
vc[1:3] #提取1~3个元素的值:11 22 33
vc[c(2,4,5)] #提取第2、第4和第5个元素的值:22 44 55
vc[-1] #提取除第一个元素之外的元素值:22 33 44 55 66
vc[-(1:3)] #提取除1~3个元素之外的元素值:44 55 66
vc[-c(2,4,5)] #提取除第2、第4和第5个之外的元素值:11 33 66。
4. r语言提取列表元素
#假如数据框是data,第一列是数据,第二列是日期(格式是2014-01),第三列是地名(local),第四列是产业名(product)
ds<-sort(as.character(unique(data[,2])))#将所有的日期提取出来,形成可能出现的月份,并排序
m1<-length(ds)
data2<-list()
for(k in 1:m1){
dv<-data[data[,2]==ds[k],]#每个月的数据
data2[[k]]<-dv[order(dv[,3]),]#将每个月的数据按照地理名称(默认是汉语拼音首字母)排序
}
#这样就得到了每个月的数据,而且是按照地理名称排名的
#接下来就得到各个季度的季度值(季度值是累加的,如第二季度其实是前六个月的累计值)
#先将数据按照各个季度合在一起
#首先将月份数据转化为季度数据
m2<-m1/3#每个季度三个月
data3<-list()
for(k in 1:m2)
data3[[k]]<-rbind(data2[[3*k-2]],data2[[3*k-1]],data5[[2*k]])
#再算出各个季度的当季(三个月,比如:第二季度其实是6,7,8三个月)数据
fun1<-function(data3){
data3<-data3[order(data3[,3]),]#按照地理名称排名
dm1<-unique(data3[,3]);#地名
dv5<-c()
for(i in 1:length(dm1)){
dv2<-data3[data3[,3]==dm1[i],]
dm2<-unique(dv2[,4])#产业名
dv4<-c()
for(j in 1:length(dm2)){
dv3<-c(dm1[i],dm2[j],sum(as.numeric(dv2[dv2[,4]==dm2[j],1])))
dv4<-rbind(dv4,dv3)
}
dv5<-rbind(dv5,dv4)
}
return(dv5)#这样得到的数据格式为(“地名”,“产业名”,数据)
}
data4<-list()
for(k in 1:m2)
data4[[k]]<-fun1(data3[[k]])#得到数据的当期值
#最后计算出季度值(累积值)
data5<-rbind(data4[[1]],data4[[2]])#2季度合并
data6<-rbind(data4[[1]],data4[[2]],data4[[3]])#3季度合并
data7<-rbind(data4[[1]],data4[[2]],data4[[3]],data4[[4]])#4季度合并
data8<-fun1(data6)#2季度累积值
data9<-fun1(data6)#3季度累积值
data10<-fun1(data7)#4季度累积值
data_q<-list(data4[[1]],data8,data9,data10)#四个季度的累积值
#需要注意,其实每年的第四个季度的累积值就是年份数据
5. r语言提取table中的数据
1、对于网页为csv文件的页面,可以直接用read.csv函数导入网页数据并转为数据框的形式。html格式的网页也可以读取。
例如:
data <- read.csv(text="it is a page")#text是要查看的文本
head(data,10)
#读取网页数据的代码data <- read.csv("page"),page可以是要查看的网址或文本。
2、R基础包中的readLines可以读取网页或文本数据。
#输入文本
cat("asqsd\n1213",file="a1")
readLines("a1") #读取文本数据
#cat中"\n"表示换行。
3、RCurl包中的getURL()函数获取网页数据。
library(RCurl)
data<-getURL("a1")#a1为某个具体的网址。
head(data)
4、通过getURL直接获取的数据有些凌乱,可以借助library(XML)解析树函数htmlTreeParse处理。
library(XML)#解析树函数htmlTreeParse
data_Parse<-htmlTreeParse(data)
head(data_Parse,2)
5、对于复杂网站的文本数据,用rvest包中的read_html函数来提取文本数据。
library(rvest)
page<-read_html("a1")#a1为某个具体的网址
data<-html_nodes(page,"table")
head(data)
#本例中没有输入网址,所以结果为空。
6、通过html_nodes获得的数据不能直接投入使用。
table<-html_table(data);table #提取表格数据,可以得到多个表格结果
table[1]#查看第1个表
text<-html_text(data);text #提取文本数据
#在实际应用中,可以发现提取表格后的数据或文本是非常便于分析的。
6. r语言怎么提取指定列
要提取r星图片,可在r星客户端里,不能保存到本地,建议你用英伟达的那个截录屏,alt+f1就可以截图,你就可以把图片提取出来了。不想用alt+f1就先按alt+z里面有快捷键设置。
- 相关评论
- 我要评论
-