1. 使用read_excel读取文件
1、打开电脑,在桌面鼠标右键选择新建excel工作表;接着打开工作表,在sheet1插入一个表格。
2、然后在excel表格sheet2,插入另一个表格数据。
3、双击打开pycharm工具,新建python文件,导入pandas包;调用read_excel()方法读取excel文件数据。
4、保存代码并运行python文件,结果出现了报错,缺少xlrd包。
5、点击File菜单,选择Settings,找到项目对应的Project Interpreter,安装xlrd。
6、安装完毕后,再次运行代码,可以查看到控制台打印出excel文件数据。
2. read.excel
import jxl.*;
import jxl.format.UnderlineStyle;
import jxl.write.*;
import jxl.write.Number;
import jxl.write.Boolean;
import java.io.*;
class excel {
public excel() {
}
/**
* 读取excel
*
* @param filepath
*/
public static void readexcel(String filepath) {
try {
InputStream is = new FileInputStream(filepath);
Workbook rwb = Workbook.getWorkbook(is);
// sheet st = rwb.getsheet("0")这里有两种方法获取sheet表,1为名字,2为下标,从0开始
Sheet st = rwb.getSheet(0);
Cell c00 = st.getCell(1, 0);
// 通用的获取cell值的方式,返回字符串
String strc00 = c00.getContents();
// 获得cell具体类型值的方式
if (c00.getType() == CellType.LABEL) {
LabelCell labelc00 = (LabelCell) c00;
strc00 = labelc00.getString();
}
// 输出
System.out.println(strc00);
// 关闭
rwb.close();
} catch (Exception e) {
e.printStackTrace();
}
}
/**
* 输出excel
*
* @param os
*/
public static void writeexcel(OutputStream os) {
try {
/**
* 只能通过api提供的工厂方法来创建workbook,而不能使用WritableWorkbook的构造函数,
* 因为类WritableWorkbook的构造函数为protected类型
* method(1)直接从目标文件中读取WritableWorkbook wwb =
* workbook.createWorkbook(new file(targetfile)); method(2)如下实例所示
* 将WritableWorkbook直接写入到输出流
*
*/
WritableWorkbook wwb = Workbook.createWorkbook(os);
// 创建excel工作表 指定名称和位置
WritableSheet ws = wwb.createSheet("test sheet 1", 0);
WritableSheet ws2 = wwb.createSheet("test sheet 2", 1);
// **************往工作表中添加数据*****************
// 1.添加label对象
Label label = new Label(0, 0, "this is a label test");
ws.addCell(label);
Label label2 = new Label(0, 0, "this is a label test2");
ws2.addCell(label2);
// 添加带有字型formatting对象
WritableFont wf = new WritableFont(WritableFont.TIMES, 18,
WritableFont.BOLD, true);
WritableCellFormat wcf = new WritableCellFormat(wf);
Label labelcf = new Label(1, 0, "this is a label test", wcf);
ws.addCell(labelcf);
// 添加带有字体颜色的formatting对象
WritableFont wfc = new WritableFont(WritableFont.ARIAL, 10,
WritableFont.NO_BOLD, false, UnderlineStyle.NO_UNDERLINE,
jxl.format.Colour.RED);
WritableCellFormat wcffc = new WritableCellFormat(wfc);
Label Labelcf = new Label(1, 0, "this is a Label cell", wcffc);
ws.addCell(Labelcf);
// 2.添加number对象
Number Labeln = new Number(0, 1, 3.1415926);
ws.addCell(Labeln);
// 添加带有formatting的number对象
NumberFormat nf = new NumberFormat("#.##");
WritableCellFormat wcfn = new WritableCellFormat(nf);
Number Labelnf = new jxl.write.Number(1, 1, 3.1415926, wcfn);
ws.addCell(Labelnf);
// 3.添加boolean对象
Boolean Labelb = new jxl.write.Boolean(0, 2, false);
ws.addCell(Labelb);
// 4.添加datetime对象
jxl.write.DateTime Labeldt = new jxl.write.DateTime(0, 3,
new java.util.Date());
ws.addCell(Labeldt);
// 添加带有formatting的dateformat对象
DateFormat df = new DateFormat("dd mm yyyy hh:mm:ss");
WritableCellFormat wcfdf = new WritableCellFormat(df);
DateTime Labeldtf = new DateTime(1, 3, new java.util.Date(), wcfdf);
ws.addCell(Labeldtf);
// 添加图片对象,jxl只支持png格式图片
// File image = new File("f:\\2.png");
// WritableImage wimage = new WritableImage(0,1,2,2,image);
// ws.addImage(wimage);
// 写入工作表
wwb.write();
wwb.close();
} catch (Exception e) {
e.printStackTrace();
}
}
/**
* 拷贝后,进行修改,其中File1为被copy对象,File2为修改后创建的对象
* 尽单元格原有的格式化修饰是不能去掉的,我们还是可以将新的单元格修饰加上去, 以使单元格的内容以不同的形式表现
*
* @param File1
* @param File2
*/
public static void modifyexcel(File File1, File File2) {
try {
Workbook rwb = Workbook.getWorkbook(File1);
WritableWorkbook wwb = Workbook.createWorkbook(File2, rwb);// copy
WritableSheet ws = wwb.getSheet(0);
WritableCell wc = ws.getWritableCell(0, 0);
// 判断单元格的类型,做出相应的转换
3. read函数可以读取整个文件,并把读取的内容放在()中
C语言对文件进行读取之前需要先打开文件,然后再进行读写,读写完之后关闭文件。 可以使用两组函数实现:
一、C语言库函数 打开文件:fopen 读写(一般对应成对使用): fgetc---fputcfgets---fputsfread---fwrite 关闭文件:fclose
二、Linux系统函数 打开文件:open 读写(一般对应成对使用):read---write 关闭文件:close
4. read函数读取文件内容
用audioread('');函数读取电脑中的音频文件,参数是音频文件的路径:
[sampledata,FS] = audioread('F:1.mp3');
sampledata保存音频信号数据,FS是音频采样率,MP3格式的采样率一般为44100;
5. 用read方法读取文件
read函数(fread)。read函数负责从文件句柄中读取指定数量的字节,并将这些字节放在标量型变量中。读者如果熟悉C的标准I/O函数fread的话,就会发现read函数也是以相同方式处理I/O缓冲的。为了提高效率,read函数并不是一次读取一个字节,而是读取一块数据并保存到临时存储区中。
然后,C的fread函数与Perl的read函数会从临时缓冲区将数据一次一个字节地传送给程序。(sysread函数可用于模拟C的底层I/O函数read。)该函数会返回读取的字节总数;或者在发生错误时,返回未定义的数字。如果碰到了EOF(文件结束符),则返回0...
6. 如何用read.table()读文件
1、对于网页为csv文件的页面,可以直接用read.csv函数导入网页数据并转为数据框的形式。html格式的网页也可以读取。
例如:
data <- read.csv(text="it is a page")#text是要查看的文本
head(data,10)
#读取网页数据的代码data <- read.csv("page"),page可以是要查看的网址或文本。
2、R基础包中的readLines可以读取网页或文本数据。
#输入文本
cat("asqsd\n1213",file="a1")
readLines("a1") #读取文本数据
#cat中"\n"表示换行。
3、RCurl包中的getURL()函数获取网页数据。
library(RCurl)
data<-getURL("a1")#a1为某个具体的网址。
head(data)
4、通过getURL直接获取的数据有些凌乱,可以借助library(XML)解析树函数htmlTreeParse处理。
library(XML)#解析树函数htmlTreeParse
data_Parse<-htmlTreeParse(data)
head(data_Parse,2)
5、对于复杂网站的文本数据,用rvest包中的read_html函数来提取文本数据。
library(rvest)
page<-read_html("a1")#a1为某个具体的网址
data<-html_nodes(page,"table")
head(data)
#本例中没有输入网址,所以结果为空。
6、通过html_nodes获得的数据不能直接投入使用。
table<-html_table(data);table #提取表格数据,可以得到多个表格结果
table[1]#查看第1个表
text<-html_text(data);text #提取文本数据
#在实际应用中,可以发现提取表格后的数据或文本是非常便于分析的。
- 相关评论
- 我要评论
-