欢迎访问悦橙教程(wld5.com),关注java教程。悦橙教程  java问答|  每日更新
页面导航 : > > 文章正文

java PDF文件解析成String,pdfstring,boolean sort

来源: javaer 分享于  点击 14552 次 点评:115

java PDF文件解析成String,pdfstring,boolean sort


boolean sort = false;// 是否排序int startPage = 1;// 开始提取页数int endPage = Integer.MAX_VALUE;// 结束提取页数Writer output = null;// 文件输入流,生成文本文件PDDocument document = null;// 内存中存储的PDF Documenttry {    document = PDDocument.load(file);    ByteArrayOutputStream baos = new ByteArrayOutputStream();    output = new OutputStreamWriter(baos);    PDFTextStripper stripper = null;// PDFTextStripper来提取文本    stripper = new PDFTextStripper();    stripper.setSortByPosition(sort);// 设置是否排序    stripper.setStartPage(startPage);// 设置起始页    stripper.setEndPage(endPage);// 设置结束页    // 调用PDFTextStripper的writeText提取并输出文本    stripper.writeText(document, output);    return baos.toString();} catch (MalformedURLException e) {    throw e;} finally {    if (output != null) {// 关闭输出流        output.close();    }    if (document != null) {// 关闭PDF Document        document.close();    }}
相关栏目:

用户点评