Java读取PDF中的文本和图片-四川平武建站

新闻中心

这里有您想知道的互联网营销解决方案

Java读取PDF中的文本和图片

本文将介绍通过Java程序来读取PDF文档中的文本和图片的方法。分别调用方法extractText()和extractImages()来读取。

我们一直强调网站建设、成都网站建设对于企业的重要性,如果您也觉得重要,那么就需要我们慎重对待,选择一个安全靠谱的网站建设公司,企业网站我们建议是要么不做，要么就做好,让网站能真正成为企业发展过程中的有力推手。专业网站制作公司不一定是大公司,创新互联作为专业的网络公司选择我们就是放心。

使用工具：Free Spire.PDF for Java（免费版）
Jar文件获取导入：
方法1：通过官网下载jar文件包。下载后，解压文件，并将lib文件夹下的Spire.Pdf.jar文件导入java程序。导入后如下图：

方法2：可通过maven仓库安装导入，可参考导入方法。

Java代码示例
【示例1】读取PDF中的文本

import com.spire.pdf.*;

import java.io.FileWriter;
import java.io.IOException;

public class ExtractText {
    public static void main(String[]args) throws Exception {
        //加载测试文档
        PdfDocument pdf = new PdfDocument("sample.pdf");

        //实例化StringBuilder类
        StringBuilder sb = new StringBuilder();
        //定义一个int型变量
        int index = 0;

        //遍历PDF文档中每页
        PdfPageBase page;
        for (int i= 0; i

文本读取结果：

【示例2】读取PDF中的图片

import com.spire.pdf.*;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractImg {
    public static void main(String[] args) throws Exception{
        //加载测试文档
        PdfDocument pdf = new PdfDocument();
        pdf.loadFromFile("test.pdf");

        //定义一个int型变量
        int index = 0;

        //遍历PDF每一页
        for (int i= 0;i< pdf.getPages().getCount(); i ++){
           //获取PDF页面
            PdfPageBase page = pdf.getPages().get(i);

            //使用extractImages方法获取页面上图片
            for (BufferedImage image : page.extractImages()) {

                //指定输出图片名称
                File output = new File( String.format("Image_%d.png", index++));
                //将图片保存为PNG格式文件
                ImageIO.write(image, "PNG", output);
            }
        }
    }
}

图片读取结果：

（本文完）

            
            
                                                            

                                                文章标题：Java读取PDF中的文本和图片                                                

                                                地址分享：http://scpingwu.com/article/ihsejj.html


                                            
                                                
                                                    其他资讯
                                                
                                                
                                                    
                                                        
                                                                ios快速界面开发框架 ios快速界面开发框架怎么用
                                                            

                                                                html5适合女生吗 html5可以做什么工作
                                                            

                                                                多文件上传jquery 多文件上传插件
                                                            

                                                                css怎么设置按钮的样式 css设置按钮位置
                                                            

                                                                jquery重复加载 jq的load方法无法重复加载