PHP 读取PDF文件内容之PdfParser - 我是东山呀

link之家

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

犯傻的葡萄 · 增广贤文电子版下载 - 百度· 2 周前 ·

热情的登山鞋 · 射雕英雄传漫画解说第期18期：郭靖黄蓉夜探王 ...· 9 月前 ·

逆袭的登山鞋 · 大作云集第十届乌镇戏剧节将于10月启幕 _大公网· 10 月前 ·

冷冷的自行车 · 2022年国际在线教育峰会：专访清华附中稻香 ...· 1 年前 ·

想出国的大象 · 《求婚大作战》成直男恋爱百科，张艺兴带你破解 ...· 1 年前 ·

果断的火腿肠 · 我是大魔王特别优漫在线,漫画评分 - 快看漫画· 1 年前 ·

PdfParser，一个独立的PHP库，提供了多种工具来从PDF文件提取数据，不支持加密的PDF文件

官方文档: https://www.pdfparser.org/documentation

使用composer安装依赖包：

composer require smalot/pdfparser

安装成功后如下图：

创建index.php文件，引入autoload.php文件：

include 'vendor/autoload.php';

1.一次性读取文件中的所有内容:

include 'vendor/autoload.php';
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
$text = $pdf->getText(); //将所有内容读取到一个字符串中
echo $text;

2.分页读取:

include 'vendor/autoload.php';

$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
$pages = $pdf->getPages(); //分页信息
foreach ($pages as $page) {
    echo $page->getText(); //输出每一页的内容
3.获取文件的基本信息，如：制作人、日期、总页数等
include 'vendor/autoload.php';

$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
$details = $pdf->getDetails();

推荐文章

犯傻的葡萄 · 增广贤文电子版下载 - 百度

2 周前

热情的登山鞋 · 射雕英雄传漫画解说第期18期：郭靖黄蓉夜探王府_哔哩哔哩_bilibili

9 月前

逆袭的登山鞋 · 大作云集第十届乌镇戏剧节将于10月启幕 _大公网

10 月前

冷冷的自行车 · 2022年国际在线教育峰会：专访清华附中稻香湖学校执行校长辛颖|国际教育|教师_网易订阅

1 年前

想出国的大象 · 《求婚大作战》成直男恋爱百科，张艺兴带你破解极致少女心_百科TA说

1 年前

果断的火腿肠 · 我是大魔王特别优漫在线,漫画评分 - 快看漫画

1 年前