项目介绍:
基于 AI 完整保留排版的 PDF 文档全文双语翻译,支持 Google/DeepL/Ollama/OpenAI 等服务,提供 CLI/GUI/Docker 。
项目亮点:
-
基于 AI 布局分析和 PDF 指令流分析实现对文档排版的完整保留 ;
-
保留行内/行间公式和图表样式,对 Latex 文献进行特殊优化;
-
保留文档可索引目录结构 ;
-
支持 Google、DeepL 和 OpenAI 等多种翻译服务 。
预览效果:
1、确保服务器安装的 Python 版本大于 3.8 且小于 3.12 ;
2、安装此程序 ;
pip install pdf2zh
3、打开 GUI 界面 , 访问:http://localhost:7860/
pdf2zh -i
4、上传文件并翻译
如上图,我们上传一个英文版 PDF ,上传完成后,在预览区域会显示 PDF 的内容。
接下来,选择翻译服务 Google、Bing、zhipu、Tentcent 等和翻译方向(英文转中文),
最后点击翻译按钮即可。
当然,我们也可以使用 命令行直接翻译:
pdf2zh raft.pdf
核心流程:
1、上传文件后,通过 AI 模型 DocLayout-YOLO-DocStructBench-onnx 解析文档格式 ;
2、调用翻译服务 Google 、智普、Bing、DeepL、OpenAI 等开放平台的服务 ;
3、将数据流整合在一起并输出到目标 PDF 。
参考资料:
https://huggingface.co/wybxc/DocLayout-YOLO-DocStructBench-onnx
原创作者: makemylife 转载于: https://www.cnblogs.com/makemylife/p/18649697
pdf翻译,两款pdf文件翻译软件,支持linux/ubuntu,window,mac下使用CopytranslatepdfTranslator
阅读paper的时候经常要英文翻译,使用谷歌、百度、有道等,要一直在网页和pdf阅读器中切换,很麻烦,介绍自己用过两款pdf文件翻译软件,支持谷歌、百度、有道、搜狗翻译,提高一下工作效率。
Copytranslate
一款开源的翻译工具,在github...
DOCLAYOUT-YOLO: ENHANCING DOCUMENT LAYOUT ANALYSIS THROUGH DIVERSE SYNTHETIC DATA
AND GLOBAL-TO-LOCAL ADAPTIVE PERCEPTION
DocLayout-YOLO:通过多样化的合成数据和全局到局部的自适应感知增强文档布局分析
推荐开源项目:Zotero-PDF-Translate - 翻译与标注PDF文献神器
项目地址:https://gitcode.com/gh_mirrors/zo/zotero-pdf-translate
是一个基于浏览器插件的工具,它无缝集成于流行的参考管理软件 Zotero 中,旨在为科研工作者提供便捷的PDF文献翻译和注解功能。此项目的目标是打破语言障碍,让全球的研究者能够更轻松地...
由于看文献或搜索学习资料时常需要看英文文献,而这些文献常以PDF格式在网页上存在,因此使用一个好的翻译工具可以极大的提高对摘要的快速阅读,以进一步提高学习和搜索效率。
基于上述现状推荐一个Chrome插件(当然Edge目前使用Chromium内核,与Chrome插件兼容,也可以使用),如下:
该插件基于深度学习进行翻译,在翻译时会自动打开DeepL网页,翻译完成后会自动关闭。该插件在GitHub上开源,网址在这里:https://github.com/yoshinobc/PDF-Trans