问题描述
使用Jpedal解析PDF时遇到问题 。
在阅读的wordlist
从Jpedal,我得到的乱码wordslist
。
使用OCR时 ,以及从PDF复制文本并粘贴到Word或简单的文本编辑器中时,也会发生这种情况。
我了解这是由Mac OS X 10.6.4上的Quartz PDF上下文生成的PDF ,用于压缩文件大小,但在PDF查看器上很容易查看。
我搜索了任何支持解码此类PDF的Java API,但均未成功。
我正在寻找可用于解码的任何应用程序或Java API。
必须在Linux机器上可用。
1楼
大家好
我正在发布可能的问题解决方案。 这是描述石英如何解析pdf的 ,当然还有需要在代码中实现的原因,直到现在我还没有找到任何现成的API,并且我相信stackoverflow就是要主动采取行动并回答那些不可行的问题做过或被问过。
问候
Rituraj