python2.7.10 使用 pdfminer3k 远程 http 读取 pdf 文件报错,有什么读取 pdf 可用的方法吗?

2016-09-26 16:08:16 +08:00
 alfer
Traceback (most recent call last):
File "D:/work/workspace/mywork/earthquake_crapy/document/pdf_example.py", line 2, in <module>
from pdfminer.pdfinterp import PDFResourceManager,process_pdf
File "D:\MyTools\Python-2.7.10\lib\site-packages\pdfminer\pdfinterp.py", line 5, in <module>
from .cmapdb import CMapDB, CMap
File "D:\MyTools\Python-2.7.10\lib\site-packages\pdfminer\cmapdb.py", line 23, in <module>
from .psparser import PSStackParser
File "D:\MyTools\Python-2.7.10\lib\site-packages\pdfminer\psparser.py", line 4, in <module>
from .utils import choplist
File "D:\MyTools\Python-2.7.10\lib\site-packages\pdfminer\utils.py", line 212, in <module>
0x00f8, 0x00f9, 0x00fa, 0x00fb, 0x00fc, 0x00fd, 0x00fe, 0x00ff,
File "D:\MyTools\Python-2.7.10\lib\site-packages\pdfminer\utils.py", line 180, in <genexpr>
PDFDocEncoding = ''.join( chr(x) for x in (
ValueError: chr() arg not in range(256)
3981 次点击
所在节点    Python
2 条回复
Kisesy
2016-09-26 16:13:28 +08:00
你用 py2 ,就不要用 3K 版好不好
alfer
2016-09-26 16:31:49 +08:00
@Kisesy 用的 pdfminer2 也不行啊,不能导入包 from pdfminer.pdfinterp import PDFResourceManager,process_pdf

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/309056

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX