我知道仅通过查看数据就无法确定任何字符串形式数据的字符编码.这不是我的问题.
我的问题是:PDF文件中是否有一个字段,按照惯例,指定了编码方案(例如:UTF-8)?这与<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8">HTML中大致类似.
非常感谢,Blz
Mat*_*man 13
快速浏览PDF规范似乎表明您可以在PDF文件中使用不同的编码.请查看第86页.因此,具有某种低级访问权限的PDF库应该能够为您提供用于字符串的编码.但是如果您只是想要文本并且不关心所使用的内部编码,我建议让图书馆为您处理转换.