我正在使用SimpleXML加载一些xml文件(我没有写/提供,并且无法真正改变格式).
偶尔(例如,每50个左右有一个或两个文件),他们不会逃避任何特殊字符(大多数情况下,但有时也是其他随机无效的字符).这创建并发布,因为带有php的SimpleXML失败了,我真的不知道处理解析无效XML的任何好方法.
我的第一个想法是将XML预处理为一个字符串并将所有字段放在CDATA中以便它可以工作,但是由于某种不正当的原因,我需要处理的XML将所有数据放在属性字段中.因此我不能使用CDATA的想法.XML的一个例子是:
<Author v="By Someone & Someone" />
Run Code Online (Sandbox Code Playgroud)
在使用SimpleXML加载之前,最好的方法是从XML中替换所有无效字符?