我使用Sublime文本中的HTML编码特殊字符将所有特殊字符转换为HTML代码.我在文件的不同部分有很多重音字符.所以,如果我可以选择所有特殊字符然后使用插件一次转换所有内容将会很棒!
是否有正则表达式有助于仅选择所有特殊字符?
我正在尝试填充电影对象,但在解析u.item文件时我收到此错误:
`split':UTF-8中无效的字节序列(ArgumentError)
File.open("Data/u.item", "r") do |infile|
while line = infile.gets
line = line.split("|")
end
end
Run Code Online (Sandbox Code Playgroud)
只有在尝试使用花哨的国际标点符号拆分行时才会发生错误.
这是一个样本
543 |Misérables,Les(1995)| 01-Jan-1995 || http://us.imdb.com/M/title-exact?Mis%E9rables%2C%20Les%20%281995%29 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 0 | 0 | 0 | 0
有工作吗?