ace*_*oxy 2 python csv pandas python-3.5
我正在将文件直接读入熊猫,出于某种奇怪的原因,反斜杠作为分隔符。这是代码:正如我在某处找到的那样,尝试使用转义字符作为参数来转义反斜杠,但这不起作用。如何将其直接读入熊猫?
raw = pd.read_csv('http://language.media.mit.edu/data/public/unesco_langlang_20120722_iso639-3.txt', escapechar='\\', delimiter = "\\")
Run Code Online (Sandbox Code Playgroud)
我不认为escapechar是你的问题/修复。我使用以下代码读取文件,没有任何问题。解决方案是使用可变空格作为分隔符。
import pandas as pd
raw = pd.read_csv(r'C:\temp\unesco_langlang_20120722_iso639-3.txt',
delim_whitespace=True)
raw.head(10)
# original_language target_language num_translations
# 0 abk aze 1
# 1 abk bul 1
# 2 abk deu 1
# 3 abk eng 2
# 4 abk est 2
# 5 abk fin 1
# 6 abk hin 1
# 7 abk kat 38
# 8 abk kaz 1
# 9 abk kbd 2
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3625 次 |
| 最近记录: |