所以,我有这个巨大的 DF,它用 iso8859_15 编码。
我有几列包含巴西的名称和地点,因此其中一些包含特殊字符,例如“í”或“Ô”。
我有在字典中替换它们的钥匙 {'í':'i', 'á':'a', ...}
我尝试用几种方法替换它(如下),但它们都不起作用。
df.replace(dictionary, regex=True, inplace=True) ###BOTH WITH AND WITHOUT REGEX AND REPLACE
Run Code Online (Sandbox Code Playgroud)
还:
df.udpate(pd.Series(dic))
Run Code Online (Sandbox Code Playgroud)
它们都没有预期的输出,这将使诸如“NÍCOLAS”之类的字符串变成“NICOLAS”。
帮助?
我是Python的初学者,我一直致力于在Jupyter上使用Pandas和Geocoder对数据库进行地理编码.
由于df有点长(约3000行),我想使用Google的地理编码API.
我已经创建了一个免费密钥,但我不知道我应该用它做什么.救命?
顺便说一下,我的代码看起来像这样:
import geocoder
import pandas as pd
geo = geocoder
df=pd.read_excel('hsp2.xlsx')
df['Coordinates']=df['Address'].apply(geo.google).apply(lambda x: x.latlng if x != None else None)
df.to_csv('output.csv', sep='|', encoding='iso8859_15')
Run Code Online (Sandbox Code Playgroud)