我正在使用Jupyter Notebook编写一些教程.但是,我在这里遇到了一个问题.如下图所示,当我对同事的笔记本程序进行更改时,索引不正确.如何改变1,在[2]到[34],[35]中的那些?
删除数字和括号以及Python中的内容时,我遇到了问题.建议使用str.replace.然而,这里的挑战是数字不是确定的数字.我只知道我需要删除任何数字,但我不确定它是什么.对于括号,我只知道我需要remove()以及里面的内容.但是,里面的内容也各不相同.例如,如果我有以下数据集:
import pandas as pd
a = pd.Series({'Country':'China 1', 'Capital': 'Bei Jing'})
b = pd.Series({'Country': 'United States (of American)', 'Capital': 'Washington'})
c = pd.Series({'Country': 'United Kingdom (of Great Britain and Northern Ireland)', 'Capital': 'London'})
d = pd.Series({'Country': 'France 2', 'Capital': 'Paris'})
e = pd.DataFrame([a,b,c,d])
Run Code Online (Sandbox Code Playgroud)
现在在"国家"栏目中,值为"中国1","美国(美国)","英国(......)"和"法国2".更换/删除后,我想删除所有数字和括号以及内容,并希望列国家/地区的值为"中国","美国","英国","法国".
假设现在我有dataframe2列:State和City.
然后dict,每个州都有一个单独的两个字母的缩写词.现在我想添加第三列来映射状态名称及其两个字母的缩写.我应该怎么做Python/Pandas?例如,示例问题如下:
import pandas as pd
a = pd.Series({'State': 'Ohio', 'City':'Cleveland'})
b = pd.Series({'State':'Illinois', 'City':'Chicago'})
c = pd.Series({'State':'Illinois', 'City':'Naperville'})
d = pd.Series({'State': 'Ohio', 'City':'Columbus'})
e = pd.Series({'State': 'Texas', 'City': 'Houston'})
f = pd.Series({'State': 'California', 'City': 'Los Angeles'})
g = pd.Series({'State': 'California', 'City': 'San Diego'})
state_city = pd.DataFrame([a,b,c,d,e,f,g])
state_2 = {'OH': 'Ohio','IL': 'Illinois','CA': 'California','TX': 'Texas'}
Run Code Online (Sandbox Code Playgroud)
现在我必须df state_city使用字典来映射列State state_2.该映射df state_city应包含三列:state,city,和state_2letter.
原始数据集我在几乎所有美国主要城市都有多个列.
因此,手动执行它的效率会降低.有没有简单的方法呢?