如何从具有公共列值的两个数据帧获得合并的数据帧,使得仅那些行使合并的数据帧在特定列中具有共同的值.
我有5000行df1作为格式: -
director_name actor_1_name actor_2_name actor_3_name movie_title
0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar
1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates
of the Caribbean: At World's End
2 Sam Mendes Christoph Waltz Rory Kinnear Stephanie Sigman Spectre
Run Code Online (Sandbox Code Playgroud)
和万行df2as
movieId genres movie_title
1 Adventure|Animation|Children|Comedy|Fantasy Toy Story
2 Adventure|Children|Fantasy Jumanji
3 Comedy|Romance Grumpier Old Men
4 Comedy|Drama|Romance Waiting to Exhale
Run Code Online (Sandbox Code Playgroud)
公共列'movie_title'具有共同的值,并且基于它们,我想获得'movie_title'相同的所有行.要删除的其他行.
任何帮助/建议将不胜感激.
注意:我已经尝试过了
pd.merge(dfinal, df1, on='movie_title')
Run Code Online (Sandbox Code Playgroud)
输出就像一排
director_name actor_1_name actor_2_name …Run Code Online (Sandbox Code Playgroud) 我在使用Python中的seaborn库绘制pairplot时遇到此错误.参考前面提到的关于同一主题的问题,我清理了我的数据并验证了我是否有任何空值,
train_data.isnull().values.any()
Out[91]: False
import seaborn as sns
sns.pairplot(train_data)
Run Code Online (Sandbox Code Playgroud)
对于seaborn情节,我仍然得到这个值误差.除了清理数据之外,我不确定,我们还能做些什么来避免这个错误.添加有关数据的更多信息,我总共有81列和大约50万行.我删除了一行具有所有空值而不是剩余数据是空的.现在的问题是如何处理此错误.有什么建议?
假设我有一个dataframedf: -
index company url address
0 A . www.abc.contact.com 16D Bayberry Rd, New Bedford, MA, 02740, USA
1 A . www.abc.contact.com . MA, USA
2 A . www.abc.about.com . USA
3 B . www.pqr.com . New Bedford, MA, USA
4 B. www.pqr.com/about . MA, USA
Run Code Online (Sandbox Code Playgroud)
我想删除dataframewhere 中的所有行address是另一个地址的子集,公司是相同的.例如,我希望这5行中的这两行.
index company url address
0 A . www.abc.contact.com 16D Bayberry Rd, New Bedford, MA, 02740, USA
3 B . www.pqr.com . New Bedford, MA, USA
Run Code Online (Sandbox Code Playgroud) 我正在使用,MacOS High Sierra并且在进行任何python相关安装时最近都遇到了此问题。我正在尝试更新设置工具
pip install --upgrade setuptools
>>>spacy 2.0.11 has requirement regex==2017.4.5, but you'll have regex 2017.11.9 which is incompatible.
Run Code Online (Sandbox Code Playgroud)
请提出如何解决此问题的建议
var allOptions = [
{value: 'AA', key: 'a'},
{value: 'BB', key: 'b'},
{value: 'CC', key: 'c'},
{value: 'DD', key: 'd'},
{value: 'EE', key: 'e'}
];
var selected = ['a', 'c'];
Run Code Online (Sandbox Code Playgroud)
我想从中获取allOptions在变量数组中有键的对象selected
即我想要结果
[
{value: 'AA', key: 'a'},
{value: 'CC', key: 'c'},
];
Run Code Online (Sandbox Code Playgroud)
如果不涉及 jquery,任何建议表示赞赏。
pandas ×3
python ×3
arrays ×1
dataframe ×1
dictionary ×1
javascript ×1
macos ×1
pip ×1
python-3.x ×1
seaborn ×1