小编Har*_*_pb的帖子

基于Pandas中的公共列值合并两个数据帧

如何从具有公共列值的两个数据帧获得合并的数据帧,使得仅那些行使合并的数据帧在特定列中具有共同的值.

我有5000行df1作为格式: -

    director_name   actor_1_name    actor_2_name    actor_3_name    movie_title
0   James Cameron   CCH Pounder Joel David Moore    Wes Studi     Avatar
1   Gore Verbinski  Johnny Depp Orlando Bloom   Jack Davenport   Pirates 
    of the Caribbean: At World's End
2   Sam Mendes   Christoph Waltz    Rory Kinnear    Stephanie Sigman Spectre
Run Code Online (Sandbox Code Playgroud)

和万行df2as

movieId                   genres                        movie_title
    1       Adventure|Animation|Children|Comedy|Fantasy   Toy Story
    2       Adventure|Children|Fantasy                    Jumanji
    3       Comedy|Romance                             Grumpier Old Men
    4       Comedy|Drama|Romance                      Waiting to Exhale
Run Code Online (Sandbox Code Playgroud)

公共列'movie_title'具有共同的值,并且基于它们,我想获得'movie_title'相同的所有行.要删除的其他行.

任何帮助/建议将不胜感激.

注意:我已经尝试过了

pd.merge(dfinal, df1, on='movie_title')
Run Code Online (Sandbox Code Playgroud)

输出就像一排

director_name   actor_1_name    actor_2_name …
Run Code Online (Sandbox Code Playgroud)

dataframe pandas

26
推荐指数
3
解决办法
5万
查看次数

Seaborn pairplot ValueError:max必须大于范围参数中的min

我在使用Python中的seaborn库绘制pairplot时遇到此错误.参考前面提到的关于同一主题的问题,我清理了我的数据并验证了我是否有任何空值,

train_data.isnull().values.any()
Out[91]: False

import seaborn as sns
sns.pairplot(train_data)
Run Code Online (Sandbox Code Playgroud)

对于seaborn情节,我仍然得到这个值误差.除了清理数据之外,我不确定,我们还能做些什么来避免这个错误.添加有关数据的更多信息,我总共有81列和大约50万行.我删除了一行具有所有空值而不是剩余数据是空的.现在的问题是如何处理此错误.有什么建议?

python pandas seaborn

10
推荐指数
2
解决办法
1万
查看次数

如何根据列值删除行,其中某行的列值是另一行的子集?

假设我有一个dataframedf: -

index company  url                          address 
 0     A .    www.abc.contact.com         16D Bayberry Rd, New Bedford, MA, 02740, USA
 1     A .    www.abc.contact.com .       MA, USA
 2     A .    www.abc.about.com .         USA
 3     B .    www.pqr.com .               New Bedford, MA, USA
 4     B.     www.pqr.com/about .         MA, USA
Run Code Online (Sandbox Code Playgroud)

我想删除dataframewhere 中的所有行address是另一个地址的子集,公司是相同的.例如,我希望这5行中的这两行.

index  company  url                          address 
 0     A .    www.abc.contact.com         16D Bayberry Rd, New Bedford, MA, 02740, USA
 3     B .    www.pqr.com .               New Bedford, MA, USA
Run Code Online (Sandbox Code Playgroud)

python python-3.x pandas

5
推荐指数
1
解决办法
122
查看次数

Spacy 2.0.11的要求是regex == 2017.4.5,但是您将拥有不兼容的regex 2017.11.9

我正在使用,MacOS High Sierra并且在进行任何python相关安装时最近都遇到了此问题。我正在尝试更新设置工具

pip install --upgrade setuptools

>>>spacy 2.0.11 has requirement regex==2017.4.5, but you'll have regex 2017.11.9 which is incompatible.
Run Code Online (Sandbox Code Playgroud)

请提出如何解决此问题的建议

python macos pip

2
推荐指数
1
解决办法
1845
查看次数

如何使用Javascript中的键数组过滤键值字典?

var allOptions = [
    {value: 'AA', key: 'a'},
    {value: 'BB', key: 'b'},
    {value: 'CC', key: 'c'},
    {value: 'DD', key: 'd'},
    {value: 'EE', key: 'e'}
];

var selected = ['a', 'c'];
Run Code Online (Sandbox Code Playgroud)

我想从中获取allOptions在变量数组中有键的对象selected

即我想要结果

[
    {value: 'AA', key: 'a'},
    {value: 'CC', key: 'c'},
];
Run Code Online (Sandbox Code Playgroud)

如果不涉及 jquery,任何建议表示赞赏。

javascript arrays dictionary

-1
推荐指数
1
解决办法
5343
查看次数

标签 统计

pandas ×3

python ×3

arrays ×1

dataframe ×1

dictionary ×1

javascript ×1

macos ×1

pip ×1

python-3.x ×1

seaborn ×1