小编sno*_*all的帖子

用户帐户的 Github API 调用

嗨，我正在尝试从 Github API 获取用户的数据、他们编程的语言、他们的存储库以及他们所连接的关注者/关注者以及他们的数量。

我已经通读了文档，但没有找到任何特定于我需要的查询的内容。

目前，我已经使用这个查询来调用 https://api.github.com/search/users?q=location:uk&sort=stars&order=desc&page=1&per_page=100

但是，这会返回与我要实现的目标无关的帐户名称、网址和其他内容。我正在 Jupyter 笔记本上使用 json 和 python 请求分析这些数据。

任何人都可以分享他们的意见，谢谢。

python api github github-api

sno*_*all

2020 06-10

5
推荐指数

1
解决办法

479
查看次数

pandas 对值进行排序以获取 groupby 中每列的前 5 个值

我有一个包含城市、名称和成员的数据框。我需要根据每个城市的最高成员（“成员”）数量找到前 5 个团体（名称）。

这是我使用时得到的：

clust.groupby(['city','name']).agg({'members':sum})

members city name Bath AWS Bath User Group 346 Agile Bath & Bristol 957 Bath Crypto Chat 47 Bath JS 142 Bath Machine Learning Meetup 435 Belfast 4th Industrial Revolution Challenge 609 Belfast Adobe Meetup 66 Belfast Azure Meetup 205 Southampton Crypto Currency Trading SouthCoast 50 Southampton Bitcoin and Altcoin Meetup 50 Southampton Functional Programming Meetup 28 Southampton Virtual Reality Meetup 248 Sunderland Sunderland Digital 287

我需要前 5 名，但正如你所看到的，成员数量似乎没有排序，即 346 名在 957 名之前，等等。

我还尝试预先对值进行排序并执行以下操作：

clust.sort_values(['city', …

python group-by pandas

sno*_*all

lucky-day

4
推荐指数

1
解决办法

6886
查看次数

将 HTML 标签移除应用于 Pandas 列

我需要从 pandas 列中的所有内容中删除 HTML 标签并保留描述。

我已经删除了一列的标签，但需要将它们应用于其他列 - 这就是我所做的；

输入：

df.description[1]

输出：

'<p>Das Ziel der <a href="http://swa-muc.de">Software Architektur München Gruppe</a> ist es, Menschen, die sich mit Software-Architektur auseinandersetzen wollen, in und um München regelmäßig zusammenzubringen, und einen persönlichen Erfahrungsaustausch zu etablieren. Dazu dienen neben der Meetup-Gruppe insbesondere der persönliche Erfahrungsaustausch, organisiert in informellen Treffen, Diskussion von Erfahrungsberichten und Case Studies bis hin zu Vorträge und Workshops. Diese werden auch über Twitter <a href="https://twitter.com/swamuc">@swamuc</a> und Meetup bekannt gegeben.</p>'

Run Code Online (Sandbox Code Playgroud)

我做到了；