嗨,我正在尝试从 Github API 获取用户的数据、他们编程的语言、他们的存储库以及他们所连接的关注者/关注者以及他们的数量。
我已经通读了文档,但没有找到任何特定于我需要的查询的内容。
目前,我已经使用这个查询来调用 https://api.github.com/search/users?q=location:uk&sort=stars&order=desc&page=1&per_page=100
但是,这会返回与我要实现的目标无关的帐户名称、网址和其他内容。我正在 Jupyter 笔记本上使用 json 和 python 请求分析这些数据。
任何人都可以分享他们的意见,谢谢。
我有一个包含城市、名称和成员的数据框。我需要根据每个城市的最高成员(“成员”)数量找到前 5 个团体(名称)。
这是我使用时得到的:
clust.groupby(['city','name']).agg({'members':sum})
members
city name
Bath AWS Bath User Group 346
Agile Bath & Bristol 957
Bath Crypto Chat 47
Bath JS 142
Bath Machine Learning Meetup 435
Belfast 4th Industrial Revolution Challenge 609
Belfast Adobe Meetup 66
Belfast Azure Meetup 205
Southampton Crypto Currency Trading SouthCoast 50
Southampton Bitcoin and Altcoin Meetup 50
Southampton Functional Programming Meetup 28
Southampton Virtual Reality Meetup 248
Sunderland Sunderland Digital 287
我需要前 5 名,但正如你所看到的,成员数量似乎没有排序,即 346 名在 957 名之前,等等。
我还尝试预先对值进行排序并执行以下操作:
clust.sort_values(['city', …
我需要从 pandas 列中的所有内容中删除 HTML 标签并保留描述。
我已经删除了一列的标签,但需要将它们应用于其他列 - 这就是我所做的;
输入:
df.description[1]
输出:
'<p>Das Ziel der <a href="http://swa-muc.de">Software Architektur München Gruppe</a> ist es, Menschen, die sich mit Software-Architektur auseinandersetzen wollen, in und um München regelmäßig zusammenzubringen, und einen persönlichen Erfahrungsaustausch zu etablieren. Dazu dienen neben der Meetup-Gruppe insbesondere der persönliche Erfahrungsaustausch, organisiert in informellen Treffen, Diskussion von Erfahrungsberichten und Case Studies bis hin zu Vorträge und Workshops. Diese werden auch über Twitter <a href="https://twitter.com/swamuc">@swamuc</a> und Meetup bekannt gegeben.</p>'
Run Code Online (Sandbox Code Playgroud)
我做到了;
read = df.description[1] …Run Code Online (Sandbox Code Playgroud)