小编Ace*_*.py的帖子

Github API,获取用 Python 语言编写的最受好评的公共存储库

我正在试验 Python。我想实现的是使用 Github API,我想获取自上个月以来用 Python 语言编写并创建的前 10 位最受好评的公共存储库。谁能给我一些关于如何实现这一目标的提示?

到目前为止,我已成功实现以下目标:

import pandas as pd
import requests 
from datetime import datetime
df = pd.DataFrame(columns=['repository_ID', 'name', 'URL', 'created_date',  'description', 'number_of_stars'])
results = requests.get('https://api.github.com/search/repositories?q=language:python&sort=stars&order=desc').json()

for repo in results['items']:
        d_tmp = {'repository_ID': repo['id'],
                'name': repo['name'],
                'URL': repo['html_url'],
                'created_date': datetime.strptime(repo['created_at'], '%Y-%m-%dT%H:%M:%SZ'),


                'number_of_stars': repo['stargazers_count']}
        df = df.append(d_tmp, ignore_index=True)


print d_tmp
Run Code Online (Sandbox Code Playgroud)

这给了我以下按星降序排列的观看次数最多的结果:

{'URL': u'https://github.com/faif/python-patterns', 'repository_ID': 4578002, 'number_of_stars': 18103, 'name': u'python-patterns', 'created_date': datetime.datetime(2012, 6, 6, 21, 2, 35)}
Run Code Online (Sandbox Code Playgroud)

我坚持的是: 如何在过去两个月和前 10 个存储库中获得相同的结果? 我感谢所有有价值的信息。

python api github pandas

8
推荐指数
1
解决办法
1780
查看次数

Mysql WEEKDAY() vs Mysql DayofWeek()

我试图理解两者,但我真的很困惑。网上说:

MySQL WEEKDAY()返回给定日期的一周中一天的索引(0 表示星期一,1 表示星期二,......6 表示星期日)。MySQL DAYOFWEEK()返回指定为参数的日期的星期数(星期日为 1,星期一为 2……星期六为 7)。

任何人都可以用一个例子来解释两者吗?谢谢你。

mysql function

7
推荐指数
2
解决办法
4333
查看次数

一种计算大熊猫奇数比的更好方法

我有一个数据帧计数1,看起来像:

Factor            w-statin  wo-statin
AgeGroups Cancer                     
0-5       No           108       6575
          Yes            0        223
11-15     No             5       3669
          Yes            1        143
16-20     No            28       6174
          Yes            1        395
21-25     No            80       8173
          Yes            2        624
26-30     No           110       9143
          Yes            2        968
30-35     No           171       9046
          Yes            5       1225
35-40     No           338       8883
          Yes           21       1475
Run Code Online (Sandbox Code Playgroud)

我想计算oddsratio(w-statin/wo-statin).我做了旧样式,就像我用纸做的那样:

counts1['sumwwoStatin']= counts1['w-statin']+counts1['wo-statin']

counts1['oddRatio']=((counts1['w-statin']/counts1['sumwwoStatin'])/(counts1['wo-statin']/counts1['sumwwoStatin']))
Run Code Online (Sandbox Code Playgroud)

是否有更好的方法来计算Pandas中的优势比,相对风险,Contigency表和卡方检验,就像在R?任何建议表示赞赏.哦顺便说一下,我忘了提一下我的csv是怎样的:

    Frequency Cancer     Factor AgeGroups
0         223    Yes  wo-statin       0-5
1         112    Yes  wo-statin      6-10
2         143    Yes  wo-statin     11-15
3 …
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
5318
查看次数

调整图中的y-lim比例(matplotlib,pandas),以使两个图达到相同的比例

我有一个看起来像这样的数据框:

   AgeGroups Factor Cancer  Frequency
0      00-05      B    Yes        223
1      00-05      A     No        108
2      00-05      A    Yes          0
3      00-05      B     No       6575
4      11-15      B    Yes        143
5      11-15      A     No          5
6      11-15      A    Yes          1
7      11-15      B     No       3669
8      16-20      B    Yes        395
9      16-20      A     No         28
10     16-20      A    Yes          1
11     16-20      B     No       6174
12     21-25      B    Yes        624
13     21-25      A     No         80
14     21-25      A    Yes          2 …
Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas

3
推荐指数
1
解决办法
97
查看次数

堆积条形图由群计数在熊猫Python上

我的csv数据看起来像下面提供的那样.我想用pandas/python创建一个堆栈条形图,其中每个条形图代表有两种颜色的男性和女性部分,在条形图的顶部显示服用该药物的男性和女性的总数(在我的情况下).例如,对于20岁的人来说,总共7人,其中6人是男性,1人是女性,所以在酒吧的情况下,酒吧的顶部应该有7个,这个6:1的部分显示在酒吧中.两种颜色.我设法根据他们的年龄计划对人们进行分组并绘制它,但我想要显示具有不同颜色的两种性别的酒吧.任何帮助将不胜感激 .谢谢.

Drug_ID,Age,Gender
FF90E5F780133BBCAEE9BA0E4654C5CA,15,F
2AB2529352E6A1D0BA91E167C5191231,17,M
6E4B2C80EA83C5B51675BC077A182E06,19,M
8AEB19A68DE4C301154973E0C87C774D,19,M
FA533E7DD1FCAB83822D4A2FC514AEE7,20,F
208F39485A8FBA7214CA004B53CC29B7,20,M
3172B95E8A5732D2EDB089A354787612,20,M
38FBAE52AAB04E56AB3A35C4AFBF3813,20,M
62D8A33130574C984EAF3A2E80C243A6,20,M
646AF35E192885FE1336649BA3735FC4,20,M
778D2B1354F30ED3D3BDD7B9437CF670,20,M
891312933FE5FB25703B3E958EF943E3,21,F
5CC63DFC5EF399F65CB9BC583A770DFB,21,M
97C9ED5750EC6FF618A059085F0BF4A6,21,M
C6F03C5E3CC37249E0308A09292F5A58,21,M
0713C427BDC3A90F291AF49599987F38,23,F
518EBD35FCDAB7C744334F993D8CEB28,23,F
A3FC185C4531AFF1E8B7B9F5985028CB,23,F
1837406921314CB182FB0C7BC5565204,23,M
CA0E6274BD39E8DE5C823F4E6F234252,23,M
E2F64030BB011C11541EDC192BAED09A,23,M
EF8F3D028C5759858AB7574864833015,23,M
5DCD427F26E05CC1C3F565BB05EAE10B,24,F
8646ED503722C3C6C6B44208EF1A5202,24,F
F9F45112C472282778E1F437F54B0B70,24,F
0CF4F20B89303CB4C03CF3BD3B27CAF0,24,M
63727039DFF77A46995DA8EDBC4E3497,24,M

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

data = pd.read_csv('/home/MedResearch/Desktop/drug_ids_age_gender.csv')
data.values

df = pd.DataFrame(data)
df2 = pd.merge(df1,df,  left_index = True, right_index = True)
temp1 = df2.groupby('Age').Age.count()

df3 = pd.merge(df1,df,  left_index = True, right_index = True)
temp2 = df3.groupby('Gender').Age.count()

ax = temp1.plot(kind='bar',stacked = False, colormap = …
Run Code Online (Sandbox Code Playgroud)

python plot numpy matplotlib pandas

0
推荐指数
1
解决办法
6079
查看次数

标签 统计

pandas ×4

python ×4

matplotlib ×2

api ×1

function ×1

github ×1

mysql ×1

numpy ×1

plot ×1