我正在试验 Python。我想实现的是使用 Github API,我想获取自上个月以来用 Python 语言编写并创建的前 10 位最受好评的公共存储库。谁能给我一些关于如何实现这一目标的提示?
到目前为止,我已成功实现以下目标:
import pandas as pd
import requests
from datetime import datetime
df = pd.DataFrame(columns=['repository_ID', 'name', 'URL', 'created_date', 'description', 'number_of_stars'])
results = requests.get('https://api.github.com/search/repositories?q=language:python&sort=stars&order=desc').json()
for repo in results['items']:
d_tmp = {'repository_ID': repo['id'],
'name': repo['name'],
'URL': repo['html_url'],
'created_date': datetime.strptime(repo['created_at'], '%Y-%m-%dT%H:%M:%SZ'),
'number_of_stars': repo['stargazers_count']}
df = df.append(d_tmp, ignore_index=True)
print d_tmp
Run Code Online (Sandbox Code Playgroud)
这给了我以下按星降序排列的观看次数最多的结果:
{'URL': u'https://github.com/faif/python-patterns', 'repository_ID': 4578002, 'number_of_stars': 18103, 'name': u'python-patterns', 'created_date': datetime.datetime(2012, 6, 6, 21, 2, 35)}
Run Code Online (Sandbox Code Playgroud)
我坚持的是: 如何在过去两个月和前 10 个存储库中获得相同的结果? 我感谢所有有价值的信息。
我试图理解两者,但我真的很困惑。网上说:
MySQL WEEKDAY()返回给定日期的一周中一天的索引(0 表示星期一,1 表示星期二,......6 表示星期日)。MySQL DAYOFWEEK()返回指定为参数的日期的星期数(星期日为 1,星期一为 2……星期六为 7)。
任何人都可以用一个例子来解释两者吗?谢谢你。
我有一个数据帧计数1,看起来像:
Factor w-statin wo-statin
AgeGroups Cancer
0-5 No 108 6575
Yes 0 223
11-15 No 5 3669
Yes 1 143
16-20 No 28 6174
Yes 1 395
21-25 No 80 8173
Yes 2 624
26-30 No 110 9143
Yes 2 968
30-35 No 171 9046
Yes 5 1225
35-40 No 338 8883
Yes 21 1475
Run Code Online (Sandbox Code Playgroud)
我想计算oddsratio(w-statin/wo-statin).我做了旧样式,就像我用纸做的那样:
counts1['sumwwoStatin']= counts1['w-statin']+counts1['wo-statin']
counts1['oddRatio']=((counts1['w-statin']/counts1['sumwwoStatin'])/(counts1['wo-statin']/counts1['sumwwoStatin']))
Run Code Online (Sandbox Code Playgroud)
是否有更好的方法来计算Pandas中的优势比,相对风险,Contigency表和卡方检验,就像在R?任何建议表示赞赏.哦顺便说一下,我忘了提一下我的csv是怎样的:
Frequency Cancer Factor AgeGroups
0 223 Yes wo-statin 0-5
1 112 Yes wo-statin 6-10
2 143 Yes wo-statin 11-15
3 …Run Code Online (Sandbox Code Playgroud) 我有一个看起来像这样的数据框:
AgeGroups Factor Cancer Frequency
0 00-05 B Yes 223
1 00-05 A No 108
2 00-05 A Yes 0
3 00-05 B No 6575
4 11-15 B Yes 143
5 11-15 A No 5
6 11-15 A Yes 1
7 11-15 B No 3669
8 16-20 B Yes 395
9 16-20 A No 28
10 16-20 A Yes 1
11 16-20 B No 6174
12 21-25 B Yes 624
13 21-25 A No 80
14 21-25 A Yes 2 …Run Code Online (Sandbox Code Playgroud) 我的csv数据看起来像下面提供的那样.我想用pandas/python创建一个堆栈条形图,其中每个条形图代表有两种颜色的男性和女性部分,在条形图的顶部显示服用该药物的男性和女性的总数(在我的情况下).例如,对于20岁的人来说,总共7人,其中6人是男性,1人是女性,所以在酒吧的情况下,酒吧的顶部应该有7个,这个6:1的部分显示在酒吧中.两种颜色.我设法根据他们的年龄计划对人们进行分组并绘制它,但我想要显示具有不同颜色的两种性别的酒吧.任何帮助将不胜感激 .谢谢.
Drug_ID,Age,Gender
FF90E5F780133BBCAEE9BA0E4654C5CA,15,F
2AB2529352E6A1D0BA91E167C5191231,17,M
6E4B2C80EA83C5B51675BC077A182E06,19,M
8AEB19A68DE4C301154973E0C87C774D,19,M
FA533E7DD1FCAB83822D4A2FC514AEE7,20,F
208F39485A8FBA7214CA004B53CC29B7,20,M
3172B95E8A5732D2EDB089A354787612,20,M
38FBAE52AAB04E56AB3A35C4AFBF3813,20,M
62D8A33130574C984EAF3A2E80C243A6,20,M
646AF35E192885FE1336649BA3735FC4,20,M
778D2B1354F30ED3D3BDD7B9437CF670,20,M
891312933FE5FB25703B3E958EF943E3,21,F
5CC63DFC5EF399F65CB9BC583A770DFB,21,M
97C9ED5750EC6FF618A059085F0BF4A6,21,M
C6F03C5E3CC37249E0308A09292F5A58,21,M
0713C427BDC3A90F291AF49599987F38,23,F
518EBD35FCDAB7C744334F993D8CEB28,23,F
A3FC185C4531AFF1E8B7B9F5985028CB,23,F
1837406921314CB182FB0C7BC5565204,23,M
CA0E6274BD39E8DE5C823F4E6F234252,23,M
E2F64030BB011C11541EDC192BAED09A,23,M
EF8F3D028C5759858AB7574864833015,23,M
5DCD427F26E05CC1C3F565BB05EAE10B,24,F
8646ED503722C3C6C6B44208EF1A5202,24,F
F9F45112C472282778E1F437F54B0B70,24,F
0CF4F20B89303CB4C03CF3BD3B27CAF0,24,M
63727039DFF77A46995DA8EDBC4E3497,24,M
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
data = pd.read_csv('/home/MedResearch/Desktop/drug_ids_age_gender.csv')
data.values
df = pd.DataFrame(data)
df2 = pd.merge(df1,df, left_index = True, right_index = True)
temp1 = df2.groupby('Age').Age.count()
df3 = pd.merge(df1,df, left_index = True, right_index = True)
temp2 = df3.groupby('Gender').Age.count()
ax = temp1.plot(kind='bar',stacked = False, colormap = …Run Code Online (Sandbox Code Playgroud)