请考虑我的系列如下:第一列是article_id,第二列是频率计数.
article_id
1 39
2 49
3 187
4 159
5 158
...
16947 14
16948 7
16976 2
16977 1
16978 1
16980 1
Name: article_id, dtype: int64
Run Code Online (Sandbox Code Playgroud)
我使用以下命令从数据帧中获取此系列:
logs.loc[logs['article_id'] <= 17029].groupby('article_id')['article_id'].count()
Run Code Online (Sandbox Code Playgroud)
logs是这里的数据框,article_id是其中的一列.
如何绘制条形图(使用Matlplotlib),使得article_id位于X轴上,频率计数位于Y轴上?
我的本能是使用.tolist()将其转换为列表但不保留article_id.
我有一个从 JSON 输出创建的数据框,如下所示:
Total Revenue Average Revenue Purchase count Rate
Date
Monday 1,304.40 CA$ 20.07 CA$ 2,345 1.54 %
Run Code Online (Sandbox Code Playgroud)
存储的值作为字符串从 JSON 接收。我在尝试着:
1) 删除条目中的所有字符(例如:CA$ 或 %) 2) 将 rate 和收入列转换为浮点数 3) 将 count 列转换为 int
我尝试执行以下操作:
df[column] = (df[column].str.split()).apply(lambda x: float(x[0]))
Run Code Online (Sandbox Code Playgroud)
它工作正常,除非我有一个昏迷的值(例如:1,465 不起作用而 143 会)。
我尝试使用几个函数来替换“,”为“”等。到目前为止没有任何效果。我总是收到以下错误:
ValueError:无法将字符串转换为浮点数:'1,304.40'
我有df:
df = pd.DataFrame({'a':[7,8,9],
'b':[1,3,5],
'c':[5,3,6]})
print (df)
a b c
0 7 1 5
1 8 3 3
2 9 5 6
Run Code Online (Sandbox Code Playgroud)
然后通过重命名第一个值这个:
df.columns.values[0] = 'f'
Run Code Online (Sandbox Code Playgroud)
一切似乎都很好:
print (df)
f b c
0 7 1 5
1 8 3 3
2 9 5 6
print (df.columns)
Index(['f', 'b', 'c'], dtype='object')
print (df.columns.values)
['f' 'b' 'c']
Run Code Online (Sandbox Code Playgroud)
如果选择b它很好:
print (df['b'])
0 1
1 3
2 5
Name: b, dtype: int64
Run Code Online (Sandbox Code Playgroud)
但如果选择a它返回列f: …
我想知道,一劳永逸.我在很多地方读过.当我想做一些"长时间操作"时,我应该使用一个Handler.
但我不明白为什么?所有我的'长时间操作'我用常规线程包围,它工作正常.
我为什么要用Handler它呢?
我必须使用的唯一一次Handler是,当我不得不安排一些任务时(postDelayed)
有什么我想念的主要想法handlers(当我真的应该使用它时)?或者也许没有真正的区别?
这里提到的所有热键(Ctrl+ Slash或Ctrl+ Divide,Ctrl+ Shift+ Slash或Ctrl+ Shift+ Divide)都不适用于我的IntelliJ IDEA 11.1.2.在Windows 7,64位下安装.我使用德语键盘布局.
我究竟做错了什么 ?
我有这个数据帧
Poloniex_DOGE_BTC Poloniex_XMR_BTC Daily_rets perc_ret
172 0.006085 -0.000839 0.003309 0
173 0.006229 0.002111 0.005135 0
174 0.000000 -0.001651 0.004203 0
175 0.000000 0.007743 0.005313 0
176 0.000000 -0.001013 -0.003466 0
177 0.000000 -0.000550 0.000772 0
178 0.000000 -0.009864 0.001764 0
Run Code Online (Sandbox Code Playgroud)
我正在尝试在perc_ret中运行total_rets
但是我的代码只是复制daily_rets中的值
df['perc_ret'] = ( df['Daily_rets'] + df['perc_ret'].shift(1) )
Poloniex_DOGE_BTC Poloniex_XMR_BTC Daily_rets perc_ret
172 0.006085 -0.000839 0.003309 NaN
173 0.006229 0.002111 0.005135 0.005135
174 0.000000 -0.001651 0.004203 0.004203
175 0.000000 0.007743 0.005313 0.005313
176 0.000000 -0.001013 -0.003466 -0.003466
177 0.000000 …Run Code Online (Sandbox Code Playgroud) 我有一个list:
L = ['a', 'b']
Run Code Online (Sandbox Code Playgroud)
我需要创建一个新的list通过串联原始list范围从去1到k.例:
k = 4
L1 = ['a1','b1', 'a2','b2','a3','b3','a4','b4']
Run Code Online (Sandbox Code Playgroud)
我尝试:
l1 = L * k
print l1
#['a', 'b', 'a', 'b', 'a', 'b', 'a', 'b']
l = [ [x] * 2 for x in range(1, k + 1) ]
print l
#[[1, 1], [2, 2], [3, 3], [4, 4]]
l2 = [item for sublist in l for item in sublist]
print l2
#[1, 1, 2, 2, …Run Code Online (Sandbox Code Playgroud) 我在文本文件中有以下格式的文件,我试图读入一个pandas数据帧.
895|2015-4-23|19|10000|LA|0.4677978806|0.4773469340|0.4089938425|0.8224291972|0.8652525793|0.6829942860|0.5139162227|
Run Code Online (Sandbox Code Playgroud)
如您所见,输入文件中的浮点后有10个整数.
df = pd.read_csv('mockup.txt',header=None,delimiter='|')
Run Code Online (Sandbox Code Playgroud)
当我尝试将其读入数据帧时,我没有得到最后4个整数
df[5].head()
0 0.467798
1 0.258165
2 0.860384
3 0.803388
4 0.249820
Name: 5, dtype: float64
Run Code Online (Sandbox Code Playgroud)
如何获得输入文件中的完整精度?我有一些需要执行的矩阵操作,所以我不能把它作为字符串.
我发现我必须做些什么,dtype但我不知道应该在哪里使用它.
我的索引:
Index([u'Newal', u'Saraswati Khera', u'Tohana'], dtype='object')
Run Code Online (Sandbox Code Playgroud)
我必须使用以下格式将此格式转换为列表:
['Newal','SaraswatiKhera','Tohana']
Run Code Online (Sandbox Code Playgroud) 我需要根据以下结构基于文本文件创建Pandas DataFrame:
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]
Tuskegee (Tuskegee University)[5]
Alaska[edit]
Fairbanks (University of Alaska Fairbanks)[2]
Arizona[edit]
Flagstaff (Northern Arizona University)[6]
Tempe (Arizona State University)
Tucson (University of Arizona)
Arkansas[edit]
Run Code Online (Sandbox Code Playgroud)
带有"[edit]"的行是States,行[number]是Regions.我需要拆分以下内容,然后重复每个Region Name的State name.
Index State Region Name
0 Alabama Aurburn...
1 Alabama Florence...
2 Alabama Jacksonville...
...
9 Alaska Fairbanks...
10 Alaska …Run Code Online (Sandbox Code Playgroud)