小编jez*_*ael的帖子

如何从熊猫系列中绘制条形图?

请考虑我的系列如下:第一列是article_id,第二列是频率计数.

article_id  
1         39 
2         49 
3        187 
4        159 
5        158 
        ...  
16947     14 
16948      7 
16976      2 
16977      1 
16978      1 
16980      1 

Name: article_id, dtype: int64
Run Code Online (Sandbox Code Playgroud)

我使用以下命令从数据帧中获取此系列:

logs.loc[logs['article_id'] <= 17029].groupby('article_id')['article_id'].count()
Run Code Online (Sandbox Code Playgroud)

logs是这里的数据框,article_id是其中的一列.

如何绘制条形图(使用Matlplotlib),使得article_id位于X轴上,频率计数位于Y轴上?

我的本能是使用.tolist()将其转换为列表但不保留article_id.

plot matplotlib series ipython pandas

13
推荐指数
2
解决办法
2万
查看次数

无法在 Pandas 中将字符串转换为浮点数(ValueError)

我有一个从 JSON 输出创建的数据框,如下所示:

        Total Revenue    Average Revenue    Purchase count    Rate
Date    
Monday  1,304.40 CA$     20.07 CA$          2,345             1.54 %
Run Code Online (Sandbox Code Playgroud)

存储的值作为字符串从 JSON 接收。我在尝试着:

1) 删除条目中的所有字符(例如:CA$ 或 %) 2) 将 rate 和收入列转换为浮点数 3) 将 count 列转换为 int

我尝试执行以下操作:

df[column] = (df[column].str.split()).apply(lambda x: float(x[0]))
Run Code Online (Sandbox Code Playgroud)

它工作正常,除非我有一个昏迷的值(例如:1,465 不起作用而 143 会)。

我尝试使用几个函数来替换“,”为“”等。到目前为止没有任何效果。我总是收到以下错误:

ValueError:无法将字符串转换为浮点数:'1,304.40'

python json numeric dataframe pandas

13
推荐指数
1
解决办法
7万
查看次数

重命名列后得到keyerror

我有df:

df = pd.DataFrame({'a':[7,8,9],
                   'b':[1,3,5],
                   'c':[5,3,6]})

print (df)
   a  b  c
0  7  1  5
1  8  3  3
2  9  5  6
Run Code Online (Sandbox Code Playgroud)

然后通过重命名第一个值这个:

df.columns.values[0] = 'f'
Run Code Online (Sandbox Code Playgroud)

一切似乎都很好:

print (df)
   f  b  c
0  7  1  5
1  8  3  3
2  9  5  6

print (df.columns)
Index(['f', 'b', 'c'], dtype='object')

print (df.columns.values)
['f' 'b' 'c']
Run Code Online (Sandbox Code Playgroud)

如果选择b它很好:

print (df['b'])
0    1
1    3
2    5
Name: b, dtype: int64
Run Code Online (Sandbox Code Playgroud)

但如果选择a它返回列f: …

numpy rename multiple-columns pandas

13
推荐指数
1
解决办法
7052
查看次数

处理程序与线程

我想知道,一劳永逸.我在很多地方读过.当我想做一些"长时间操作"时,我应该使用一个Handler.

但我不明白为什么?所有我的'长时间操作'我用常规线程包围,它工作正常.

我为什么要用Handler它呢?

我必须使用的唯一一次Handler是,当我不得不安排一些任务时(postDelayed)

有什么我想念的主要想法handlers(当我真的应该使用它时)?或者也许没有真正的区别?

android handler

11
推荐指数
1
解决办法
4689
查看次数

用于评论的IntelliJ IDEA热键不适用于Scala

这里提到的所有热键(Ctrl+ SlashCtrl+ Divide,Ctrl+ Shift+ SlashCtrl+ Shift+ Divide)都不适用于我的IntelliJ IDEA 11.1.2.在Windows 7,64位下安装.我使用德语键盘布局.

我究竟做错了什么 ?

scala intellij-idea

11
推荐指数
2
解决办法
1万
查看次数

使用pandas数据帧计算累积回报

我有这个数据帧

Poloniex_DOGE_BTC   Poloniex_XMR_BTC    Daily_rets  perc_ret
172 0.006085    -0.000839   0.003309    0
173 0.006229    0.002111    0.005135    0
174 0.000000    -0.001651   0.004203    0
175 0.000000    0.007743    0.005313    0
176 0.000000    -0.001013   -0.003466   0
177 0.000000    -0.000550   0.000772    0
178 0.000000    -0.009864   0.001764    0
Run Code Online (Sandbox Code Playgroud)

我正在尝试在perc_ret中运行total_rets

但是我的代码只是复制daily_rets中的值

df['perc_ret'] = (  df['Daily_rets'] + df['perc_ret'].shift(1) )


Poloniex_DOGE_BTC   Poloniex_XMR_BTC    Daily_rets  perc_ret
172 0.006085    -0.000839   0.003309    NaN
173 0.006229    0.002111    0.005135    0.005135
174 0.000000    -0.001651   0.004203    0.004203
175 0.000000    0.007743    0.005313    0.005313
176 0.000000    -0.001013   -0.003466   -0.003466
177 0.000000 …
Run Code Online (Sandbox Code Playgroud)

python pandas cumsum

11
推荐指数
3
解决办法
1万
查看次数

Python:包含范围列表的合并列表

我有一个list:

L = ['a', 'b']
Run Code Online (Sandbox Code Playgroud)

我需要创建一个新的list通过串联原始list范围从去1k.例:

k = 4
L1 = ['a1','b1', 'a2','b2','a3','b3','a4','b4']
Run Code Online (Sandbox Code Playgroud)

我尝试:

l1 = L * k
print l1
#['a', 'b', 'a', 'b', 'a', 'b', 'a', 'b']

l = [ [x] * 2  for x in range(1, k + 1) ]
print l
#[[1, 1], [2, 2], [3, 3], [4, 4]]

l2 = [item for sublist in l for item in sublist]
print l2
#[1, 1, 2, 2, …
Run Code Online (Sandbox Code Playgroud)

python list-comprehension list range python-2.7

11
推荐指数
1
解决办法
653
查看次数

在pandas中使用read_csv时精度会丢失

我在文本文件中有以下格式的文件,我试图读入一个pandas数据帧.

895|2015-4-23|19|10000|LA|0.4677978806|0.4773469340|0.4089938425|0.8224291972|0.8652525793|0.6829942860|0.5139162227|
Run Code Online (Sandbox Code Playgroud)

如您所见,输入文件中的浮点后有10个整数.

df = pd.read_csv('mockup.txt',header=None,delimiter='|')
Run Code Online (Sandbox Code Playgroud)

当我尝试将其读入数据帧时,我没有得到最后4个整数

df[5].head()

0    0.467798
1    0.258165
2    0.860384
3    0.803388
4    0.249820
Name: 5, dtype: float64
Run Code Online (Sandbox Code Playgroud)

如何获得输入文件中的完整精度?我有一些需要执行的矩阵操作,所以我不能把它作为字符串.

我发现我必须做些什么,dtype但我不知道应该在哪里使用它.

python csv numpy floating-accuracy pandas

11
推荐指数
1
解决办法
9504
查看次数

如何将Index转换成列表?

我的索引:

Index([u'Newal', u'Saraswati Khera', u'Tohana'], dtype='object')
Run Code Online (Sandbox Code Playgroud)

我必须使用以下格式将此格式转换为列表:

['Newal','SaraswatiKhera','Tohana']
Run Code Online (Sandbox Code Playgroud)

python python-2.7 pandas

11
推荐指数
1
解决办法
2万
查看次数

使用特定模式从txt文件创建Pandas DataFrame

我需要根据以下结构基于文本文件创建Pandas DataFrame:

Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
Livingston (University of West Alabama)[2]
Montevallo (University of Montevallo)[2]
Troy (Troy University)[2]
Tuscaloosa (University of Alabama, Stillman College, Shelton State)[3][4]
Tuskegee (Tuskegee University)[5]
Alaska[edit]
Fairbanks (University of Alaska Fairbanks)[2]
Arizona[edit]
Flagstaff (Northern Arizona University)[6]
Tempe (Arizona State University)
Tucson (University of Arizona)
Arkansas[edit]
Run Code Online (Sandbox Code Playgroud)

带有"[edit]"的行是States,行[number]是Regions.我需要拆分以下内容,然后重复每个Region Name的State name.

Index          State          Region Name
0              Alabama        Aurburn...
1              Alabama        Florence...
2              Alabama        Jacksonville...
...
9              Alaska         Fairbanks...
10             Alaska …
Run Code Online (Sandbox Code Playgroud)

python regex text extract pandas

11
推荐指数
3
解决办法
1万
查看次数