我面临着一种独特的情况,有点微不足道但很痛苦.
我需要使用Python 2.6.6,因为NLTK没有移植到Python 3(这是我可以收集的).
在一个不同的代码(它同时工作)中,有一个集合计数器函数,它只在Python 3中可用,但在Python 2.6.6中不可用.
所以,每次我在两个代码之间切换时,我都需要安装和卸载版本.那是浪费时间.
有关如何指定我想使用哪个版本的任何建议?
我已将Excel工作表导入到pandas中.它有7列是数字,1列是字符串(标志).
将标志转换为分类变量后,我试图从Pandas数据帧中删除字符串列.但是,我无法做到.
这是代码:
[In] parts_median_temp.columns
[Out] Index([u'PART_NBR', u'PRT_QTY', u'PRT_DOL', u'BTS_QTY', u'BTS_DOL', u'Median', u'Upper_Limit', u'Flag_median'], dtype='object')
Run Code Online (Sandbox Code Playgroud)
我想要删除的列是'Flag_median'.
[In] parts_median_temp.drop('Flag_median')
[Out] ...ValueError: labels ['Flag_median'] not contained in axis
Run Code Online (Sandbox Code Playgroud)
帮我Flag_median从Pandas数据框中删除该列.
我有一个有 40 列和 400000 行的熊猫数据框。我在 3 列上创建了一个汇总的数据集。
现在,我需要根据其中两列计算 % 指标。Python 抛出错误 -
unsupported operand type(s) for /: 'SeriesGroupBy' and 'SeriesGroupBy'
Run Code Online (Sandbox Code Playgroud)
这是示例代码:
print sample_data
date part receipt bad_dollars total_dollars bad_percent
0 1 123 22 40 100 NaN
1 2 456 44 80 120 NaN
2 3 134 33 30 150 NaN
3 1 123 22 80 100 NaN
4 5 456 45 40 90 NaN
5 3 134 33 85 150 NaN
6 7 123 24 70 120 NaN
7 5 …Run Code Online (Sandbox Code Playgroud)