我有一个这样的数据框:
print(df)
0 1 2
0 354.7 April 4.0
1 55.4 August 8.0
2 176.5 December 12.0
3 95.5 February 2.0
4 85.6 January 1.0
5 152 July 7.0
6 238.7 June 6.0
7 104.8 March 3.0
8 283.5 May 5.0
9 278.8 November 11.0
10 249.6 October 10.0
11 212.7 September 9.0
Run Code Online (Sandbox Code Playgroud)
如您所见,月份不是日历顺序.所以我创建了第二列,以获得与每个月相对应的月份数(1-12).从那里,我如何根据日历月的顺序对此数据框进行排序?
我试图确定函数导入的一些最佳实践,而 PEP 8 没有明确谈论这一点,事实上PEP 8 导入部分相对较小。我想知道使用缩写导入时的最佳实践是什么。
例如:
import pandas as pd
import numpy as np
Run Code Online (Sandbox Code Playgroud)
很容易理解,因为它们是使用非常广泛的包。就我自己的情况而言,我希望在模块中导入一些晦涩的类或函数,例如:
from my_module import my_fun_function as mff
...
myvar = mff(input1)
Run Code Online (Sandbox Code Playgroud)
相对
from my_module import my_fun_function
...
myvar = my_fun_function(input1)
Run Code Online (Sandbox Code Playgroud)
有这方面的最佳实践参考吗?
我有一个带有性别列的数据框。它包括对性别的预测。现在,性别列具有诸如mostly_male、mostly_female 之类的值。我想删除大部分。所以我尝试了df['gender'] = df['gender'].map(lambda x: x.lstrip('mostly_'))
但我得到了一列,其中“男性”的值对应于“麦芽酒”
我正在尝试将 pandas 中的数据框输出到 Excel。
\n\ndata = {\'Names\':[\'A\', \'B\', \'C\', \'D\'], Attending Cost\xe2\x80\x99: [1, 1, 1, 1], \'Summary\':[2, 2, 2, 2]}\ndata_2 = pd.DataFrame.from_dict(data)\nwriter = pd.ExcelWriter("test", engine=\'xlsxwriter\') \ndata_2.to_excel(writer, sheet_name=\'Sheet1\', \nstartrow=5)\nwriter.save()\nRun Code Online (Sandbox Code Playgroud)\n\n我希望我可以在最后两列上使用 Excel 的内置会计格式,但我不知道该怎么做。任何帮助表示赞赏。
\n我有一个数据框,其中包含多列包含列表,每行中列表的长度不同:
tweetid tweet_date user_mentions hashtags
00112 11-02-2014 [] []
00113 11-02-2014 [00113] [obama, trump]
00114 30-07-2015 [00114, 00115] [hillary, trump, sanders]
00115 30-07-2015 [] []
Run Code Online (Sandbox Code Playgroud)
数据帧是三个不同数据帧的连续,我不确定列表中的项是否具有相同的dtype.例如,在user_mentions列中,有时数据如下:
[00114, 00115]
Run Code Online (Sandbox Code Playgroud)
但有时是这样的:
['00114','00115']
Run Code Online (Sandbox Code Playgroud)
如何设置列表中项目的dtype?