我正在尝试制作一个python程序来返回具有双连续字母的单词(例如,门,球,地板).我的代码到现在为止如下所示,但它将文件中的所有单词分成两个字母的部分:
def text_processing( file_location ):
import re
file_variable = open( file_location )
lines = file_variable.read()
print lines
double_letter = re.compile('[A-Z]{2,2}', re.IGNORECASE)
double_letter_list = double_letter.findall(lines)
print double_letter_list
Run Code Online (Sandbox Code Playgroud) 我必须找到一个遵循特定格式的文件中的所有数字.格式如下:
每个数字都是正数或负数(符号可能存在也可能不存在,小数点前有一个或多个数字,小数点后有一个或多个数字).可能没有小数位.每个数字前后都可以有空格.两个数字用逗号(,)或分号(;)或冒号(:)分隔.例如(35.3,52.23; -623,623.62:-52,65)
所以在上面的例子中,我想列出六个数字.要搜索的数字列表在括号之间.到目前为止,我的代码如下所示:
def number_processing( file_location ):
""""""
import re
file_variable = open( file_location )
lines = file_variable.readlines()
numbers = re.compile(r'[(] *[+]?[-]?[0-9][0-9]*[.]+[,]+[;]+[0-9][0-9]* *[)]')
numbers_list = []
for line in lines:
for word in line.split(" "):
match = numbers.match(word)
if match:
numbers_list.append(match.group())
print numbers_list
Run Code Online (Sandbox Code Playgroud)
任何帮助是极大的赞赏!
假设我有以下内容:
In [20]: df.groupby("dummy").agg({"returns": [np.mean, np.sum]})
Out[20]:
returns
sum mean
dummy
1 0.285833 0.028583
Run Code Online (Sandbox Code Playgroud)
如何删除“退货”标题?这样我就有一个包含“总和”和“平均值”列的数据框?
我有一个格式为 YYYYQ 的 char 字段(例如 20124、20131 等),我想使用 Zoo 包中的 as.yearqtr 将其转换为字段格式。
感谢您的帮助!