小编ita*_*oot的帖子

返回双连续字母的单词

我正在尝试制作一个python程序来返回具有双连续字母的单词(例如,门,球,地板).我的代码到现在为止如下所示,但它将文件中的所有单词分成两个字母的部分:

def text_processing( file_location ):
    import re
    file_variable = open( file_location )
    lines = file_variable.read()
    print lines

    double_letter = re.compile('[A-Z]{2,2}', re.IGNORECASE)
    double_letter_list = double_letter.findall(lines)

    print double_letter_list

Run Code Online (Sandbox Code Playgroud)

python regex

ita*_*oot

2012 03-07

2
推荐指数

1
解决办法

4954
查看次数

查找具有特定格式的数字

我必须找到一个遵循特定格式的文件中的所有数字.格式如下:

每个数字都是正数或负数(符号可能存在也可能不存在,小数点前有一个或多个数字,小数点后有一个或多个数字).可能没有小数位.每个数字前后都可以有空格.两个数字用逗号(,)或分号(;)或冒号(:)分隔.例如(35.3,52.23; -623,623.62:-52,65)

所以在上面的例子中,我想列出六个数字.要搜索的数字列表在括号之间.到目前为止,我的代码如下所示:

def number_processing( file_location ):
    """"""

    import re

    file_variable = open( file_location )
    lines = file_variable.readlines()

    numbers = re.compile(r'[(] *[+]?[-]?[0-9][0-9]*[.]+[,]+[;]+[0-9][0-9]* *[)]')
    numbers_list = []

    for line in lines:
        for word in line.split(" "):
            match = numbers.match(word)
            if match:
                numbers_list.append(match.group())
      print numbers_list

Run Code Online (Sandbox Code Playgroud)

任何帮助是极大的赞赏!

python regex

ita*_*oot

2012 03-07

2
推荐指数

1
解决办法

144
查看次数

pandas聚合后删除组头

假设我有以下内容：

In [20]: df.groupby("dummy").agg({"returns": [np.mean, np.sum]})
Out[20]: 
        returns          
            sum      mean

dummy                    
1      0.285833  0.028583

Run Code Online (Sandbox Code Playgroud)

如何删除“退货”标题？这样我就有一个包含“总和”和“平均值”列的数据框？

python pandas pandas-groupby

ita*_*oot

lucky-day

2
推荐指数

2
解决办法

6906
查看次数