小编ita*_*oot的帖子

返回双连续字母的单词

我正在尝试制作一个python程序来返回具有双连续字母的单词(例如,门,球,地板).我的代码到现在为止如下所示,但它将文件中的所有单词分成两个字母的部分:

def text_processing( file_location ):
    import re
    file_variable = open( file_location )
    lines = file_variable.read()
    print lines

    double_letter = re.compile('[A-Z]{2,2}', re.IGNORECASE)
    double_letter_list = double_letter.findall(lines)

    print double_letter_list
Run Code Online (Sandbox Code Playgroud)

python regex

2
推荐指数
1
解决办法
4954
查看次数

查找具有特定格式的数字

我必须找到一个遵循特定格式的文件中的所有数字.格式如下:

每个数字都是正数或负数(符号可能存在​​也可能不存在,小数点前有一个或多个数字,小数点后有一个或多个数字).可能没有小数位.每个数字前后都可以有空格.两个数字用逗号(,)或分号(;)或冒号(:)分隔.例如(35.3,52.23; -623,623.62:-52,65)

所以在上面的例子中,我想列出六个数字.要搜索的数字列表在括号之间.到目前为止,我的代码如下所示:

def number_processing( file_location ):
    """"""

    import re

    file_variable = open( file_location )
    lines = file_variable.readlines()

    numbers = re.compile(r'[(] *[+]?[-]?[0-9][0-9]*[.]+[,]+[;]+[0-9][0-9]* *[)]')
    numbers_list = []

    for line in lines:
        for word in line.split(" "):
            match = numbers.match(word)
            if match:
                numbers_list.append(match.group())
      print numbers_list
Run Code Online (Sandbox Code Playgroud)

任何帮助是极大的赞赏!

python regex

2
推荐指数
1
解决办法
144
查看次数

pandas聚合后删除组头

假设我有以下内容:

In [20]: df.groupby("dummy").agg({"returns": [np.mean, np.sum]})
Out[20]: 
        returns          
            sum      mean

dummy                    
1      0.285833  0.028583
Run Code Online (Sandbox Code Playgroud)

如何删除“退货”标题?这样我就有一个包含“总和”和“平均值”列的数据框?

python pandas pandas-groupby

2
推荐指数
2
解决办法
6906
查看次数

使用 as.yearqtr 转换 YYYYQ

我有一个格式为 YYYYQ 的 char 字段(例如 20124、20131 等),我想使用 Zoo 包中的 as.yearqtr 将其转换为字段格式。

感谢您的帮助!

r date date-format zoo

0
推荐指数
1
解决办法
9669
查看次数

标签 统计

python ×3

regex ×2

date ×1

date-format ×1

pandas ×1

pandas-groupby ×1

r ×1

zoo ×1