小编Jan*_*Jan的帖子

DataFrame值以startwith开头

我在熊猫中有以下数据框:

        Datum   Zeit                                     Event
0  14.11.2016  13:00   Veröffentlichung des 9-Monats-Berichtes
1  14.03.2017  13:00            Telefonkonferenz für Analysten
2  14.03.2017  13:00            Telefonkonferenz für Analysten
3  27.04.2017  14:00              Ordentliche Hauptversammlung
4  03.05.2017  14:00                         Dividendenzahlung
5  15.05.2017  14:00                    Bericht zum 1. Quartal
6  14.08.2017  14:00           Telefonkonferenz für Investoren
7  14.08.2017  14:00            Telefonkonferenz für Analysten
8  14.08.2017  14:00  Veröffentlichung des Halbjahresberichtes
Run Code Online (Sandbox Code Playgroud)

我在这里寻找季度报告的日期("古老的德语"中的"Bericht").
我可以通过选择行

df.loc[df["Event"].str.startswith("Bericht"), "Datum"]
Run Code Online (Sandbox Code Playgroud)

返回一个Series像这样的对象

5    15.05.2017
Name: Datum, dtype: object
Run Code Online (Sandbox Code Playgroud)

但是,我只想要约会 - 我在这里过于复杂吗?

python dataframe pandas

5
推荐指数
1
解决办法
7581
查看次数

正则表达式匹配函数参数

select\[([^\s]*(?<param>[a-z0-9]+)[^,\s]*)*\]
Run Code Online (Sandbox Code Playgroud)

尝试从逗号分隔的参数加载捕获组(数字或字母数字选项),忽略每个参数的前导/尾随空格,但保留单词之间的空格(即“两个单词”)。

select[  1, 22 ,word,      two words    ]
Run Code Online (Sandbox Code Playgroud)

成为:

param1: "1"
param2: "22"
param3: "word"
param4: "two words"
Run Code Online (Sandbox Code Playgroud)

正则表达式101

一旦排序,想要处理参数周围的可选单引号 ' 。

感谢您的考虑

python regex

5
推荐指数
1
解决办法
5224
查看次数

什么是正确将SVG'd'属性分割为标记的正则表达式?

我试图将dsvg文件中的路径标记上的属性拆分为标记.

这个比较容易:

d = "M 2 -12 C 5 15 21 19 27 -2 C 17 12 -3 40 5 7"
tokens = d.split(/[\s,]/)
Run Code Online (Sandbox Code Playgroud)

但这也是一个有效的d属性:

d = "M2-12C5,15,21,19,27-2C17,12-3,40,5,7"
Run Code Online (Sandbox Code Playgroud)

棘手的部分是字母,数字不再分开,负数只使用负号作为分隔符.如何创建处理此问题的正则表达式?

规则似乎是:

  • 只要有空格或逗号就分开
  • 从字母中分割数字(并用数字保持" - ")

我知道我可以使用环视,例如:

tokens = pathdef.split(/(?<=\d)(?=\D)|(?<=\D)(?=\d)/)
Run Code Online (Sandbox Code Playgroud)

我在制作单个正则表达式时也遇到了麻烦,这个正则表达式也会在减号上分开,并用数字保留减号.

上面的代码应该标记为如下:

[ 'M', '2', '-12', 'C', '5', '15', '21', '19', '27', '-2', 'C', '17', '12', '-3', '40', '5', '7' ]
Run Code Online (Sandbox Code Playgroud)

javascript regex

5
推荐指数
1
解决办法
87
查看次数

如何跳过专栏?

我有文字表:

   13.5         0.12557         0.04243         -0.0073         0.00377
     14         0.12573            0.05        -0.00697         0.00437
   14.5         0.12623         0.05823        -0.00703           0.005
     15         0.12853          0.0686        -0.00627         0.00493
   15.5          0.1299         0.08073        -0.00533          0.0063
Run Code Online (Sandbox Code Playgroud)

在哪里我想匹配所有数字,除了第一列中的数字.我试图使用负面的lookbehind但没有成功:

(?<!^)[\d.E-]+
Run Code Online (Sandbox Code Playgroud)

如何匹配除第一列(13.5,14,14.5,15,15.5)之外的所有数字?

c# regex

5
推荐指数
1
解决办法
78
查看次数

使用 atof 转换数字

在 中Python 3.5,我想使用locale.atof以下代码将德语数字字符串转换为浮点数:


import locale
from locale import atof
locale.setlocale(locale.LC_ALL, 'de_DE')

number = atof('17.907,08')
Run Code Online (Sandbox Code Playgroud)

然而,这提出了一个ValueError

ValueError: could not convert string to float: '17.907.08'
Run Code Online (Sandbox Code Playgroud)


为什么?这不就是atof()为了这个而生的吗?

python python-3.5

4
推荐指数
1
解决办法
1万
查看次数

Python 正则表达式删除空格 b/wa 括号和数字

Python,我有一个这样的字符串,输入:

IBNR    13,123   1,234  ( 556 )   ( 2,355 )  934 
Run Code Online (Sandbox Code Playgroud)

所需的输出-:

要么删除空格 b/w 括号和数字

IBNR    13,123   1,234  (556)   (2,355)  934  
Run Code Online (Sandbox Code Playgroud)

或删除括号:

IBNR   13,123   1,234  556  2,355  934  
Run Code Online (Sandbox Code Playgroud)

我试过这个:

re.sub('(?<=\d)+ (?=\\))','',text1)
Run Code Online (Sandbox Code Playgroud)

这解决了右侧,需要左侧的帮助。

python regex regex-group python-3.x regex-lookarounds

4
推荐指数
1
解决办法
71
查看次数

如何裁剪多边形外的区域?

我想让 PHP 中预定义多边形之外的任何东西都透明。比方说,你有你的头部形状,那么图像的任何其他部分都应该被装箱。非常感谢!为了让自己清楚,这是我一直在研究的一些代码:

$dat = dirname(__FILE__)."/foto_".time().".png";
$img = imagecreatefrompng("foto.png");
$points = array(93,36,147,1,255,-5,294,37,332,114,327,189,315,249,303,291,290,327,260,360,205,404,165,407,131,376,86,325,62,236,61,155,66,96,77,57,87,45);
$schwarz = ImageColorAllocate ($img, 0, 0, 0);
imagefilledpolygon($img, $points, count($points)/2, $schwarz);
imagepng($img, $dat);
Run Code Online (Sandbox Code Playgroud)

可以在此处找到原始图像,在此处找到结果。除了黑色区域之外的所有东西都应该被丢弃。

php crop polygon

3
推荐指数
1
解决办法
2311
查看次数

熊猫选择过去的最近日期

作为的初学者pandas,我想知道如何选择过去的最接近日期?例如,我有dataframe以下内容:

               Terminart                        Info     Datum  Ergebnis
0       Hauptversammlung                         NaN  22.06.16       NaN
1        Jahresabschluss                        2015  10.03.16       NaN
2         Quartalszahlen                     Q3 2015  28.10.15       NaN
3         Quartalszahlen                     Q2 2015  29.07.15       NaN
4       Hauptversammlung                         NaN  05.05.15       NaN
5         Quartalszahlen                     Q1 2015  29.04.15       NaN
6  Bilanzpressekonferenz                        2014  12.03.15       NaN
7  Bilanzpressekonferenz  Jahrespressekonferenz 2015  12.03.15       NaN
Run Code Online (Sandbox Code Playgroud)


我可以选择Terminartwith df.loc(),即:

df.loc[df['Terminart'] == 'Hauptversammlung']
Run Code Online (Sandbox Code Playgroud)

仅选择两行(正确)。


但是,如何选择过去的最接近日期?这将是第一行(06/22/16)吗?默认情况下,数据框未排序。

python dataframe pandas

3
推荐指数
1
解决办法
3110
查看次数

as.data.frame() 无列名 (R)

假设我有以下列表:

result
[[1]]
 [1]  NA 104  67  NA 107  71  94  NA  NA  64

[[2]]
 [1]  NA 381  NA  NA 412  NA 287  NA  NA  NA

[[3]]
 [1] NA 38 NA NA NA NA NA NA NA NA
Run Code Online (Sandbox Code Playgroud)

dput()

list(c(NA, 104, 67, NA, 107, 71, 94, NA, NA, 64), c(NA, 381, 
NA, NA, 412, NA, 287, NA, NA, NA), c(NA, 38, NA, NA, NA, NA, 
NA, NA, NA, NA))
Run Code Online (Sandbox Code Playgroud)


现在我想将此列表转换为dataframe

df <- as.data.frame(do.call(cbind, result), 
                    stringsAsFactors = …
Run Code Online (Sandbox Code Playgroud)

r dataframe

3
推荐指数
1
解决办法
9866
查看次数

Scrapy 自定义设置

使用scrapy,我在我的一只蜘蛛中:

class IndexSpider(scrapy.Spider):
    name = "indices"

    def __init__(self, *args, **kwargs):
        super(IndexSpider, self).__init__(*args, **kwargs)

        # set custom settings
        custom_settings = {
            'DOWNLOAD_DELAY': 2,
            'ITEM_PIPELINES': {
                'freedom.pipelines.IndexPipeline': 300
            }
        }
Run Code Online (Sandbox Code Playgroud)

但是,当我稍后尝试通过

    print(dict(self.settings.get('ITEM_PIPELINES')))
Run Code Online (Sandbox Code Playgroud)

他们是空的。背景是我想在每个蜘蛛的基础上控制设置(和可能的管道)。
我在这里做错了什么?

python scrapy

3
推荐指数
1
解决办法
4425
查看次数