我在熊猫中有以下数据框:
Datum Zeit Event
0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes
1 14.03.2017 13:00 Telefonkonferenz für Analysten
2 14.03.2017 13:00 Telefonkonferenz für Analysten
3 27.04.2017 14:00 Ordentliche Hauptversammlung
4 03.05.2017 14:00 Dividendenzahlung
5 15.05.2017 14:00 Bericht zum 1. Quartal
6 14.08.2017 14:00 Telefonkonferenz für Investoren
7 14.08.2017 14:00 Telefonkonferenz für Analysten
8 14.08.2017 14:00 Veröffentlichung des Halbjahresberichtes
Run Code Online (Sandbox Code Playgroud)
我在这里寻找季度报告的日期("古老的德语"中的"Bericht").
我可以通过选择行
df.loc[df["Event"].str.startswith("Bericht"), "Datum"]
Run Code Online (Sandbox Code Playgroud)
返回一个Series像这样的对象
5 15.05.2017
Name: Datum, dtype: object
Run Code Online (Sandbox Code Playgroud)
但是,我只想要约会 - 我在这里过于复杂吗?
select\[([^\s]*(?<param>[a-z0-9]+)[^,\s]*)*\]
Run Code Online (Sandbox Code Playgroud)
尝试从逗号分隔的参数加载捕获组(数字或字母数字选项),忽略每个参数的前导/尾随空格,但保留单词之间的空格(即“两个单词”)。
select[ 1, 22 ,word, two words ]
Run Code Online (Sandbox Code Playgroud)
成为:
param1: "1"
param2: "22"
param3: "word"
param4: "two words"
Run Code Online (Sandbox Code Playgroud)
一旦排序,想要处理参数周围的可选单引号 ' 。
感谢您的考虑
我试图将dsvg文件中的路径标记上的属性拆分为标记.
这个比较容易:
d = "M 2 -12 C 5 15 21 19 27 -2 C 17 12 -3 40 5 7"
tokens = d.split(/[\s,]/)
Run Code Online (Sandbox Code Playgroud)
但这也是一个有效的d属性:
d = "M2-12C5,15,21,19,27-2C17,12-3,40,5,7"
Run Code Online (Sandbox Code Playgroud)
棘手的部分是字母,数字不再分开,负数只使用负号作为分隔符.如何创建处理此问题的正则表达式?
规则似乎是:
我知道我可以使用环视,例如:
tokens = pathdef.split(/(?<=\d)(?=\D)|(?<=\D)(?=\d)/)
Run Code Online (Sandbox Code Playgroud)
我在制作单个正则表达式时也遇到了麻烦,这个正则表达式也会在减号上分开,并用数字保留减号.
上面的代码应该标记为如下:
[ 'M', '2', '-12', 'C', '5', '15', '21', '19', '27', '-2', 'C', '17', '12', '-3', '40', '5', '7' ]
Run Code Online (Sandbox Code Playgroud) 我有文字表:
13.5 0.12557 0.04243 -0.0073 0.00377
14 0.12573 0.05 -0.00697 0.00437
14.5 0.12623 0.05823 -0.00703 0.005
15 0.12853 0.0686 -0.00627 0.00493
15.5 0.1299 0.08073 -0.00533 0.0063
Run Code Online (Sandbox Code Playgroud)
在哪里我想匹配所有数字,除了第一列中的数字.我试图使用负面的lookbehind但没有成功:
(?<!^)[\d.E-]+
Run Code Online (Sandbox Code Playgroud)
如何匹配除第一列(13.5,14,14.5,15,15.5)之外的所有数字?
在 中Python 3.5,我想使用locale.atof以下代码将德语数字字符串转换为浮点数:
import locale
from locale import atof
locale.setlocale(locale.LC_ALL, 'de_DE')
number = atof('17.907,08')
Run Code Online (Sandbox Code Playgroud)
然而,这提出了一个ValueError:
ValueError: could not convert string to float: '17.907.08'
Run Code Online (Sandbox Code Playgroud)
atof()为了这个而生的吗? Python,我有一个这样的字符串,输入:
IBNR 13,123 1,234 ( 556 ) ( 2,355 ) 934
Run Code Online (Sandbox Code Playgroud)
所需的输出-:
要么删除空格 b/w 括号和数字
IBNR 13,123 1,234 (556) (2,355) 934
Run Code Online (Sandbox Code Playgroud)
或删除括号:
IBNR 13,123 1,234 556 2,355 934
Run Code Online (Sandbox Code Playgroud)
我试过这个:
re.sub('(?<=\d)+ (?=\\))','',text1)
Run Code Online (Sandbox Code Playgroud)
这解决了右侧,需要左侧的帮助。
我想让 PHP 中预定义多边形之外的任何东西都透明。比方说,你有你的头部形状,那么图像的任何其他部分都应该被装箱。非常感谢!为了让自己清楚,这是我一直在研究的一些代码:
$dat = dirname(__FILE__)."/foto_".time().".png";
$img = imagecreatefrompng("foto.png");
$points = array(93,36,147,1,255,-5,294,37,332,114,327,189,315,249,303,291,290,327,260,360,205,404,165,407,131,376,86,325,62,236,61,155,66,96,77,57,87,45);
$schwarz = ImageColorAllocate ($img, 0, 0, 0);
imagefilledpolygon($img, $points, count($points)/2, $schwarz);
imagepng($img, $dat);
Run Code Online (Sandbox Code Playgroud)
作为的初学者pandas,我想知道如何选择过去的最接近日期?例如,我有dataframe以下内容:
Terminart Info Datum Ergebnis
0 Hauptversammlung NaN 22.06.16 NaN
1 Jahresabschluss 2015 10.03.16 NaN
2 Quartalszahlen Q3 2015 28.10.15 NaN
3 Quartalszahlen Q2 2015 29.07.15 NaN
4 Hauptversammlung NaN 05.05.15 NaN
5 Quartalszahlen Q1 2015 29.04.15 NaN
6 Bilanzpressekonferenz 2014 12.03.15 NaN
7 Bilanzpressekonferenz Jahrespressekonferenz 2015 12.03.15 NaN
Run Code Online (Sandbox Code Playgroud)
Terminartwith df.loc(),即:
df.loc[df['Terminart'] == 'Hauptversammlung']
Run Code Online (Sandbox Code Playgroud)
仅选择两行(正确)。
06/22/16)吗?默认情况下,数据框未排序。 假设我有以下列表:
result
[[1]]
[1] NA 104 67 NA 107 71 94 NA NA 64
[[2]]
[1] NA 381 NA NA 412 NA 287 NA NA NA
[[3]]
[1] NA 38 NA NA NA NA NA NA NA NA
Run Code Online (Sandbox Code Playgroud)
和dput():
list(c(NA, 104, 67, NA, 107, 71, 94, NA, NA, 64), c(NA, 381,
NA, NA, 412, NA, 287, NA, NA, NA), c(NA, 38, NA, NA, NA, NA,
NA, NA, NA, NA))
Run Code Online (Sandbox Code Playgroud)
dataframe:
df <- as.data.frame(do.call(cbind, result),
stringsAsFactors = …Run Code Online (Sandbox Code Playgroud) 使用scrapy,我在我的一只蜘蛛中:
class IndexSpider(scrapy.Spider):
name = "indices"
def __init__(self, *args, **kwargs):
super(IndexSpider, self).__init__(*args, **kwargs)
# set custom settings
custom_settings = {
'DOWNLOAD_DELAY': 2,
'ITEM_PIPELINES': {
'freedom.pipelines.IndexPipeline': 300
}
}
Run Code Online (Sandbox Code Playgroud)
但是,当我稍后尝试通过
print(dict(self.settings.get('ITEM_PIPELINES')))
Run Code Online (Sandbox Code Playgroud)
他们是空的。背景是我想在每个蜘蛛的基础上控制设置(和可能的管道)。
我在这里做错了什么?
python ×6
regex ×4
dataframe ×3
pandas ×2
c# ×1
crop ×1
javascript ×1
php ×1
polygon ×1
python-3.5 ×1
python-3.x ×1
r ×1
regex-group ×1
scrapy ×1