小编roc*_*987的帖子

Python elasticsearch.helpers.scan示例

有人可以提供python elasticsearch助手客户端的扫描API示例吗?

res = elasticsearch.helpers.scan(....)

如何从res对象获得elasticsearch的所有结果?

python python-2.7 elasticsearch elasticsearch-5

14
推荐指数
1
解决办法
9904
查看次数

简单正则表达式:匹配所有内容直到最后一个点

只想匹配每个角色,但不包括最后一个时期

 dog.jpg     -> dog
 abc123.jpg.jpg -> abc123.jpg
Run Code Online (Sandbox Code Playgroud)

我试过了

(.+?)\.[^\.]+$
Run Code Online (Sandbox Code Playgroud)

regex

10
推荐指数
3
解决办法
2万
查看次数

Notepad ++使用Regex查找和替换

这是我的编码:

alpha = ["first", 55, 28]
beta  = ["second", 89, 09]
gamma = ["third", 99, 40]
Run Code Online (Sandbox Code Playgroud)

这是我的预期结果:

first", 55, 28]
second", 89, 09]
third", 99, 40]
Run Code Online (Sandbox Code Playgroud)

我试过^.*?"用空替换正则表达式.但为什么我这样做呢?:

, 55, 28]
, 89, 09]
, 99, 40]
Run Code Online (Sandbox Code Playgroud)

regex notepad++

10
推荐指数
2
解决办法
1050
查看次数

python 3.6 Anaconda的"模式"包

我的机器上有Anaconda环境用于python 3.6当我尝试通过pip 安装模式包时,它给出了一个错误

打印周围的括号

然后我试图conda install -c asmeurer pattern=2.5;conda install -c asmeurer pattern.它说

不满意的错误:发现以下规范存在冲突: - pattern - > python 2.7* - python 3.6*"

最后,我知道python 3没有直接模式.

所以,我尝试从http://www.clips.ua.ac.be/pattern下载模式zip .现在,当我跑python ./setup.py install.它再次给出了与print n周围的括号相关的错误

我已经尝试了几乎所有东西,但无法在我的python 3.6 Anaconda环境中安装模式包.有人可以帮我解决这个问题吗?

python python-3.x anaconda

8
推荐指数
2
解决办法
7027
查看次数

什么意思是原子分组存在更快的失败

注意: - 问题有点长,因为它包括书中的一节.

我正在读关于atomic groups掌握正则表达式.

它被赋予atomic groups导致更快的失败.引用书中的特定部分

使用原子分组更快地失败.考虑^\w+:适用于 Subject.我们可以看到它只是通过查看它会失败,因为文本中没有冒号,但正则表达式实际上经过检查的动作之前,正则表达式引擎将无法得出结论.

因此,在:首次检查时,\w+ 将会进入字符串的末尾.这导致了很多状态 - skip me每个匹配的一个状态\w由加号(除了第一个,因为加号需要一个匹配).当在字符串末尾检查后,:失败,所以正则表达式引擎回溯到最近保存的状态:

在此输入图像描述

此时:再次失败,这次试图匹配t.这种回溯测试失败循环一直发生在最旧的状态:

在此输入图像描述

在最终状态的尝试失败后,最终可以宣布整体失败.所有这些回溯都是很多工作,只需一瞥我们就知道这是不必要的.如果冒号在最后一个字母后无法匹配,那肯定无法匹配其中一个+被强制放弃的字母!

因此,知道没有任何状态\w+,一旦完成,可能导致匹配,我们可以保存正则表达式引擎检查它们的麻烦:^(?>\w+):.通过添加原子分组,我们使用我们对正则表达式的全局知识来\w+通过将其保存的状态(我们知道无用)丢弃来增强本地工作.如果存在匹配,则原子分组将不重要,但如果不匹配,抛弃无用状态可让正则表达式更快地得出结论.


在这里尝试了这些正则表达式.它需要4个步骤^\w+:和6个步骤^(?>\w+): (禁用内部引擎优化)


我的问题

  1. 在上一节的第二段中,提到了

因此,在:首次检查时,\w+将会进入字符串的末尾.这导致很多状态 - 一个跳过我的状态为每个匹配\w的加号(除了第一个,因为加号需要一个匹配).然后检查字符串的结尾,:失败,所以正则表达式引擎回溯到最近保存的状态:

在此输入图像描述

此时:再次失败,这次试图匹配t.这种回溯测试失败循环一直发生在最旧的状态:

在此输入图像描述

但在这个网站上,我看不到回溯.为什么?

内部是否有一些优化(即使它被禁用)?

  1. 正则表达式所采取的步骤数是否可以决定一个正则表达式是否比其他正则表达式具有良好的性能?

regex pcre

7
推荐指数
1
解决办法
120
查看次数

如何在字符串之间选择值并使用python中的regex放置在数据框的列中

我有一个包含标题为"评论"的列的大型数据框

在评论部分我需要提取3个值并放入单独的列中,即(占空比,气体和压力)

"数据采集START占空比:0,气体:真空压力:0.000028 Torr"

目前我使用.split和.tolist来解析字符串 - >

#split string and sort into columns 
df1 = pd.DataFrame(eventsDf.comment.str.split().tolist(),columns="0 0 0 0 0 0 dutyCycle 0 Gas 0 Pressure 0 ".split())

#join dataFrames
eventsDf = pd.concat([eventsDf, df1], axis=1)

#drop columns not needed
eventsDf.drop(['comment','0',],axis=1,inplace=True)
Run Code Online (Sandbox Code Playgroud)

我发现这个方法相当"hacky",因为如果注释部分的结构发生变化,我的代码就会变得无用......有人能告诉我一个更有效/更强大的方法来做这个吗?非常感谢!

python regex dataframe pandas

5
推荐指数
1
解决办法
65
查看次数

如何在PHP中加密/解密整数

是否有任何方法可以为整数(或字符串)进行2路加密/解密请注意,我不是在寻找编码

我需要这样的东西

crypting(100) - > 24694

加密(101) - > 9564jh4或45216或gvhjdfT或其他......

解密(24694) - > 100

我不需要编码,因为它是双射的

base64_encode(100) - > MTAw

base64_encode(101) - > MTAx

我希望我能在这里找到一种加密/解密PURE NUMBERS的方法(计算机爱数,它更快)

php encryption

4
推荐指数
2
解决办法
1万
查看次数

正则表达式,数字可以从9开始,但不能连续999开始

我正在尝试制作正则表达式:

  1. 一个数字可以从3,5,6或9开始
  2. 该号码不能以999开头.

因此,例如,93214211匹配,但99912345不应匹配.

这就是我现在所满足的第一个要求:

^3|^5|^6|^9|[^...]}

我现在停留在第二个要求一段时间了.谢谢!

php regex pcre

4
推荐指数
1
解决办法
110
查看次数

使用Regex从字符串中提取变量

我正在尝试使用以下格式从字符串变量中提取:$ {var}

鉴于此字符串:

val s = "This is a string with ${var1} and ${var2} and {var3}"
Run Code Online (Sandbox Code Playgroud)

结果应该是

List("var1","var2")
Run Code Online (Sandbox Code Playgroud)

这是尝试,它以异常结束.这个正则表达式有什么问题?

val pattern = """\${([^\s}]+)(?=})""".r
val s = "This is a string with ${var1} and ${var2} and {var3}"
val vals = pattern.findAllIn(s)

println(vals.toList)
Run Code Online (Sandbox Code Playgroud)

和例外:

线程"main"中的异常java.util.regex.PatternSyntaxException:

索引1附近非法重复 \${([^\s}]+)(?=})

regex scala

2
推荐指数
1
解决办法
193
查看次数

在 SKLearn Logistic Regression 中,class = Balanced 有助于运行具有不平衡数据的模型?此选项使用什么方法

在阅读了随机欠采样、随机过采样和SMOTE 之后,我试图了解 SKlearn 包中用于逻辑回归或随机森林的默认实现使用什么方法。我在这里检查了文档

所述均衡模式使用y的值来自动调节权重成反比的输入数据作为类频率N_SAMPLES次/(n_classes * np.bincount(Y))

我无法在样本多数类或样本少数类下理解它来创建平衡集

python sampling random-forest scikit-learn logistic-regression

2
推荐指数
1
解决办法
3103
查看次数

mysql正则表达式精确匹配单词

我想要正则表达式来精确匹配选择mysql查询的单词。如果我有来自数据库的以下字符串

string :  my name is amit patel with surname amitnindroda
Run Code Online (Sandbox Code Playgroud)

现在我想匹配amit上面字符串中的整个单词,那么它应该找到确切的单词amit,并且不应该从 中找到匹配项amitnindroda。请建议mysql查询的正则表达式

regex mysql

1
推荐指数
1
解决办法
5443
查看次数

在c中打印指针中的指针差异

考虑一下代码:

int main() {
    char orange[5];
    for (int i = 0; i < 5; i++)
        orange[i] = 1;
    printf("orange: %d\n", *((char *)orange));        
    printf("orange: %d\n", *((int *)orange)); 
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

第一个print语句给了我一个值1,但是第二个print语句给了我一个值16843009.差异的原因是什么?

c pointers casting

0
推荐指数
1
解决办法
77
查看次数