小编use*_*947的帖子

循环使用elasticsearch索引中的所有文档

使用Elasticsearch javascript客户端(node.js),循环索引中每个文档(约10万个文档)的最佳(或最简单)方法是什么?

elasticsearch

12
推荐指数
1
解决办法
6747
查看次数

在空行上拆分<textarea>帖子

我有一个表格:

<textarea name="test">
Run Code Online (Sandbox Code Playgroud)

假设用户输入以下文本:

This is the first paragraph
It has two lines

This is the second paragraph
Run Code Online (Sandbox Code Playgroud)

我想把这个文本分成一个列表["这是第一段\n它有两行","这是第二段"]

我认为这会奏效:

temp = self.request.get("test")
list = re.split(r'\n\n', temp)
Run Code Online (Sandbox Code Playgroud)

但事实并非如此.然而,

temp = self.request.get("test")
list = re.split(r'\n', temp)
Run Code Online (Sandbox Code Playgroud)

产生以下列表:["这是第一行","","这是第二行"]

我错过了什么?

也:

假设在to文本之间可能有一个或两个空行,这是否有意义?

temp = self.request.get("test")
list = re.split(r'(\n){2,3}', temp)
Run Code Online (Sandbox Code Playgroud)

解:

在下面的帮助下,

我发现以下代码适用于我的情况:

temp = self.request.get("test")
list = [l for l in temp.split('\r\n\r\n') if l.split()]
Run Code Online (Sandbox Code Playgroud)

我认为断线可能取决于输入来自哪个系统,因此它可能不是完美的解决方案.

python

2
推荐指数
1
解决办法
1037
查看次数

标签 统计

elasticsearch ×1

python ×1