小编pop*_*top的帖子

jsoup没有获得完整的数据

我有一个学校的项目来解析Web代码并像数据库一样使用它.当我试图从(https://www.marathonbet.com/en/betting/Football/)中删除数据时,我没有得到所有这些？

这是我的代码:

Document doc = Jsoup.connect("https://www.marathonbet.com/en/betting/Football/").get();
Elements newsHeadlines = doc.select("div#container_EVENTS");

for (Element e: newsHeadlines.select("[id^=container_]")) {
    System.out.println(e.select("[class^=block-events-head]").first().text());
    System.out.println(e.select("[class^=foot-market]").select("[class^=event]").text());
}

Run Code Online (Sandbox Code Playgroud)

得到的结果(这是显示的联赛的最后一个):

Football. Friendlies. Internationals All bets Main bets
1. USA 2. Mexico 16 Apr 01:30 +124 7/5 23/10 111/50 +124

Run Code Online (Sandbox Code Playgroud)

在她之上显示所有联赛.

为什么我没有获得完整数据？感谢您的时间!

java jsoup

pop*_*top

2015 08-22

6
推荐指数

1
解决办法

812
查看次数

最小值直到行熊猫

我在按日期排序数据时遇到了一些问题，例如这样的：

date,       value,      min
2015-08-17,    3,        nan
2015-08-18,    2,        nan
2015-08-19,    4,        nan
2015-08-28,    1,        nan
2015-08-29,    5,        nan

Run Code Online (Sandbox Code Playgroud)

现在我想将列中的min值保存min到这一行，所以结果看起来像这样：

date,       value,      min
2015-08-17,    3,        3
2015-08-18,    2,        2
2015-08-19,    4,        2
2015-08-28,    1,        1
2015-08-29,    5,        1

Run Code Online (Sandbox Code Playgroud)

我已经尝试了一些选择，但仍然不明白我做错了什么，这是我尝试过的一个例子：

data['min'] = min(data['value'], data['min'].shift())

Run Code Online (Sandbox Code Playgroud)

我不想遍历所有行，因为我拥有的数据很大。对于此类问题，您可以使用 Pandas 编写的最佳策略是什么？

python numpy pandas

pop*_*top

2017 04-24

3
推荐指数

2
解决办法

410
查看次数

替换字符，但排除使用正则表达式的单词

我正在处理一个问题，例如，有一个句子：“今天_asf是null_word day__和__bla__bla ”。我想得到的是一个句子，其中所有的_都用空格代替，但null_word中除外。因此，输出语句应如下所示：“今天asf是null_word日，bla bla”。

为此，我编写了一个redux表达式：

 (\w*((?!null_word)\b\S+)[_]+\w*)

Run Code Online (Sandbox Code Playgroud)

此表达式选择所有使用_ char的单词，并排除null_word。但是现在，如何从这些组中选择所有_字符？

我尝试用以下方法将它们分开：

 (\w*((?!null_word)\b\S+)[_]+\w*)[_]

Run Code Online (Sandbox Code Playgroud)

但示例结果是：day__

谢谢您的帮助！

regex

pop*_*top

lucky-day

3
推荐指数

1
解决办法

35
查看次数

标签统计

java ×1

jsoup ×1

numpy ×1

pandas ×1

python ×1

regex ×1

jsoup没有获得完整的数据

最小值直到行熊猫

替换字符，但排除使用正则表达式的单词

标签 统计

小编pop_top的帖子

标签统计