小编pop*_*top的帖子

jsoup没有获得完整的数据

我有一个学校的项目来解析Web代码并像数据库一样使用它.当我试图从(https://www.marathonbet.com/en/betting/Football/)中删除数据时,我没有得到所有这些?

这是我的代码:

Document doc = Jsoup.connect("https://www.marathonbet.com/en/betting/Football/").get();
Elements newsHeadlines = doc.select("div#container_EVENTS");

for (Element e: newsHeadlines.select("[id^=container_]")) {
    System.out.println(e.select("[class^=block-events-head]").first().text());
    System.out.println(e.select("[class^=foot-market]").select("[class^=event]").text());
} 
Run Code Online (Sandbox Code Playgroud)

得到的结果(这是显示的联赛的最后一个):

Football. Friendlies. Internationals All bets Main bets
1. USA 2. Mexico 16 Apr 01:30 +124 7/5 23/10 111/50 +124
Run Code Online (Sandbox Code Playgroud)

在她之上显示所有联赛.

为什么我没有获得完整数据?感谢您的时间!

java jsoup

6
推荐指数
1
解决办法
812
查看次数

最小值直到行熊猫

我在按日期排序数据时遇到了一些问题,例如这样的:

date,       value,      min
2015-08-17,    3,        nan
2015-08-18,    2,        nan
2015-08-19,    4,        nan
2015-08-28,    1,        nan
2015-08-29,    5,        nan
Run Code Online (Sandbox Code Playgroud)

现在我想将列中的min值保存min到这一行,所以结果看起来像这样:

date,       value,      min
2015-08-17,    3,        3
2015-08-18,    2,        2
2015-08-19,    4,        2
2015-08-28,    1,        1
2015-08-29,    5,        1
Run Code Online (Sandbox Code Playgroud)

我已经尝试了一些选择,但仍然不明白我做错了什么,这是我尝试过的一个例子:

data['min'] = min(data['value'], data['min'].shift())
Run Code Online (Sandbox Code Playgroud)

我不想遍历所有行,因为我拥有的数据很大。对于此类问题,您可以使用 Pandas 编写的最佳策略是什么?

python numpy pandas

3
推荐指数
2
解决办法
410
查看次数

替换字符,但排除使用正则表达式的单词

我正在处理一个问题,例如,有一个句子:“今天_asf是null_word day__和__bla__bla ”。我想得到的是一个句子,其中所有的_都用空格代替,但null_word中除外。因此,输出语句应如下所示:“今天asf是null_word日,bla bla”。

为此,我编写了一个redux表达式:

 (\w*((?!null_word)\b\S+)[_]+\w*)
Run Code Online (Sandbox Code Playgroud)

此表达式选择所有使用_ char的单词,并排除null_word。但是现在,如何从这些组中选择所有_字符?

我尝试用以下方法将它们分开:

 (\w*((?!null_word)\b\S+)[_]+\w*)[_]
Run Code Online (Sandbox Code Playgroud)

但示例结果是:day__

谢谢您的帮助!

regex

3
推荐指数
1
解决办法
35
查看次数

标签 统计

java ×1

jsoup ×1

numpy ×1

pandas ×1

python ×1

regex ×1