我有一个学校的项目来解析Web代码并像数据库一样使用它.当我试图从(https://www.marathonbet.com/en/betting/Football/)中删除数据时,我没有得到所有这些?
这是我的代码:
Document doc = Jsoup.connect("https://www.marathonbet.com/en/betting/Football/").get();
Elements newsHeadlines = doc.select("div#container_EVENTS");
for (Element e: newsHeadlines.select("[id^=container_]")) {
System.out.println(e.select("[class^=block-events-head]").first().text());
System.out.println(e.select("[class^=foot-market]").select("[class^=event]").text());
}
Run Code Online (Sandbox Code Playgroud)
得到的结果(这是显示的联赛的最后一个):
Football. Friendlies. Internationals All bets Main bets
1. USA 2. Mexico 16 Apr 01:30 +124 7/5 23/10 111/50 +124
Run Code Online (Sandbox Code Playgroud)
在她之上显示所有联赛.
为什么我没有获得完整数据?感谢您的时间!
我在按日期排序数据时遇到了一些问题,例如这样的:
date, value, min
2015-08-17, 3, nan
2015-08-18, 2, nan
2015-08-19, 4, nan
2015-08-28, 1, nan
2015-08-29, 5, nan
Run Code Online (Sandbox Code Playgroud)
现在我想将列中的min值保存min到这一行,所以结果看起来像这样:
date, value, min
2015-08-17, 3, 3
2015-08-18, 2, 2
2015-08-19, 4, 2
2015-08-28, 1, 1
2015-08-29, 5, 1
Run Code Online (Sandbox Code Playgroud)
我已经尝试了一些选择,但仍然不明白我做错了什么,这是我尝试过的一个例子:
data['min'] = min(data['value'], data['min'].shift())
Run Code Online (Sandbox Code Playgroud)
我不想遍历所有行,因为我拥有的数据很大。对于此类问题,您可以使用 Pandas 编写的最佳策略是什么?
我正在处理一个问题,例如,有一个句子:“今天_asf是null_word day__和__bla__bla ”。我想得到的是一个句子,其中所有的_都用空格代替,但null_word中除外。因此,输出语句应如下所示:“今天asf是null_word日,bla bla”。
为此,我编写了一个redux表达式:
(\w*((?!null_word)\b\S+)[_]+\w*)
Run Code Online (Sandbox Code Playgroud)
此表达式选择所有使用_ char的单词,并排除null_word。但是现在,如何从这些组中选择所有_字符?
我尝试用以下方法将它们分开:
(\w*((?!null_word)\b\S+)[_]+\w*)[_]
Run Code Online (Sandbox Code Playgroud)
但示例结果是:day__
谢谢您的帮助!