如何使用正则表达式匹配捕获组 1

hac*_*man 0 python regex

我的目标是从以下字符串中捕获日期:

<span class="ui_bubble_rating bubble_50"></span><span class="ratingDate relativeDate" title="November 9, 2017">Reviewed 2 days ago </span><a class="viaMobile" href="/apps" target="_blank" onclick="ta.util.cookie.setPIDCookie(24487)"><span class="ui_icon mobile-phone"></span>via mobile </a>

为此,我使用正则表达式:title="(*?)" 返回匹配(组 0):title="November 9, 2017"组 1:November 9, 2017

我需要正则表达式返回的匹配只是日期,当前是第 1 组。有没有一种简单的方法可以做到这一点?我是 regex 的新手,但我可以在网上找到方向。

注意:我不是为日期结构编写正则表达式,因为某些字符串有多个日期,而我只想要标题中的日期。谢谢!

use*_*994 5

您可以使用负前瞻/后视而不是捕获组

(?<=title=\").+?(?=")
Run Code Online (Sandbox Code Playgroud)

这将确保它以标题开头,而不实际选择它