我在python中做了一个小脚本,但由于我很新,我陷入了一个部分:我需要从.srt文件中获取时间和文本.例如,来自
1
00:00:01,000 --> 00:00:04,074
Subtitles downloaded from www.OpenSubtitles.org
Run Code Online (Sandbox Code Playgroud)
我需要得到:
00:00:01,000 --> 00:00:04,074
和
Subtitles downloaded from www.OpenSubtitles.org.
我已经设法制作正则表达式,但我被困在文本中.我试图使用我的正则表达式后面的时间:
( ?<=(\d+):(\d+):(\d+)(?:\,)(\d+) --> (\d+):(\d+):(\d+)(?:\,)(\d+) )\w+
Run Code Online (Sandbox Code Playgroud)
但没有效果.就个人而言,我认为使用背后的外观是解决这个问题的正确方法,但我不确定如何正确地编写它.谁能帮我?谢谢.