我有一个视频脚本 SRT 文件,其中包含传统 SRT 格式的线条。这是一个例子:
1
00:00:00,710 --> 00:00:03,220
Lorem ipsum dolor sit amet
consectetur, adipisicing elit.
2
00:00:03,220 --> 00:00:05,970
Dignissimos et quod laboriosam
iure magni expedita
3
00:00:05,970 --> 00:00:09,130
nisi, quis quaerat. Rem, facere!
Run Code Online (Sandbox Code Playgroud)
我正在尝试使用 python 读取并解析此文件,删除(或跳过)包含数字字符串的行(例如 SKIP '1' & '00:00:00,710 --> 00:00:03,220 '),然后格式化剩余的文本行,以便将它们连接起来并以可读的格式呈现。这是我尝试生成的输出的示例:
Lorem ipsum dolor sat amet consectetur,adipisicing elit。Dignissimos et quod Laboriosam iure magni expedita nisi, quis quaerat。雷姆,面对吧!
这是我到目前为止想出的代码:
def main():
# Access folder in filesystem
# After parsing content of file, move to next …
Run Code Online (Sandbox Code Playgroud)