小编Jet*_*als的帖子

将成绩单 .srt 文件解析为可读文本

我有一个视频脚本 SRT 文件,其中包含传统 SRT 格式的线条。这是一个例子:

1
00:00:00,710 --> 00:00:03,220
Lorem ipsum dolor sit amet
consectetur, adipisicing elit.

2
00:00:03,220 --> 00:00:05,970
Dignissimos et quod laboriosam
iure magni expedita

3
00:00:05,970 --> 00:00:09,130
nisi, quis quaerat. Rem, facere!
Run Code Online (Sandbox Code Playgroud)

我正在尝试使用 python 读取并解析此文件,删除(或跳过)包含数字字符串的行(例如 SKIP '1' & '00:00:00,710 --> 00:00:03,220 '),然后格式化剩余的文本行,以便将它们连接起来并以可读的格式呈现。这是我尝试生成的输出的示例:

Lorem ipsum dolor sat amet consectetur,adipisicing elit。Dignissimos et quod Laboriosam iure magni expedita nisi, quis quaerat。雷姆,面对吧!

这是我到目前为止想出的代码:

def main():
    # Access folder in filesystem

    # After parsing content of file, move to next …
Run Code Online (Sandbox Code Playgroud)

python srt

6
推荐指数
2
解决办法
2万
查看次数

标签 统计

python ×1

srt ×1