使用正则表达式解析HLS m3u8文件

Use*_*337 3 regex android http-live-streaming m3u8

我想解析HLS master m3u8文件并从中获取带宽,分辨率和文件名.目前我正在使用String解析来搜索某些模式的字符串,并使用子字符串来获取值.

示例文件:

#EXTM3U
#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=476416,RESOLUTION=416x234
Stream1/index.m3u8
#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=763319,RESOLUTION=480x270
Stream2/index.m3u8
#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=1050224,RESOLUTION=640x360
Stream3/index.m3u8
#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=1910937,RESOLUTION=640x360
Stream4/index.m3u8
#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=3775816,RESOLUTION=1280x720
Stream5/index.m3u8
Run Code Online (Sandbox Code Playgroud)

但是我发现我们可以使用这个问题中提到的正则表达式来解析它: 在Android中匹配正则表达式模式的问题

我没有任何正则表达的想法,所以有人请指导我使用正则表达式解析它.

或者有人可以帮我编写regexp来解析下面的字符串中的BANDWIDTH和RESOLUTION值

#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=476416,RESOLUTION=416x234
Run Code Online (Sandbox Code Playgroud)

rva*_*vik 10

你可以尝试这样的事情:

    final Pattern pattern = Pattern.compile("^#EXT-X-STREAM-INF:.*BANDWIDTH=(\\d+).*RESOLUTION=([\\dx]+).*");

    Matcher matcher = pattern.matcher("#EXT-X-STREAM-INF:PROGRAM-ID=1,BANDWIDTH=476416,RESOLUTION=416x234");
    String bandwidth = "";
    String resolution = "";

    if (matcher.find()) {
        bandwidth = matcher.group(1);
        resolution = matcher.group(2);
    }
Run Code Online (Sandbox Code Playgroud)

将带宽和分辨率设置为正确的(String)值.

我没有在Android设备或模拟器上尝试过这个,但从您发送的链接和Android API判断它应该与上面的普通旧java一样.

正则表达式匹配字符串开头,#EXT-X-STREAM-INF:包含BANDWIDTHRESOLUTION后跟正确的值格式.然后在反向引用组1和2中对它们进行反向引用,以便我们可以提取它们.

编辑:

如果RESOLUTION不总是存在,那么您可以将该部分设为可选的:

"^#EXT-X-STREAM-INF:.*BANDWIDTH=(\\d+).*(?:RESOLUTION=([\\dx]+))?.*"
Run Code Online (Sandbox Code Playgroud)

resolution字符串会null在情况下,仅BANDWIDTH存在.

EDIT2:

?使事物变得可选,并且(?:___)意味着被动组(而不是后引用组(___).所以它基本上是一个可选的被动组.所以是的,它内部的任何东西都是可选的.

A .匹配单个字符,而*make表示它将重复零次或多次.所以.*将匹配零个或多个字符.我们需要这个的原因是在我们匹配的东西之间消耗任何东西,例如#EXT-X-STREAM-INF:和之间的任何东西BANDWIDTH.有很多方法可以做到这一点,但是.*最通用/最广泛的方法.

\d基本上是一组表示numbers(0-9)的字符,但由于我们将字符串定义为Java字符串,因此我们需要double \\,否则Java编译器将失败,因为它无法识别转义字符\d(在Java中).相反它会解析\\\我们进入\d传递给Pattern构造函数的最终字符串.

[\dx]+表示+字符0-9和中的一个或多个字符()x.[\dx\d]将是+同一组字符中的单个字符(否).

如果你有兴趣在正则表达式,你可以检查出regular-expressions.info或/和regexone.com,在那里你会在深入回答你所有的问题找到更多.