正则表达式模式匹配一​​个字符

Bti*_*rt3 1 string r

我是R的新手,所以如果这很简单直截了当,我道歉.我已成功将网页读入字符向量.我想将此字符串拆分为较小的段,以便我可以提取一些数据.到目前为止,这么容易.

问题是我是regex和R的新手,所以这对我来说非常困难.我只是想缩短字符串,使其包含之间的所有内容

<div class="appForm"

and 

</div>
Run Code Online (Sandbox Code Playgroud)

出于某种原因,我很难使用stringr包和?str_match.

任何帮助 - 更有效的解决方案 - 将非常感谢.网络抓取的新手,但决定留在R内.

hat*_*rix 5

社区中的一些人严重阻止使用正则表达式来解析包含任意数量的嵌套表达式的文本.R确实有一个XML解析器(也适用于HTML),您可以考虑将其用于此目的.