我想在Python中对字符串列表进行分类,具体取决于它们是大写,小写还是混合大小写
我怎样才能做到这一点?
我有一系列格式如下的文本文件:
text = 'COMPANY NAME: Ruff name of company TYPE OF EVENT: Party NOTIFIED DATE: 1/27/20 COMPANY NAME: Company2/CPT TYPE OF EVENT: Fire NOTIFIED DATE: 1/31/20'
Run Code Online (Sandbox Code Playgroud)
我最终需要将它们放入 pandas 数据框中,其中COMPANY NAME, TYPE OF EVENT,NOTIFIED DATE是列标题和填充行之间的文本。第一步只是弄清楚如何在“:”前面有一个或多个全大写单词的地方分割文本。因此,一些输出如下:
res = ['COMPANY NAME', 'Ruff name of company', 'TYPE OF EVENT', 'PARTY', etc]
Run Code Online (Sandbox Code Playgroud)
我对正则表达式非常陌生,不知道如何让这个匹配发挥作用。我尝试了以下方法:
re.findall('[A-Z]+[A-Z]+[A-Z]', text)
Run Code Online (Sandbox Code Playgroud)
我承认我还差得很远。我还查看了许多其他类似的问题,但未能使它们适应我的用例。
其他帖子:
任何帮助将不胜感激,谢谢!