我正试图从新闻稿中提取公司名称.作为一个例子,下面有一个新闻稿的片段(法语),其中包含七个以公司结尾的公司的名单.inc.
En effet,RevenuQuébecavait des motifs raisonnables de croire que ces entreprisesavaientutilisédefausses factures provenant deplusieurssociétés,dont Asphalte Vrac Transport inc.,9163-6704Québecinc.,EntrepriseDenisDupréinc.,Gestion Jean M. Machado inc.,Impact Technologie Environnementale inc.,Les entreprisesLucClémentinc.et Transport Vrac Globe International inc.
我正在尝试使用以下代码提取所有名称:
aa = re.findall('inc\.,? (.*?inc\.)', text)
Run Code Online (Sandbox Code Playgroud)
我设法捕获了不少,但由于某种原因我无法想象,我无法全部提取它们.这似乎微不足道,但它已经让我踩了几个小时....
任何帮助表示赞赏!