用于从路径中提取文件名的正则表达式

Question

我需要从以下路径中提取文件名(没有文件扩展名)....

\\my-local-server\path\to\this_file may_contain-any&character.pdf

我尝试了几件事,大部分是基于像http://regexr.com?302m5这样的东西,但是不能完全达到目的

Answer 1

^\\(.+\\)*(.+)\.(.+)$

这个正则表达式已经在这两个例子上进行了测试:

\ var\www\www.example.com\index.php
\ index.php

第一个块"(.+ \)*"匹配目录路径.
第二个块"(.+)"匹配没有扩展名的文件名.
第三个块"(.+)$"匹配扩展名.

Answer 2

这将获得文件名,但也将得到点.您可能希望在代码中截断它的最后一位数字.

[\w-]+\.

更新

@Geoman如果文件名中有空格,则使用下面的修改模式

[ \w-]+\.      (space added in brackets)

Answer 3

这只是@hmd的一个细微变化，因此您不必截断 .

[ \w-]+?(?=\.)

真的，感谢@hmd。我对此只稍作改进。

Answer 4

试试这个：

[^\\]+(?=\.pdf$)

它匹配除反斜杠后跟.pdf字符串末尾的所有内容。

您也可以（也许更好）将您想要的部分加入捕获组，如下所示：

([^\\]+)\.pdf$

但是您如何引用这个组（括号中的部分）取决于您使用的语言或正则表达式风格。在大多数情况下，它会像$1、或一样，或者\1库将提供一些方法来在正则表达式匹配后通过其编号获取捕获组。

Answer 5

我使用@"[^\\]+$" That 给出了包含扩展名的文件名。