Python:从比较两个绝对路径获取相对路径

tam*_*are 133 python

说,我有两条绝对路径.我需要检查其中一条路径引用的位置是否是另一条路径的后代.如果是真的,我需要找出祖先的后代的相对路径.在Python中实现这个的好方法是什么?我可以从中受益的任何图书馆?

Eri*_*got 153

os.path.commonprefix()os.path.relpath()是你的朋友:

>>> print os.path.commonprefix(['/usr/var/log', '/usr/var/security'])
'/usr/var'
>>> print os.path.commonprefix(['/tmp', '/usr/var'])  # No common prefix: the root is the common prefix
'/'
Run Code Online (Sandbox Code Playgroud)

因此,您可以测试公共前缀是否是路径之一,即如果其中一个路径是共同的祖先:

paths = […, …, …]
common_prefix = os.path.commonprefix(list_of_paths)
if common_prefix in paths:
    …
Run Code Online (Sandbox Code Playgroud)

然后,您可以找到相对路径:

relative_paths = [os.path.relpath(path, common_prefix) for path in paths]
Run Code Online (Sandbox Code Playgroud)

您甚至可以使用此方法处理两个以上的路径,并测试是否所有路径都在其中一个路径之下.

PS:根据您的路径的样子,您可能希望首先执行一些规范化(这在人们不知道它们是否始终以'/'结尾,或者某些路径是相对的情况下很有用).相关函数包括os.path.abspath()os.path.normpath().

PPS:正如Peter Briggs在评论中提到的,上述简单方法可能会失败:

>>> os.path.commonprefix(['/usr/var', '/usr/var2/log'])
'/usr/var'
Run Code Online (Sandbox Code Playgroud)

即使/usr/var没有路径的一个共同的前缀.在调用之前强制所有路径以'/'结尾commonprefix()解决了这个(特定)问题.

PPPS:正如bluenote10所提到的,添加斜杠并不能解决一般问题.以下是他的后续问题:如何规避Python的os.path.commonprefix的谬误?

PPPPS:从Python 3.4开始,我们有一个pathlib,一个提供更好的路径操作环境的模块.我猜一组路径的公共前缀可以通过获取每个路径的所有前缀(with PurePath.parents()),获取所有这些父集合的交集,并选择最长的公共前缀来获得.

PPPPPS:Python 3.5为这个问题引入了一个正确的解决方案:os.path.commonpath()它返回一个有效的路径.

  • 注意`commonprefix`,例如`/ usr/var/log`和`/ usr/var2/log`的公共前缀作为`/ usr/var`返回 - 这可能不是你所期望的.(它也可能返回非有效目录的路径.) (9认同)

war*_*iuc 77

os.path.relpath:

将相对文件路径从当前目录或可选起始点返回到路径.

>>> from os.path import relpath
>>> relpath('/usr/var/log/', '/usr/var')
'log'
>>> relpath('/usr/var/log/', '/usr/var/sad/')
'../log'
Run Code Online (Sandbox Code Playgroud)

因此,如果相对路径以'..'- 开头- 则表示第二条路径不是第一条路径的后代.

在Python3中,您可以使用PurePath.relative_to:

Python 3.5.1 (default, Jan 22 2016, 08:54:32)
>>> from pathlib import Path

>>> Path('/usr/var/log').relative_to('/usr/var/log/')
PosixPath('.')

>>> Path('/usr/var/log').relative_to('/usr/var/')
PosixPath('log')

>>> Path('/usr/var/log').relative_to('/etc/')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/usr/local/Cellar/python3/3.5.1/Frameworks/Python.framework/Versions/3.5/lib/python3.5/pathlib.py", line 851, in relative_to
    .format(str(self), str(formatted)))
ValueError: '/usr/var/log' does not start with '/etc'
Run Code Online (Sandbox Code Playgroud)

  • 我错了还是`os.relpath`更强大,因为它处理`..`和`PurePath.relative_to()`没有?我错过了什么吗? (7认同)
  • 检查`os.pardir`的存在比检查`..`更强大(同意,但是没有很多其他约定). (2认同)

小智 15

另一种选择是

>>> print os.path.relpath('/usr/var/log/', '/usr/var')
log
Run Code Online (Sandbox Code Playgroud)


Tah*_*lor 12

在 Python 3 中使用 pathlib 编写了 jme 的建议。

from pathlib import Path
parent = Path(r'/a/b')
son = Path(r'/a/b/c/d')            
?
if parent in son.parents or parent==son:
    print(son.relative_to(parent)) # returns Path object equivalent to 'c/d'
Run Code Online (Sandbox Code Playgroud)