我在企业级使用 python fuzzywuzzy 来匹配 2 个字符串。它在大多数情况下工作正常,但在下面提到的场景中会产生意想不到的结果:
fuzz.partial_ratio('ja rule:mesmerize','ja rule feat. ashanti:mesmerize') gives output 65
Run Code Online (Sandbox Code Playgroud)
和
fuzz.partial_ratio('ja rule:mesmerize','jennifer lopez feat. ja rule:im real ') gives the output 67
Run Code Online (Sandbox Code Playgroud)
有什么解释为什么第二场比赛的模糊分数比第一场比赛更好吗?
非常感谢任何帮助/建议。
给定两个日期,我想创建一个数组,其中包含这些日期之间的所有日期,然后对其进行过滤以仅包含一个月末的日期。
例如,使用start_date 2019-01-31和end_date 2019-06-30,我将构造数组
[
'2019-01-31',
'2019-02-28',
'2019-03-31',
'2019-04-30',
'2019-05-31',
'2019-06-30'
]
Run Code Online (Sandbox Code Playgroud) 我正在运行一个Spark集群,并且在Databricks Notebook上执行以下命令时,它会为我提供输出:
dbutils.fs.ls("/mnt/test_file.json")
[FileInfo(path=u'dbfs:/mnt/test_file.json', name=u'test_file.json', size=1083L)]
Run Code Online (Sandbox Code Playgroud)
但是,当我尝试读取该文件时,出现以下错误:
with open("mnt/test_file.json", 'r') as f:
for line in f:
print line
IOError: [Errno 2] No such file or directory: 'mnt/test_file.json'
Run Code Online (Sandbox Code Playgroud)
这里可能是什么问题?任何帮助/支持,我们将不胜感激。
databricks ×1
fuzzy-logic ×1
fuzzywuzzy ×1
pyspark ×1
python ×1
python-2.7 ×1
snowflake-cloud-data-platform ×1
snowsql ×1