小编Sai*_*ins的帖子

需要更多地了解 python 模糊部分比率

我在企业级使用 python fuzzywuzzy 来匹配 2 个字符串。它在大多数情况下工作正常，但在下面提到的场景中会产生意想不到的结果：

fuzz.partial_ratio('ja rule:mesmerize','ja rule feat. ashanti:mesmerize') gives output 65

Run Code Online (Sandbox Code Playgroud)

和

fuzz.partial_ratio('ja rule:mesmerize','jennifer lopez feat. ja rule:im real ') gives the output 67

Run Code Online (Sandbox Code Playgroud)

有什么解释为什么第二场比赛的模糊分数比第一场比赛更好吗？

非常感谢任何帮助/建议。

python fuzzy-logic fuzzy-comparison python-2.7 fuzzywuzzy

Sai*_*ins

2018 12-13

6
推荐指数

1
解决办法

6968
查看次数

如何使用Snowsql在给定日期范围内构造日期数组？

给定两个日期，我想创建一个数组，其中包含这些日期之间的所有日期，然后对其进行过滤以仅包含一个月末的日期。

例如，使用start_date 2019-01-31和end_date 2019-06-30，我将构造数组

[
  '2019-01-31',
  '2019-02-28',
  '2019-03-31',
  '2019-04-30',
  '2019-05-31',
  '2019-06-30'
]

Run Code Online (Sandbox Code Playgroud)

snowflake-cloud-data-platform snowsql

Sai*_*ins

2019 11-16

5
推荐指数

2
解决办法

140
查看次数

Databricks dbutils.fs.ls显示文件。但是，读取它们会引发IO错误

我正在运行一个Spark集群，并且在Databricks Notebook上执行以下命令时，它会为我提供输出：

dbutils.fs.ls("/mnt/test_file.json")

[FileInfo(path=u'dbfs:/mnt/test_file.json', name=u'test_file.json', size=1083L)]

Run Code Online (Sandbox Code Playgroud)

但是，当我尝试读取该文件时，出现以下错误：

with open("mnt/test_file.json", 'r') as f:
  for line in f:
    print line

IOError: [Errno 2] No such file or directory: 'mnt/test_file.json'

Run Code Online (Sandbox Code Playgroud)

这里可能是什么问题？任何帮助/支持，我们将不胜感激。

pyspark databricks

Sai*_*ins

2018 10-31

1
推荐指数

1
解决办法

6099
查看次数

标签统计

databricks ×1

fuzzy-comparison ×1

fuzzy-logic ×1

fuzzywuzzy ×1

pyspark ×1

python ×1

python-2.7 ×1

snowflake-cloud-data-platform ×1

snowsql ×1

需要更多地了解 python 模糊部分比率

如何使用Snowsql在给定日期范围内构造日期数组？

Databricks dbutils.fs.ls显示文件。但是，读取它们会引发IO错误

标签 统计

小编Sai_ins的帖子

标签统计