小编zel*_*usp的帖子

如何在一个句子中模糊匹配单词到一个完整单词(并且只有完整单词)?

常见的拼写错误的英文单词是两个或三个印刷错误(的取代的组合,内小号,插入,还是信缺失d从他们正确的形式).即单词对中的错误absence - absense可以概括为具有1s,0i0d.

可以使用to-replace-re regex python模块进行模糊匹配以查找单词及其拼写错误.

下表总结了从一些句子中对一个感兴趣的词进行模糊分段的尝试:

在此输入图像描述

  • Regex1 wordsentence允许最多2个错误时找到最佳匹配
  • Regex2找到最佳word匹配,sentence允许最多2个错误,同时尝试仅操作(我认为)整个单词
  • Regex3找到最佳word匹配,sentence允许最多2个错误,同时仅操作(我认为)整个单词.我错了.
  • Regex4找到最佳word匹配,sentence允许最多2个错误,而我(我认为)寻找匹配结束为单词边界

我如何编写一个正则表达式,如果可能的话,在这些单词 - 句子对上消除假阳性和假阴性模糊匹配?

一种可能的解决方案是仅将句子中的单词(由空格包围的字符串或行的开头/结尾)与感兴趣的单词(主要单词)进行比较.如果主要单词和句子中的单词之间存在模糊匹配(e <= 2),则从句子中返回该完整单词(并且仅返回该单词).

将以下数据帧复制到剪贴板:

            word                  sentence
0      cub cadet              cub cadet 42
1        plastex              vinyl panels
2            spt  heat and air conditioner
3     closetmaid                closetmaid
4          ryobi           batteries kyobi
5          ryobi …
Run Code Online (Sandbox Code Playgroud)

python regex fuzzy-search

9
推荐指数
1
解决办法
722
查看次数

如何根据列组上的多(其他列)条件选择数据框行?

将以下数据框复制到剪贴板:

  textId   score              textInfo
0  name1     1.0            text_stuff
1  name1     2.0  different_text_stuff
2  name1     2.0            text_stuff
3  name2     1.0  different_text_stuff
4  name2     1.3  different_text_stuff
5  name2     2.0  still_different_text
6  name2     1.0              yoko ono
7  name2     3.0     I lika da Gweneth
8  name3     1.0     Always a tradeoff
9  name3     3.0                What?!
Run Code Online (Sandbox Code Playgroud)

现在使用

import pandas as pd
df=pd.read_clipboard(sep='\s\s+')
Run Code Online (Sandbox Code Playgroud)

将其加载到您的环境中。如果该组包含至少一个等于 1.0、2.0 和 3.0 的数据帧,如何对该数据帧进行切片,以便返回特定的所有行?此处,所需操作的结果将排除行name1,因为其组缺少 3.0 并排除name3,因为其组缺少 2.0:textIdscoretextIdscoretextIdscorescore

  textId   score              textInfo …
Run Code Online (Sandbox Code Playgroud)

python conditional group-by pandas

7
推荐指数
1
解决办法
1098
查看次数

如何更改ngrok的Web界面端口地址(不是4040)?

默认情况下,指向ngrok的真棒Web界面http://127.0.0.1:4040.但是,我有其他应用程序正在侦听该端口,并且需要更改它以便ngrok监听,比如说http://127.0.0.1:4045.

port localhost ngrok

5
推荐指数
1
解决办法
4711
查看次数

使用Conda环境(而不是virtualenv)将Python应用程序部署到Heroku

当我运行git push heroku master将我的应用程序部署到Heroku时,我不断收到错误

Heroku Push被拒绝,无法编译Python应用程序.找不到满足要求的版本

问题是requirements.txt我用的文件

pip freeze > requirements.txt
Run Code Online (Sandbox Code Playgroud)

转换了我的系统范围的Python库,而不仅仅是我的库virtualenv(如这里所述).这很奇怪,因为我从我的活跃的virtualenv中冻结了这些要求 - 这种行为应该是不可能的.

virtualenv 在Windows上总是让我失望,所以我准备尝试一个新的环境经理.

我想使用,conda但我正在努力与它一起部署到Heroku.我遵循Heroku关于conda build-packs的说明,只是为了在构建时获得模糊/无用的错误.

如何使用Conda环境将Python应用程序部署到Heroku?

python git heroku

5
推荐指数
1
解决办法
2535
查看次数

如何从另一个可折叠项目[js]中的链接展开可折叠项目?

我正在制作一个可折叠项目列表,可以调用自己来滚动和动态扩展其他项目.为此射击......

在选择超链接之前. 在此输入图像描述

选择后. 在此输入图像描述

当选择第三个项目段落中的链接时,如何将第一个折叠项目展开?

我得到了:如果上面的示例有更多折叠项目,那么下面的代码会将网页滚动到所需的可折叠项目(解决方案的一半).

<!DOCTYPE html>
<html>
    <head>
      <!--Import materialize.css-->
      <link type="text/css" rel="stylesheet" href="css/materialize.min.css"  media="screen,projection"/>
      <meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no"/>
    </head>
    <body>
    <div>
        <ul class="collapsible" data-collapsible="accordion">
            <li>
              <div class="collapsible-header"><i class="mdi-navigation-chevron-right"></i><a name="987"/>First</a></div>
              <div class="collapsible-body"><p>Hello StackOverflow! SO's da' bomb diggidy!</p></div>
            </li>
            <li>
              <div class="collapsible-header"><i class="mdi-navigation-chevron-right"></i>Second</div>
              <div class="collapsible-body"><p>Why is the person who invests your money called a broker?</p></div>
            </li>
            <li>
              <div class="collapsible-header"><i class="mdi-navigation-chevron-right"></i>Third</div>
              <div class="collapsible-body"><p>I'd like to <a href="#987">open the First collapsible element</a> in this list.</p></div>
            </li>
        </ul>
    </div>
      <!--Import …
Run Code Online (Sandbox Code Playgroud)

html javascript css jquery materialize

3
推荐指数
1
解决办法
1万
查看次数

如何找到最佳模糊字符串匹配?

Python的新正则表达式模块支持模糊字符串匹配.唱歌(现在)大声赞美.

根据文档:

ENHANCEMATCH标志使模糊匹配尝试改善它找到的下一个匹配的拟合.

BESTMATCH标志使模糊匹配搜索最佳匹配而不是下一个匹配

ENHANCEMATCH标志使用设置(?e)

regex.search("(?e)(dog){e<=1}", "cat and dog")[1] 返回"狗"

但实际设置BESTMATCH标志没什么.怎么做的?

python regex string fuzzy-search pypi-regex

3
推荐指数
1
解决办法
1452
查看次数