最常见的拼写错误的英文单词是两个或三个印刷错误(的取代的组合,内小号,插入我,还是信缺失d从他们正确的形式).即单词对中的错误absence - absense
可以概括为具有1s,0i和0d.
可以使用to-replace-re regex python模块进行模糊匹配以查找单词及其拼写错误.
下表总结了从一些句子中对一个感兴趣的词进行模糊分段的尝试:
word
在sentence
允许最多2个错误时找到最佳匹配word
匹配,sentence
允许最多2个错误,同时尝试仅操作(我认为)整个单词word
匹配,sentence
允许最多2个错误,同时仅操作(我认为)整个单词.我错了.word
匹配,sentence
允许最多2个错误,而我(我认为)寻找匹配结束为单词边界我如何编写一个正则表达式,如果可能的话,在这些单词 - 句子对上消除假阳性和假阴性模糊匹配?
一种可能的解决方案是仅将句子中的单词(由空格包围的字符串或行的开头/结尾)与感兴趣的单词(主要单词)进行比较.如果主要单词和句子中的单词之间存在模糊匹配(e <= 2),则从句子中返回该完整单词(并且仅返回该单词).
将以下数据帧复制到剪贴板:
word sentence
0 cub cadet cub cadet 42
1 plastex vinyl panels
2 spt heat and air conditioner
3 closetmaid closetmaid
4 ryobi batteries kyobi
5 ryobi …
Run Code Online (Sandbox Code Playgroud) 将以下数据框复制到剪贴板:
textId score textInfo
0 name1 1.0 text_stuff
1 name1 2.0 different_text_stuff
2 name1 2.0 text_stuff
3 name2 1.0 different_text_stuff
4 name2 1.3 different_text_stuff
5 name2 2.0 still_different_text
6 name2 1.0 yoko ono
7 name2 3.0 I lika da Gweneth
8 name3 1.0 Always a tradeoff
9 name3 3.0 What?!
Run Code Online (Sandbox Code Playgroud)
现在使用
import pandas as pd
df=pd.read_clipboard(sep='\s\s+')
Run Code Online (Sandbox Code Playgroud)
将其加载到您的环境中。如果该组包含至少一个等于 1.0、2.0 和 3.0 的数据帧,如何对该数据帧进行切片,以便返回特定的所有行?此处,所需操作的结果将排除行name1,因为其组缺少 3.0 并排除name3,因为其组缺少 2.0:textId
score
textId
score
textId
score
score
textId score textInfo …
Run Code Online (Sandbox Code Playgroud) 默认情况下,指向ngrok的真棒Web界面http://127.0.0.1:4040
.但是,我有其他应用程序正在侦听该端口,并且需要更改它以便ngrok监听,比如说http://127.0.0.1:4045
.
当我运行git push heroku master
将我的应用程序部署到Heroku时,我不断收到错误
Heroku Push被拒绝,无法编译Python应用程序.找不到满足要求的版本
问题是requirements.txt
我用的文件
pip freeze > requirements.txt
Run Code Online (Sandbox Code Playgroud)
转换了我的系统范围的Python库,而不仅仅是我的库virtualenv
(如这里所述).这很奇怪,因为我从我的活跃的virtualenv中冻结了这些要求 - 这种行为应该是不可能的.
virtualenv
在Windows上总是让我失望,所以我准备尝试一个新的环境经理.
我想使用,conda
但我正在努力与它一起部署到Heroku.我遵循Heroku关于conda build-packs的说明,只是为了在构建时获得模糊/无用的错误.
如何使用Conda环境将Python应用程序部署到Heroku?
我正在制作一个可折叠项目列表,可以调用自己来滚动和动态扩展其他项目.为此射击......
在选择超链接之前.
选择后.
当选择第三个项目段落中的链接时,如何将第一个折叠项目展开?
我得到了:如果上面的示例有更多折叠项目,那么下面的代码会将网页滚动到所需的可折叠项目(解决方案的一半).
<!DOCTYPE html>
<html>
<head>
<!--Import materialize.css-->
<link type="text/css" rel="stylesheet" href="css/materialize.min.css" media="screen,projection"/>
<meta name="viewport" content="width=device-width, initial-scale=1.0, maximum-scale=1.0, user-scalable=no"/>
</head>
<body>
<div>
<ul class="collapsible" data-collapsible="accordion">
<li>
<div class="collapsible-header"><i class="mdi-navigation-chevron-right"></i><a name="987"/>First</a></div>
<div class="collapsible-body"><p>Hello StackOverflow! SO's da' bomb diggidy!</p></div>
</li>
<li>
<div class="collapsible-header"><i class="mdi-navigation-chevron-right"></i>Second</div>
<div class="collapsible-body"><p>Why is the person who invests your money called a broker?</p></div>
</li>
<li>
<div class="collapsible-header"><i class="mdi-navigation-chevron-right"></i>Third</div>
<div class="collapsible-body"><p>I'd like to <a href="#987">open the First collapsible element</a> in this list.</p></div>
</li>
</ul>
</div>
<!--Import …
Run Code Online (Sandbox Code Playgroud) Python的新正则表达式模块支持模糊字符串匹配.唱歌(现在)大声赞美.
根据文档:
该
ENHANCEMATCH
标志使模糊匹配尝试改善它找到的下一个匹配的拟合.该
BESTMATCH
标志使模糊匹配搜索最佳匹配而不是下一个匹配
该ENHANCEMATCH
标志使用设置(?e)
在
regex.search("(?e)(dog){e<=1}", "cat and dog")[1]
返回"狗"
但实际设置BESTMATCH
标志没什么.怎么做的?
python ×4
fuzzy-search ×2
regex ×2
conditional ×1
css ×1
git ×1
group-by ×1
heroku ×1
html ×1
javascript ×1
jquery ×1
localhost ×1
materialize ×1
ngrok ×1
pandas ×1
port ×1
pypi-regex ×1
string ×1