我在哪里可以找到一些真实的拼写错误统计数据?
我试图将人们的输入文本与内部对象进行匹配,人们往往会犯拼写错误.
有两种错误:
typos - "Helllo"而不是"Hello"/"Satudray"而不是"Saturday"等. Spelling - "Shikago"而不是"芝加哥" 我使用 Damerau-Levenshtein距离进行拼写错误,使用Double Metaphone进行拼写(Python实现此处和此处).
我想专注于Damerau-Levenshtein(或简单地说edit-distance).教科书实现总是使用'1'来表示删除,插入替换和转置的权重.虽然这很简单并且允许很好的算法但它与"现实"/"真实世界概率"不匹配.
例子:
删除,插入,替换和转置的"真实世界"权重应该是什么?
即使是Norvig非常酷的拼写校正器也使用非加权编辑距离.
BTW-我确定权重需要是函数而不是简单的浮点数(根据上面的例子)......
我可以调整算法,但在哪里可以"学习"这些权重?我无法访问Google规模的数据 ...
我应该猜猜他们吗?
编辑 - 尝试回答用户问题:
我需要检测IE6才能解决缺少位置的问题:修复.我一直在使用一个简单的正则表达式:
var isIE6 = /msie|MSIE 6/.test(navigator.userAgent);
Run Code Online (Sandbox Code Playgroud)
除了浏览器声称同时属于IE6和IE7的用户外,这几乎一直都有效:
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1) ; .NET CLR 1.1.4322; .NET CLR 2.0.50727; InfoPath.1; .NET CLR 3.0.04506.30)
Run Code Online (Sandbox Code Playgroud)
辉煌.
我喜欢使用jquery.support,但看起来它不支持查询position:fixed是否可用.所以我回来检测IE6.
有各种建议的解决方案,例如寻找maxHeight的存在.但那些似乎相当随意并吓到我 - 如果上面的正则表达式有例外,我怎么能确定maxHeight没有例外?
我正在考虑使用条件评论 - 至少它是IE本身声称是IE6,而不是黑客.就像是:
<!--[if IE 6]>
<SCRIPT> var isIE6 = true; </SCRIPT>
<![endif]-->
Run Code Online (Sandbox Code Playgroud)
或者,可以直接测试position:fixed是否可用,但这看起来有点沉重.
我的条件评论方法不起作用的任何原因?有更好的方法吗?
javascript css jquery internet-explorer-6 browser-feature-detection
我无法弄清楚如何使这项工作:
object x = new Int32[7];
Type t = x.GetType();
// now forget about x, and just use t from here.
// attempt1
object y1 = Activator.CreateInstance(t); // fails with exception
// attempt2
object y2 = Array.CreateInstance(t, 7); // creates an array of type Int32[][] ! wrong
Run Code Online (Sandbox Code Playgroud)
什么是秘诀?如果我能得到数组元素的类型,我可以使第二个工作,但我也没有想到那个.
我正在尝试删除我正在运行我的Python程序的目录中的某个文件.
def erase_custom_file():
directory=os.listdir(os.getcwd())
for somefile in directory:
if somefile=="file.csv":
os.remove(???)
Run Code Online (Sandbox Code Playgroud)
我不确定我的下一步应该是什么.我知道这os.remove需要一个参数的路径,但我不知道如何将它指向我想要的文件.请帮帮我?
我正在编写 Baby 的第一个 Web 应用程序。我的第一个任务是建立一个身份验证系统,我认为我做得很好。不过,我对整个事情都很陌生,所以:
当用户报告他忘记了密码时,我会通过电子邮件以纯文本形式向他发送临时替换密码。这也许不是处理这种情况最安全的方法,但这是我目前的做法。我确实强迫他在下次登录时更改它,我使用的技术是在数据库中携带一个“必须更改”字段,对于已发送电子邮件的用户设置为 true。
我的问题:在这种情况下,单独的数据库列是最好的策略吗?或者我可以做更好的事情吗?
我正在尝试在我的控制台应用程序中遍历引用的程序集.我已与其他项目BuildManager.GetReferencedAssemblies这样做,但在我的控制台应用程序,我得到一个InvalidOperationException:此方法不能在应用程序的预启动初始化阶段被调用.
据我所知,没有办法在控制台应用程序中延迟执行.你是在static void Main中做的,或者你根本不这样做......任何人对如何解决这个问题都有任何建议吗?
我也没有提到textInput.我的意思是,一旦你在一个TextView具有静态文本(从数据库调用填充到用户输入的数据(可能不是大写)),我怎么能确保他们的资本?
谢谢!
或者如何在修改后的列表中使用if语句.
我一直在阅读StackOverflow一段时间(感谢大家).我喜欢它.我也看到你可以发一个问题并自己回答.很抱歉,如果我复制,但我没有在StackOverflow上找到这个特定的答案.
我的问题:
myList = ["Foo", "Bar"]
if "foo" in myList:
print "found!"
Run Code Online (Sandbox Code Playgroud)
由于我不知道列表中元素的情况,我想与小写列表进行比较.明显但丑陋的答案是:
myList = ["Foo", "Bar"]
lowerList = []
for item in myList:
lowerList.append(item.lower())
if "foo" in lowerList:
print "found!"
Run Code Online (Sandbox Code Playgroud)
我可以做得更好吗?
我正在尝试构建一个基于CSS的表,该表将填充来自数据库的信息.
用于此结构化数据的最合适的标记是什么?我最初认为是ul,因为每一行都是一个无序的数据列表......但后来我发现了一些使用CSS进入网格的困难.
我现在正在看DIV(内联?)和Span.可能还有其他人.什么标签被认为是显示基于CSS的网格的行业标准方式?
虽然我有兴趣从DOM-Theory的角度来学习什么是最合适的,但最终我想要在浏览器中保持一致的干净代码......这可能会彻底清除ul标签.
专家们怎么想?
更新
所以似乎每个人都建议我使用表格来表示(duh)表格数据.我对这个问题感到愚蠢的唯一原因是因为我的ASP.net网格供应商在动态调整大小的网格方面存在问题......并且允许在客户端上调整列的大小.
供应商声称列调整大小的原因是因为表格.他们将转向基于DIV的布局来解决问题.我很快就会发布参考链接......
搜索单词"基于",您将看到MVP提及内部更改的帖子:http: //stagev5.componentart.com/community/forums/t/60782.aspx
更新2:
也许一个大的非基于表格的网格也会渲染得更快.
您可能会说我需要大量的可扩展性(对于大型行集)以及调整窗格大小的能力.与Outlook目前的外观/运营方式非常相似:

需求摘要:我正在寻找一种表格方法,允许:
我似乎无法将合并的字典添加到XAML中的合并字典集合中.
Theme.xaml
<ResourceDictionary.MergedDictionaries>
<ResourceDictionary Source="/Mine;component/Themes/Palette.Blue.xaml"/>
<ResourceDictionary Source="/Mine;component/Themes/Template.xaml"/>
</ResourceDictionary.MergedDictionaries>
Run Code Online (Sandbox Code Playgroud)
应用资源
<Application.Resources>
<ResourceDictionary>
<ResourceDictionary.MergedDictionaries>
<ResourceDictionary Source="/Mine;component/Themes/Theme.xaml"/>
<!--
<ResourceDictionary Source=="/Mine;component/Themes/Palette.Blue.xaml"/>
<ResourceDictionary Source="/Mine;component/Themes/Template.xaml"/>
-->
</ResourceDictionary.MergedDictionaries>
</ResourceDictionary>
</Application.Resources>
Run Code Online (Sandbox Code Playgroud)
注意:如果我将两个ResourceDictionaries放在Appication.Resources MergedDictionary中(注释掉theme.xaml并取消注释其他两个词典),它们都会正确加载.但是,我们的资源定义方式,这可能意味着将加载相当多的资源,而对于动态加载,我希望能够定义模板.
python ×3
css ×2
.net ×1
android ×1
arrays ×1
buildmanager ×1
c# ×1
constructor ×1
database ×1
delete-file ×1
fuzzy-search ×1
generator ×1
html ×1
html-table ×1
if-statement ×1
javascript ×1
jquery ×1
list ×1
reflection ×1
security ×1
silverlight ×1
spelling ×1
wpf ×1
xaml ×1
xml ×1