小编Sla*_*off的帖子

转义SQL字符串中的&符号

我试图在我的SQL数据库中按名称查询某一行,它有一个&符号.我试图设置一个转义字符然后逃脱&符号,但由于某种原因这不起作用,我不确定我的问题到底是什么.

Set escape '\'
    select * from V1144engine.T_nodes where node_id in(
    select node2_id from V1144engine.T_edges where node1_id in(
    select node2_id from V1144engine.T_edges where node1_id in(
    select node2_id from V1144engine.T_edges where node1_id = 
      (select node_id from V1144engine.T_nodes where node_name = 'Geometric Vectors \& Matrices')))
    and edge_type_id = 1)
    and node_type_id = 1
    and node_id in (
    select node2_id from V1144engine.T_edges where node1_id =
      (select node_id from V1144engine.T_nodes where node_name = 'Algebra II')
    and edge_type_id = 2);
Run Code Online (Sandbox Code Playgroud)

虽然这与这个问题有类似的解决方案,但问题却有很大不同.他们可能最终得到相同的解决方案,但这并不意味着问题是相同的.

sql oracle sqlplus escaping

127
推荐指数
5
解决办法
30万
查看次数

Django最好的AJAX库是什么?

哪个AJAX库最适合django,为什么?
寻找一个包含大量教程,书籍和详细文档的数据库.
哪一个最容易合作?哪一个处于早期开发阶段,但对未来有很大希望?

此致,
克里斯

django ajax

109
推荐指数
5
解决办法
5万
查看次数

Porter和Lancaster Stemming算法的主要区别和好处是什么?

我正在研究java中的文档分类任务.

强烈推荐这两种算法,每种算法的优点和缺点是什么,哪些在自然语言处理任务的文献中更常用?

java nlp machine-learning

57
推荐指数
1
解决办法
3万
查看次数

文本分类的特征选择与缩减

我目前正在开发一个项目,一个简单的情绪分析器,这样在不同的情况下会有2个和3个类.我正在使用一个非常丰富独特单词(大约200.000)的语料库.我用袋的词方法用于特征选择和以减少的数量独特特征,进行消除由于一个进行阈值出现频率.在最后一组的功能包括围绕20.000的功能,这实际上是一个90%的下降,但还不够用于测试预测的预期准确性.我正在使用LibSVMSVM-light进行训练和预测(线性RBF内核)以及PythonBash.

到目前为止观察到的最高精度约为75%,我至少需要90%.这是二进制分类的情况.对于多级培训,准确率降至约60%.在这两种情况下我都需要至少90%,并且无法计算如何增加它:通过优化训练参数通过优化特征选择

我读过有关文本分类中特征选择的文章,我发现使用了三种不同的方法,它们之间实际上有明显的相关性.这些方法如下:

  • 词袋的频率逼近(BOW)
  • 信息增益(IG)
  • X ^ 2统计(CHI)

第一种方法已经是我使用的方法,但我非常简单地使用它,需要指导以更好地使用它以获得足够高的准确度.我也缺乏IGCHI实际实施的知识,并寻求任何帮助以这种方式指导我.

非常感谢,如果您需要任何其他信息以获得帮助,请告诉我们.


  • @larsmans:频率阈值 …

nlp svm feature-extraction sentiment-analysis

49
推荐指数
2
解决办法
2万
查看次数

二维阵列matplotlib的Colorplot

所以,我认为这将非常简单,但我在一个易于理解的例子中找到了很多我正在寻找的东西.

基本上我想制作相位图,所以假设我有一个二维数组,我怎样才能让matplotlib将它转换成一个我可以附加标题,轴和图例(颜色条)的图.

我正在寻找一种非常简单的裸骨解决方案,它只使用可用于任何2D阵列的所需内容.

我确信这很简单,我只是在某种程度上很厚,但我真的遇到了很多麻烦.

我一直在使用这些示例工具,但它们似乎不适合我正在尝试做的事情:我喜欢这个图表的一般外观,我只是希望能够传入2dArray并拥有它相同的结果:

import numpy as np
import matplotlib as ml
import matplotlib.pyplot as plt

H = [[1,2,3,4][5,6,7,8][9,10,11,12][13,14,15,16]]

fig = plt.figure(figsize=(6, 3.2))

ax = fig.add_subplot(111)
ax.set_title('colorMap')
X,Y = np.meshgrid(xedges, yedges)
plt.pcolormesh(X, Y, H)
ax.set_aspect('equal')

cax = fig.add_axes([0.12, 0.1, 0.78, 0.8])
cax.get_xaxis().set_visible(False)
cax.get_yaxis().set_visible(False)
cax.patch.set_alpha(0)
cax.set_frame_on(False)
plt.colorbar(orientation='vertical')
plt.show()
Run Code Online (Sandbox Code Playgroud)

python plot numpy matplotlib

32
推荐指数
2
解决办法
11万
查看次数

Flask应用程序引发500错误,没有异常

我已经在Flask中反对这种方法了一段时间了,虽然现在看来我正在取得进展,但我发现了一些让我感到困惑的事情.这是我正在调用的方法:

@app.route('/facedata/<slug>', methods=["POST"])
def facedata(slug):
    if request.method == "POST":
        try:
            post = Post.objects.get_or_404(slug=slug)
            data = [float(item) for item in request.form.getlist('emotions[]')]
            post.face_data.append(data)
            post.save()
        except:
            traceback.print_exc(file=sys.stdout)
Run Code Online (Sandbox Code Playgroud)

很长一段时间我在这里遇到错误然后会被heroku日志记录下来.目前没有错误,暗示它没有到达except循环,但更糟糕的是,仍然有500个错误.特别是我得到的500个错误是:

heroku[router]: at=info method=POST path=/facedata/StripedVuitton host=cryptic-mountain-6390.herokuapp.com fwd="18.111.90.180" dyno=web.2 connect=4ms service=39ms status=500 bytes=291
Run Code Online (Sandbox Code Playgroud)

POST通过这种方法通过AJAX 发送这些请求:

var slug = document.getElementById("hidden-slug").getAttribute("value");
data = {emotions: lRes};
$.ajax({
    type: "POST",
    data: data,
    url: document.location.origin + "/facedata/" + slug,
    success: function(){
        console.log("Success!");
    }
});
Run Code Online (Sandbox Code Playgroud)

老实说,我只是不知道如何继续调试这个问题.在没有例外的情况下获得追溯对我来说没有多大意义,但也许我只是天真.

如果相关的话,我在Heroku上的MongoHQ上使用mongoengine.

python exception heroku flask

29
推荐指数
1
解决办法
3万
查看次数

如何检测语音记录与另一个语音记录的相似程度?

我想建立一个程序来检测用户的录音与另一个录音的接近程度,以便纠正用户的发音.例如:

  1. 我记录自己说"早上好"
  2. 我让外国学生记录"早上好"
  3. 将他的录音与我的录音进行比较,看看他的发音是否足够好.

我在一些语言学习工具中看到了这一点(我相信Rosetta Stone会这样做),但它是如何完成的?请注意,我们只处理语音(而不是音乐).我应该研究哪些算法或库?

algorithm audio machine-learning

20
推荐指数
3
解决办法
1万
查看次数

如何正式弃用pip包

这可能看起来有点奇怪,但在谷歌搜索了很长一段时间后,我无法找到一种可接受的方法.

基本上我有一个我维护的pip包.它主要是外部API的包装器,外部API只是改变了.我发送了一个新版本的包装器,但大概不是每个人都保持他们的pip包完全更新.我努力保留大多数遗留功能,但有一些我无法保留的功能.

有没有办法正式让人们知道某个版本之前的每个软件包都已被正式弃用?理想情况下,这会告诉人们积极升级,但我不确定这是多么可行.

似乎pip必须有一些功能或最佳实践,但我真的找不到任何相关的文档.

python packaging pip deprecated

15
推荐指数
1
解决办法
530
查看次数

在ubuntu中读取复合文档文件V2文档(.msg)文件

我从Outlook电子邮件帐户中获得了大量数据,这些数据完全来自.msg文件.快速调用ubuntu的文件方法显示它们是Composite Document File V2 Documents(无论这意味着什么).我真的希望能够以明文形式阅读这些文件.这有可能吗?

更新:事实证明,对于这些类型的文件进行大规模数据挖掘并不是完全可能的.如果你遇到同样的问题,我建立了一个库来解决这个问题.https://github.com/Slater-Victoroff/msgReader

文档不是很好,但它是一个非常小的库,所以它应该是自我解释的.

encoding text msg

12
推荐指数
1
解决办法
2万
查看次数

metaphone与soundex对比NYSIIS

我试图想出一个隐式拼写检查器,它将使用输入单词的映射到某种更一般的语音表示来解释可能发生的拼写错误,基本上对于一个会自动纠正你的拼写到一定程度的搜索栏.我一直在研究的两件事是metaphone,nysiis和soundex,但我真的不知道哪个更适合这个应用程序.

我希望优先选择更多的匹配而不是更少的匹配,我希望匹配更加通用,因此我想与soundex一起使用,这似乎是比原始的metaphone更接近的映射,但我真的不知道模糊性的差异有多大.我知道nysiis与soundex非常相似,但我不太清楚它们有多相似,或者nysiis与metaphone相比如何.

我也在寻找最快的解决方案.我知道这些语音映射器通常很快,但我不确定哪个是最快的,考虑到我希望能够在不增加搜索时间的情况下检查拼写,速度是一个考虑因素.思考?

nlp soundex machine-learning metaphone phonetics

11
推荐指数
1
解决办法
7108
查看次数