问题列表 - 第4539页

用于从有意义的文本中分离无意义文本的算法

我为我的一些程序提供了反馈功能.不幸的是,我忘了包含某种垃圾邮件保护 - 所以用户可以将他们想要的任何内容发送到我的服务器 - 每个反馈都存储在一个巨大的数据库中.

一开始我定期检查这些反馈 - 我过滤掉了可用的和删除的垃圾.问题是:我每天收到900条反馈.只有4-5个真正有用,其他消息大多是2种类型的乱码:

  • 废话:jfvgasdjkfahs kdlfjhasdf(人们在键盘上粉碎他们的头脑)
  • 语言我不明白

到目前为止我做了什么:

  1. 我安装了一个过滤器来删除任何包含"asdf","qwer"等的反馈...... - >每天只有700个

  2. 我安装了一个文字过滤器来删除任何包含不良语言的东西 - >每天600(不要问 - 但那里有很多奇怪的人)

  3. 我过滤掉任何包含我的语言未使用的字母的消息 - >每天400

但每天400仍然太多了.所以我想知道是否有人之前已经处理过这样的问题并且知道某种算法来过滤掉无意义的消息.

真的很感激任何帮助!

algorithm nlp filter cpu-word spam

8
推荐指数
5
解决办法
2913
查看次数

我如何证明(成本效益)花时间设置适当的开发环境(Subversion)?

在技​​术方面,我的老板是一个紧张的人,他很少批准不直接影响收入的项目.他(错误地)多次忽略了等式的成本方面,特别是对于难以估算成本的技术项目.这里有没有人有任何白皮书,文章等,以建立适当的开发环境(颠覆,开发,升级和生产服务器)的理性成本效益为基础的论点?

谢谢!

svn

6
推荐指数
2
解决办法
404
查看次数

设置SVN提交电子邮件的最简单/最好的方法是什么?

我想在我正在处理的项目上设置提交电子邮件,如下所述:http:
//producingoss.com/en/vc.html#commit-emails

也就是说,使用post commit hook将电子邮件发送到包含更改的提交标题/日志和差异的列表.

在Linux机器上设置它的最简单方法是什么?

svn svn-hooks

19
推荐指数
3
解决办法
3万
查看次数

来自UIImage的数据URL/PNG

我有一个有UIImage的iPhone程序.需要将此UIImage传输到UIWebView中的javascript Image对象.我想这可以通过使用我发送到UIWebView的数据URL来完成,如下所示:

[wview stringByEvaluatingJavaScriptFromString:@"loadimage('%d')",dataurlfromuiimage];
Run Code Online (Sandbox Code Playgroud)

所以,我需要将我的UIImage转换为Data:URL.如果我能获得PNG数据,我可以自己做,但我也找不到怎么做.如果有更好的方法将其发送到WebView,那也会很好.

cocoa-touch

5
推荐指数
1
解决办法
1万
查看次数

我可以使用RAM磁盘来加速我的IDE吗?

重复:

用于编译的RAMDrive - 有这样的事吗?

我知道如何加速我的IDE.

我想创建一个RAM磁盘并将我的解决方案移动到这个虚拟磁盘上.
我认为这可以加速IDE,因为RAM比HDD快得多.

有没有人这样做过?

PS:我认为,当我在我的程序(真实世界)中有一些经常使用的文档(例如一些文档模板)时,最好将这些文档移到RAM磁盘上以加速I/O. 我错了吗?

如果电力有问题,UPS可以解决它.

ide performance ramdrive ramdisk

2
推荐指数
1
解决办法
9607
查看次数

使用Ajax动态地将表单添加到Django formset

我想使用Ajax自动将新表单添加到Django表单集中,这样当用户单击"添加"按钮时,它会运行JavaScript,向页面添加一个新表单(它是表单集的一部分).

django ajax

253
推荐指数
8
解决办法
7万
查看次数

将一个pdf或ps文件叠加在另一个上面

我有两个pdf或postscript文件(我可以使用其中任何一个).我想要做的是将每个页面合并在另一个页面之上,以便将文档A的page1与文档B的页面1组合以产生输出文档的页面1.这不是我一定需要以编程方式进行的操作,尽管这会有所帮助.

有任何想法吗?

pdf postscript

53
推荐指数
3
解决办法
6万
查看次数

我如何纺织和消毒HTML?

现在我遇到了一些愚蠢的情况.我希望用户能够使用纺织品,但他们不应该在他们的条目周围乱用我的有效HTML.所以我必须以某种方式逃避HTML.

  • html_escape(textilize("</body>Foo")) 会破坏纺织品

  • textilize(html_escape("</body>Foo"))可以工作,但打破各种纺织品功能,如链接(写得像"Linkname":http://www.wheretogo.com/),因为引号将转化为&quot;纺织品,因此不再被纺织品检测到.

  • sanitize 没有做得更好.

有关那个的任何建议吗?我宁愿不使用Tidy来解决这个问题.提前致谢.

html escaping ruby-on-rails textile

5
推荐指数
1
解决办法
3428
查看次数

将C++模板类添加到列表中

我有一个模板类C_Foo <T>,它有很多种方法.

struct Bar_Base { ... };
struct Bar_1 : public Bar_Base { ... };
struct Bar_2 : public Bar_Base { ... };
struct Bar_3 : public Bar_Base { ... };

class C_Foo<T> { ... };

class C_Foo_1 : public C_Foo<Bar_1> { ... };
class C_Foo_2 : public C_Foo<Bar_2> { ... };
class C_Foo_3 : public C_Foo<Bar_3> { ... };
Run Code Online (Sandbox Code Playgroud)

实例化如下:

C_Foo_1      foo1;
C_Foo_2      foo2;
C_Foo_3      foo3;
Run Code Online (Sandbox Code Playgroud)

我有一组常见的操作,所有操作都是在C_Foo上定义的,我想在foo1,foo2和foo3上执行.我尝试过以下方法:

vector<C_Foo *>  v;
v.push_back(&foo1);
v.push_back(&foo2);
v.push_back(&foo3);
Run Code Online (Sandbox Code Playgroud)

但是我得到编译错误,大概是因为编译器不确定如何从C_Foo_1转到C_Foo.

可以这样做吗?我希望能够循环遍历foo1 ... fooN并对所有这些操作执行相同的操作,而不必像这样复制和粘贴样板代码:

foo1.do_stuff();
foo2.do_stuff(); …
Run Code Online (Sandbox Code Playgroud)

c++ templates

1
推荐指数
1
解决办法
228
查看次数

为什么DSL需要解析工具?

DSL不能像API一样简单,因此不需要解析器吗?或者我误解了域特定语言到底是什么?我认为它提到了解决特定域问题的任何有组织的规则集.API似乎符合该定义,对吧?

api dsl parsing dsl-tools

5
推荐指数
1
解决办法
490
查看次数