小编Ale*_*nko的帖子

在子二次时间中删除"几乎重复"的字符串

我正在尝试在真实的数据集(酒店评论)上进行机器学习.不幸的是,它受到垃圾邮件的困扰,垃圾邮件的形式几乎完全相同,这对我来说非常重要.

我想基于编辑距离或类似的东西从数据集中删除"几乎重复",并且由于数据集大小> 100K,因此算法必须是数据集大小的次级二次.现在我只能想到标记过于频繁重复的单个句子或短语,然后删除所有带有它们的评论,但很容易看出这种策略如何适得其反.有一个更好的常见算法吗?

algorithm data-mining

11
推荐指数
1
解决办法
207
查看次数

理解Haskell中的绑定函数

我熟悉类别理论中的monad(实际上它们是一个非常简单的概念),但>>=Haskell中的函数完全让我困惑.好的,所以将bind应用于一个M a和一个函数的值与a -> M u首先将monad应用于此函数,然后在指定的值上进行评估并将结果相乘:a >>= f是相同的join $ (fmap f) $ a.但这是如何自然地描述计算?是否有一些有用的方法可以帮助我理解它?

在某个地方是否有一些适合C++丛林新鲜事物的文章?

monads haskell

10
推荐指数
2
解决办法
665
查看次数

除非我使用超时,否则CSS转换不起作用

我有几个课:hidedisplay: none,transparentopacity: 0.元素pr_container-webkit-transition: opacity 1s.以下基于JQuery的代码使元素出现在动画中:

pr_container.removeClass("hide");
setTimeout(function() { pr_container.removeClass("transparent"); }, 0);
Run Code Online (Sandbox Code Playgroud)

但是,当我删除setTimeout而只是删除第二个类时,没有动画.为什么?

编辑:我正在使用最新的Chrome,我还没有检查过其他浏览器.

编辑:我尝试将两个调用放在同一个setTimeout回调中 - 没有动画.所以这显然是关于分离.

编辑:这是jsFiddle:http://jsfiddle.net/WfAVj/

javascript jquery css3 css-transitions

9
推荐指数
1
解决办法
1790
查看次数

SML中的标准排序功能?

SML中是否有标准排序功能?互联网上的文件非常稀缺,我找不到任何文件.

sml

8
推荐指数
2
解决办法
7041
查看次数

在网络工作者中填充`窗口`和`文件`

是否存在用于实现windowdocument对象的解决方案,这些解决方案在初始化之后不使用DOM但具有兼容的接口?它们对于在Web worker中使用像MathJax这样的重量级库很有用.

javascript html5

6
推荐指数
1
解决办法
267
查看次数

RAX,RBX,RCX,RDX,RSI,RDI,RBP,RSP,R8-R15是否可互换?

x64寄存器是否可以互换,因为任何与它们组合使用的指令都可以与其他指令一起使用?除了名称之外,是否有性能差异或任何其他因素使它们彼此不同?

assembly x86-64

4
推荐指数
2
解决办法
1592
查看次数

Postgres一贯主张嵌套循环联接优于合并联接

我有一个复杂的查询:

SELECT DISTINCT ON (delivery.id)
delivery.id, dl_processing.pid
FROM mailer.mailer_message_recipient_rel AS delivery
    JOIN mailer.mailer_message AS message ON delivery.message_id = message.id
    JOIN mailer.mailer_message_recipient_rel_log AS dl_processing ON dl_processing.rel_id = delivery.id AND dl_processing.status = 1000
    -- LEFT JOIN mailer.mailer_recipient AS r ON delivery.email = r.email
    JOIN mailer.mailer_mailing AS mailing ON message.mailing_id = mailing.id
WHERE
    NOT EXISTS (SELECT dl_finished.id FROM mailer.mailer_message_recipient_rel_log AS dl_finished WHERE dl_finished.rel_id = delivery.id AND dl_finished.status <> 1000) AND
    dl_processing.date <= NOW() - (36000 * INTERVAL '1 second') AND
    NOT EXISTS (SELECT …
Run Code Online (Sandbox Code Playgroud)

sql postgresql performance

4
推荐指数
1
解决办法
4227
查看次数

使用惰性列表的Haskell性能很差

我试图测试Haskell性能,但得到了一些意想不到的糟糕结果:

-- main = do
--  putStrLn $ show $ sum' [1..1000000]

sum' :: [Int] -> Int
sum' [] = 0
sum' (x:xs) = x + sum' xs
Run Code Online (Sandbox Code Playgroud)

我首先运行它ghci -O2:

> :set +s
> :sum' [1..1000000]
1784293664
(4.81 secs, 163156700 bytes)
Run Code Online (Sandbox Code Playgroud)

然后我编写了代码ghc -O3,运行它time并得到了这个:

1784293664

real    0m0.728s
user    0m0.700s
sys     0m0.016s
Run Code Online (Sandbox Code Playgroud)

毋庸置疑,与C代码相比,这些结果非常糟糕:

#include <stdio.h>

int main(void)
{
    int i, n;
    n = 0;
    for (i = 1; i <= 1000000; ++i)
        n += i;
    printf("%d\n", …
Run Code Online (Sandbox Code Playgroud)

performance haskell

3
推荐指数
1
解决办法
772
查看次数

为什么Haskell有Data.Sequence?

为什么Haskell有Data.Sequence?是不是(懒惰)列表已经是最普遍的前向迭代器(由于是免费的幺半群)?

haskell

3
推荐指数
1
解决办法
1025
查看次数

在Orchard中创建内容项时,不显示内容部分编辑视图

我创建了一个内容部分,然后将其添加到Orchard的内容类型中.但是当我尝试创建该类型的内容项时,不会显示该部件属性的字段.我正在寻找问题所在的建议.

UPD:相关代码:

using JetBrains.Annotations;
using ArealAds.Models;
using Orchard.ContentManagement;
using Orchard.ContentManagement.Drivers;
using ArealAds.Models;
using ArealAds.Services;
using ArealAds.ViewModels;

namespace ArealAds.Drivers {
    [UsedImplicitly]
    public class AdDriver : ContentPartDriver<AdPart> {
        private readonly IAdService _adService;

        public AdDriver (IAdService adService)
        {
            _adService = adService;
        }

        protected override string Prefix {
            get { return "AdPart"; }
        }

        protected override DriverResult Display(
            AdPart part, string displayType, dynamic shapeHelper) {

            return ContentShape("Parts_Ad", () => shapeHelper.Parts_Ad(
                Title: part.Title,
                Url: part.Url,
                Email: part.Email,
                Phone1: part.Phone1,
                Phone2: part.Phone2,
                AreaName: part.AreaRecord.Name,
                AreaId: part.AreaRecord.Id, …
Run Code Online (Sandbox Code Playgroud)

asp.net orchardcms

2
推荐指数
1
解决办法
1227
查看次数

Python中的奇怪事件

出于某种原因,在Python 2.7的形式表达tuple > list的回报True,但tuple < listtuple == list回报False.这是为什么?

无论如何,这种观察对我来说并不是原创.

python

1
推荐指数
2
解决办法
132
查看次数