小编Ali*_*xel的帖子

RegEx:\ w - UTF-8中的"_"+" - "

我需要一个匹配UTF-8字母和数字的正则表达式,破折号(-)但不匹配下划线(_),我尝试了这些愚蠢的尝试但没有成功:

  • ([\w-^_])+
  • ([\w^_]-?)+
  • (\w[^_]-?)+

\w是简写[A-Za-z0-9_],但如果我有u修饰符集,它也匹配UTF-8字符.

任何人都可以帮我解决这个问题吗?

php regex unicode pcre utf-8

13
推荐指数
1
解决办法
3万
查看次数

有效地计算SQL中的重要术语

我刚刚向ElasticSearch介绍了重要的术语聚合,并且对这个度量标准的优秀和相关程度感到非常惊讶.对于那些不熟悉它的人来说,这是一个非常简单的概念 - 对于给定的查询(前景集),给定的属性根据背景集的统计显着性进行评分.

例如,如果我们要查询英国交通警察中最重要的犯罪类型:

C = 5,064,554 -- total number of crimes
T =    66,799 -- total number of bicycle thefts
S =    47,347 -- total number of crimes in British Transport Police
I =     3,640 -- total number of bicycle thefts in British Transport Police
Run Code Online (Sandbox Code Playgroud)

通常,自行车盗窃仅占犯罪的1%(66,799/5,064,554),但对于处理铁路和车站犯罪的英国交通警察来说,7%的犯罪(3,640/47,347)是自行车盗窃.频率增加了7倍.

"自行车盗窃"的意义在于 [(I/S) - (T/C)] * [(I/S) / (T/C)] = 0.371...

哪里:

  • C是集合中所有文档的编号
  • S是与查询匹配的文档数
  • T是具有特定术语的文档数
  • 是与ST相交的文档数

由于实际原因(我拥有大量的数据和巨大的ElasticSearch内存要求),我希望在SQL中或直接在代码中实现重要的术语聚合.

我一直在寻找一些方法来潜在地优化这种查询,特别是降低内存需求和提高查询速度,但代价是一些错误余量 - 但到目前为止我还没有破解它.在我看来,这:

  • 变量CS …

sql query-optimization aggregation elasticsearch significant-terms

13
推荐指数
1
解决办法
430
查看次数

好的数字哈希值

我想要散列字符串,但我需要输出为整数,所以我不能做md5.这里的人有任何他们可能想要启发我喜欢的数字哈希.我正在使用PHP.

谢谢!

php hash

12
推荐指数
1
解决办法
3829
查看次数

生成Luhn校验和

验证Luhn校验和有很多实现,但很少用于生成它们.我遇到过这个,但是在我的测试中它发现它是错误的,我不理解delta变量背后的逻辑.

我已经创建了这个应该生成Luhn校验和的函数,但由于某些原因我还没有理解生成的校验和在一半时间内是无效的.

function Luhn($number, $iterations = 1)
{
    while ($iterations-- >= 1)
    {
        $stack = 0;
        $parity = strlen($number) % 2;
        $number = str_split($number, 1);

        foreach ($number as $key => $value)
        {
            if ($key % 2 == $parity)
            {
                $value *= 2;

                if ($value > 9)
                {
                    $value -= 9;
                }
            }

            $stack += $value;
        }

        $stack = 10 - $stack % 10;

        if ($stack == 10)
        {
            $stack = 0;
        }

        $number[] = $stack;
    }

    return implode('', …
Run Code Online (Sandbox Code Playgroud)

php algorithm checksum check-digit luhn

12
推荐指数
1
解决办法
1万
查看次数

免费的CSS UI模板

有人可以向我展示一些用于一致的Web应用程序的css ui框架/模板,例如:

框架/模板是"纯粹"的CSS而不是javascript/ajax框架(ExtJS,JQuery UI,YUI等),并且可以在没有JQuery或其他JS/Ajax框架(主要只是UI)的情况下工作.

也许有点太多,但考虑包括的模板:

  • 表单样式(输入,按钮,选择,字段集,收音机,复选框等)
  • 表样式(标题,行突出显示,行焦点等)
  • 导航样式(基于标签,基于列表等)
  • 文字排版(h1 ... h3,b,i,u,em,strong,a等)

我发现了一些在这里:
http://www.webresourcesdepot.com/free-admin-template-for-web-applications/
http://blogfreakz.com/web-design/excellent-free-admin-template-for-web -applications /

我希望我能找到任何一个,特别是那个看起来像谷歌产品(gmail,wave,analytics)的产品,只是为了加快网页设计过程,同时保持UI设计的一致性.

css user-interface templates frameworks

12
推荐指数
2
解决办法
3万
查看次数

QWERTY键盘的助记符密码生成算法

我有一个" 助记符 "密码生成功能,如下所示:

function Mnemonic($mnemonic)
{
    $result = null;
    $charset = array(str_split('aeiou', 1), str_split('bcdfghjklmnpqrstvwxyz', 1));

    for ($i = 1; $i <= $mnemonic; $i++)
    {
        $result .= $charset[$i % 2][array_rand($charset[$i % 2])];
    }

    return $result;
}
Run Code Online (Sandbox Code Playgroud)

基本上这会生成一个$mnemonic长度为的字符串,其中每个奇数字符都是辅音,每个偶数字符都是元音.虽然我明白这会降低密码的复杂性,但通常更容易记住.现在我想通过生成易于键入的字符串来改进它.

QWERTY键盘布局

例如,虽然一个*nix新手我总是喜欢基于RHEL的发行版而不是Debian版,但主要原因是打字yum的简易性和打字的简易性apt[-get],只需亲自试试.

我应该如何实现逻辑以生成易于在QWERTY键盘上键入的字符串?

php string algorithm keyboard qwerty

12
推荐指数
1
解决办法
3052
查看次数

WEKA新手教程/示例

这个答案后续内容中,我想问一下你们是否知道任何好的(更重要的是易于理解)教程和/或使用Weka工具包进行数据挖掘的例子.

自从我第一次听说它及其可以做的事情以来,我一直对数据挖掘非常感兴趣,我也有一些实验,我想用我的一些数据做,我已经买了四个书和我发现特别有趣的以下两个:

智能数据分析http://ecx.images-amazon.com/images/I/41CJNXchMrL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg 数据挖掘http://ecx.images- amazon.com/images/I/61DhYb1Z6QL._BO2,204,203,200_PIsitb-sticker-arrow-click,TopRight,35,-76_AA240_SH20_OU01_.jpg

最后一个是由Weka的同一个作者写的,包含了很多例子,但我发现它有点难以理解逻辑,特别是数学.我的数学技能目前非常粗糙,我计划今年去大学,希望我能学习并能够更好地理解所涉及的数学,但在那之前我想在数据挖掘中获得一些练习.

有没有我可以阅读的示例数据的分步教程让我开始使用Weka工具包?

machine-learning data-mining weka

12
推荐指数
2
解决办法
2万
查看次数

错误的Olson时区抵消?

今天,我发现我的脚本来转换并显示奥尔森时区ID添加到城市和GMT偏移量是生产一些非常奇怪的结果:阿根廷区引起了我的注意,因为他们显示标准(非DST)时间基准的±0000日光节约/世界标准时间.

我检查了我的代码,我发现在我的逻辑个小bug,但它是不相关的差异,所以我更新timezonedb通过pecl为版本2012.8,但它仍然返回错误的偏移...

以下是一些代码,它返回对America/Argentina/San_Luis时区的最后3个更改:

$timezone = new DateTimeZone('America/Argentina/San_Luis');
$transitions = $timezone->getTransitions();

echo '<pre>';
print_r(array_slice($transitions, -3, null, true));
echo '</pre>';
Run Code Online (Sandbox Code Playgroud)

这是输出:

Array
(
    [59] => Array
        (
            [ts] => 1223784000
            [time] => 2008-10-12T04:00:00+0000
            [offset] => -10800
            [isdst] => 1
            [abbr] => WARST
        )

    [60] => Array
        (
            [ts] => 1236481200
            [time] => 2009-03-08T03:00:00+0000
            [offset] => -14400
            [isdst] => 
            [abbr] => WART
        )

    [61] => Array
        (
            [ts] => 1255233600
            [time] => 2009-10-11T04:00:00+0000
            [offset] => …
Run Code Online (Sandbox Code Playgroud)

php timezone timezone-offset

12
推荐指数
1
解决办法
1092
查看次数

SyntaxError:意外的标识符(ES6中的生成器)

在阅读了MDN生成器文档后,我想出了这个简单的实验:

var nodes = {
    type: 'root',
    value: [
        { type: 'char', value: 'a' },
        { type: 'char', value: 'b' },
        { type: 'char', value: 'c' },
    ],
};

function* recursiveGenerator(node) {
    if (node.type === 'root') {
        node.value.forEach(function (subnode) {
            for (var suffix of recursiveGenerator(subnode)) {
                yield suffix;
            }
        });
    }

    else {
        yield node.value;
    }
}

for (generated of recursiveGenerator(nodes)) {
    console.log(generated);
}
Run Code Online (Sandbox Code Playgroud)

在node.js v0.11.9上运行它并--harmony设置了标志会产生以下错误:

alix@900X4C:~$ node --version
v0.11.9
alix@900X4C:~$ node --harmony test.js …
Run Code Online (Sandbox Code Playgroud)

javascript yield generator node.js ecmascript-harmony

12
推荐指数
1
解决办法
2万
查看次数

像BluePrint/960gs这样的HTML5 + CSS3框架?

我正在开始一个侧面项目,并希望用HTML5 + CSS3构建它.向后兼容性不是问题.

我想知道是否存在类似于BluePrint/960gs的框架.主要是,我正在寻找网格系统和排版.我发现最好的(也是唯一一个)与新的HTML5标签配合使用的是Less Framework,这是一个好的开始,但我想知道是否存在更好的东西?

css html5 frameworks css3

11
推荐指数
1
解决办法
7387
查看次数