小编SCO*_*SCO的帖子

在ISO 8601日期,T字符是强制性的吗？

我想知道以下日期是否符合ISO8601标准:

2012-03-02 14:57:05.456+0500

Run Code Online (Sandbox Code Playgroud)

(当然,2012-03-02T14:57:05.456 + 0500是合规的,但没有那么多人类可读!)IOW,日期和时间之间的T是强制性的吗？

standards iso date datetime-format

SCO*_*SCO

2017 03-10

36
推荐指数

2
解决办法

8412
查看次数

Postgresql中的高斯随机分布

我有一个表格,比方说250个网址:

create table url (
  id serial,
  url varchar(64)
)

Run Code Online (Sandbox Code Playgroud)

这些URL分别对应于网站.每个网站都有不同的受欢迎程度.比方说,在id=125(集中于高斯一)是最流行的,那些在id=1或者id=250是最流行的.

我想在"url"表中提供的"log"表格中填充"log"表,其值为url,但考虑到不同的URL可能更频繁地出现(例如,id为125的url url将是最受欢迎).

create table log (
  id serial,
  url_id integer
)

Run Code Online (Sandbox Code Playgroud)

我想避免使用,random()因为它是统一的而不是非常"真实".

如何用Postgresql实现这一目标？

random postgresql statistics gaussian

SCO*_*SCO

2014 10-14

6
推荐指数

2
解决办法

3760
查看次数

为什么像Vertica/InfoBright/GreenPlum这样的面向列的数据库会对Hadoop大做文章？

为Hadoop集群提供数据并使用该集群将数据输入Vertica/InfoBright数据仓库有什么意义？

所有这些供应商都在说"我们可以与Hadoop联系",但我不明白这是什么意思.在Hadoop中存储并转移到InfoBright有什么兴趣？为什么不将应用程序直接存储在Infobright/Vertica DW中？

谢谢 !

hadoop vertica greenplum infobright

SCO*_*SCO

lucky-day

5
推荐指数

2
解决办法

6066
查看次数

如何在c ++中使用std :: remove'd字符串？

让我们假设如下:

string s("!Hello!'");

Run Code Online (Sandbox Code Playgroud)

我的目的是在s变量中获取只有"Hello"字符串,IOW我想删除感叹号.

我尝试了以下方法:

std::remove ( s.begin(), s.end(), '!' );

Run Code Online (Sandbox Code Playgroud)

当我得到结果的字符串时,我得到:

Helloo!

Run Code Online (Sandbox Code Playgroud)

"!" 字符已被删除,但字符串的末尾未被移动.

我已经读过我需要从std :: remove的返回值中获取一个迭代器,但我是C++的新手,并没有成功.

我希望像char :: iterator这样的东西是有效的,但似乎不是......所以

char::iterator new_end;
new_end = std::remove ( s.begin(), s.end(), '!' );
cout << new_end ;

Run Code Online (Sandbox Code Playgroud)

没有成功.

任何帮助/指针将不胜感激!

c++ string iterator

SCO*_*SCO

2012 05-21

3
推荐指数

1
解决办法

595
查看次数

改善ZeroMQ REQ/REP性能

我正在使用ZeroMQ 3.2.3和CZmq 1.4.1.我试试了"Hello world"样本.该示例(https://github.com/imatix/zguide/tree/master/examples/C),当使用10个并发客户端时,允许我在Intel i7上每秒最多交换12500条消息(8 GB RAM,总计本地主机(Ubuntu 13.04)上的8个内核).

我读过ZeroMQ可以处理更多.我做错了什么,或者错过了什么？

以下是示例代码:

//  Hello World server

#include <zmq.h>
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <assert.h>

int main (void)
{
    //  Socket to talk to clients
    void *context = zmq_ctx_new ();
    void *responder = zmq_socket (context, ZMQ_REP);
    int rc = zmq_bind (responder, "tcp://*:5555");
    assert (rc == 0);

    while (1) {
        char buffer [10];
        zmq_recv (responder, buffer, 10, 0);
        //printf ("Received Hello\n");
        zmq_send (responder, "World", 5, 0);
        //usleep (1);          //  Do …

Run Code Online (Sandbox Code Playgroud)

zeromq

SCO*_*SCO

lucky-day

3
推荐指数

1
解决办法

2285
查看次数

无法将迭代器设置为std :: pair的std :: map

我有一张地图，其值为std :: pair。

尝试设置迭代器时，编译器抱怨如下，但我不明白为什么：

src / DBConnector.cpp：在成员函数'int DBConnector :: createGenericInsert（std :: string，std :: map <std :: basic_string <char，std :: char_traits <char>，std :: allocator <char>>， std :: pair <int，std :: basic_string <char，std :: char_traits <char>，std :: allocator <char>>>，std :: less <std :: basic_string <char，std :: char_traits <char >，std :: allocator <char>>>，std :: allocator <std :: pair <const std :: basic_string <char，std :: char_traits <char>，std :: allocator <char>>，std :: pair <int，std :: basic_string <char，std :: char_traits <char>，std :: allocator <char>>>>>，std :: string＆）'：src …

c++ iterator map std-pair

SCO*_*SCO

2012 05-03

2
推荐指数

1
解决办法

1975
查看次数

按日期分组,当count()不产生任何行时为0

我正在使用Postgresql 9,当没有计算行数时,我正在计算和分组.

我们假设以下架构:

create table views {
 date_event timestamp with time zone ;
 event_id integer;
}

Run Code Online (Sandbox Code Playgroud)

让我们想象以下内容:

2012-01-01 00:00:05    2
2012-01-01 01:00:05    5
2012-01-01 03:00:05    8
2012-01-01 03:00:15    20

Run Code Online (Sandbox Code Playgroud)

我想按小时分组,并计算行数.我希望我能找回以下内容:

2012-01-01 00:00:00    1
2012-01-01 01:00:00    1
2012-01-01 02:00:00    0
2012-01-01 03:00:00    2
2012-01-01 04:00:00    0
2012-01-01 05:00:00    0
.
.

2012-01-07 23:00:00    0

Run Code Online (Sandbox Code Playgroud)

我的意思是,对于每个时间范围槽,我计算我的表中日期对应的行数,否则,我返回一个计数为零的行.

以下肯定不会起作用(只会将计数行数大于0的行).

SELECT  extract ( hour from date_event ),count(*)
FROM views
where date_event > '2012-01-01' and date_event <'2012-01-07'
GROUP BY extract ( hour from date_event );

Run Code Online (Sandbox Code Playgroud)

请注意,我可能还需要按分钟,按小时,按天,按月或按年分组(当然可以进行多次查询). …

postgresql group-by count

SCO*_*SCO

lucky-day

2
推荐指数

1
解决办法

2103
查看次数

如何修改Python JSON对象数组

我们假设如下:

sp_sample=[{"t":1434946093036,"v":54.0},{"t":1434946095013,"v":53.0},{"t":1434946096823,"v":52.0}

Run Code Online (Sandbox Code Playgroud)

我希望我能得到以下结果:

sp_sample=[{"t":1434946093036,"v":5400.0},{"t":1434946095013,"v":5300.0},{"t":1434946096823,"v":5200.0}

Run Code Online (Sandbox Code Playgroud)

换句话说,我希望我可以通过100因子迭代数组和多个v.

以下仅对第一项执行乘法运算,即得到54000:

for i, a in enumerate(sp_sample):
    a[i]['v'] =  a[i]['v'] * 100

Run Code Online (Sandbox Code Playgroud)

该sp_sample类型是元组.使用以下产生整个数组,这不是我所期望的:

print sp_sample[0]

Run Code Online (Sandbox Code Playgroud)

另外,尝试打印sp_sample:

print sp_sample

Run Code Online (Sandbox Code Playgroud)

返回以下内容(为简洁起见,替换了.......):

([{'t': 1434946093036, 'v': 54.0}, {'t': 1434946095013, 'v': 53.0}, {'t': 1434946096823, 'v': 52.0}, {'t': 1434946098612, 'v': 52.0}, {'t': 1434946100400, 'v': 51.0}, {'t': 1434946102372, 'v': 49.0},........, {'t': 1434947987823, 'v': 15.0}, {'t': 1434947989851, 'v': 12.0}, {'t': 1434947991899, 'v': 10.0}, {'t': 1434947993744, 'v': 5.0}, {'t': 1434947995599, 'v': 0.0}, {'t': 1434947997455, 'v': 0.0}, {'t': 1434947999494, 'v': 0.0}, {'t': 1434948001542, 'v': …

Run Code Online (Sandbox Code Playgroud)

python arrays json python-2.7

SCO*_*SCO

2015 11-10

2
推荐指数

1
解决办法

109
查看次数

使用regcomp进行^ [az] {0,20000} $正则表达式编译的可怕性能

我想知道为什么这样一个正则表达式的编译占用了我的RAM的70%,导致强烈的交换和16的负载平均值:

strcpy(regexStr,"^[a-z]{0,20000}$" );
regcomp( &regex , regexStr , REG_NOSUB | REG_EXTENDED );

Run Code Online (Sandbox Code Playgroud)

执行时间大约为几分钟(之前必须终止进程).^[a-z]{0,2000}$(2,000,而不是20,000)的执行大约是100ms,这对我来说很重要.

我用它来检查一个模式,同时检查长度.我发现正则表达式对两者都很方便.难道我做错了什么？

regex memory performance libc

SCO*_*SCO

2011 02-05

1
推荐指数

1
解决办法

326
查看次数

如何从sed的时间戳中删除毫秒？

我的输入文件如下:

12/13/2011,07:14:13.724,12/13/2011 07:14:13.724,231.56.3.245,LasVegas,US

Run Code Online (Sandbox Code Playgroud)

我希望得到以下内容:

12/13/2011,07:14:13,12/13/2011 07:14:13,231.56.3.245,LasVegas,US

Run Code Online (Sandbox Code Playgroud)

我试过这个,但没有成功:

sed "s/[0-9]{2}\:[0-9]{2}\:[0-9]{2}\(\.[0-9]{1,3}\)/\1/g" input_file.csv > output.csv

Run Code Online (Sandbox Code Playgroud)

regex grep sed

SCO*_*SCO

2011 12-19

1
推荐指数

1
解决办法

2148
查看次数

用于在 json 中提取会话标识符的 GREP 正则表达式

让我们考虑一个包含以下 JSON 文档的 a.txt 文件：

{ "body": { "session_info": { "session_id": "BAzcWu2nHVXrXrx096PMZOaFslgWrjx1", "email": "admin@site.com" }, "status": { "msg": "success" } }

Run Code Online (Sandbox Code Playgroud)

我正在编写一个 bash 脚本，我需要为其提取 session_id 值。我开始使用以下正则表达式进行 grep'ing，但没有成功（没有返回任何内容）：

#!/bin/bash
regex="session_id\": \"[A-Z0-9a-z]{32}.*"
echo "REGEX=$regex"
echo "----"
content=$(cat a.txt)
echo $content
echo "----"
[[ $content =~ $regex ]]
sessionid="${BASH_REMATCH[1]}"
echo ${sessionid}

Run Code Online (Sandbox Code Playgroud)

这有什么问题？

regex bash json

SCO*_*SCO

lucky-day

1
推荐指数

1
解决办法

4482
查看次数