我想知道以下日期是否符合ISO8601标准:
2012-03-02 14:57:05.456+0500
Run Code Online (Sandbox Code Playgroud)
(当然,2012-03-02T14:57:05.456 + 0500是合规的,但没有那么多人类可读!)IOW,日期和时间之间的T是强制性的吗?
我有一个表格,比方说250个网址:
create table url (
id serial,
url varchar(64)
)
Run Code Online (Sandbox Code Playgroud)
这些URL分别对应于网站.每个网站都有不同的受欢迎程度.比方说,在id=125(集中于高斯一)是最流行的,那些在id=1或者id=250是最流行的.
我想在"url"表中提供的"log"表格中填充"log"表,其值为url,但考虑到不同的URL可能更频繁地出现(例如,id为125的url url将是最受欢迎).
create table log (
id serial,
url_id integer
)
Run Code Online (Sandbox Code Playgroud)
我想避免使用,random()因为它是统一的而不是非常"真实".
如何用Postgresql实现这一目标?
为Hadoop集群提供数据并使用该集群将数据输入Vertica/InfoBright数据仓库有什么意义?
所有这些供应商都在说"我们可以与Hadoop联系",但我不明白这是什么意思.在Hadoop中存储并转移到InfoBright有什么兴趣?为什么不将应用程序直接存储在Infobright/Vertica DW中?
谢谢 !
让我们假设如下:
string s("!Hello!'");
Run Code Online (Sandbox Code Playgroud)
我的目的是在s变量中获取只有"Hello"字符串,IOW我想删除感叹号.
我尝试了以下方法:
std::remove ( s.begin(), s.end(), '!' );
Run Code Online (Sandbox Code Playgroud)
当我得到结果的字符串时,我得到:
Helloo!
Run Code Online (Sandbox Code Playgroud)
"!" 字符已被删除,但字符串的末尾未被移动.
我已经读过我需要从std :: remove的返回值中获取一个迭代器,但我是C++的新手,并没有成功.
我希望像char :: iterator这样的东西是有效的,但似乎不是......所以
char::iterator new_end;
new_end = std::remove ( s.begin(), s.end(), '!' );
cout << new_end ;
Run Code Online (Sandbox Code Playgroud)
没有成功.
任何帮助/指针将不胜感激!
我正在使用ZeroMQ 3.2.3和CZmq 1.4.1.我试试了"Hello world"样本.该示例(https://github.com/imatix/zguide/tree/master/examples/C),当使用10个并发客户端时,允许我在Intel i7上每秒最多交换12500条消息(8 GB RAM,总计本地主机(Ubuntu 13.04)上的8个内核).
我读过ZeroMQ可以处理更多.我做错了什么,或者错过了什么?
以下是示例代码:
// Hello World server
#include <zmq.h>
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <assert.h>
int main (void)
{
// Socket to talk to clients
void *context = zmq_ctx_new ();
void *responder = zmq_socket (context, ZMQ_REP);
int rc = zmq_bind (responder, "tcp://*:5555");
assert (rc == 0);
while (1) {
char buffer [10];
zmq_recv (responder, buffer, 10, 0);
//printf ("Received Hello\n");
zmq_send (responder, "World", 5, 0);
//usleep (1); // Do …Run Code Online (Sandbox Code Playgroud) 我有一张地图,其值为std :: pair。
尝试设置迭代器时,编译器抱怨如下,但我不明白为什么:
src / DBConnector.cpp:在成员函数'int DBConnector :: createGenericInsert(std :: string,std :: map <std :: basic_string <char,std :: char_traits <char>,std :: allocator <char>>, std :: pair <int,std :: basic_string <char,std :: char_traits <char>,std :: allocator <char>>>,std :: less <std :: basic_string <char,std :: char_traits <char >,std :: allocator <char>>>,std :: allocator <std :: pair <const std :: basic_string <char,std :: char_traits <char>,std :: allocator <char>>,std :: pair <int,std :: basic_string <char,std :: char_traits <char>,std :: allocator <char>>>>>,std :: string&)':src …
我正在使用Postgresql 9,当没有计算行数时,我正在计算和分组.
我们假设以下架构:
create table views {
date_event timestamp with time zone ;
event_id integer;
}
Run Code Online (Sandbox Code Playgroud)
让我们想象以下内容:
2012-01-01 00:00:05 2
2012-01-01 01:00:05 5
2012-01-01 03:00:05 8
2012-01-01 03:00:15 20
Run Code Online (Sandbox Code Playgroud)
我想按小时分组,并计算行数.我希望我能找回以下内容:
2012-01-01 00:00:00 1
2012-01-01 01:00:00 1
2012-01-01 02:00:00 0
2012-01-01 03:00:00 2
2012-01-01 04:00:00 0
2012-01-01 05:00:00 0
.
.
2012-01-07 23:00:00 0
Run Code Online (Sandbox Code Playgroud)
我的意思是,对于每个时间范围槽,我计算我的表中日期对应的行数,否则,我返回一个计数为零的行.
以下肯定不会起作用(只会将计数行数大于0的行).
SELECT extract ( hour from date_event ),count(*)
FROM views
where date_event > '2012-01-01' and date_event <'2012-01-07'
GROUP BY extract ( hour from date_event );
Run Code Online (Sandbox Code Playgroud)
请注意,我可能还需要按分钟,按小时,按天,按月或按年分组(当然可以进行多次查询). …
我们假设如下:
sp_sample=[{"t":1434946093036,"v":54.0},{"t":1434946095013,"v":53.0},{"t":1434946096823,"v":52.0}
Run Code Online (Sandbox Code Playgroud)
我希望我能得到以下结果:
sp_sample=[{"t":1434946093036,"v":5400.0},{"t":1434946095013,"v":5300.0},{"t":1434946096823,"v":5200.0}
Run Code Online (Sandbox Code Playgroud)
换句话说,我希望我可以通过100因子迭代数组和多个v.
以下仅对第一项执行乘法运算,即得到54000:
for i, a in enumerate(sp_sample):
a[i]['v'] = a[i]['v'] * 100
Run Code Online (Sandbox Code Playgroud)
该sp_sample类型是元组.使用以下产生整个数组,这不是我所期望的:
print sp_sample[0]
Run Code Online (Sandbox Code Playgroud)
另外,尝试打印sp_sample:
print sp_sample
Run Code Online (Sandbox Code Playgroud)
返回以下内容(为简洁起见,替换了.......):
([{'t': 1434946093036, 'v': 54.0}, {'t': 1434946095013, 'v': 53.0}, {'t': 1434946096823, 'v': 52.0}, {'t': 1434946098612, 'v': 52.0}, {'t': 1434946100400, 'v': 51.0}, {'t': 1434946102372, 'v': 49.0},........, {'t': 1434947987823, 'v': 15.0}, {'t': 1434947989851, 'v': 12.0}, {'t': 1434947991899, 'v': 10.0}, {'t': 1434947993744, 'v': 5.0}, {'t': 1434947995599, 'v': 0.0}, {'t': 1434947997455, 'v': 0.0}, {'t': 1434947999494, 'v': 0.0}, {'t': 1434948001542, 'v': …Run Code Online (Sandbox Code Playgroud) 我想知道为什么这样一个正则表达式的编译占用了我的RAM的70%,导致强烈的交换和16的负载平均值:
strcpy(regexStr,"^[a-z]{0,20000}$" );
regcomp( ®ex , regexStr , REG_NOSUB | REG_EXTENDED );
Run Code Online (Sandbox Code Playgroud)
执行时间大约为几分钟(之前必须终止进程).^[a-z]{0,2000}$(2,000,而不是20,000)的执行大约是100ms,这对我来说很重要.
我用它来检查一个模式,同时检查长度.我发现正则表达式对两者都很方便.难道我做错了什么 ?
我的输入文件如下:
12/13/2011,07:14:13.724,12/13/2011 07:14:13.724,231.56.3.245,LasVegas,US
Run Code Online (Sandbox Code Playgroud)
我希望得到以下内容:
12/13/2011,07:14:13,12/13/2011 07:14:13,231.56.3.245,LasVegas,US
Run Code Online (Sandbox Code Playgroud)
我试过这个,但没有成功:
sed "s/[0-9]{2}\:[0-9]{2}\:[0-9]{2}\(\.[0-9]{1,3}\)/\1/g" input_file.csv > output.csv
Run Code Online (Sandbox Code Playgroud) 让我们考虑一个包含以下 JSON 文档的 a.txt 文件:
{ "body": { "session_info": { "session_id": "BAzcWu2nHVXrXrx096PMZOaFslgWrjx1", "email": "admin@site.com" }, "status": { "msg": "success" } }
Run Code Online (Sandbox Code Playgroud)
我正在编写一个 bash 脚本,我需要为其提取 session_id 值。我开始使用以下正则表达式进行 grep'ing,但没有成功(没有返回任何内容):
#!/bin/bash
regex="session_id\": \"[A-Z0-9a-z]{32}.*"
echo "REGEX=$regex"
echo "----"
content=$(cat a.txt)
echo $content
echo "----"
[[ $content =~ $regex ]]
sessionid="${BASH_REMATCH[1]}"
echo ${sessionid}
Run Code Online (Sandbox Code Playgroud)
这有什么问题?
regex ×3
c++ ×2
iterator ×2
json ×2
postgresql ×2
arrays ×1
bash ×1
count ×1
date ×1
gaussian ×1
greenplum ×1
grep ×1
group-by ×1
hadoop ×1
infobright ×1
iso ×1
libc ×1
map ×1
memory ×1
performance ×1
python ×1
python-2.7 ×1
random ×1
sed ×1
standards ×1
statistics ×1
std-pair ×1
string ×1
vertica ×1
zeromq ×1