小编kak*_*sat的帖子

通过在T-SQL中设置种子,从均匀分布生成随机值

我想从均匀分布中生成随机值,其中对于T-SQL中给定数​​据表的每一行,mean = 0和标准devation = 1.另外,我想设置种子以确保分析的可重复性.以下是不起作用的想法:

  1. 使用RAND()具有声明数字的函数不能实现此目标:为数据集的每一行生成相同的随机值.

  2. 这样的解决方案:

    SELECT ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) AS [RandomNumber]

由于它不可再现,因此无法解决问题.

编辑:

由于我的表有数亿条记录,因此性能很重要.

t-sql sql-server random random-seed

10
推荐指数
1
解决办法
1362
查看次数

Python - 将数组中的字符串转换为日期

我已经从TXT文件中读取了一个字符串数组,并使用这样一行将其保存为一个数组(超过数千个值):

dates = np.genfromtxt('filename.txt', delimiter=";", usecols=(0), dtype=None)
Run Code Online (Sandbox Code Playgroud)

接下来,我想将字符串转换为日期.我试着用这行:

dates2 = dt.datetime.strptime([dates], '"%Y-%m-%d"').date()
Run Code Online (Sandbox Code Playgroud)

但是,我收到了一个错误:

TypeError:必须是字符串,而不是列表

我发现这样的代码工作正常:

data1='"2010-02-28"'
data1_1 = dt.datetime.strptime(data1, '"%Y-%m-%d"').date()
Run Code Online (Sandbox Code Playgroud)

我应该如何处理所描述的问题?

python arrays string date strptime

7
推荐指数
1
解决办法
3万
查看次数

何时应在 CosmosDB 中创建新容器?

我想在Azure CosmosDB上存储不同结构的数据。我知道容器可以存储不同类型的数据。在生产中,通过为它们分配不同的“类型”属性来区分它们。

当我观看最佳实践视频时:我注意到有两个容器(时间戳:17:47):CosmosDB 中的两个容器

第一个,users,只有一种数据类型,而第二个,posts,包含两种类型的内容:帖子和评论。

  1. 什么时候建议创建一个新容器而不是向已创建的容器添加不同类型的数据?
  2. 稍微解释一下这个问题:既然容器可以存储各种数据类型,为什么不将上面屏幕上的用户帖子评论放在一个容器中呢?

containers azure azure-cosmosdb

6
推荐指数
1
解决办法
1154
查看次数

Azure 服务总线队列发送和接收消息的测试

我想编写一个集成测试,检查 Python 脚本与 Azure 服务总线队列的连接。测试应该:

  1. 向队列发送消息,
  2. 确认消息已进入队列。

测试看起来像这样:

import pytest

from azure.servicebus import ServiceBusClient, ServiceBusMessage, ServiceBusSender

CONNECTION_STRING = <some connection string>
QUEUE = <queue name>


def send_message_to_service_bus(sender: ServiceBusSender, msg: str) -> None:
    message = ServiceBusMessage(msg)
    sender.send_message(message)


class TestConnectionWithQueue:
    def test_message_is_sent_to_queue_and_received(self):
        msg = "test message sent to queue"
        expected_message = ServiceBusMessage(msg)
        
        servicebus_client = ServiceBusClient.from_connection_string(conn_str=CONNECTION_STRING, logging_enable=True)
        with servicebus_client:
            sender = servicebus_client.get_queue_sender(queue_name=QUEUE)
            with sender:
                send_message_to_service_bus(sender, expected_message)
        
            receiver = servicebus_client.get_queue_receiver(queue_name=QUEUE)
            with receiver:
                messages_in_queue = receiver.receive_messages(max_message_count=10, max_wait_time=20)
        assert any(expected_message == str(actual_message) for actual_message in messages_in_queue) …
Run Code Online (Sandbox Code Playgroud)

python testing integration-testing servicebus azure-servicebus-queues

5
推荐指数
1
解决办法
129
查看次数

R:为什么在省略号是最后一个参数时为省略号(...)提供列表不起作用?

我正在编写一个利用省略号(又名...)的函数.它允许您指定可变数量的其他参数.我想提供一个带参数的列表作为附加参数.以下是可重现的示例:

f <- function(..., a =1, b = 2){
  l <- list(...)
  print(l)
}
f(list(a = 2))

[[1]]
[[1]]$a
[1] 2
Run Code Online (Sandbox Code Playgroud)

在列表中提供附加参数的目的是避免名称冲突(内部函数f可以采用命名参数a,我希望确保提供它的可能性).

在更改实现时,我注意到将省略号移动到函数声明中的最后一个位置会返回不同的结果(即空列表):

g <- function(a =1, b = 2, ...){
  l <- list(...)
  print(l)
}
g(list(a = 2))

list()
Run Code Online (Sandbox Code Playgroud)

好奇,我添加了两个函数的默认参数:

f <- function(..., a =1, b = 2){
  l <- list(...)
  print(l)
  print(c(a = a, b = b))
}
g <- function(a =1, b = 2, ...){
  l <- list(...)
  print(l)
  print(c(a = …
Run Code Online (Sandbox Code Playgroud)

r function list ellipsis

3
推荐指数
1
解决办法
144
查看次数

从字符串调用 data.frame

我正在做一个循环,我需要对数据框的列的固定范围进行子集化。但循环正是为了生成我需要提取列的 data.frame 的名称。我想知道如何从字符串名称调用 data.frame。它必须与assign()函数类似,但我没有为空分配任何值,我只需要使用paste0()函数从字符串生成 data.frame 的名称。

loops r

1
推荐指数
1
解决办法
4304
查看次数