小编Zor*_*rik的帖子

从 Google Cloud Run 执行日志记录的最简单方法

我按照本指南https://firebase.google.com/docs/hosting/cloud-run来设置云运行 docker。然后我尝试按照本指南https://cloud.google.com/run/docs/logging执行简单的日志。尝试将结构化日志写入 stdout 这是我的代码：

    trace_header = request.headers.get('X-Cloud-Trace-Context')

    if trace_header:
        trace = trace_header.split('/')
        global_log_fields['logging.googleapis.com/trace'] = "projects/sp-64d90/traces/" + trace[0]

    # Complete a structured log entry.
    entry = dict(severity='NOTICE',
                 message='This is the default display field.',
                 # Log viewer accesses 'component' as jsonPayload.component'.
                 component='arbitrary-property',
                 **global_log_fields)

    print(json.dumps(entry))

Run Code Online (Sandbox Code Playgroud)

我在 Cloud Logs Viewer 中看不到此日志。每次调用 docker 时，我都会看到 http Get 日志。我错过了什么吗？我对此很陌生，想知道假设我创建的 docker 完全按照指南中的步骤（https://firebase.google.com/docs/hosting/cloud）记录信息并查看它的简单方法是什么-运行)

谢谢

python logging docker google-cloud-run

Zor*_*rik

2021 01-02

10
推荐指数

2
解决办法

3987
查看次数

最佳实践：对 eventhub 数据进行分区并通过 azure eventhub 到外部存储（azure blob）实现大规模、低延迟和高吞吐量

作为安全产品的一部分，我拥有大规模云服务（azure worker 角色），它从事件中心读取事件，将它们分批处理到 ~2000 并存储在 blob 存储中。每个事件都有一个 MachineId（发送它的机器）。事件以随机顺序来自事件中心，我以随机顺序将它们存储在 blob 存储中。吞吐量高达 125K 事件/秒，每个事件约为 2K，因此我们有高达 250MB/秒的流量。我们有大约 100 万台机器...

稍后，另一个云服务下载 blob 并对事件运行一些检测逻辑。他按 MachineId 对事件进行分组，并尝试从机器时间线中了解某些内容

问题是今天来自同一台机器的事件被填充到不同的 blob。如果我可以通过它们的 MachineId 以某种方式对事件进行分组，并确保机器的某个时间窗口填充到相同的 blob，这将增加我可以在云中进行的检测。

我们确实将事件写入另一个 Map reduce 系统，并且在那里我们正在做很多复杂的检测，但那些当然具有高延迟。如果我可以在云中更好地对事件进行分组，我就可以实时捕获更多信息

我有什么技术可以帮助我吗？

提前致谢

azure data-partitioning azure-eventhub azure-blob-storage

Zor*_*rik

2018 10-23

4
推荐指数

1
解决办法

2651
查看次数