小编Son*_*Son的帖子

sklearn中的transformer和estimator有什么区别?

我看到sklearn 文档中提到了Transformerestimator

这两个词有什么区别吗?

scikit-learn

14
推荐指数
1
解决办法
2645
查看次数

JupyterLab 和 JupyterHub 有什么区别?

JupyterLab和 和有JupyterHub什么区别?我应该如何决定为用户部署哪一个?

jupyter jupyterhub jupyter-lab

8
推荐指数
1
解决办法
7974
查看次数

Apache Flink:使用 filter() 或 split() 拆分流?

我有一个来自 Kafka 的 DataStream,它对 MyModel 中的一个字段有 2 个可能的值。MyModel 是一个 pojo,具有从来自 Kafka 的消息解析的特定领域字段。

DataStream<MyModel> stream = env.addSource(myKafkaConsumer);
Run Code Online (Sandbox Code Playgroud)

我想分别在每个键 a1、a2 上应用窗口和运算符。有什么好的方法可以将它们分开?我有 2 个选项过滤和选择,但不知道哪个更快。

过滤方法

stream
        .filter(<MyModel.a == a1>)
        .keyBy()
        .window()
        .apply()
        .addSink()

stream
        .filter(<MyModel.a == a2>)
        .keyBy()
        .window()
        .apply()
        .addSink()
Run Code Online (Sandbox Code Playgroud)

拆分和选择方法

SplitStream<MyModel> split = stream.split(…)
    split
        .select(<MyModel.a == a1>)
        …
        .addSink()

    split
        .select<MyModel.a == a2>()
        …
        .addSink()
Run Code Online (Sandbox Code Playgroud)

如果 split 和 select 更好,如果我想根据 MyModel 中某个字段的值进行拆分,如何实现它们?

apache-flink flink-streaming

5
推荐指数
2
解决办法
4744
查看次数

Apache Flink的分离模式是什么?

我在Flink文档中看到了这一行,但无法弄清楚“分离模式”的含义。请帮忙。谢谢。

在分离模式下运行示例程序:

./bin/flink run -d ./examples/batch/WordCount.jar
Run Code Online (Sandbox Code Playgroud)

apache-flink

2
推荐指数
1
解决办法
627
查看次数