小编Maa*_*mon的帖子

依旧注入Akka

我在我的应用程序中使用Guice非常多.最近我开始学习akka演员,感觉就像用它重构我的应用程序.

无论如何,我已经想知道我的所有guice将如何与演员合作.我继续搜索谷歌,它有点混乱.

我在这个主题上找到的最新文档是论文:

http://letitcrash.com/post/55958814293/akka-dependency-injection

http://eng.42go.com/tag/guice/

哪个不提倡相同的事情.

我必须承认我仍然需要阅读很多,我正在学习akka的开始.我做了一些例子和一些简单的事情,但我不想深入了解后来会发现我会遇到很多问题.

所以我的问题是截至今天,关于如何使用依赖注入的Akka Actors的共识是什么.

什么样的注射可能?我们可以将演员与对象/其他演员/ ....

无论如何,请以简洁的方式概述一些可以帮助我理解什么是可能的以及什么是最佳实践的东西?

dependency-injection scala actor akka

9
推荐指数
2
解决办法
8799
查看次数

红隼函数式编程设计模式的附加值是什么?(斯卡拉)

我想知道为什么使用Kestrel放弃代码的副作用部分是如此有用.有没有人有这方面的经验?并且可以解释真正的动机以及它如何帮助到底.

虽然我知道Pure函数编程是关于零方效应的,因此可以更好地调试和预测代码.但是对于Kestrel来说,我看不出它真的有帮助吗?

最好,

MM-

design-patterns functional-programming scala

9
推荐指数
1
解决办法
915
查看次数

解析PDF文件时Ubuntu机器上的字体问题

我在我的Ubuntu 14.04.x机器上有一个应用程序.此应用程序对PDF文件进行文本挖掘.我怀疑它正在使用Apache Tika等......

问题是,在阅读过程中,我收到以下警告:

2015-09-10 14:15:35 [WARN] FontManager Font not found: CourierNewPSMT
2015-09-10 14:15:36 [WARN] FontManager Font not found: CourierNewPSMT
2015-09-10 14:19:33 [WARN] FontManager Font not found: Helvetica
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica
2015-09-10 14:19:34 [WARN] FontManager Font not found: ESQWSF+Helvetica
......
Run Code Online (Sandbox Code Playgroud)

如何在我的机器上获取这些字体?或者是一些我缺少字体的java lib?

java text-mining apache-tika ubuntu-14.04

9
推荐指数
1
解决办法
611
查看次数

获取特定时区中的当前 Instant

我试图在特定时区获取当前实例,但它没有按预期工作。关于如何做到这一点的任何想法?

这是我所做的:

Instant.now(Clock.system(ZoneId.of("America/Los_Angeles"))).truncatedTo(ChronoUnit.SECONDS)
Run Code Online (Sandbox Code Playgroud)

但是,返回的即时时间始终是 UTC。我多次更改 ZoneID 并且总是错误。请指教。

编辑:

我正在与使用 timeStamp 生成日志的应用程序进行交互,我需要对这些事件进行操作。立即,如果我使用特定的时间戳启动我的程序,它应该从该时间戳开始读取事件。虽然我的笔记本电脑与生成这些事件的应用程序在同一个时区,但当我得到 Instant.Now() 时,我似乎在 UTC 中。而应用程序根据我们所在的时区生成时间戳。我希望我的程序的时钟与服务器中的时钟相同。

应用程序生成 2016-08-04T18:17:51Z 形式的时间戳

java scala java-8 java-time

9
推荐指数
1
解决办法
1万
查看次数

Kafka FETCH_SESSION_ID_NOT_FOUND 经常出现在日志中

运行 Kafka 2.3.0、Kafka 客户端 2.1.1,我的经纪人不断输出以下日志:

[2019-09-06 15:18:03,596] INFO [ReplicaFetcher replicaId=1, leaderId=0, fetcherId=0] Node 0 was unable to process the fetch request with (sessionId=1458702821, epoch=538): FETCH_SESSION_ID_NOT_FOUND. (org.apache.kafka.clients.FetchSessionHandler)
[2019-09-06 15:21:11,145] INFO [GroupMetadataManager brokerId=1] Removed 0 expired offsets in 1 milliseconds. (kafka.coordinator.group.GroupMetadataManager)
[2019-09-06 15:22:33,737] INFO [ReplicaFetcher replicaId=1, leaderId=0, fetcherId=0] Node 0 was unable to process the fetch request with (sessionId=1917353656, epoch=538): FETCH_SESSION_ID_NOT_FOUND. (org.apache.kafka.clients.FetchSessionHandler)
[2019-09-06 15:27:03,768] INFO [ReplicaFetcher replicaId=1, leaderId=0, fetcherId=0] Node 0 was unable to process the fetch request with (sessionId=404608404, epoch=538): FETCH_SESSION_ID_NOT_FOUND. …
Run Code Online (Sandbox Code Playgroud)

java apache-kafka

9
推荐指数
1
解决办法
3056
查看次数

监控 Kubernetes Pod 磁盘 IOPS:有相关的导出器吗?

我有一堆有状态集应用程序,特别是 Kafka Brokers 和 Kafka Stream 客户端应用程序,包括一些数据库,全部部署在 Kubernetes 中。我希望能够构建一个 grafana 仪表板,其中包含上述应用程序磁盘上的 IOPS。

有没有办法监视 Pod 的磁盘 IOPS(如果没有)监视运行应用程序的节点的磁盘 IOPS。我们那里有哪些 kubernetes Prometheus 出口商可以给我这些信息?

kubernetes prometheus

9
推荐指数
0
解决办法
1049
查看次数

解释 Haskell 中的柯里化实现

我是一名 Scala 程序员,正在通过“从第一原则开始的 Haskell 编程”学习 Haskell,以使我在 Scala 中使用的函数概念更加一致。

我非常理解柯里化的概念。在 Scala 中很好地实现了它。

但是我不明白作者提供的currying和uncurry的实现:

curry f a b = f (a, b) 
:t curry 
-- curry :: ((t1, t2) -> t) -> t1 -> t2 -> t 

:t fst 
-- fst :: (a, b) -> a 
:t curry fst 
-- curry fst :: t -> b -> t

Run Code Online (Sandbox Code Playgroud)
uncurry f (a, b) = f a b 
:t uncurry 
-- uncurry :: (t1 -> t2 -> t) -> (t1, t2) -> t  
Run Code Online (Sandbox Code Playgroud)

(第 …

haskell scala

9
推荐指数
1
解决办法
341
查看次数

Sbt不会更新本地maven仓库中的快照

我有一个基于maven的项目,我正在使用SBT集成我在Scala中开发的一些库.

目前,SBT项目(我正在开发Lib)有一个快照版本.

虽然快照jar在Ivy中得到了很好的更新,但是当我使用PublishM2时Maven的情况并非如此.我必须删除前一个才能获得我将使用PublishM2发布的新版本.

有没有办法确保我的PublishM2正确更新本地Maven存储库(意味着新快照)?

maven sbt

8
推荐指数
1
解决办法
249
查看次数

Spark 2.3.1结构化流状态存储内部工作

我一直在浏览关于结构化流的spark 2.3.1的文档,但是找不到有关状态存储在状态存储内部如何工作的详细信息。更具体地说,我想知道的是:(1)状态存储区是分布式的吗?(2)如果是,那么每个工人或每个核心如何?

似乎在旧版本的spark中是每个工人,但现在还不知道。我知道它得到了HDFS的支持,但是没有任何东西可以解释内存中存储的实际工作方式。

确实是分布式内存存储吗?我对重复数据删除特别感兴趣,如果数据来自一个大型数据集,那么这需要进行计划,因为所有“不同”数据集最终都将保存在内存中,直到该数据集处理结束。因此,需要根据状态存储的工作方式来计划工作者或主服务器的大小。

没有人有一些信息,指针或建议如何处理吗?

谢谢,Maatari

apache-spark spark-structured-streaming

8
推荐指数
1
解决办法
694
查看次数

有没有办法动态停止 Spark Structured Streaming?

在我的场景中,我有几个数据集时不时出现,我需要在我们的平台中摄取它们。摄取过程涉及几个转换步骤。其中之一是 Spark。到目前为止,我特别使用火花结构化流媒体。基础设施还涉及 kafka,spark 结构化流从中读取数据。

我想知道是否有一种方法可以检测到某个主题在一段时间内没有其他可消费的东西来决定停止工作。那就是我想在消耗该特定数据集所需的时间内运行它,然后停止它。出于特定原因,我们决定不使用 spark 的批处理版本。

因此,是否有任何超时或可用于检测没有更多数据进入并且所有内容都已处理的东西。

谢谢

apache-kafka apache-spark spark-streaming spark-structured-streaming

8
推荐指数
1
解决办法
3468
查看次数