小编Swa*_*air的帖子

机器学习服务器日志数据

我最近获得了大量的服务器日志数据(在新工作中).我在大学的机器学习方面有一些经验.日志数据包括服务器日志,数据库访问日志等.我想知道从这样的数据可以做什么样的学习.

我尝试过的一件小事就是根据过去一周的数据预测当天某个小时的请求数量,这似乎没问题,但这有点微不足道.所以,

  • 从这些数据中可以做什么样的学习?
    • 可预测的IP上的广告做点击垃圾邮件的概率(是该公司成)根据以往的垃圾邮件发送者的一些使用模式?
    • 可能预测交通可能会在什么时候出现.
  • 是否有任何专门利用的现有工具/项目?
  • 任何有趣的资源/论文谈论类似的东西?
  • 此外,数据在服务器上超过特定时间的过程活动.这对学习有用吗?

logging machine-learning

14
推荐指数
1
解决办法
1万
查看次数

strace tmux输出重定向到文件

我想检查tmux在启动时触摸哪些文件(而不仅仅是tmux运行时打开文件的列表).Strace tmux似乎是最好的选择.

尝试将输出重定向到文件时strace tmux > /tmp/blah.文件为空.

为什么会这样?如何将跟踪重定向到文件?

io-redirection strace

8
推荐指数
2
解决办法
9638
查看次数

Python快速排序 - 列表理解与递归(分区例程)

我看了三个美丽的Quicksorts谈话,并且正在忙着赶快行动.我在python中的实现与c非常相似(选择pivot,围绕它进行分区并在越来越大的分区上递归).我认为这不是pythonic.

所以这是在python中使用list comprehension的实现.

def qsort(list):
    if list == []: 
        return []
    pivot = list[0]
    l = qsort([x for x in list[1:] if x < pivot])
    u = qsort([x for x in list[1:] if x >= pivot])
    return l + [pivot] + u
Run Code Online (Sandbox Code Playgroud)

让我们调用递归方法qoortR.现在我注意到qsortR比大型(r)列表的qsort运行慢得多.实际上"cmp中超出了最大递归深度",即使对于递归方法也是1000个elems.我在sys.setrecursionlimit中重置.

一些数字:

list-compr 1000 elems 0.491770029068
recursion 1000 elems 2.24620914459
list-compr 2000 elems 0.992327928543
recursion 2000 elems 7.72630095482
Run Code Online (Sandbox Code Playgroud)

所有代码都在这里.

我有一些问题:

  • 为什么列表理解这么快?
  • 对python中递归限制的一些启示.我首先将它设置为100000,在什么情况下我应该小心?
    • ('优化尾递归'究竟是什么意思,它是如何完成的?)
  • 试图对我的笔记本电脑的1000000个元素进行排序(使用递归方法).如果我想要排序这么多元素,我该怎么办?什么样的优化是可能的?

python sorting optimization tail-recursion quicksort

7
推荐指数
1
解决办法
7465
查看次数

服务器上 CPU 密集型和 IO 密集型进程的多进程与多线程

我有一台 16 核和 32G 内存的服务器。对于像 那样的进程apache,它为每个新连接产生一个新线程,以下哪个替代方案更好,为什么?在应用程序的情况下也会发生什么cassandra。如果 cassandra 有大量的内存写入,这意味着在同一台机器上有两个“节点”会有什么好处?

  1. 同一应用程序的多个(例如,两个)实例在同一台机器上运行并在两个不同的端口上提供服务。(可能是本机前面不同机器上的LB)。

    我很困惑操作系统将如何处理多线程应用程序的两个实例。这两个进程都会在所有内核上运行线程吗?在什么情况下会发生上下文切换(在进程和线程之间)以及它将如何影响性能?

  2. 在一个端口上服务的多线程应用程序的单个实例。

对于像 cassandra 这样的应用程序,其中线程将拥有共享内存以供写入,线程之间何时会发生上下文切换?

multithreading operating-system multiprocessing cassandra

5
推荐指数
1
解决办法
6884
查看次数

从 swift 数组创建张量

这工作正常:

import TensorFlow
var t = Tensor<Float>([[1, 0], [0, 1]])
Run Code Online (Sandbox Code Playgroud)

但以下给出了错误

import TensorFlow
var a = [[1, 0], [0, 1]]
var t = Tensor<Float>(a)
Run Code Online (Sandbox Code Playgroud)
error: expression type 'Tensor<Float>' is ambiguous without more context
var t = Tensor<Float>(a)
        ^~~~~~~~~~~~~~~~
Run Code Online (Sandbox Code Playgroud)

为什么会出现这种情况?另外,如何快速从数组创建张量。

swift tensorflow swift-for-tensorflow

3
推荐指数
1
解决办法
635
查看次数

函数类型('a - >'a) - > int - >'a - >'a和('a - >'a) - > int - >('a - >'a)之间有什么区别?

当我写一个Ocaml函数以递归方式组合相同的函数n次时,我这样做了:

let rec compose f n = 
  (fun x -> if n = 1 then f x else ((compose f (n-1))) (f x));; 
Run Code Online (Sandbox Code Playgroud)

它给出了类型

val compose : ('a -> 'a) -> int -> 'a -> 'a = <fun>
Run Code Online (Sandbox Code Playgroud)

类型有什么区别

('a -> 'a) -> int -> 'a -> 'a
Run Code Online (Sandbox Code Playgroud)

并输入

('a -> 'a) -> int -> ('a -> 'a)
Run Code Online (Sandbox Code Playgroud)

类似的组合函数如何看待后一种类型?

ocaml type-systems functional-programming

1
推荐指数
1
解决办法
119
查看次数