小编Ben*_*gal的帖子

如何在Web应用程序中集成R.

我正在开发一个Web应用程序,我想执行两种统计/建模操作.

(1)根据存储在我的app(HBase集群)后端的数据进行批量分析.通常,这种操作需要定期进行,比如每晚.数据的大小可能超过可以存储在本地内存中的数据,因此可能需要调用某些支持并行计算的程序包.(2)由前端用户请求触发的动态R执行.典型用例包括小时间序列的预测.用户可以在同一时间发出请求,因此应该支持并发.性能至关重要,因为用户不能无限期地等待响应.

我的问题是:解决这两个问题的技术/ CRAN包的最佳组合是什么？我现在的想法是:

将Rserver与Ruby客户端结合使用.或者,我正在考虑用Java编写自己的服务器并使用现有的R/Java绑定.
使用RHadoop处理大数据集上的作业.

我看到RevoDeployR是一个很棒的工具,但不是开源的,不是吗？

谢谢您的帮助

analytics web-services r

Ben*_*gal

lucky-day

13
推荐指数

1
解决办法

1万
查看次数

Django 不重用 CONN_MAX_AGE=60 的 MySQL 连接

我在开发中使用 Django 1.9.2 ( DEBUG=True) 和 MySQL 5.6.23。以下是我的数据库设置

DATABASES = {
    'default': {
        'ENGINE': 'django.db.backends.mysql',
        'NAME': 'dbname',
        'USER': "django",
        'PASSWORD': 'password',
        'HOST': 'localhost',
        'PORT': '3306',
        'CONN_MAX_AGE': 60,
    }
}

Run Code Online (Sandbox Code Playgroud)

我正在使用以下命令查询 MySQL 以获取活动连接数：

show status where `variable_name` = 'Threads_connected';

Run Code Online (Sandbox Code Playgroud)

它产生这样的结果

+-------------------+-------+
| Variable_name     | Value |
+-------------------+-------+
| Threads_connected | 10    |
+-------------------+-------+
1 row in set (0,00 sec)

Run Code Online (Sandbox Code Playgroud)

每次我向 Django 发出新请求时，连接的线程数都会增加，直到我(1040, 'Too many connections')得到Threads_connected=151. 此外，60 秒后连接不会关闭。

这种行为在生产中似乎不会发生（DEBUG=False）。

python mysql django

Ben*_*gal

lucky-day

6
推荐指数

1
解决办法

2861
查看次数

org.joda.time.DateTimeFormat线程安全吗？

我在对象中有一个org.joda.time.DateTimeFormat的实例:

   object TimeRange {
    lazy val dateFormat = DateTimeFormat.forPattern("YYYY-MM-dd")
   }

Run Code Online (Sandbox Code Playgroud)

我的API是异步的(使用Finagle Future),不同的线程可能希望使用函数dateFormat.parseDateTime("2013-07-01")访问我的dateFormat格式化日期.我的问题是:我怎么能确定这个方法调用是线程安全的？我们可以假设没有副作用的所有方法调用都是线程安全的吗？它取决于DateTimeFormat的具体实现吗？

谢谢,

concurrency scala jodatime

Ben*_*gal

lucky-day

3
推荐指数

1
解决办法

1583
查看次数