小编jef*_*rey的帖子

如何在Shiny中更改"超出最大上载大小"限制并保存用户文件输入?

我最近了解到R Shiny程序默认情况下对文件上传施加了最大大小限制(我不知道大小究竟是什么,但我猜它是5,000 KB).我想删除这个限制.我怎么能这样做,对于用户上传的大小有什么一般的经验法则?

此外,这是另一个注意事项,但相关:如何通过用户BY会话保存输入?例如,应用程序中会有一个文件提示符,用户可以在其中上传文件.然后,当用户选择要显示的文件时,他可以在他上传的文件中进行选择.如果他退出会话,清单就会清除.

r shiny

75
推荐指数
1
解决办法
2万
查看次数

有没有办法检查列是否是R中的日期?

这是对这个问题的伪跟进:为什么ggplot绘制空百分比数据点?

假设这是我的数据集:

Date        AE      AA      AEF     Percent
1/1/2012    1211    1000    3556    0.03
1/2/2012    100     2000    3221    0.43
1/3/2012    3423    10000   2343    0.54
1/4/2012    10000   3000    332     0.43
1/5/2012    2342    500     4435    0.43
1/6/2012    2342    800     2342    0.23
1/7/2012    2342    1500    1231    0.12
1/8/2012    111     2300    333 
1/9/2012    1231    1313    3433    
1/10/2012   3453    5654    222 
1/11/2012   3453    3453    454 
1/12/2012   5654    7685    3452 

> str(data)
'data.frame':   12 obs. of  5 variables:
 $ Date   : Factor w/ 12 levels "10/11/2012","10/12/2012",..: 1 …
Run Code Online (Sandbox Code Playgroud)

r

18
推荐指数
4
解决办法
3万
查看次数

Scikit-Learn线性回归如何获得系数的各自特征?

我正在尝试通过评估我的回归系数输出来执行特征选择,并选择具有最高幅度系数的特征.问题是,我不知道如何获得相应的功能,因为只有系数从coef._属性返回.文件说:

线性回归问题的估计系数.如果在拟合期间传递多个目标(y 2D),则这是形状的二维数组(n_targets,n_features),而如果仅传递一个目标,则这是长度为n_features的一维数组.

我传入了我的regression.fit(A,B),其中A是一个二维数组,文档中每个特征的tfidf值.示例格式:

         "feature1"   "feature2"
"Doc1"    .44          .22
"Doc2"    .11          .6
"Doc3"    .22          .2
Run Code Online (Sandbox Code Playgroud)

B是我的数据目标值,它们只是与每个文档相关的数字1-100:

"Doc1"    50
"Doc2"    11
"Doc3"    99
Run Code Online (Sandbox Code Playgroud)

使用regression.coef_,我得到一个系数列表,但不是它们的相应特征!我怎样才能获得这些功能?我猜我需要修改B目标的结构,但我不知道如何.

linear-regression feature-selection scikit-learn

16
推荐指数
5
解决办法
4万
查看次数

如何创建一个空的java.util.UUID对象?

我不知道为什么我找不到这个答案,但我需要在我的一个函数中传递一个空白的UUID对象来表示缺少UUID.什么是UUID的类似形式

val x: "" 
Run Code Online (Sandbox Code Playgroud)

,这将是一个空字符串.我本质上是想获得一个空的UUID.我试过了

UUID.fromString("")
Run Code Online (Sandbox Code Playgroud)

但收到错误,因为您需要一个有效的UUID字符串.

编辑:我在Scala中实现这一点.

java uuid scala

12
推荐指数
2
解决办法
1万
查看次数

为什么我的生产ELK堆栈+机器规格需要经纪人?

我最近提出了一个测试ELK堆栈的Ubuntu盒来测试功能,并对它非常满意.我的生产用例将涉及每天摄取至少100GB的日志.我想尽可能地扩展,因为我们有更多的日志源,这100GB /天可以快速上升.

我读了一些关于ELK制作的文章,包括幻想的Logz.io ELK部署.虽然我对我需要做的事情有一个大概的了解,但我不确定一些核心概念,我需要多少台机器才能获得如此大量的数据,以及我是否需要像我的架构中包含Redis这样的经纪人.

像Redis这样的经纪人有什么意义?在我的测试实例中,我有多个日志源通过TCP,syslog和logstash转发器将日志直接发送到我的Logstash直接在我的ELK服务器上(其中安装了Elasticsearch,Nginx和Kibana,配置了SSL).

为了保持高可用性,最先进的生产集群,我每天至少需要100GB数据的机器+规格,未来可能会扩展到150GB或更多?我正计划使用自己的服务器.根据我的研究,起点应该像(假设我包括Redis):

  • 每个服务器具有Redis + Logstash(索引器)实例的2/3服务器.对于规格,我在考虑32GB RAM,快速I/O磁盘500GB可能是SSD,8核(i7)
  • Elasticsearch的3台服务器(这是我最不确定的) - 我知道我需要至少3个主节点和2个数据节点,因此2个服务器将拥有1个主/ 1个数据 - 这些将是强大的64GB RAM ,20TB,8芯.其他剩余的主节点可以在低规格机器上,因为它不处理数据.
  • Nginx/Kibana的2台服务器 - 这些应该是低规格的机器,因为它们只是Web服务器和UI.这里需要负载均衡器吗?

编辑:计划将日志保留60天.

redis elasticsearch logstash kibana

7
推荐指数
1
解决办法
3326
查看次数

如何在R Shiny中增加ggplot2图形的绝对大小?

我有一个R Shiny应用程序,它接收用户csv文件并绘制csv文件的图形.

我的R Shiny程序正在使用tabsetPanel,这比我想要的更多地缩小了图形.

我可以添加ggplot()中的属性来增加图形的大小吗?

我还注意到,当我尝试在选项卡中绘制多个图形时,我只能使用2行图形,因为UI的高度有限.我怎么能延长这个?

现在我有一个标签,但我打算稍后再添加.

这是我的代码:

ui.R

dataset <- list('Upload a file'=c(1))

shinyUI(pageWithSidebar(

  headerPanel(''),

  sidebarPanel(

     wellPanel(
        fileInput('file', 'Data file'),
        radioButtons('format', 'Format', c('CSV', 'TSV'))
      ),

     wellPanel(
          selectInput('xMulti', 'X', names(dataset)),
          selectInput('yMulti', 'Y', names(dataset),  multiple=T)

                                                   )

      wellPanel(
          checkboxInput('normalize', 'Normalize y axes', value=TRUE)
      ),


      wellPanel(
          sliderInput("cols", 
           "Plots per row", 
           min = 1, 
           max = 4, 
           value = 2
          )
      )
  )

  mainPanel( 
      tabsetPanel(
          tabPanel("Multiplot", plotOutput('plotMulti'), value="multi"),
           id="tsp"            #id of tab
           )


  )
))
Run Code Online (Sandbox Code Playgroud)

server.R

library(reshape2)
library(googleVis)
library(ggplot2)

#Increase max upload size 
options(shiny.maxRequestSize=-1) …
Run Code Online (Sandbox Code Playgroud)

r ggplot2 shiny

6
推荐指数
1
解决办法
8581
查看次数

芹菜工人失去了心跳,并在Ec2上获得了大量漂移

我现在正在测试我的芹菜实施超过3台ec2机器.我现在对我的实现非常有信心,但是我遇到了实际的工作执行问题.我的测试结构如下:

  • 1台ec2机器被指定为经纪人,也经营一名芹菜工人
  • 1 ec2机器被指定为客户端(运行客户端芹菜脚本,使用.delay()排队所有任务,也运行芹菜工人
  • 1台ec2机器纯粹是一名工人.

所有机器都有1名芹菜工人在运行.之前,我立即得到了这样的信息:

"来自芹菜@ [其他ec2 ip]的大幅度漂移可能意味着时钟不同步." 然后将打印以秒为单位的漂移量,这将随着时间的推移而增加.我也会收到消息:"从芹菜@ [其他ec2 ip]错过了心跳.

此时机器将完成很少的工作,因此我的ec2中的AutoScaling配置会在cpu利用率水平非常低(<5%)时自动关闭实例

因此,为了尝试解决这个问题,我尝试使用此命令同步我所有机器的时钟(虽然我认为芹菜处理了这个),该命令是在所有机器启动时执行的:

apt-get -qy install ntp
service ntp start
Run Code Online (Sandbox Code Playgroud)

有了这个,他们都表现良好,大约10分钟没有故障,之后我开始错过心跳,我的ec2实例停滞并关闭.奇怪的是,漂移有时增加然后减少.

对于为什么会发生这种情况的任何想法?

我正在使用最新版本的芹菜(3.1)和rabbitmq

编辑:应该注意的是,我在ec2上使用us-west-1a和us-west-1c可用区.

编辑2:我开始认为记忆问题可能是一个问题.我正在使用t2.micro实例,并且在同一台机器上运行3个芹菜工人(只有1个实例),这也是经纪人,仍然导致心跳未命中和失速.

rabbitmq celery django-celery

5
推荐指数
0
解决办法
3306
查看次数

HTTP 标头的字段值中可以包含冒号吗?

我最近一直在处理 HTTP 标头。我正在根据 RFC 规定的冒号分隔从 HTTP 标头请求中解析字段和值。在蟒蛇中:

header_request_line.split(":")
Run Code Online (Sandbox Code Playgroud)

但是,如果值字段中允许使用冒号,则会出现问题。考虑:

User-Agent: Mozilla:4.0
Run Code Online (Sandbox Code Playgroud)

这将被分成 3 个字符串,而不是我想要的 2 个。

http rfc http-headers

5
推荐指数
1
解决办法
5785
查看次数

如何将文本文件转换为CoNLL格式的麦芽解析器?

我正在尝试使用预制英语模型的麦芽解析器.但是,我不知道如何将英文句子的文本语料库转换为Malt Parser操作所必需的CoNLL格式.我在网站上找不到任何文档.我该怎么办呢?

更新.我指的是这个帖子Create .conll文件作为Stanford Parser的输出来创建一个.conll.但是,这是使用Stanford Parser.

parsing nlp pos-tagger stanford-nlp

5
推荐指数
1
解决办法
5728
查看次数

如何在tilemap中获得瓷砖的x,y坐标位置?

我刚刚开始习惯于使用Unity的新tilemap工具(UnityEngine.Tilemaps)。

我遇到的一个问题是我不知道如何通过脚本获取放置的图块的x,y坐标。我正在尝试将脚本中的tilemap上的scriptableObject移动到播放器单击的新位置,但是我不知道如何获取所单击的tile位置的坐标。Tile类似乎没有任何position属性(Tile对其位置一无所知),因此Tilemap必须具有答案。我无法在Unity文档中找到有关如何在Tilemap中获取所选图块的Vector3坐标的任何信息。

unity-game-engine

5
推荐指数
2
解决办法
9055
查看次数