小编eli*_*avs的帖子

将字符串转换为数字

我导入了一个测试文件并尝试制作直方图

pichman <- read.csv(file="picman.txt", header=TRUE, sep="/t")   
hist <- as.numeric(pichman$WS)    
Run Code Online (Sandbox Code Playgroud)

但是,我从数据集中的值得到不同的数字.本来我以为这是因为我有文字,所以我删除了文字:

table(pichman$WS)    
ws <- pichman$WS[pichman$WS!="Down" & pichman$WS!="NoData"]    
Run Code Online (Sandbox Code Playgroud)

但是,我仍然得到很高的数字,有没有人有想法?

string r

96
推荐指数
2
解决办法
34万
查看次数

在闪亮的应用程序上安排任务

我正在使用闪亮的应用程序,作为我项目的一部分,我需要每天从网站上抓取一些数据.
是否可以使用cron或类似工具安排每12小时完成一项工作?
我正在使用免费的闪亮服务器托管服务器

r scheduled-tasks shiny

7
推荐指数
1
解决办法
2844
查看次数

消失的闪亮服务器日志

我想在Digital Ocean上运行一个Shiny应用程序,看起来我的机器上还有空间:

free
              total        used        free      shared  buff/cache   available
Mem:         500096       78316       54188        5712      367592      385688
Swap:             0           0           0
Run Code Online (Sandbox Code Playgroud)

这是我的操作系统设置:

eliavs:/srv/shiny-server# uname -a
Linux ubuntu-eliavs 4.4.0-64-generic #85-Ubuntu SMP Mon Feb 20 11:50:30 UTC 2017 x86_64 x86_64 x86_64 GNU/Linux
Run Code Online (Sandbox Code Playgroud)

尝试连接到App后,我可以看到目录中的日志:

eliavs:/var/log/shiny-server# ls -la
total 12
drwxrwxrwx+ 2 shiny shiny  4096 Feb 27 08:35 .
drwxrwxrwx  8 root  syslog 4096 Feb 27 06:25 ..
-rw-r-----  1 shiny shiny   362 Feb 27 08:35 shiny-server-shiny-20170227-083550-38332.log
Run Code Online (Sandbox Code Playgroud)

当我尝试查看日志时,似乎文件不存在:

cat shiny-server-shiny-20170227-083550-38332.log
cat: shiny-server-shiny-20170227-083550-38332.log: No such file …
Run Code Online (Sandbox Code Playgroud)

logging shiny-server digital-ocean

7
推荐指数
2
解决办法
2749
查看次数

嵌套 json 到 Pandas 非常慢

我正在尝试将 321 个MB嵌套的 json 文件转换为熊猫Dataframe,这花了我长时间,我确信有更快的方法来做到这一点,这是我的代码:

这是数据的样子:

js_dict["data"][0:5]
d = [{'datetime': '2013-01-01T00:00:00+02:00', 'channels': [
{'id': 1, 'name': 'Rain', 'alias': None, 'value': 0.0, 'status': 1, 'valid': True, 'description': None},
{'id': 2, 'name': 'WSmax', 'alias': None, 'value': 7.7, 'status': 1, 'valid': True, 'description': None},
{'id': 3, 'name': 'WDmax', 'alias': None, 'value': 52.0, 'status': 1, 'valid': True, 'description': None},
{'id': 4, 'name': 'WS', 'alias': None, 'value': 5.2, 'status': 1, 'valid': True, 'description': None},
{'id': 5, 'name': 'WD', 'alias': …
Run Code Online (Sandbox Code Playgroud)

python performance json pandas

7
推荐指数
1
解决办法
1174
查看次数

估计威布尔密度参数(误差:"......'vmmin'中的初始值不是有限的")

我试图估计数据集的形状和规模.
我使用了两种不同的方式,两者都收到了错误消息:

首先,我尝试使用survey包时:

survreg(Surv(all.ws)~1, dist="weibull")
Run Code Online (Sandbox Code Playgroud)

我收到了错误消息:

此分布的无效生存时间

其次,我尝试使用fitdistr()功能:

fitdistr(all.ws, densfun=dweibull, start=list(scale=1, shape=2))    
Run Code Online (Sandbox Code Playgroud)

我收到一条错误消息:

optim中的错误(x = c(2.2,2.1,1.9 ....:
'vmmin'中的初始值不是有限的

我在做什么有什么问题?

statistics r weibull

5
推荐指数
1
解决办法
8341
查看次数

使用 R 在 Excel 工作表中创建图表

我正在使用openXLSX包从我的R输出中生成 excel 文件。
我找不到将 excel 图表添加到 excel 工作簿的方法。
我看到它python有一个用于创建 Excel 文件的模块,该模块有一个用于添加 Excel 图表的类。
有没有办法用 R 做到这一点?

excel r

5
推荐指数
2
解决办法
7968
查看次数

类似于excel vlookup

嗨,
我有一个10年,5分钟的粉尘浓度分辨率数据集,
我有一个15年的数据集与天气分类的天气分类我怎么能结合这两个数据集他们不是相同的长度或分辨率
这里是一个数据样本

> head(synoptic)
        date synoptic
1 01/01/1995        8    
2 02/01/1995        7    
3 03/01/1995        7    
4 04/01/1995       20    
5 05/01/1995        1   
6 06/01/1995        1       
>    
head(beit.shemesh)
  X........................ StWd  SHT PRE  GSR RH Temp  WD  WS PM10  CO   O3    
1                        NA   64 19.8   0 -2.9 37 15.2  61 2.2  241 0.9 40.6    
2                        NA   37 20.1   0  1.1 38 15.2 344 2.1  241 0.9 40.3    
3                        NA   36 20.2   0  0.7 39 15.1  32 1.9  241 0.9 39.4    
4 …
Run Code Online (Sandbox Code Playgroud)

lookup r

3
推荐指数
1
解决办法
3290
查看次数

在希伯来语中使用polyglot包进行命名实体识别

我试图在希伯来语中使用多语言包进行命名实体识别.
这是我的代码:

# -*- coding: utf8 -*-
import polyglot
from polyglot.text import Text, Word
from polyglot.downloader import downloader
downloader.download("embeddings2.iw")
text = Text(u"in france and in germany")
print(type(text))
text2 = Text(u"????? ???????? ??? ????")
print(type(text2))
print(text.entities)
print(text2.entities)
Run Code Online (Sandbox Code Playgroud)

这是输出:

<class 'polyglot.text.Text'>
<class 'polyglot.text.Text'>
[I-LOC([u'france']), I-LOC([u'germany'])]
Traceback (most recent call last):
  File "C:/Python27/Lib/site-packages/IPython/core/pyglot.py", line 15, in <module>
    print(text2.entities)
  File "C:\Python27\lib\site-packages\polyglot\decorators.py", line 20, in __get__
    value = obj.__dict__[self.func.__name__] = self.func(obj)
  File "C:\Python27\lib\site-packages\polyglot\text.py", line 132, in entities
    for i, (w, tag) in enumerate(self.ne_chunker.annotate(self.words)):
  File "C:\Python27\lib\site-packages\polyglot\decorators.py", …
Run Code Online (Sandbox Code Playgroud)

python nlp polyglot named-entity-recognition

3
推荐指数
1
解决办法
1422
查看次数

自动清理坏数据

我正在构建一个使用闪亮和露天的应用程序来分析风数据.
现在,在用户上传之前,需要"清理"数据.我有兴趣自动这样做.有些数据是空的,有些不是数字,所以不可能建立风玫瑰.我想要:

    1.估计有多少数据不是数字
    2.将其删除并仅保留数字数据

这里是一个数据的例子:
"NO2.mg"被读作一个因素,而不是int因为它不仅仅包含数字
OK
这里是一个可重现的例子:

no2<-factor(c(5,4,"c1",54,"c5",seq(2:50)))
no2
[1] 5  4  c1 54 c5 1  2  3  4  5  6  7  8  9  10 11 12 13 14
[20] 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
[39] 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
52 Levels: 1 10 11 12 13 14 15 16 17 18 19 …
Run Code Online (Sandbox Code Playgroud)

r shiny openair

2
推荐指数
1
解决办法
498
查看次数