小编Ann*_*nna的帖子

oracle中有没有类似于mysql中的group_concat的函数?

我的投入是这样的.

col1   col2
1      a
1      b
2      c
2      d
2      e
Run Code Online (Sandbox Code Playgroud)

O/p:应该是这样的

col1    col2
1       a,b
2       c,d,e
Run Code Online (Sandbox Code Playgroud)

我想要一个可以在DB级别触发的查询.我尝试了各种各样的方法,但未能做到这一点......

sql oracle

48
推荐指数
1
解决办法
7万
查看次数

如何解释不同的ggplot2密度?

我对geom_densityggplot中以下变种的含义感到困惑:

有人可以解释这四个电话之间的区别:

  1. geom_density(aes_string(x=myvar))
  2. geom_density(aes_string(x=myvar, y=..density..))
  3. geom_density(aes_string(x=myvar, y=..scaled..))
  4. geom_density(aes_string(x=myvar, y=..count../sum(..count..)))

我的理解是:

  • geom_density 单独产生密度,其曲线下面积总和为1
  • geom_density..density..基本相同...?
  • ..count../sum(..count..)将正常化峰高更像一个标准化直方图,以确保所有的高度之和为1
  • 如果..count..没有分母,则只需将每个bin乘以其中的项目数
  • ..scaled..参数将使它这样的密度的最大值为1.

我发现..scaled..非常违反直觉,如果我对它的解释是正确的,我从未见过它,所以我想忽略它.我主要是在寻找澄清之间的差异geom_density和一种归一化密度图,我假设需要...count../...参数.谢谢.

(相关:ggplot2将变量映射到y并使用stat ="bin"时出错)

r ggplot2

18
推荐指数
1
解决办法
8184
查看次数

如何在sql中生成随机的十六进制颜色?

对我来说这是一个非常难的话题,因为SQL不是我最好的技能;)

我必须将随机的十六进制颜色插入数据库行.我该怎么做?是否可以创建绘制数字的函数?

sql random hex

17
推荐指数
3
解决办法
8909
查看次数

我无法在R中下载reshape2包

我在尝试安装R包时收到此响应:

>installed.packages("reshape2")
     Package LibPath Version Priority Depends Imports LinkingTo Suggests Enhances
     License License_is_FOSS License_restricts_use OS_type Archs MD5sum
     NeedsCompilation Built
Run Code Online (Sandbox Code Playgroud)

R版本3.2.2(2015-08-14)平台:x86_64-w64-mingw32/x64(64位)运行于:Windows 8 x64(build 9200)

install r package reshape2

11
推荐指数
1
解决办法
1万
查看次数

区别与独特之间的区别

使用dplyr考虑到R distinctuniqueR 之间有什么区别:

  • 速度
  • 功能(有效输入,参数等)和使用
  • 产量

例如:

library(dplyr)
data(iris)

# creating data with duplicates
iris_dup <- bind_rows(iris, iris)

d <- distinct(iris_dup)
u <- unique(iris_dup)

all(d==u) # returns True
Run Code Online (Sandbox Code Playgroud)

在该示例中distinct并且unique执行相同的功能.有没有时间你应该使用一个而不是另一个?是否有任何技巧或常用?

r dplyr

10
推荐指数
2
解决办法
1万
查看次数

在给定的时间后杀死函数?

在 Python 中给定时间后终止函数(仍在运行)的最佳方法是什么?这是我目前发现的两种方法:

说这是我们的基本功能:

import time
def foo():
    a_long_time = 10000000
    time.sleep(a_long_time)

TIMEOUT = 5 # seconds
Run Code Online (Sandbox Code Playgroud)

1. 多处理方法

import multiprocessing

if __name__ == '__main__':
    p = multiprocessing.Process(target=foo, name="Foo")
    p.start()

    p.join(TIMEOUT)

    if p.is_alive()
        print('function terminated')
        p.terminate()
        p.join()
Run Code Online (Sandbox Code Playgroud)

2. 信号方法

import signal

class TimeoutException(Exception):
    pass

def timeout_handler(signum, frame):
    raise TimeoutException

signal.signal(signal.SIGALRM, timeout_handler)


signal.alarm(TIMEOUT)    
try:
    foo()
except TimeoutException:
    print('function terminated')
Run Code Online (Sandbox Code Playgroud)

这两种方法在范围、安全性和可用性方面的优缺点是什么?有没有更好的办法?

python multithreading signal-processing timer

7
推荐指数
1
解决办法
1万
查看次数

使用 Google-Drive-API 移动文件

是否可以通过 python 的 googleapiclient 模块显式移动文件?我想创建以下函数,给定文件、原始路径和目标路径:

def move_file(service, filename, init_drive_path, drive_path, copy=False):
    """Moves a file in Google Drive from one location to another.

    service: Drive API service instance.
    filename (string): full name of file on drive
    init_drive_path (string): initial file location on Drive
    drive_path (string): the file path to move the file in on Drive
    copy (boolean): file should be saved in both locations

    Returns nothing.
    """
Run Code Online (Sandbox Code Playgroud)

目前我一直通过手动下载文件然后将其重新上传到所需位置来执行此操作,但是这对于大文件来说并不实用,无论如何似乎都是一种解决方法。

这是google-drive-api 上可用方法的文档


编辑请参阅下面的解决方案:

python google-api-client google-api-python-client

4
推荐指数
1
解决办法
3250
查看次数

在 R 中的 ggplot2 和 ggfortify 中标记图例

我绘制了一个图表并想要自定义该图的图例。我将感谢所有对此的帮助。谢谢!

library("survival")
library("ggplot2")
library("ggfortify")

data(lung)
lung$SurvObj <- with(lung, Surv(time, status == 2))
km.by.sex <- survfit(SurvObj ~ sex, data = lung, conf.type = "log-log")

gender.plot <- autoplot(km.by.sex)
gender.plot <- gender.plot + 
  ggtitle("Gender based Survival (1=male, 2=female)") +
  labs(x = "Time", y = "Survival Probability") 
print(gender.plot)
Run Code Online (Sandbox Code Playgroud)

r ggplot2 survival-analysis ggfortify

3
推荐指数
1
解决办法
7928
查看次数

在R中,使用melt(),如何隐藏警告消息?

我正在融化一些数据,并且不想提供一个id.var参数来融化.数据融化得很好,但我得到了

"No id variables; using all as measure variables"
Run Code Online (Sandbox Code Playgroud)

有没有办法防止该消息出现,或者说id.var = default或类似的方式?使用dplyr的虹膜示例:

> dt <- iris %>% summarize_at(c("Sepal.Length","Sepal.Width"), funs(mean))
> dt
  Sepal.Length Sepal.Width
1     5.843333    3.057333
> melt(dt, value.name="Mean")
No id variables; using all as measure variables
      variable     Mean
1 Sepal.Length 5.843333
2  Sepal.Width 3.057333
Run Code Online (Sandbox Code Playgroud)

或者有没有办法告诉函数不打印警告消息或类似的东西?谢谢!

r melt reshape2

3
推荐指数
1
解决办法
972
查看次数

收到错误OpenCV(3.4.1)C:\ projects \ opencv-python \ opencv \ modules \ imgproc \ src \ thresh.cpp:1406:错误:(-215)

我运行了以下代码,但出现错误

OpenCV(3.4.1)C:\ projects \ opencv-python \ opencv \ modules \ imgproc \ src \ thresh.cpp:1406:错误:(-215)src.type()==((((0)&(( 1 << 3)-1))+((((1)-1)<< 3))在函数cv :: threshold中

我不清楚这意味着什么以及如何解决它

import numpy as numpy
from matplotlib import pyplot as matplot
import pandas as pandas
import math
from sklearn import preprocessing
from sklearn import svm
import cv2

blur = cv2.GaussianBlur(img,(5,5),0)
ret3,th3 = cv2.threshold(blur,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
image = numpy.invert(th3)
matplot.imshow(image,'gray')
matplot.show()
Run Code Online (Sandbox Code Playgroud)

python opencv

3
推荐指数
1
解决办法
9057
查看次数

使用R在Excel工作表中清理数据

我有Excel表格中的数据,我需要一种方法来清理它.我想删除不一致的值,如分支名称被指定为(计算机科学与工程,CSE,CS,计算机科学).那么我怎样才能将它们全部带入单一符号?

excel r

1
推荐指数
1
解决办法
3038
查看次数