基于我之前提出的一个问题,@ Andrie回答说,我对cut函数和标签的使用有疑问.
我想根据用户登录的次数获取摘要统计信息.
这是我的数据:
# Get random numbers
NumLogin <- round(runif(100,1,50))
# Set the login range
LoginRange <- cut(NumLogin,
c(0,1,3,5,10,15,20,Inf),
labels=c('1','2','3-5','6-10','11-15','16-20','20+')
)
Run Code Online (Sandbox Code Playgroud)
现在我有了我的LoginRange,但我不确定该cut函数是如何工作的.我想找到已登录1次,2次,3-5次等的用户,同时仅包括用户,如果他们在该范围内.是cut包括3两次(在2桶和3-5桶)功能?如果我查看我的示例,我可以看到登录3次的用户,但他们是cut'2'.我查看了文档和R我拥有的每本书,但没有运气.我究竟做错了什么?
另外 - 作为使用问题 - 我应该将LoginRange附加到我的数据框吗?如果是这样,最好的方法是什么?
DF <- data.frame(NumLogin, LoginRange)
Run Code Online (Sandbox Code Playgroud)
?
谢谢
我需要在列中找到所有特殊字符的出现位置SQL Server 2008.所以,我不在乎A, B, C ... 8, 9, 0,但我确实在意!, @, &,,等等.
在我看来,最简单的方法就是排除A, B, C, ... 8, 9, 0,但如果我写了一个声明来排除这些,我会错过那些有!和的条目A.因此,在我看来,我必须获得每个非字母/非数字字符的列表,然后SELECT使用a LIKE和Wildcard限定符运行.
这是我要运行的:
SELECT Col1
FROM TABLE
WHERE Col1 LIKE ('!', '@', '#', '$', '%'....)
Run Code Online (Sandbox Code Playgroud)
但是,我不认为你可以运行多个限定符,可以吗?有没有办法可以做到这一点?
这是一个初学者python安装问题.这是我第一次尝试安装和调用包.我已经pip安装了,我试图安装两个模块 - numpy和pandas.
在终端中,我运行了以下命令:
sudo pip install numpy
sudo pip install pandas
Run Code Online (Sandbox Code Playgroud)
两个命令都返回成功消息.这是pandas成功消息(它是我安装的第二个包,仍然在我的终端历史记录中):
Successfully installed pandas
Cleaning up...
Run Code Online (Sandbox Code Playgroud)
pipnumpy安装后返回类似的消息.
现在,当我启动python并尝试调用它时:
import pandas
Run Code Online (Sandbox Code Playgroud)
我收到此错误消息:
Run Code Online (Sandbox Code Playgroud)Traceback (most recent call last): File "<stdin>", line 1, in <module> ImportError: No module named pandas
当我尝试时也一样numpy.
谁能告诉我我做错了什么?
applescript当Outlook中有新消息时,我正在尝试修改一个触发咆哮通知的内容.原始脚本在这里.
在我的if陈述中,我试图说,如果文件夹是已删除邮件,垃圾邮件或已发送邮件,请不要触发通知.
这是声明:
if folder of theMsg is "Junk E-mail" or "Deleted Items" or "Sent Items" then
set notify to false
else
set notify to true
end if
Run Code Online (Sandbox Code Playgroud)
看来applecript不喜欢我添加的多个/或项目.有没有办法包含多个条件,还是我需要编写嵌套的if/then?
我知道,R装有自动一些调色板,如palette,rainbow,heat.colors和gray.我也知道RColorBrewer.但是,如果我想使用自定义调色板并按名称指定颜色,该怎么办?那可能吗?
我公司的调色板如下:
#1A73BA (R: 26 G: 115 B: 186) - this is a blue
#FFDB43 (R:255 G:219 B:67) - this is a yellow
#B54B05 (R:181 G:75 B:5) - this is an orange
Run Code Online (Sandbox Code Playgroud)
我公司的名字缩写是AT.
我希望能够通过名称而不是HEX或RGB来调用这些颜色,因为我不记得它们.理想情况下,我可以创建一个自动加载到R中的文件来启动这些颜色.
ATBlue <- #1A73BA
ATYellow <- #FFDB43
ATOrange <- #B54B05
Run Code Online (Sandbox Code Playgroud)
然后,我可以调用颜色:
plot(x,y, col = "ATBlue")
Run Code Online (Sandbox Code Playgroud)
我可以将值放入数据帧,然后像这样调用它们:
ATColors <- data.frame(name = c("ATBlue", "ATYellow", "ATOrange"), color= c("#1A73BA", "#F7D364", "#B54B05"))
plot(x,y, col = ATColors[3,2])
Run Code Online (Sandbox Code Playgroud)
但我需要知道数据框中的位置才能正确调用它.
我可以创建一个元素,当R启动时会自动加载,这样我就可以将自定义颜色名称调用到图中吗?
我开始学习如何在Python中进行数据分析.
在R中,您可以将数据加载到内存中,然后将变量保存到.rdata文件中.
我正在尝试创建一个分析"项目",所以我可以加载数据,存储脚本,然后保存输出,以便我可以在需要时调用它.
Python中是否有等效函数?
谢谢
在SQL Server中,您可以应用该use函数将查询指向另一个数据库.例如:
USE databasename
GO;
是否有一个函数允许您指向不同的数据库服务器并在该服务器上使用数据库?我希望这可行,但没有运气:
USE [servername].databasename
GO;
我知道我可以将查询指向另一台服务器上的数据库,但是当我处理生产与登台环境时,在查询开始时声明服务器和数据库会更有效.
谢谢
在我的控制器中我有:
@konkurrencer = Rating.new(params[:kon])
@konkurrencer.save
@konkurrencer.konkurrencer.rating_score += params[:kon][:ratings].to_i
@konkurrencer.konkurrencer.ratings += 1
@konkurrencer.created_at = Time.now.strftime("%Y-%m-%d 00:00:00")
@konkurrencer.save
Run Code Online (Sandbox Code Playgroud)
当我创建一个新项时,created_at列是:
2012-02-27 16:35:18
Run Code Online (Sandbox Code Playgroud)
我希望它是:
2012-02-27 00:00:00
Run Code Online (Sandbox Code Playgroud) 使用ggplot2,我想创建一个直方图,其中X以上的任何内容都被分组到最终的bin中.例如,如果我的大多数发行版都在100到200之间,并且我希望以10分为单位,那么我希望将200以上的任何内容分成"200+".
# create some fake data
id <- sample(1:100000, 10000, rep=T)
visits <- sample(1:1200,10000, rep=T)
#merge to create a dataframe
df <- data.frame(cbind(id,visits))
#plot the data
hist <- ggplot(df, aes(x=visits)) + geom_histogram(binwidth=50)
Run Code Online (Sandbox Code Playgroud)
如何限制X轴,同时仍然表示我想要限制的数据?
我想查看TimeSeries各个时间段内每个客户的数据Pandas.
import pandas as pd
import numpy as np
import random
clients = np.random.randint(1, 11, size=100)
dates = pd.date_range('20130101',periods=365)
OrderDates = random.sample(dates,100)
Values = np.random.randint(10, 250, size=100)
df = pd.DataFrame({ 'Client' : clients,'OrderDate' : OrderDates, 'Value' : Values})
df = df.sort(['OrderDate', 'Client'], ascending=['True', 'True'])
df.head()
Run Code Online (Sandbox Code Playgroud)
我想要完成的是获取"值"列的计数和总和,按"客户"分组各个时间段(每月,每季度,每年 - 我可能会为此数据构建3个不同的数据帧,然后制作数据帧"广泛").
对于季度,我希望这样的事情:
Client OrderDate NumberofEntries SumofValues
1 2013-03-31 7 28
1 2013-06-30 2 7
1 2013-09-30 6 20
1 2013-12-31 1 3
2 2013-03-31 1 4
2 2013-06-30 2 …Run Code Online (Sandbox Code Playgroud) r ×4
python ×3
pandas ×2
sql-server ×2
applescript ×1
colors ×1
ggplot2 ×1
histogram ×1
numpy ×1
ruby ×1