小编Pat*_*bug的帖子

使用ggplot()在同一个绘图上绘制多个时间序列

我是R的新手,我试图同时绘制两个时间序列线(当然使用不同的颜色),使用ggplot2.

我有2个数据帧.第一个具有'X'和'日期'列的百分比变化.第二个也有'Y'和'Date'列的百分比变化,即两个都有一个'Date'列具有相同的值,而'Percent Change'列有不同的值.

我想在单个图上使用ggplot2将'Percent Change'列与'Date'(两者共有)绘制.

我在网上找到的例子使用了具有不同变量的相同数据框来实现这一点,我无法找到任何利用2个数据帧来绘制图的东西.我不想将两个数据框绑定在一起,我想将它们分开.这是我正在使用的代码:

ggplot(jobsAFAM, aes(x=jobsAFAM$data_date, y=jobsAFAM$Percent.Change)) + geom_line() +
  xlab("") + ylab("")
Run Code Online (Sandbox Code Playgroud)

但是这段代码只生成一行,我想在它上面添加另一行.任何帮助将非常感激.TIA.

plot r ggplot2

41
推荐指数
4
解决办法
16万
查看次数

使用RSelenium包执行jQuery函数

我正在尝试使用该RSelenium软件包自动执行登录网站并对其执行某些过程的过程.我已经能够登录,点击这里和那里的按钮,但我坚持在jQuery页面上执行一个功能.有一个下拉框,使用jQuery函数填充其中的数据.我不确定如何执行此功能.页面源(包括jQuery函数)如下:

 <input disabled="disabled" id="stuff" name="stuff" style="width:100%" type="text" /><script>
    jQuery(function(){jQuery("#stuff").kendoDropDownList({"change":disableNext,"dataSource":{"transport":{"read":{"url":"/StuffInfo/GetStuff","data":filterStuff},"prefix":""},"serverFiltering":true,"filter":[],"schema":{"errors":"Errors"}},"autoBind":false,"optionLabel":"Select court...","cascadeFrom":"state"});});
</script>
            <script>
Run Code Online (Sandbox Code Playgroud)

下拉列表的名称是stuff,我正在使用以下代码来访问它:

library("RSelenium")

startServer()
mybrowser <- remoteDriver()
mybrowser$open()
mybrowser$navigate("<URL>")
wxChooseStuff <- mybrowser$findElement(using='id',"stuff")
Run Code Online (Sandbox Code Playgroud)

当我尝试执行以下命令时:

wxChooseStuff$clickElement()
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

Error:   Summary: ElementNotVisible
     Detail: An element command could not be completed because the element is not visible on the page.
     class: org.openqa.selenium.ElementNotVisibleException
Run Code Online (Sandbox Code Playgroud)

我希望点击会自动填充下拉列表中的数据.

任何关于如何使用jQuery函数的指针RSelenium都将非常感激.

即使我可以jQuery使用另一个包执行该功能,那也没关系.我想执行此函数并单击该元素.

PS - 我不是网络开发者,如果我问一个愚蠢的问题,请原谅我.

编辑:

我根据建议尝试了以下代码:

在这个命令中,我只包括script标签中包含的完整文本,用"单引号(')替换所有双引号()

 mybrowser$executeScript(script = "jQuery(function(){jQuery('#stuff').kendoDropDownList({'change':disableNext,'dataSource':{'transport':{'read':{'url':'/StuffInfo/GetStuff','data':filterStuff},'prefix':''},'serverFiltering':true,'filter':[],'schema':{'errors':'Errors'}},'autoBind':false,'optionLabel':'Select …
Run Code Online (Sandbox Code Playgroud)

jquery r rselenium

20
推荐指数
1
解决办法
683
查看次数

如何在sklearn中使用datasets.fetch_mldata()?

我正在尝试运行以下代码以获得简短的机器学习算法:

import re
import argparse
import csv
from collections import Counter
from sklearn import datasets
import sklearn
from sklearn.datasets import fetch_mldata

dataDict = datasets.fetch_mldata('MNIST Original')
Run Code Online (Sandbox Code Playgroud)

在这段代码中,我试图通过sklearn阅读mldata.org上的数据集"MNIST Original".这导致以下错误(有更多的代码行,但我在此特定行收到错误):

Traceback (most recent call last):
  File "C:\Program Files (x86)\JetBrains\PyCharm 2.7.3\helpers\pydev\pydevd.py", line 1481, in <module>
    debugger.run(setup['file'], None, None)
  File "C:\Program Files (x86)\JetBrains\PyCharm 2.7.3\helpers\pydev\pydevd.py", line 1124, in run
    pydev_imports.execfile(file, globals, locals) #execute the script
  File "C:/Users/sony/PycharmProjects/Machine_Learning_Homework1/zeroR.py", line 131, in <module>
    dataDict = datasets.fetch_mldata('MNIST Original')
  File "C:\Anaconda\lib\site-packages\sklearn\datasets\mldata.py", line 157, in fetch_mldata
    matlab_dict = io.loadmat(matlab_file, struct_as_record=True)
  File …
Run Code Online (Sandbox Code Playgroud)

python numpy machine-learning

14
推荐指数
4
解决办法
3万
查看次数

无法从cygwin运行'aws'

我正在使用cygwin安装Windows 10并尝试从中进行访问awscli.

我曾经pip install awscli安装过awscli.这个安装awscli.然后我试图运行只是aws为了看它是否已安装,我收到以下错误:

-bash: /cygdrive/c/Program Files/Anaconda2/Scripts/aws: C:\Program: bad interpreter: No such file or directory
Run Code Online (Sandbox Code Playgroud)

我不确定为什么会这样.在这方面的任何帮助都会非常苛刻.

bash cygwin amazon-web-services aws-cli

14
推荐指数
2
解决办法
2831
查看次数

如何将外部图例添加到ggpairs()?

我正在使用绘制散点图矩阵ggpairs.我使用以下代码:

# Load required packages
require(GGally)

# Load datasets
data(state)
df <- data.frame(state.x77,
                 State = state.name,
                 Abbrev = state.abb,
                 Region = state.region,
                 Division = state.division
) 
# Create scatterplot matrix
p <- ggpairs(df, 
             # Columns to include in the matrix
             columns = c(3,5,6,7),

             # What to include above diagonal
             # list(continuous = "points") to mirror
             # "blank" to turn off
             upper = "blank",
             legends=T,

             # What to include below diagonal
             lower = list(continuous = "points"),

             # What to …
Run Code Online (Sandbox Code Playgroud)

plot r ggally

11
推荐指数
2
解决办法
3896
查看次数

ValueError:num必须为1 <= num <= 2,而不是3

我有以下dataframe生成使用pivot_table:

在此输入图像描述

boxplot在多列中使用以下代码:

    fig = plt.figure()
for i in range(0,25):
    ax = plt.subplot(1,2,i+1)
    toPlot1.boxplot(column='Score',by=toPlot1.columns[i+1],ax=ax)
fig.suptitle('test title', fontsize=20)
plt.show()
Run Code Online (Sandbox Code Playgroud)

我期待如下输出:

在此输入图像描述

但是这段代码给了我以下错误:

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-275-9c68ce91596f> in <module>()
      1 fig = plt.figure()
      2 for i in range(0,25):
----> 3     ax = plt.subplot(1,2,i+1)
      4     toPlot1.boxplot(column='Score',by=toPlot1.columns[i+1],ax=ax)
      5 fig.suptitle('test title', fontsize=20)

E:\Anaconda2\lib\site-packages\matplotlib\pyplot.pyc in subplot(*args, **kwargs)
   1020 
   1021     fig = gcf()
-> 1022     a = fig.add_subplot(*args, **kwargs)
   1023     bbox = a.bbox
   1024     byebye = []

E:\Anaconda2\lib\site-packages\matplotlib\figure.pyc in …
Run Code Online (Sandbox Code Playgroud)

python boxplot pandas

10
推荐指数
1
解决办法
1万
查看次数

TypeError:&''float'和'numpy.float64'不支持的操作数类型

我正在尝试使用以下代码将连续变量转换为分类变量:

def score_to_categorical(x):
    if x<0.25:
        return 'very bad'
    if x>=0.25 & x<0.5:
        return 'bad'
    if x>=0.5 & x<0.75:
        return 'good'
    else:
        return 'very good'

ConceptTemp['Score'] = ConceptTemp['Score'].apply(score_to_categorical)
ConceptTemp1['Score'] = ConceptTemp1['Score'].apply(score_to_categorical)
Run Code Online (Sandbox Code Playgroud)

但是我收到以下错误:

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-72-7ec42b055d4f> in <module>()
----> 1 ConceptTemp['Score'] = ConceptTemp['Score'].apply(score_to_categorical)
      2 ConceptTemp1['Score'] = ConceptTemp1['Score'].apply(score_to_categorical)

E:\Anaconda2\lib\site-packages\pandas\core\series.pyc in apply(self, func, convert_dtype, args, **kwds)
   2167             values = lib.map_infer(values, lib.Timestamp)
   2168 
-> 2169         mapped = lib.map_infer(values, f, convert=convert_dtype)
   2170         if len(mapped) and isinstance(mapped[0], Series):
   2171             from pandas.core.frame import …
Run Code Online (Sandbox Code Playgroud)

python numpy typeerror

8
推荐指数
1
解决办法
2万
查看次数

写入Pickle文件时出现FileNotFoundError

我将所有文件名放在的某个目录中list,并希望将此列表写入pickle文件中。这是我正在使用的代码:

import _pickle as pickle
with open(filepath+'filenames.pkl', 'wb') as f:
    pickle.dump(filenames, f)
Run Code Online (Sandbox Code Playgroud)

这给了我以下错误:

---------------------------------------------------------------------------
FileNotFoundError                         Traceback (most recent call last)
<ipython-input-32-c59e6889d2fe> in <module>()
      1 import _pickle as pickle
----> 2 with open(dpath+'filenames.pkl', 'wb') as f:
      3     pickle.dump(filenames, f)

FileNotFoundError: [Errno 2] No such file or directory: '/data/train/filenames.pkl'
Run Code Online (Sandbox Code Playgroud)

我应该创建此文件,为什么已经需要该文件?

(我正在使用Python 3.6)任何帮助将不胜感激。

TIA。

python pickle

7
推荐指数
2
解决办法
1万
查看次数

使用plotly修改轴范围

我正在使用以下代码生成气泡图plotly:

Dataframe.iplot(kind='bubble', x='branch', y='retention', size='active_users', text='active_users',
             xTitle='', yTitle='Retention',
             filename='cufflinks/PlotName')
Run Code Online (Sandbox Code Playgroud)

我想设置Y轴的手动范围.任何帮助,将不胜感激.

python plotly

6
推荐指数
2
解决办法
3190
查看次数

在多个子图行中绘制条形图

我有一个简单的长格式数据集,我想从中生成条形图。数据框如下所示:

data = {'Year':[2019,2019,2019,2020,2020,2020,2021,2021,2021],
        'Month_diff':[0,1,2,0,1,2,0,1,2],
        'data': [12,10,13,16,12,18,19,45,34]}
df = pd.DataFrame(data)
Run Code Online (Sandbox Code Playgroud)

我想绘制一个有 3 行的条形图,每行代表 2019 年、2020 年和 2021 年。X 轴month_diffdataY 轴。我该怎么做呢?

如果数据位于不同的列中,那么我可以使用以下代码:

df.plot(x="X", y=["A", "B", "C"], kind="bar")
Run Code Online (Sandbox Code Playgroud)

但我的data在单列中,理想情况下,我希望每年都有不同的行。

python matplotlib bar-chart pandas seaborn

5
推荐指数
1
解决办法
3607
查看次数