小编Nic*_*ddy的帖子

如何更改 Plotly 3D 散点图中的颜色

我正在学习如何使用他们的示例和我自己的数据在 Plotly 上绘制 3D 散点图。样品在这里

我可以绘制散点图(它看起来很酷),但我无法让不同的数据系列点显示为单独的颜色。

import plotly #load plotly for plotting
import plotly.plotly as py
from plotly import tools
from plotly.graph_objs import * #all the types of plots that we will plot here
plotly.offline.init_notebook_mode() # run at the start of every ipython notebook

trace1 = Scatter3d(
    x = res,
    y = lc,
    z = spent,
    mode='markers',
    marker=dict(
        size=12,
        color=["z","y","x"],  # set color to an array/list of desired values
        colorscale='Viridis',   # choose a colorscale
        opacity=0.8
    )
) …
Run Code Online (Sandbox Code Playgroud)

python-3.x plotly

7
推荐指数
1
解决办法
1万
查看次数

如何根据dtype删除DataFrame列

我有一个pandas数据帧,我试图删除所有的对象字段,以便我只剩下数字.

我一直在尝试写一个for循环来完成这项任务,因为我可能需要一遍又一遍地使用不同的数据.

出于某种原因,我无法让它发挥作用.以下是我到目前为止所做的事情

for cols in data:
    if data.values.type == object:
        numdata = data.drop(axis=1, inplace=True)
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

对于数据中的cols,()1中的AttributeError Traceback(最近一次调用last):----> 2如果data.values.type == object:3 numdata = data.drop(axis = 1,inplace = True)

AttributeError:'numpy.ndarray'对象没有属性'type'

我是一个新手,由于某种原因,我不能得到for循环和if语句逻辑坚持我的脑袋.

python pandas

7
推荐指数
1
解决办法
3986
查看次数

什么"指数参数已被弃用并将被删除(假定为真)0.17"是什么意思?

我刚开始学习python并道歉,如果这是一个非常基本的问题/错误.

我在做Kaggle生物反应教程.我收到了这个错误

C:\ Anaconda\lib\site-packages\sklearn\cross_validation.py:65:DeprecationWarning:不推荐使用indices参数,并且将在0.17 stacklevel = 1中删除(假设为True)结果:0.458614231133

谁知道这意味着什么?我谷歌它死了,找不到答案.

我正在运行的脚本是:

from sklearn.ensemble import RandomForestClassifier
from sklearn import cross_validation
import logloss
import numpy as np

def main():
    #read in  data, parse into training and target sets
    dataset = np.genfromtxt(open('train.csv','r'), delimiter=',', dtype='f8')[1:]
    target = np.array([x[0] for x in dataset])
    train = np.array([x[1:] for x in dataset])

    #In this case we'll use a random forest, but this could be any classifier
    cfr = RandomForestClassifier(n_estimators=100)

    #Simple K-Fold cross validation. 5 folds.
    #(Note: in older scikit-learn …
Run Code Online (Sandbox Code Playgroud)

python machine-learning python-2.7 kaggle

4
推荐指数
1
解决办法
955
查看次数

如何在熊猫中阅读.txt

我正在尝试将包含两个数据系列的txt文件拉入pandas.到目前为止,我已经尝试了下面的变体,我从堆栈上的其他帖子中获取.到目前为止,它只会作为一个系列阅读.

我正在使用的数据可在此处获得

icdencoding = pd.read_table("data/icd10cm_codes_2017.txt", delim_whitespace=True, header=None)
icdencoding = pd.read_table("data/icd10cm_codes_2017.txt", header=None, sep="/t")
icdencoding = pd.read_table("data/icd10cm_codes_2017.txt", header=None, delimiter=r"\s+")
Run Code Online (Sandbox Code Playgroud)

我确定我做的事情显然是错的,但是我看不到它.

python python-3.x pandas

4
推荐指数
2
解决办法
7612
查看次数

熊猫不是进口的吗?'NameError: 全局名称 'pandas' 未定义'

我在这里遇到了一些错误,但我认为这是由于熊猫未导入,因为它变灰了。如果这是问题,我将如何解决这个问题?

C:\Anaconda\python.exe C:/Users/nickd/Documents/SKLEARN-STOCKS/stock-mach.py​​ Traceback(最近一次调用最后一次):文件“C:/Users/nickd/Documents/SKLEARN-STOCKS/stock -mach.py​​”,第 38 行,在 Key_Stats() 文件“C:/Users/nickd/Documents/SKLEARN-STOCKS/stock-mach.py​​”,第 12 行,在 Key_Stats 中 df = pandas.DataFrame(columns = [' Date','Unix','Ticker','DE Ratio']) NameError: 全局名称 'pandas' 未定义

进程以退出代码 1 结束

import pandas as pd
import os
import time
from datetime import datetime

#location of the data files
path = 'C:\Users\nickd\Documents\SKLEARN-STOCKS'
#what specific field do you want to grab and in all files in that directory
def Key_Stats(gather="Total Debt/Equity (mrq) "):
    statspath = path+'/_KeyStats'
    stock_list = [x[0] for x in os.walk(statspath)]
    df = pandas.DataFrame(columns …
Run Code Online (Sandbox Code Playgroud)

python machine-learning python-2.7 pandas

3
推荐指数
1
解决办法
2万
查看次数

为什么Plotly不会识别属性'离线'?

我正在按照教程的时间序列,在这里.我还修改了代码,允许在Jupyter离线图表,在这里.

我正试图在Jupyter Notebook中绘制一个时间序列.我收到以下错误.

AttributeError:模块'plotly.plotly'没有属性'离线'

据我所知,我已经执行了所有说明,但无法使用他们建议的方法.

import plotly.plotly as py
import plotly.graph_objs as go

py.offline.init_notebook_mode()

data = [go.Scatter(x=dataload.date, y=dataload.spend)]

py.offline.iplot(data)

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
<ipython-input-14-c9b2e8d8907c> in <module>()
      2 import plotly.graph_objs as go
      3 
----> 4 py.offline.init_notebook_mode()
      5 
      6 data = [go.Scatter(x=dataload.date, y=dataload.spend)]

AttributeError: module 'plotly.plotly' has no attribute 'offline'
Run Code Online (Sandbox Code Playgroud)

有没有人建议我为什么会收到此错误,这可能是本地设置问题?

python plotly

3
推荐指数
1
解决办法
4595
查看次数

从FeedParser获取Feed并导入到Pandas DataFrame

我正在学习python.作为练习我正在使用feedparser构建一个rss scraper,将输出放入pandas数据框并尝试使用NLTK ...但我首先从多个RSS提要中获取文章列表.

我使用这篇文章介绍了如何传递多个feed,并将其与我之前收到的关于如何将其变为Pandas数据帧的另一个问题的答案相结合.

问题是,我希望能够查看数据框中所有Feed的数据.目前,我只能访问供稿列表中的第一项.

FeedParser似乎正在做它的工作但是当把它放入Pandas df时它似乎只抓住了列表中的第一个RSS.

import feedparser
import pandas as pd

rawrss = [
    'http://newsrss.bbc.co.uk/rss/newsonline_uk_edition/front_page/rss.xml',
    'https://www.yahoo.com/news/rss/',
    'http://www.huffingtonpost.co.uk/feeds/index.xml',
    'http://feeds.feedburner.com/TechCrunch/',
    ]

feeds = []
for url in rawrss:
    feeds.append(feedparser.parse(url))

for feed in feeds:
    for post in feed.entries:
        print(post.title, post.link, post.summary)

df = pd.DataFrame(columns=['title', 'link', 'summary'])

for i, post in enumerate(feed.entries):
    df.loc[i] =  post.title, post.link, post.summary

df.shape

df
Run Code Online (Sandbox Code Playgroud)

python feedparser pandas

3
推荐指数
1
解决办法
1492
查看次数

ValueError:float()的无效文字:17/08/2015

我收到此错误"ValueError:float()的无效文字:17/08/2015".这是我正在阅读的文件中的最后一行,它遵循与其他文件相同的格式.脚本的代码如下.

我在想.该错误是否实际发生在整个文件中,但它被标记为唯一错误,因为它是最后一个错误,如果这对任何人都有意义.

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt

    rankings = pd.read_csv('data/rankingunitsdata.csv', parse_dates='date')
    rankings.plot('date','rankingpos')

    x = rankings.date.values
    y = rankings.rankingpos.values

    plt.plot(x,y, 'o')
    plt.xlabel('Ranking Position')
    plt.ylabel('Date')
    plt.show()

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-15-b6d9eb0809d3> in <module>()
----> 1 plt.plot(x,y, 'o')
      2 plt.xlabel('Ranking Position')
      3 plt.ylabel('Date')
      4 plt.show()

C:\Anaconda3\lib\site-packages\matplotlib\pyplot.py in plot(*args, **kwargs)
   3097         ax.hold(hold)
   3098     try:
-> 3099         ret = ax.plot(*args, **kwargs)
   3100         draw_if_interactive()
   3101     finally:

C:\Anaconda3\lib\site-packages\matplotlib\axes\_axes.py in plot(self, *args, **kwargs)
   1372 
   1373         for line in …
Run Code Online (Sandbox Code Playgroud)

python numpy matplotlib

0
推荐指数
1
解决办法
7014
查看次数