我正在学习如何使用他们的示例和我自己的数据在 Plotly 上绘制 3D 散点图。样品在这里
我可以绘制散点图(它看起来很酷),但我无法让不同的数据系列点显示为单独的颜色。
import plotly #load plotly for plotting
import plotly.plotly as py
from plotly import tools
from plotly.graph_objs import * #all the types of plots that we will plot here
plotly.offline.init_notebook_mode() # run at the start of every ipython notebook
trace1 = Scatter3d(
x = res,
y = lc,
z = spent,
mode='markers',
marker=dict(
size=12,
color=["z","y","x"], # set color to an array/list of desired values
colorscale='Viridis', # choose a colorscale
opacity=0.8
)
) …
Run Code Online (Sandbox Code Playgroud) 我有一个pandas数据帧,我试图删除所有的对象字段,以便我只剩下数字.
我一直在尝试写一个for循环来完成这项任务,因为我可能需要一遍又一遍地使用不同的数据.
出于某种原因,我无法让它发挥作用.以下是我到目前为止所做的事情
for cols in data:
if data.values.type == object:
numdata = data.drop(axis=1, inplace=True)
Run Code Online (Sandbox Code Playgroud)
我得到的错误是:
对于数据中的cols,()1中的AttributeError Traceback(最近一次调用last):----> 2如果data.values.type == object:3 numdata = data.drop(axis = 1,inplace = True)
AttributeError:'numpy.ndarray'对象没有属性'type'
我是一个新手,由于某种原因,我不能得到for循环和if语句逻辑坚持我的脑袋.
我刚开始学习python并道歉,如果这是一个非常基本的问题/错误.
我在做Kaggle生物反应教程.我收到了这个错误
C:\ Anaconda\lib\site-packages\sklearn\cross_validation.py:65:DeprecationWarning:不推荐使用indices参数,并且将在0.17 stacklevel = 1中删除(假设为True)结果:0.458614231133
谁知道这意味着什么?我谷歌它死了,找不到答案.
我正在运行的脚本是:
from sklearn.ensemble import RandomForestClassifier
from sklearn import cross_validation
import logloss
import numpy as np
def main():
#read in data, parse into training and target sets
dataset = np.genfromtxt(open('train.csv','r'), delimiter=',', dtype='f8')[1:]
target = np.array([x[0] for x in dataset])
train = np.array([x[1:] for x in dataset])
#In this case we'll use a random forest, but this could be any classifier
cfr = RandomForestClassifier(n_estimators=100)
#Simple K-Fold cross validation. 5 folds.
#(Note: in older scikit-learn …
Run Code Online (Sandbox Code Playgroud) 我正在尝试将包含两个数据系列的txt文件拉入pandas.到目前为止,我已经尝试了下面的变体,我从堆栈上的其他帖子中获取.到目前为止,它只会作为一个系列阅读.
我正在使用的数据可在此处获得
icdencoding = pd.read_table("data/icd10cm_codes_2017.txt", delim_whitespace=True, header=None)
icdencoding = pd.read_table("data/icd10cm_codes_2017.txt", header=None, sep="/t")
icdencoding = pd.read_table("data/icd10cm_codes_2017.txt", header=None, delimiter=r"\s+")
Run Code Online (Sandbox Code Playgroud)
我确定我做的事情显然是错的,但是我看不到它.
我在这里遇到了一些错误,但我认为这是由于熊猫未导入,因为它变灰了。如果这是问题,我将如何解决这个问题?
C:\Anaconda\python.exe C:/Users/nickd/Documents/SKLEARN-STOCKS/stock-mach.py Traceback(最近一次调用最后一次):文件“C:/Users/nickd/Documents/SKLEARN-STOCKS/stock -mach.py”,第 38 行,在 Key_Stats() 文件“C:/Users/nickd/Documents/SKLEARN-STOCKS/stock-mach.py”,第 12 行,在 Key_Stats 中 df = pandas.DataFrame(columns = [' Date','Unix','Ticker','DE Ratio']) NameError: 全局名称 'pandas' 未定义
进程以退出代码 1 结束
import pandas as pd
import os
import time
from datetime import datetime
#location of the data files
path = 'C:\Users\nickd\Documents\SKLEARN-STOCKS'
#what specific field do you want to grab and in all files in that directory
def Key_Stats(gather="Total Debt/Equity (mrq) "):
statspath = path+'/_KeyStats'
stock_list = [x[0] for x in os.walk(statspath)]
df = pandas.DataFrame(columns …
Run Code Online (Sandbox Code Playgroud) 我正在按照教程的时间序列,在这里.我还修改了代码,允许在Jupyter离线图表,在这里.
我正试图在Jupyter Notebook中绘制一个时间序列.我收到以下错误.
AttributeError:模块'plotly.plotly'没有属性'离线'
据我所知,我已经执行了所有说明,但无法使用他们建议的方法.
import plotly.plotly as py
import plotly.graph_objs as go
py.offline.init_notebook_mode()
data = [go.Scatter(x=dataload.date, y=dataload.spend)]
py.offline.iplot(data)
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-14-c9b2e8d8907c> in <module>()
2 import plotly.graph_objs as go
3
----> 4 py.offline.init_notebook_mode()
5
6 data = [go.Scatter(x=dataload.date, y=dataload.spend)]
AttributeError: module 'plotly.plotly' has no attribute 'offline'
Run Code Online (Sandbox Code Playgroud)
有没有人建议我为什么会收到此错误,这可能是本地设置问题?
我正在学习python.作为练习我正在使用feedparser构建一个rss scraper,将输出放入pandas数据框并尝试使用NLTK ...但我首先从多个RSS提要中获取文章列表.
我使用这篇文章介绍了如何传递多个feed,并将其与我之前收到的关于如何将其变为Pandas数据帧的另一个问题的答案相结合.
问题是,我希望能够查看数据框中所有Feed的数据.目前,我只能访问供稿列表中的第一项.
FeedParser似乎正在做它的工作但是当把它放入Pandas df时它似乎只抓住了列表中的第一个RSS.
import feedparser
import pandas as pd
rawrss = [
'http://newsrss.bbc.co.uk/rss/newsonline_uk_edition/front_page/rss.xml',
'https://www.yahoo.com/news/rss/',
'http://www.huffingtonpost.co.uk/feeds/index.xml',
'http://feeds.feedburner.com/TechCrunch/',
]
feeds = []
for url in rawrss:
feeds.append(feedparser.parse(url))
for feed in feeds:
for post in feed.entries:
print(post.title, post.link, post.summary)
df = pd.DataFrame(columns=['title', 'link', 'summary'])
for i, post in enumerate(feed.entries):
df.loc[i] = post.title, post.link, post.summary
df.shape
df
Run Code Online (Sandbox Code Playgroud) 我收到此错误"ValueError:float()的无效文字:17/08/2015".这是我正在阅读的文件中的最后一行,它遵循与其他文件相同的格式.脚本的代码如下.
我在想.该错误是否实际发生在整个文件中,但它被标记为唯一错误,因为它是最后一个错误,如果这对任何人都有意义.
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
rankings = pd.read_csv('data/rankingunitsdata.csv', parse_dates='date')
rankings.plot('date','rankingpos')
x = rankings.date.values
y = rankings.rankingpos.values
plt.plot(x,y, 'o')
plt.xlabel('Ranking Position')
plt.ylabel('Date')
plt.show()
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-15-b6d9eb0809d3> in <module>()
----> 1 plt.plot(x,y, 'o')
2 plt.xlabel('Ranking Position')
3 plt.ylabel('Date')
4 plt.show()
C:\Anaconda3\lib\site-packages\matplotlib\pyplot.py in plot(*args, **kwargs)
3097 ax.hold(hold)
3098 try:
-> 3099 ret = ax.plot(*args, **kwargs)
3100 draw_if_interactive()
3101 finally:
C:\Anaconda3\lib\site-packages\matplotlib\axes\_axes.py in plot(self, *args, **kwargs)
1372
1373 for line in …
Run Code Online (Sandbox Code Playgroud) python ×7
pandas ×4
plotly ×2
python-2.7 ×2
python-3.x ×2
feedparser ×1
kaggle ×1
matplotlib ×1
numpy ×1