标签: data-visualization

SVR超参数选择和可视化

我只是数据分析的初学者。我想使用“交叉验证网格搜索方法”来确定径向基函数 (RBF) 内核 SVM 的参数 gamma 和 C。我不知道应该将数据放在这段代码的哪里,也不知道我的数据类型是什么应该使用(训练或目标数据)?

对于SVR

import numpy as np
import pandas as pd
from math import sqrt
from sklearn.tree import DecisionTreeRegressor
import matplotlib.pyplot as plt
from sklearn.ensemble import AdaBoostRegressor
from sklearn.metrics import mean_squared_error,explained_variance_score
from TwoStageTrAdaBoostR2 import TwoStageTrAdaBoostR2 # import the two-stage algorithm
from sklearn import preprocessing
from sklearn import svm
from sklearn.svm import SVR
from sklearn.model_selection import GridSearchCV
from sklearn.metrics import classification_report
from matplotlib.colors import Normalize
from sklearn.svm import SVC

# Data import (source)
source= pd.read_csv(sourcedata) …
Run Code Online (Sandbox Code Playgroud)

data-visualization svm data-analysis scikit-learn grid-search

0
推荐指数
1
解决办法
4395
查看次数

需要改变python中networkx库中节点的形状

这是一个硬编码的示例。我想要不同形状的节点。我想要圆形、方形等。目前我只能为图表添加一种形状。是否可以按照我为节点位置/位置和颜色指定的方式指定不同的形状。

import networkx as nx
import matplotlib.pyplot as plt

G=nx.Graph()

G.add_edges_from([("1", "2" ), ("3", "2"),("4", "2"), ("2", "5"),("5", "6"),("6", "7")])

pos = {"1": [0,1],
       "2": [1,0],
       "3": [0,0],
       "4": [0,-1],
       "5": [2,0],
       "6": [3,0],
       "7": [4,0]
       }
nx.draw(G,pos, node_color= ["#80d189","#de3737","#80d189","#80d189","#ccbfbe","#ccbfbe","#ccbfbe"],node_size = [3000,15000,3000,3000,3000,3000,3000] ,  with_labels = True)
plt.savefig("simple_path.png") # save as png
plt.show() # display
Run Code Online (Sandbox Code Playgroud)

python data-visualization matplotlib networkx

0
推荐指数
1
解决办法
1995
查看次数

如何在 Python 中创建带有过滤器的交互式图表(例如 Excel 数据透视图)

首先让我描述一下我试图用 Python 重现的 Excel 数据透视图。

以下是生成示例数据集的代码:

# The code should work in Python 3.7 and pandas 0.24 or above
import pandas as pd
years = [i for i in range(2015,2021)]
countries = ['US', 'CA', 'JP', 'MX', 'IT']
months = [i for i in range(1,13)]

idx = pd.MultiIndex.from_product([years, countries, months], names=['year', 'country', 'month'])
df = pd.DataFrame(np.random.randn(len(idx), 1),columns=['val'], index=idx).sort_index()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

我可以将df.to_clipboard()其粘贴到 Excel 中,如下所示:

在此输入图像描述

然后我可以根据数据插入数据透视图,并以某种方式配置它,以便我可以按年份和国家/地区查看每月线图。该数据透视图是“交互式”的,因为通过“年份”和“国家/地区”下拉控件,我可以以任何我想要的方式方便地过滤数据,例如“显示 JP 的所有年份”或“显示 2020 年的所有国家/地区” ”。

在此输入图像描述

我的问题是
有没有简单的方法可以在 Python 中创建这样的交互式绘图?我使用 Jupyter Notebook 来处理数据并做了很多这样的探索性研究。我不喜欢每次想要可视化数据时都必须将数据复制到 Excel 中。在Python中,我可以做一些愚蠢的事情,比如df.loc[(2015, 'US'),:].plot() …

python plot data-visualization pandas jupyter-notebook

0
推荐指数
1
解决办法
4495
查看次数

如何将 R 中的数据表表示为热图

我有以下数据:

\n
library(data.table)\nDT <- data.table(\n  Pays = c("Austria", "Belgium", "Brazil", "Bulgaria", \n           "Canada", "China", "Croatia", "Cyprus", "Czechia", "Denmark"), \n  `Nouveaux cas` = c("212.2", "136.0", "143.5", "258.7", "122.8", \n                      "0.0", "615.0", "299.0", "327.7", "314.5"), \n  `Nouveaux d\xc3\xa9c\xc3\xa8s` = c("53.8", "35.4", "14.9", "89.7", "14.2", "0.0", "79.0", "14.4", "47.3", "6.9"), \n  `\xc3\x89volution du nombre de cas` = c("-21.5%", "2.8%", "5.6%", "-5.2%", "4.1%", "-0.9%", "5.5%", "34.3%", "36.7%", "73.8%"), \n  `\xc3\x89volution du nombre de d\xc3\xa9c\xc3\xa8s` = c("-20.1%", "-20.4%", "10.5%", "-8.5%", "24.1%", "NaN%", "2.9%", "63.6%", "-5.4%", …
Run Code Online (Sandbox Code Playgroud)

datatable r data-visualization heatmap

0
推荐指数
1
解决办法
4107
查看次数

如何在R中组合不同的条形图?

我是新的 R 用户。

我很难弄清楚如何将不同的条形图组合成一个图形。

例如,

假设中国前五名的职业分别是政府雇员、CEO、医生、运动员、艺术家,收入(美元)分别为20,000、17,000、15,000、14,000和13,000,而前五名的职业为在美国,医生、运动员、艺术家、律师、教师的收入(以美元计)分别为 40,000、35,000、30,000、25,000 和 20,000。

我想在一张图中显示差异。

我该怎么做?请注意,它们具有不同的名称。

r data-visualization

-1
推荐指数
1
解决办法
1万
查看次数

是否可以使用ggplot在facet之间显示符号?

我想在ggplot中将符号放在我的方面之间,以便可视化不同方面之间的关系,例如:

? + ? - ? = ?
Run Code Online (Sandbox Code Playgroud)

每个方格都是一个方面.这可能吗?

r data-visualization ggplot2

-3
推荐指数
1
解决办法
44
查看次数

如何在特定位置添加网格线到图?

在现有绘图中,如何在垂直位置0处添加水平网格线.我可以使用该lines函数添加线条.但是,那条线会影响我的传奇.

r data-visualization

-8
推荐指数
1
解决办法
1066
查看次数

大数据问题的解决方法是什么?

让我们考虑以下问题.我们有一个包含大量数据的系统(大数据).所以,实际上我们有一个数据库.作为第一个要求,我们希望能够快速写入和读取数据库.我们还希望拥有一个到数据库的Web界面(以便不同的客户端可以远程写入和读取数据库).

但是我们想拥有的系统应该不仅仅是一个数据库.首先,我们希望能够对数据运行不同的数据分析算法,以查找规律性,相关性,异常性等(就像之前我们对性能的关注一样).其次,我们希望将机器学习机器绑定到数据库.这意味着我们希望在数据上运行机器学习算法,以便能够学习数据上存在的"关系",并基于此预测尚未存在于数据库中的条目的值.

最后,我们希望有一个基于点击的界面,可视化数据.这样用户就可以以漂亮的图形,图形和其他交互式可视化对象的形式看到数据.

什么是上述问题的标准和广泛认可的方法.必须使用哪些编程语言来处理所描述的问题?

database data-visualization machine-learning data-analysis bigdata

-8
推荐指数
2
解决办法
1121
查看次数