标签: data-visualization

r 问题中的干图

为什么当我在 R 中执行茎函数时,茎和叶值与数据点不对应?当我做scale=2时,它就起作用了。

r data-visualization

3
推荐指数
1
解决办法
673
查看次数

基于json输入绘制网络拓扑图

我想通过证明 json 数据作为输入,使用 Highchart 或任何其他 js 库绘制网络拓扑图。在查看http://www.highcharts.com/demo/renderer上拓扑图要求的示例时,我发现它是静态的,并且没有任何具有固定 json 格式的示例来根据拓扑 xml 动态渲染拓扑。

寻求帮助以根据各种 json /xml 绘制逻辑拓扑/网络拓扑。

data-visualization topology highcharts d3.js noflo

3
推荐指数
1
解决办法
2万
查看次数

使用线条和多因素连接 ggplot 箱线图

我正在尝试将 ggplot2 箱线图与 geom_lines 连接起来以了解多个因素。到目前为止,我已经能够完成用线条连接所有箱线图,请参阅附图。但我希望通过相应的因素连接唯一的箱线图。

在此输入图像描述

例如,对于我的变量 FL,我只想连接这两个箱线图,而不将它们与其余变量连接。同样,对于变量 RW,将这两个性别箱线图连接起来,而不连接其余的其他箱线图。

library("MASS")  
data(crabs)  
melt_crabs <- melt(crabs,id.var=c("sp","sex","index"))   
ggplot(melt_crabs, aes(x = variable, y = value)) +   geom_line(aes(group = index), size = 0.05, alpha = 0.7) +   geom_boxplot(aes(fill = sp), alpha = 0.5) + facet_grid(sex~.)
Run Code Online (Sandbox Code Playgroud)

有谁知道如何实现这一目标?我希望我能以最清楚的方式解释自己。

非常感谢和良好的祝愿,

plot r data-visualization ggplot2 boxplot

3
推荐指数
2
解决办法
1万
查看次数

如何在热图中居中显示刻度线和标签

我正在使用 matplotlib 绘制热图,如下图所示:

matplotlib 热图

该图是通过以下代码构建的:

C_range = 10. ** np.arange(-2, 8)
gamma_range = 10. ** np.arange(-5, 4)

confMat=np.random.rand(10, 9)

heatmap = plt.pcolor(confMat)

for y in range(confMat.shape[0]):
    for x in range(confMat.shape[1]):
        plt.text(x + 0.5, y + 0.5, '%.2f' % confMat[y, x],
                horizontalalignment='center',
                verticalalignment='center',)


plt.grid()
plt.colorbar(heatmap)
plt.subplots_adjust(left=0.15, right=0.99, bottom=0.15, top=0.99)
plt.ylabel('Cost')
plt.xlabel('Gamma')

plt.xticks(np.arange(len(gamma_range)), gamma_range, rotation=45,)
plt.yticks(np.arange(len(C_range)), C_range, rotation=45)
plt.show()
Run Code Online (Sandbox Code Playgroud)

我需要将刻度和标签在两个轴上居中。有任何想法吗?

python label data-visualization matplotlib heatmap

3
推荐指数
1
解决办法
1万
查看次数

是否可以使用字符串元素作为sklearn中的输入?

我正在尝试使用 sklearn 分析我的数据,看看元素之间是否存在某种相关性。我的数据集是一个短的蛋白质基序,其序列非常多样化。我的输入如下所示:

  1p 2p 3p 4p 5p               genus
0  T  V  H  F  K  Enterobacteriaceae
1  T  V  M  F  M         Escherichia
2  E  I  H  V  K  Enterobacteriaceae
3  K  L  M  F  K  Enterobacteriaceae
Run Code Online (Sandbox Code Playgroud)

位置 1-5 有 20 个不同的字母可能性。

我想使用与 sklearn Iris 集所示类似的方法来检查不同位置的氨基酸和细菌属之间的依赖性。换句话说,我想看看字母序列是否特定于属,以及单个位置的字母是否与其他位置的字母有某种关系。

问题是,据我所知,只有数字可以用作 sklearn 的输入。我尝试用数字代替字母:每个字母从 1e-10 到 1e10,但后来我在数据可视化方面遇到了问题。我希望有其他更有效的方法来使用此类输入数据。我将非常感谢一些提示。谢谢!

python import data-visualization bioinformatics scikit-learn

3
推荐指数
1
解决办法
3000
查看次数

如何剪切y轴让图表看起来更好?

我想要做的是使用 D3.js (v4) 创建一个条形图,它将显示 2 或 3 个数值差异较大的条形图。

如下图所示,黄色条的值为 1596.6,而绿色条的值为 177.2。因此,为了以优雅的方式显示图表,决定将 y 轴切割为某个值,该值接近绿色条的值,并继续接近黄色条的值。

在图中,y 轴在 500 后被切断,并在 1500 后继续。

如何使用 D3.js 做到这一点?

在此输入图像描述

data-visualization d3.js

3
推荐指数
1
解决办法
2056
查看次数

使用 Embedding Projector 可视化 Word2Vec 模型

使用 TensorFlow 的嵌入投影仪可视化 Word2Vec 模型的最佳方法是什么?有没有办法将 Word2Vec 模型的向量导出为 Embedding Projector 期望的格式?或者张量流中有一个内置函数吗?

谢谢!

nlp data-visualization gensim word2vec tensorflow

3
推荐指数
1
解决办法
1185
查看次数

向 Folium FastMarkerCluster 标记添加文本?

使用以下代码,我尝试将文本添加到我的 folium FastMarkerCluster 标记中。下面的代码生成一个地图,但添加文本没有成功。文本包含为与每个经纬度对相对应的字符串。

我相信这个问题与包含文本列的 df 是 pandas 系列对象有关。据我了解,在这种情况下应该如何指定“df.columnname”。然而,这没有用。我还尝试将专栏变成列表,但这种方法也没有成功。任何指点真的很感激。

xlat = guns2013['latitude'].tolist()
xlon = guns2013['longitude'].tolist()
locations = list(zip(xlat, xlon))
map2 = folium.Map(location=[38.9, -77.05], tiles='CartoDB dark_matter', 
zoom_start=1)
marker_cluster = MarkerCluster().add_to(map2)
for point in range(0, len(locations)):
   folium.Marker(locations[point], 
   popup='guns2013.texts'[point]).add_to(marker_cluster)

map2
Run Code Online (Sandbox Code Playgroud)

python text data-visualization folium

3
推荐指数
1
解决办法
6690
查看次数

词向量列表上的 T-SNE 可视化

我有一个大约 20k 单词向量('tuple_vectors')的列表,没有标签,每个向量如下所示

[-2.84658718e+00 -7.74899840e-01 -2.24296474e+00 -8.69364500e-01
  3.90927410e+00 -2.65316987e+00 -9.71897244e-01 -2.40408254e+00
  1.16272974e+00 -2.61649752e+00 -2.87350488e+00 -1.06603658e+00
  2.93374014e+00  1.07194626e+00 -1.86619771e+00  1.88549474e-01
 -1.31901133e+00  3.83382154e+00 -3.46174908e+00 ...
Run Code Online (Sandbox Code Playgroud)

有没有一种快速、简洁的方法来使用 t-sne 进行可视化?

我尝试过以下方法

from sklearn.manifold import TSNE

n_sne = 21060


tsne = TSNE(n_components=2, verbose=1, perplexity=40, n_iter=300)
tsne_results = tsne.fit_transform(tuple_vectors)
plt(tsne_results)
Run Code Online (Sandbox Code Playgroud)

python nlp data-visualization scikit-learn word-embedding

3
推荐指数
1
解决办法
1669
查看次数

如何将参数传递给PowerBI嵌入式报表

我有一个 IFrame,它显示具有帐户数据的 PowerBI 嵌入式报告,并且我通过 UI 从用户处获取两个输入作为开始日期和结束日期,并根据这些输入,我的数据库表将填充该选择的唯一 ID。我可以通过嵌入的 URL 将参数传递给 PowerBI Embedded,以根据该输入和 UI 中当前选择的唯一 ID 来过滤我的报告。

谢谢

database postgresql r data-visualization powerbi

3
推荐指数
1
解决办法
8985
查看次数