标签: data-visualization

r 问题中的干图

为什么当我在 R 中执行茎函数时，茎和叶值与数据点不对应？当我做scale=2时，它就起作用了。

r data-visualization

作者

lucky-day

3
推荐指数

1
解决办法

673
查看次数

基于json输入绘制网络拓扑图

我想通过证明 json 数据作为输入，使用 Highchart 或任何其他 js 库绘制网络拓扑图。在查看http://www.highcharts.com/demo/renderer上拓扑图要求的示例时，我发现它是静态的，并且没有任何具有固定 json 格式的示例来根据拓扑 xml 动态渲染拓扑。

寻求帮助以根据各种 json /xml 绘制逻辑拓扑/网络拓扑。

data-visualization topology highcharts d3.js noflo

Nis*_*edi

2015 10-19

3
推荐指数

1
解决办法

2万
查看次数

使用线条和多因素连接 ggplot 箱线图

我正在尝试将 ggplot2 箱线图与 geom_lines 连接起来以了解多个因素。到目前为止，我已经能够完成用线条连接所有箱线图，请参阅附图。但我希望通过相应的因素连接唯一的箱线图。

在此输入图像描述

例如，对于我的变量 FL，我只想连接这两个箱线图，而不将它们与其余变量连接。同样，对于变量 RW，将这两个性别箱线图连接起来，而不连接其余的其他箱线图。

library("MASS")  
data(crabs)  
melt_crabs <- melt(crabs,id.var=c("sp","sex","index"))   
ggplot(melt_crabs, aes(x = variable, y = value)) +   geom_line(aes(group = index), size = 0.05, alpha = 0.7) +   geom_boxplot(aes(fill = sp), alpha = 0.5) + facet_grid(sex~.)

Run Code Online (Sandbox Code Playgroud)

有谁知道如何实现这一目标？我希望我能以最清楚的方式解释自己。

非常感谢和良好的祝愿，

plot r data-visualization ggplot2 boxplot

Sta*_*sra

2016 03-27

3
推荐指数

2
解决办法

1万
查看次数

如何在热图中居中显示刻度线和标签

我正在使用 matplotlib 绘制热图，如下图所示：

该图是通过以下代码构建的：

C_range = 10. ** np.arange(-2, 8)
gamma_range = 10. ** np.arange(-5, 4)

confMat=np.random.rand(10, 9)

heatmap = plt.pcolor(confMat)

for y in range(confMat.shape[0]):
    for x in range(confMat.shape[1]):
        plt.text(x + 0.5, y + 0.5, '%.2f' % confMat[y, x],
                horizontalalignment='center',
                verticalalignment='center',)


plt.grid()
plt.colorbar(heatmap)
plt.subplots_adjust(left=0.15, right=0.99, bottom=0.15, top=0.99)
plt.ylabel('Cost')
plt.xlabel('Gamma')

plt.xticks(np.arange(len(gamma_range)), gamma_range, rotation=45,)
plt.yticks(np.arange(len(C_range)), C_range, rotation=45)
plt.show()

Run Code Online (Sandbox Code Playgroud)

我需要将刻度和标签在两个轴上居中。有任何想法吗？

python label data-visualization matplotlib heatmap

Adi*_*diT

2017 12-11

3
推荐指数

1
解决办法

1万
查看次数

是否可以使用字符串元素作为sklearn中的输入？

我正在尝试使用 sklearn 分析我的数据，看看元素之间是否存在某种相关性。我的数据集是一个短的蛋白质基序，其序列非常多样化。我的输入如下所示：

  1p 2p 3p 4p 5p               genus
0  T  V  H  F  K  Enterobacteriaceae
1  T  V  M  F  M         Escherichia
2  E  I  H  V  K  Enterobacteriaceae
3  K  L  M  F  K  Enterobacteriaceae

Run Code Online (Sandbox Code Playgroud)

位置 1-5 有 20 个不同的字母可能性。

我想使用与 sklearn Iris 集所示类似的方法来检查不同位置的氨基酸和细菌属之间的依赖性。换句话说，我想看看字母序列是否特定于属，以及单个位置的字母是否与其他位置的字母有某种关系。

问题是，据我所知，只有数字可以用作 sklearn 的输入。我尝试用数字代替字母：每个字母从 1e-10 到 1e10，但后来我在数据可视化方面遇到了问题。我希望有其他更有效的方法来使用此类输入数据。我将非常感谢一些提示。谢谢！

python import data-visualization bioinformatics scikit-learn

Daw*_*wid

2018 01-03

3
推荐指数

1
解决办法

3000
查看次数

如何剪切y轴让图表看起来更好？

我想要做的是使用 D3.js (v4) 创建一个条形图，它将显示 2 或 3 个数值差异较大的条形图。

如下图所示，黄色条的值为 1596.6，而绿色条的值为 177.2。因此，为了以优雅的方式显示图表，决定将 y 轴切割为某个值，该值接近绿色条的值，并继续接近黄色条的值。

在图中，y 轴在 500 后被切断，并在 1500 后继续。

如何使用 D3.js 做到这一点？

data-visualization d3.js

Akb*_*bar

2018 01-05

3
推荐指数

1
解决办法

2056
查看次数

使用 Embedding Projector 可视化 Word2Vec 模型

使用 TensorFlow 的嵌入投影仪可视化 Word2Vec 模型的最佳方法是什么？有没有办法将 Word2Vec 模型的向量导出为 Embedding Projector 期望的格式？或者张量流中有一个内置函数吗？

谢谢！

nlp data-visualization gensim word2vec tensorflow

Cod*_*dir

lucky-day

3
推荐指数

1
解决办法

1185
查看次数

向 Folium FastMarkerCluster 标记添加文本？

使用以下代码，我尝试将文本添加到我的 folium FastMarkerCluster 标记中。下面的代码生成一个地图，但添加文本没有成功。文本包含为与每个经纬度对相对应的字符串。

我相信这个问题与包含文本列的 df 是 pandas 系列对象有关。据我了解，在这种情况下应该如何指定“df.columnname”。然而，这没有用。我还尝试将专栏变成列表，但这种方法也没有成功。任何指点真的很感激。

xlat = guns2013['latitude'].tolist()
xlon = guns2013['longitude'].tolist()
locations = list(zip(xlat, xlon))
map2 = folium.Map(location=[38.9, -77.05], tiles='CartoDB dark_matter', 
zoom_start=1)
marker_cluster = MarkerCluster().add_to(map2)
for point in range(0, len(locations)):
   folium.Marker(locations[point], 
   popup='guns2013.texts'[point]).add_to(marker_cluster)

map2

Run Code Online (Sandbox Code Playgroud)

python text data-visualization folium

Ogn*_*anD

lucky-day

3
推荐指数

1
解决办法

6690
查看次数

词向量列表上的 T-SNE 可视化

我有一个大约 20k 单词向量（'tuple_vectors'）的列表，没有标签，每个向量如下所示

[-2.84658718e+00 -7.74899840e-01 -2.24296474e+00 -8.69364500e-01
  3.90927410e+00 -2.65316987e+00 -9.71897244e-01 -2.40408254e+00
  1.16272974e+00 -2.61649752e+00 -2.87350488e+00 -1.06603658e+00
  2.93374014e+00  1.07194626e+00 -1.86619771e+00  1.88549474e-01
 -1.31901133e+00  3.83382154e+00 -3.46174908e+00 ...

Run Code Online (Sandbox Code Playgroud)

有没有一种快速、简洁的方法来使用 t-sne 进行可视化？

我尝试过以下方法

from sklearn.manifold import TSNE

n_sne = 21060


tsne = TSNE(n_components=2, verbose=1, perplexity=40, n_iter=300)
tsne_results = tsne.fit_transform(tuple_vectors)
plt(tsne_results)

Run Code Online (Sandbox Code Playgroud)

python nlp data-visualization scikit-learn word-embedding

W.R*_*W.R

lucky-day

3
推荐指数

1
解决办法

1669
查看次数

如何将参数传递给PowerBI嵌入式报表

我有一个 IFrame，它显示具有帐户数据的 PowerBI 嵌入式报告，并且我通过 UI 从用户处获取两个输入作为开始日期和结束日期，并根据这些输入，我的数据库表将填充该选择的唯一 ID。我可以通过嵌入的 URL 将参数传递给 PowerBI Embedded，以根据该输入和 UI 中当前选择的唯一 ID 来过滤我的报告。

谢谢

database postgresql r data-visualization powerbi

Abh*_*dey

2019 01-21

3
推荐指数

1
解决办法

8985
查看次数