标签: tag-cloud

实现像Wordle一样的文字云的算法

上下文

  • 看看Wordle:http://www.wordle.net/
  • 它比我见过的任何其他文字云生成器都要好看
  • 注意:源代码不可用 - 请阅读常见问题解答:http://www.wordle.net/faq#code

我的问题

  • 是否有可用于Wordle的算法?
  • 如果不是,有哪些替代产生类似的输出?

我为什么这么问

  • 只是好奇
  • 想学习

layout fonts typography tag-cloud wordle-game

198
推荐指数
9
解决办法
9万
查看次数

使用h1到h6从阵列生成标签云的最佳方法是什么?

我有以下数组:

$artist = array("the roots", "michael jackson", "billy idol", "more", "and more", "and_YET_MORE");
$count = array(5, 3, 9, 1, 1, 3);
Run Code Online (Sandbox Code Playgroud)

我想生成一个标签云,它将在$count封闭的h6标签和最低的封闭h1标签中包含更高编号的艺术家.

php arrays tag-cloud

73
推荐指数
5
解决办法
6482
查看次数

用于标记,云和搜索的最佳数据架构(如StackOverflow)?

我很想知道Stack Overflow的标记和搜索是如何构建的,因为它看起来效果很好.

如果我想要执行以下所有操作,那么什么是良好的数据库/搜索模型:

  1. 在各种实体上存储标签,(如何规范化?即实体,标签和Entity_Tag表?)
    • 搜索具有特定标签的项目
    • 构建适用于特定搜索结果集的所有标记的标记云
    • 如何在搜索结果中显示每个项目的标签列表?

也许以标准化的形式存储标签是有意义的,但也可以作为空格分隔的字符串用于#2,#4和#3的目的.思考?

我听说它说Stack Overflow使用Lucene进行搜索.真的吗?我听过几个关于SQL优化的播客,但没有关于Lucene的内容.如果他们确实使用Lucene,我想知道有多少搜索结果来自Lucene,以及"钻取"标签云是否来自Lucene.

tags database-design full-text-search tag-cloud

38
推荐指数
2
解决办法
6163
查看次数

有趣的标签云实施

您知道的最有趣的标签云实施是什么?我正在寻找一些易于使用但有些不合标准的东西.我知道WP-Cumulus 3D标签云,我对一个有趣的实现很感兴趣 - 不一定是视觉术语(作为一个例子,语义分组标签云也可能很有趣).

tag-cloud

20
推荐指数
2
解决办法
3533
查看次数

计算tagcloud中标签的字体大小的公式是什么?

我有一个标签云,我需要知道如何更改最常用标签的字体大小.

我需要设置min-font-size和max-font-size.

tags algorithm math tag-cloud

19
推荐指数
2
解决办法
5531
查看次数

C#中的标签云

我正在制作一个小型的C#应用程序,并希望从简单的纯文本中提取标签云.有没有可以为我做的功能?

c# tag-cloud

15
推荐指数
4
解决办法
2万
查看次数

如何在R中增加绘制区域wordclouds的大小

试图复制这里的例子;

http://onertipaday.blogspot.com/2011/07/word-cloud-in-r.html

需要帮助搞清楚如何增加单词云的绘制区域.更改png("wordcloud_packages.png",width = 1280,height = 800)中的高度和宽度参数只会更改画布的高度和宽度.但绘制的区域仍然很小.

require(XML)
require(tm)
require(wordcloud)
require(RColorBrewer)
u = "http://cran.r-project.org/web/packages/available_packages_by_date.html"
t = readHTMLTable(u)[[1]]
ap.corpus <- Corpus(DataframeSource(data.frame(as.character(t[,3]))))
ap.corpus <- tm_map(ap.corpus, removePunctuation)
ap.corpus <- tm_map(ap.corpus, tolower)
ap.corpus <- tm_map(ap.corpus, function(x) removeWords(x, stopwords("english")))
ap.tdm <- TermDocumentMatrix(ap.corpus)
ap.m <- as.matrix(ap.tdm)
ap.v <- sort(rowSums(ap.m),decreasing=TRUE)
ap.d <- data.frame(word = names(ap.v),freq=ap.v)
table(ap.d$freq)
pal2 <- brewer.pal(8,"Dark2")
png("wordcloud_packages.png", width=1280,height=800)
wordcloud(ap.d$word,ap.d$freq, scale=c(8,.2),min.freq=3,
max.words=Inf, random.order=FALSE, rot.per=.15, colors=pal2)
dev.off()
Run Code Online (Sandbox Code Playgroud)

r tag-cloud text-mining word-cloud

13
推荐指数
1
解决办法
2万
查看次数

"标签云"发电机?

我想在我正在研究的项目中添加一个"标签云".我通过谷歌看到了很多,但它们似乎主要是"输入网址"类型.

这是我的意思的一个例子:

我正在找一个要么有的

  • 一个很好的网络访问api
  • 一个独立的本地可执行文件(linux首选)
  • 一个可链接的库(c,python首选)

当然,其他选择和建议赞赏!

更新:看起来我正在寻找的通常被称为标签云而不是文本云,即使我有兴趣使用它来查看文本块.

更新2:最优秀的Jonathan Feinberg和IBM发布了Wordle ......万岁!!!

http://www.wordle.net

cloud text tag-cloud

10
推荐指数
2
解决办法
9455
查看次数

如何在d3云中创建每个单词的链接?

我正在使用D3 Cloud构建一个词云.以下是示例代码:

<!DOCTYPE html>
<meta charset="utf-8">
<body>
<script src="../lib/d3/d3.js"></script>
<script src="../d3.layout.cloud.js"></script>
<script>
  var fill = d3.scale.category20();

  d3.layout.cloud().size([300, 300])
      .words(["This", "is", "some", "random", "text"].map(function(d) {
        return {text: d, size: 10 + Math.random() * 90};
      }))
      .padding(5)
      .rotate(function() { return ~~(Math.random() * 2) * 90; })
      .font("Impact")
      .fontSize(function(d) { return d.size; })
      .on("end", draw)
      .start();

  function draw(words) {
    d3.select("body").append("svg")
        .attr("width", 300)
        .attr("height", 300)
      .append("g")
        .attr("transform", "translate(150,150)")
      .selectAll("text")
        .data(words)
      .enter().append("text")
        .style("font-size", function(d) { return d.size + "px"; })
        .style("font-family", "Impact")
        .style("fill", …
Run Code Online (Sandbox Code Playgroud)

javascript tag-cloud d3.js

10
推荐指数
1
解决办法
7413
查看次数

如何在数据库中建模?

我有一个现有的webapp,并希望添加标记功能,以便用户可以标记现有对象.问题是我应该为每个对象添加一个标记列吗?或者我应该将其标准化并使用标记表,其中每个对象都有一组标记?我倾向于后者,因为它感觉更干净,更容易报告并且更容易创建标签云.但既然我知道这已经解决了1000次我想问,看看我是否遗漏了什么?

database tags normalization tag-cloud

9
推荐指数
1
解决办法
2296
查看次数