我有以下数组:
$artist = array("the roots", "michael jackson", "billy idol", "more", "and more", "and_YET_MORE");
$count = array(5, 3, 9, 1, 1, 3);
Run Code Online (Sandbox Code Playgroud)
我想生成一个标签云,它将在$count封闭的h6标签和最低的封闭h1标签中包含更高编号的艺术家.
我很想知道Stack Overflow的标记和搜索是如何构建的,因为它看起来效果很好.
如果我想要执行以下所有操作,那么什么是良好的数据库/搜索模型:
也许以标准化的形式存储标签是有意义的,但也可以作为空格分隔的字符串用于#2,#4和#3的目的.思考?
我听说它说Stack Overflow使用Lucene进行搜索.真的吗?我听过几个关于SQL优化的播客,但没有关于Lucene的内容.如果他们确实使用Lucene,我想知道有多少搜索结果来自Lucene,以及"钻取"标签云是否来自Lucene.
您知道的最有趣的标签云实施是什么?我正在寻找一些易于使用但有些不合标准的东西.我知道WP-Cumulus 3D标签云,我对一个有趣的实现很感兴趣 - 不一定是视觉术语(作为一个例子,语义分组标签云也可能很有趣).
我有一个标签云,我需要知道如何更改最常用标签的字体大小.
我需要设置min-font-size和max-font-size.
试图复制这里的例子;
http://onertipaday.blogspot.com/2011/07/word-cloud-in-r.html
需要帮助搞清楚如何增加单词云的绘制区域.更改png("wordcloud_packages.png",width = 1280,height = 800)中的高度和宽度参数只会更改画布的高度和宽度.但绘制的区域仍然很小.
require(XML)
require(tm)
require(wordcloud)
require(RColorBrewer)
u = "http://cran.r-project.org/web/packages/available_packages_by_date.html"
t = readHTMLTable(u)[[1]]
ap.corpus <- Corpus(DataframeSource(data.frame(as.character(t[,3]))))
ap.corpus <- tm_map(ap.corpus, removePunctuation)
ap.corpus <- tm_map(ap.corpus, tolower)
ap.corpus <- tm_map(ap.corpus, function(x) removeWords(x, stopwords("english")))
ap.tdm <- TermDocumentMatrix(ap.corpus)
ap.m <- as.matrix(ap.tdm)
ap.v <- sort(rowSums(ap.m),decreasing=TRUE)
ap.d <- data.frame(word = names(ap.v),freq=ap.v)
table(ap.d$freq)
pal2 <- brewer.pal(8,"Dark2")
png("wordcloud_packages.png", width=1280,height=800)
wordcloud(ap.d$word,ap.d$freq, scale=c(8,.2),min.freq=3,
max.words=Inf, random.order=FALSE, rot.per=.15, colors=pal2)
dev.off()
Run Code Online (Sandbox Code Playgroud) 我想在我正在研究的项目中添加一个"标签云".我通过谷歌看到了很多,但它们似乎主要是"输入网址"类型.
这是我的意思的一个例子:
我正在找一个要么有的
当然,其他选择和建议赞赏!
更新:看起来我正在寻找的通常被称为标签云而不是文本云,即使我有兴趣使用它来查看文本块.
更新2:最优秀的Jonathan Feinberg和IBM发布了Wordle ......万岁!!!
我正在使用D3 Cloud构建一个词云.以下是示例代码:
<!DOCTYPE html>
<meta charset="utf-8">
<body>
<script src="../lib/d3/d3.js"></script>
<script src="../d3.layout.cloud.js"></script>
<script>
var fill = d3.scale.category20();
d3.layout.cloud().size([300, 300])
.words(["This", "is", "some", "random", "text"].map(function(d) {
return {text: d, size: 10 + Math.random() * 90};
}))
.padding(5)
.rotate(function() { return ~~(Math.random() * 2) * 90; })
.font("Impact")
.fontSize(function(d) { return d.size; })
.on("end", draw)
.start();
function draw(words) {
d3.select("body").append("svg")
.attr("width", 300)
.attr("height", 300)
.append("g")
.attr("transform", "translate(150,150)")
.selectAll("text")
.data(words)
.enter().append("text")
.style("font-size", function(d) { return d.size + "px"; })
.style("font-family", "Impact")
.style("fill", …Run Code Online (Sandbox Code Playgroud) 我有一个现有的webapp,并希望添加标记功能,以便用户可以标记现有对象.问题是我应该为每个对象添加一个标记列吗?或者我应该将其标准化并使用标记表,其中每个对象都有一组标记?我倾向于后者,因为它感觉更干净,更容易报告并且更容易创建标签云.但既然我知道这已经解决了1000次我想问,看看我是否遗漏了什么?
tag-cloud ×10
tags ×3
algorithm ×1
arrays ×1
c# ×1
cloud ×1
d3.js ×1
database ×1
fonts ×1
javascript ×1
layout ×1
math ×1
php ×1
r ×1
text ×1
text-mining ×1
typography ×1
word-cloud ×1
wordle-game ×1