帮助理解标签云的算法

Ani*_*mde 7 c# asp.net tags algorithm tag-cloud

我想了解标签云的算法/实现.

在标签云中我们得到以下标签(重量)

  • 标记:标记是搜索的字符串或术语(或父级,具体取决于云的类型)
  • 权重:标记的数值频率

现在在标签云控件中,只有值的子集以不同的字体大小显示.考虑以下示例空间tag1(1)... tagx(2),然后是几个大标签tag2(4000).现在在UI上我想显示堡垒大小的标签(html元素).有了这样一个独特的样本,人们最终无法显示出1000px的大字体.需要处理这些数据,以获得点浓度的平板,这样我得到的值如下:

  • 对于点浓度移动1 - 4,以便我将它分成4个板,每个点数为2(1- 2px,2- 4px,... 4-8px)
  • 4000和一些K较少,所以我想制作两块板(1000 - 2000 = 10px)和(2000及以上= 12px)

我正在使用ASP.NET C#.请让我知道如何实现这一目标.我真的不擅长数学(统计学).请帮我解决这个问题.或链接到数学/教程或良好的样本将有所帮助.

Eug*_*nca 2

有一本可下载的 O'Reilly 电子书(40 多页),名为《Building Tag Clouds in Perl and PHP》(据我记得,是不久前),它对基础知识进行了很好的介绍,并且还具有(如标题所暗示的) Perl 和 PHP 中的示例实现。