小编dam*_*ola的帖子

实现用于聚类的邻近矩阵

如果这个问题听起来微不足道或基本的话,请原谅我.

我有一组数据集(一堆字是特定的),我需要通过使用彼此的编辑距离来生成邻近矩阵,以找到并生成邻近矩阵.

然而,我很困惑如何跟踪矩阵中的数据/字符串.我需要接近矩阵用于聚类.

或者你在这个领域如何处理这类问题.我使用perl和R来实现这一点.

这是我编写的perl中的典型代码,它从包含我的文字包的文本文件中读取

use strict ;
   use warnings ; 
   use Text::Levenshtein qw(distance) ;
   main(@ARGV);
   sub main
   {    
    my @TokenDistances ;
    my $Tokenfile  = 'TokenDistinct.txt';
    my @Token ;
    my $AppendingCount  = 0 ; 
    my @Tokencompare ;  
    my %Levcount  = ();
    open (FH ,"< $Tokenfile" ) or die ("Error opening file . $!");
     while(<FH>)
     {
        chomp $_;
        $_ =~ s/^(\s+)$//g;
        push (@Token , $_ ); 
     }
    close(FH); 
     @Tokencompare = @Token ; 


     foreach my $tokenWord(@Tokencompare)
     { 
        my $lengthoffile =  scalar @Tokencompare; …

Run Code Online (Sandbox Code Playgroud)

r cluster-analysis machine-learning data-mining

dam*_*ola

2011 08-09

6
推荐指数

1
解决办法

2072
查看次数

perl中散列哈希的问题

我在哈希散列中访问变量时遇到问题我不知道我做错了什么.调试hash%list1的值会给出一个undef,所以我无法得到我的值.

use strict ;
use warnings ;
my $text = "The, big, fat, little, bastards";
my $Author = "Alex , Shuman ,Directory";
my %hashes  = {1,2,3,40};
my %count  = ();
my @lst = split(",",$text);
my $i = 0 ;
my @Authors  =  split(",", $Author);
foreach  my $SingleAuthor(@Authors)
{
    foreach my $dig (@lst)
    {

     $count{$SingleAuthor}{$dig}++;
    }
}

counter(\%count);

sub counter
{
    my $ref  =  shift;
    my @SingleAuthors = keys %$ref;
    my %list1;
    foreach  my $SingleAuthor1(@SingleAuthors)
  {   
   %list1 =  $ref->{$SingleAuthor1};
    foreach my …

Run Code Online (Sandbox Code Playgroud)

perl hash

dam*_*ola

2011 07-02

1
推荐指数

1
解决办法

4796
查看次数