小编s.e*_*s.e的帖子

Matlab:如何自定义聚类代码作为多级聚类?

我想聚集大量的数据记录.我正在处理的数据是字符串类型.群集过程需要很长时间.
让我们假设我想将一组电子邮件数据记录集群到集群中,同一个人写的电子邮件被分配到同一个集群(考虑到一个人可能以不同的方式写下他/她的名字).
我想执行多阶段群集:

  • 基于名称的第一阶段聚类,如果两个记录之间的名称距离小于阈值,我们会考虑这些聚类......
  • 数据记录基于其他属性(名称除外)进入群集的第二阶段.

计算成对距离.现在我正处于聚类阶段.我想使用以下代码进行dbscan群集:

function [IDX, isnoise] = dbscan_strings(X,epsilon,MinPts)
C = 0;
n = size(X,1); 
IDX = zeros(n,1);
D = pdist2(X,X,@intersection);
visited = false(n,1);
isnoise = false(n,1);
for i = 1:n
    if ~visited(i)
        visited(i) = true;
        Neighbors = RegionQuery(i);
        if numel(Neighbors)<MinPts
            % X(i,:) is NOISE
            isnoise(i) = true;
        else
            C = C+1;
            ExpandCluster(i,Neighbors,C);
        end
    end
end

function ExpandCluster(i,Neighbors,C)
    IDX(i) = C;
    k = 1;
    while true
        j = Neighbors(k);
        if ~visited(j)
            visited(j) = true;
            Neighbors2 = …
Run Code Online (Sandbox Code Playgroud)

matlab cluster-analysis multistage

5
推荐指数
1
解决办法
355
查看次数

Matlab:webread正在读取数据的子集而不是所有数据

我想使用Matlab对存储在服务器上的数据集记录进行聚类.我webread以前从服务器读取数据.

url1 = 'http://localhost:8011/contentC:/xqy/features_3sets.xqy';
url2 = 'http://localhost:8003/contentC:/xqy/features_3sets.xqy';

options = weboptions('Username','admin','Password','admin', 'ContentType','auto' , 'Timeout', 8000);

csv_data = webread(url1, options);
csv_testing= webread(url2, options);

%read data and convert to matrix
extracted_data=textscan(csv_data,'%s%s%s%s%s%s%s', 'delimiter',',');
attributes=[extracted_data{1} extracted_data{2} extracted_data{3}    extracted_data{4} extracted_data{5} extracted_data{6} extracted_data{7}];

extracted_testing=textscan(csv_testing,'%s%s%s%s%s%s%s', 'delimiter',',');
attributes_testing=[extracted_testing{1} extracted_testing{2}        extracted_testing{3} extracted_testing{4} extracted_testing{5}  extracted_testing{6} extracted_testing{7}];
Run Code Online (Sandbox Code Playgroud)

我遇到了返回的记录数量问题webread.保存在服务器上的记录数为764,而返回的记录数webread382.我需要返回所有记录.注意:它似乎返回了数据大小的一半764/2 = 382

返回的数据:单个数据记录如下所示

plah plah ,nursg,low back pa risk factor staff,low back pa,low back pa risk factor staff,back pa risk factor epidemiology,plah,
Run Code Online (Sandbox Code Playgroud)

我打印过, …

csv matlab

5
推荐指数
0
解决办法
400
查看次数

Matlab:如何动态更新for循环的限制?

我在matlab中处理以下代码:

m=unique(x);
for i=1:length(m)
%some code that increase the number of unique values in x
.......
.......
%here I tried to update m 
m=unique(x);
end
Run Code Online (Sandbox Code Playgroud)

虽然我已经m通过m=unique(x);在for end之前写这行来更新,但for循环的限制仍然具有相同的旧值.我需要动态更新for循环的限制.那可能吗?如果有可能,该怎么办?

matlab for-loop updates limit

3
推荐指数
1
解决办法
180
查看次数

XQuery由"&amp;"引起的无效实体引用错误 实体参考

我正在尝试运行此行,xdmp:unquote(concat('<info>', string( $paragraph) , '</info>'))但我遇到以下错误:xdmp:unquote("<info>LEARNING &amp; MEMORY</info>") -- Invalid entity reference " " at line 1.看起来这个实体引用&amp;导致了问题.我试图使用replace函数删除它但它仍然存在.我该怎么办?

xquery entityreference marklogic f#-unquote

2
推荐指数
1
解决办法
436
查看次数

Marklogic:如何将XML文档加载到Marklogic中,其顺序与源文件中的顺序相同

我正在运行一组关于存储在marklogic中的数据的xqueries.当我看到结果时,我注意到数据记录的排序顺序与我从其加载的文件中的排序顺序不同.我使用flow studio将我的xml文档加载到marklogic中.我需要文件的顺序与源文件中的顺序相同.有没有办法实现这一目标?或者,如果不可能按升序排序文档将解决我的问题.该怎么办?注意:
我想订购xml文件而不是xquery结果

xml reload marklogic

-2
推荐指数
1
解决办法
98
查看次数