标签: analysis

超越 SOUNDEX 和差异 - SQL Server

我正在使用SOUNDEX&DIFFERENCE函数对表中的数据进行一些分析。

但此功能在以下类型的数据上失败。&完全不同ITEM TYPE。ITEM SIZE

SELECT SOUNDEX('ITEM TYPE'), SOUNDEX('ITEM SIZE')

op:-

I350    I350

For DIFFERENCE op: - 4

Run Code Online (Sandbox Code Playgroud)

我理解人类思维所做的每一项分析都无法编码，但我仍然想问，是否存在其他功能SQL Server可以帮助我进行下一级分析？

sql sql-server analysis text-analysis

Adi*_*tya

lucky-day

3
推荐指数

1
解决办法

3572
查看次数

Elasticsearch 自定义分析器，带有 ngram，连字符上没有单词分隔符

我正在尝试索引包含连字符但不包含空格、句点或任何其他标点符号的字符串。我不想根据连字符分割单词，而是希望连字符成为索引文本的一部分。

例如，我的 6 个文本字符串是：

杂志播放
马杂志
在线杂志
最佳杂志
杂志之友
杂志玩游戏

我希望能够在这些字符串中搜索包含 "play" 的文本或以 "magazine" 开头的文本。

我已经能够使用ngram使包含“play”的文本正常工作。但是，连字符导致文本分割，并且它包含连字符后面的单词中“杂志”的结果。我只希望出现以“magazine”开头的字符串。

根据上面的示例，当以“magazine”开头时，只有这 3 个应该出现：

杂志播放
马杂志
杂志玩游戏

请帮助我的 ElasticSearch 索引示例：

DELETE /sample

PUT /sample
{
    "settings": {
        "index.number_of_shards":5,
        "index.number_of_replicas": 0,
        "analysis": {
            "filter": {
                "nGram_filter": {
                   "type": "nGram",
                   "min_gram": 2,
                   "max_gram": 20,
                   "token_chars": [
                      "letter",
                      "digit"
                   ]
                },
                "word_delimiter_filter": {
                    "type": "word_delimiter",
                    "preserve_original": true,
                    "catenate_all" : true
                }
             },
          "analyzer": {
            "ngram_index_analyzer": {
              "type" : "custom",
              "tokenizer": "lowercase",
              "filter" …

Run Code Online (Sandbox Code Playgroud)

analysis tokenize analyzer elasticsearch

Dav*_*all

2017 04-19

3
推荐指数

1
解决办法

2728
查看次数

真实世界MySQL/Postgres数据库架构示例和分析工具

我正在对模式演化进行分析,并且实际上没有真正的数据库模式,这些模式已经进化了一些并存储在版本控制中.到目前为止,Mediawiki(http://svn.wikimedia.org/svnroot/mediawiki/trunk/phase3/maintenance/tables.sql)似乎是一个非常好的候选人.我已经考虑过Bugzilla,但它们似乎没有像Mediawiki那样在主干中使用.sql文件.必须执行构建数据库模式/表的Perl脚本 - 因此我不必像mediawiki(tables.sql)那样只获取一个文件,我现在必须下载整个Bugzilla文件夹以进行不同的修订以了解模式更改.

问题1: 我想知道是否有人知道或使用过大型数据库模式,这些模式是开源的,在版本控制下并且变化足够大以进行模式演化分析(最好有DDL脚本 - .sql文件).

问题2: 另外,您是否遇到过在.sql文件(DDL脚本)上提供分析(表/列计数,修订版之间的补丁等)的任何工具.我发现的所有工具都需要在对它们进行任何分析之前将.sql文件加载到数据库中.

对于这两个问题,首选MySQL或Postgres作为数据库.

我很满意这个社区的其他成员的任何回应.

谢谢,

Venkatesh Mandalapa

database schema analysis relational

作者

lucky-day

2
推荐指数

1
解决办法

4835
查看次数

如何分析封闭格式(例如doc或vce)？

我想学习.vce格式.它是一种二进制格式,看起来比简单的对象序列化更复杂.是否存在分析二进制格式的任何工具或技术？

format binary analysis reverse-engineering

Ric*_*ald

2011 09-22

2
推荐指数

1
解决办法

2882
查看次数

统计余弦分析,

嘿,我正在尝试计算统计量中的余弦分析,但我不知道如何这样做.我需要计算节奏数据的MESOR,AMPLITUDE和ACROPHASE.

http://www.wepapers.com/Papers/73565/Cosinor_analysis_of_accident_risk_using__SPSS%27s_regression_procedures.ppt

有一个链接,显示如何做,公式等,但它没有给我很多帮助.有没有人知道它的代码,无论是在statistica还是SPSS？

我真的需要这样做,因为它是一篇重要的论文

statistics trigonometry analysis time-series spss

bra*_*man

2010 05-25

2
推荐指数

1
解决办法

4443
查看次数

访问控制图导致R？

我有一个简短的R脚本,它加载一堆数据并将其绘制在XBar图表中.使用以下代码,我可以绘制数据并查看各种统计信息.

library(qcc)
tir<-read.table("data.dat", header=T,,sep="\t")
names(tir)
attach(tir)
rand <- sample(tir)
xbarchart <- qcc(rand[1:100,],type="R")
summary(xbarchart)

Run Code Online (Sandbox Code Playgroud)

我希望能够在创建XBar图表后立即进行一些过程能力分析(在此处描述(PDF),第5页).为了创建分析图表,我需要将之前创建的XBar图表结果中的LCL和UCL结果存储为变量.有什么方法可以做到这一点吗？

charts analysis r process capability

Bat*_*son

lucky-day

2
推荐指数

1
解决办法

1846
查看次数