标签: analysis

Python和Perl解决方案与Wide Finder挑战的比较

如果你能将胜利的O'Rourke的Perl解决方案Lundh的Python解决方案进行比较,我将非常感激,因为我不知道Perl是否足以理解那里发生的事情.更具体地说,我想知道是什么赋予了Perl版本3x的优势:算法优势,C扩展的质量,其他因素?

Wide Finder:结果

python perl performance analysis

8
推荐指数
2
解决办法
1781
查看次数

预分类分析算法?

Quicksort是一个众所周知的问题,当数据集处于或几乎按排序顺序时,性能会大幅降低.在这种情况下,插入排序通常非常慢,很容易成为最佳选择.问题是知道何时使用哪个.

是否有可用于运行数据集的算法,应用比较因子,并返回有关数据集与排序顺序的接近程度的报告?我更喜欢Delphi/Pascal,但如果示例不是过于复杂,我可以阅读其他语言.

delphi sorting algorithm analysis

8
推荐指数
1
解决办法
1677
查看次数

有没有办法获取应用于HTML片段或页面的所有CSS的列表?

我知道使用Firefox的Firebug扩展等工具可以很容易地获得应用于HTML中单个节点的CSS.

但有没有办法看到整个页面上生效的所有 CSS,或者更大的HTML片段?

具体来说,我们正在将一个非常大的CSS文件清理成更小的模块,并希望找出某个页面上使用的CSS,因此我们可以将所有未使用的CSS移动到另一个模块.

html css analysis

8
推荐指数
2
解决办法
2277
查看次数

友谊没有继承 - 有哪些替代方案?

我已经写过/我正在编写一段物理分析代码,最初是为了我自己,现在希望由一小群物理学家使用和扩展.我们都不是C++大师.我已经整理了一个小框架,将"物理事件"数据抽象为由一系列工具操作的对象,这些工具可以根据分析要求轻松交换.

这创造了代码的两半:"物理分析"代码,它操纵事件对象并通过基础"工具"的衍生产生我们的结果; 以及附加输入文件的"结构"代码,将作业拆分为并行运行,根据某些脚本将工具链接到链中等.

问题在于:对于其他人来说,要使用代码,每个用户都应该能够遵循以任何方式修改事件数据的每一步.因此,(许多)额外的困难结构代码线可能是令人生畏的,除非它明显且明显地是物理学的外围.更糟糕的是,在太多细节上看它可能会给人们一些想法 - 我宁愿他们没有很好的理由不编辑结构代码 - 最重要的是他们不得引入任何影响物理的东西.

我希望能够:

  • A)以明显的方式演示结构代码不以任何方式编辑事件数据
  • B)一旦其他用户开始自己扩展代码就强制执行(我们都不是专家,物理总是第一位 - 翻译:任何没有用的东西都是公平的游戏,讨厌讨厌的黑客)

在我理想的场景中,事件数据将是私有的,派生的物理工具继承了Tool基类的访问权限.当然,实际上这是不允许的.我听说有充分的理由,但这不是问题.

不幸的是,在这种情况下,从基础(它是朋友)调用getter/setter的方法会产生比它解决的问题更多的问题 - 代码应该是干净的,易于遵循的,并且尽可能地连接到物理上.工具本身的实现(用户不需要成为C++的专家或程序的内部工作来创建工具).

鉴于我有一个值得信赖的基类,任何衍生品都会受到密切关注,是否有其他环形交叉口但经过良好测试的方式只允许访问这些衍生品?或者任何拒绝访问某些其他基础的衍生物的方法?


为了澄清情况,我有类似的东西

class Event
{
    // The event data (particle collections etc)
};

class Tool
{
    public:
        virtual bool apply(Event* ev) = 0;
};

class ExampleTool : public Tool
{
    public:
        bool apply(Event* ev)
        {
            // do something like loop over the electron collection
            // and throw away those will low energy
        }
};
Run Code Online (Sandbox Code Playgroud)

由于上述两个原因(A和B),理想情况是将对Event的内容的访问限制为仅这些工具.

感谢大家提出的解决方案.我认为,正如我所怀疑的那样,我所希望的完美解决方案是不可能的.dribeas的解决方案在任何其他设置中都是完美的,但它恰好在apply()函数中,代码需要尽可能清晰和简洁,因为我们基本上会花一整天时间编写/编辑apply()函数,并且还会需要了解每个人写的每一行.它与可读性和努力能力无关.我喜欢"无用"的预处理器解决方案.它并没有真正强制执行分离,但有人需要真正恶意破坏它.对于那些建议使用图书馆的人,我认为这肯定是一个很好的第一步,但并没有真正解决两个主要问题(因为我仍然需要提供源代码).

c++ inheritance physics analysis friend

8
推荐指数
1
解决办法
321
查看次数

算法空间复杂度教程

可能重复:
Big O的简单英文解释

我一直在努力计算我编写的算法的Big-O时间和空间复杂度.

任何人都可以指出一个很好的资源来研究算法的空间复杂性.

编辑:我在发布之前搜索过教程.遗憾的是,所有教程都侧重于运行时复杂性,并且几乎没有写太多关于空间复杂性的内容.

algorithm analysis space-complexity

8
推荐指数
1
解决办法
1万
查看次数

重现T(n)= T(n ^(1/2))+ 1

我一直在看这个重复,并想检查我是否采取了正确的方法.

T(n) = T(n^(1/2)) + 1
= T(n^(1/4)) + 1 + 1
= T(n^(1/8)) + 1 + 1 + 1
...
= 1 + 1 + 1 + ... + 1 (a total of rad n times)
= n^(1/2)
Run Code Online (Sandbox Code Playgroud)

所以答案将达到n ^(1/2)的θ界限

algorithm math big-o recurrence analysis

8
推荐指数
2
解决办法
2万
查看次数

功能规划的分析与设计

当您计划使用像Haskell这样的函数式编程语言开发系统时,如何处理分析和设计阶段?

我的背景是命令式/面向对象的编程语言,因此,我习惯使用案例分析和使用UML来记录程序的设计.但事实是,UML本质上与面向对象的软件方式有关.

我很感兴趣的是,为将要使用函数式编程开发的系统开发文档和定义软件设计的最佳方法是什么.

  • 您是否仍会使用用例分析结构化分析和设计
  • 软件架构师如何定义系统的高级设计,以便开发人员遵循它?
  • 当您应该展示解决方案的设计时,您向客户或新开发人员展示了什么?
  • 如何在不首先编写所有内容的情况下记录整个图片?
  • 在功能世界中有没有可与UML相媲美的东西?

haskell functional-programming analysis software-design purely-functional

8
推荐指数
1
解决办法
1605
查看次数

是否有类似于Solr分析工具的Elasticsearch插件?

Solr具有内置的"分析屏幕",有助于调试特定字段类型的标记器和过滤器之间的相互作用:

在此输入图像描述

是否有一个ElasticSearch插件可以做类似的事情?具体来说,我希望看到每个过滤器的输入/输出,而不仅仅是分析链的最终结果.我在这方面非常密集地使用谷歌,但没有找到任何东西.

https://www.found.no/play/#analysis完全包含我想要的功能(向下滚动到"myAnalyzer"),但不幸的是,这不是我可以在我的索引上运行的东西.但它表明这样的功能是可能的.

编辑:我知道有很多插件显示完整的过滤器链的输出,例如用户@Bass建议的kopf:

在此输入图像描述

这不是我想要的!我想看看每个过滤器的输出,而不仅仅是最终结果.

solr analysis elasticsearch

8
推荐指数
1
解决办法
410
查看次数

Sedgewick算法4,为什么BinarySearchST将FrequencyCounters的测试成本低于SequentialSearchST?

我正在阅读算法第4版.我在阅读第3章搜索时遇到了一些问题.从成本汇总中,BinarySearchST的插入成本(在最坏的情况下为2N)比SequentialSearchST(在最坏的情况下为N)稍差.但使用VisualAccumulator(绘制图表)的FrequencyCounter测试显示

对于长度为8或更长的字,返回FrequencyCounter的put()操作的成本,我们看到,对于SequentialSearchST,每次操作的平均成本从2,246比较(加上数组访问)减少到BinarySearchST的484.

BinarySearchST的put()操作是否需要比SequentialSearchST更多的比较(加上数组访问)?

另一个问题,对于BinarySearchST,这本书说

命题B(续).在最坏的情况下,将一个新密钥插入一个大小为N的有序数组中使用~2N数组访问,因此在最坏的情况下将N个密钥插入一个最初为空的表使用~N 2个数组访问

当我查看BinarySearchST的代码时,我认为将一个新密钥插入一个大小为N的有序数组中会使用~4N数组访问.

    public void put(Key key, Value val)  {
    if (key == null) throw new IllegalArgumentException("first argument to put() is null"); 

    if (val == null) {
        delete(key);
        return;
    }

    int i = rank(key);

    // key is already in table
    if (i < n && keys[i].compareTo(key) == 0) {
        vals[i] = val;
        return;
    }

    // insert new key-value pair
    if (n == keys.length) resize(2*keys.length);

    for (int j = n; j > …
Run Code Online (Sandbox Code Playgroud)

algorithm analysis

8
推荐指数
1
解决办法
231
查看次数

带有管道和 GridSearchCV 的 StandardScaler

我已将 standardScaler 放在管道上,并且 CV_mlpregressor.predict(x_test) 的结果很奇怪。我想我必须从 standardScaler 取回这些值,但仍然不知道如何做。

pipe_MLPRegressor = Pipeline([('scaler',  StandardScaler()),
            ('MLPRegressor', MLPRegressor(random_state = 42))])


grid_params_MLPRegressor = [{
    'MLPRegressor__solver': ['lbfgs'],
    'MLPRegressor__max_iter': [100,200,300,500],
    'MLPRegressor__activation' : ['relu','logistic','tanh'],
    'MLPRegressor__hidden_layer_sizes':[(2,), (4,),(2,2),(4,4),(4,2),(10,10),(2,2,2)],
}]


CV_mlpregressor = GridSearchCV (estimator = pipe_MLPRegressor,
                               param_grid = grid_params_MLPRegressor,
                               cv = 5,return_train_score=True, verbose=0)

CV_mlpregressor.fit(x_train, y_train)

CV_mlpregressor.predict(x_test)
Run Code Online (Sandbox Code Playgroud)

结果:

array([ 2.67564153e+04,  1.90010572e+04,  9.62702942e+04,  3.98791931e+04,
        1.48889808e+03,  7.08980726e+03,  3.86311279e+02,  7.05602301e+04,
        4.06858486e+03,  4.29186303e+04,  3.86701735e+03,  6.30228075e+04,
        6.78276925e+04, -5.91956287e+02, -7.37680434e+02,  3.07485001e+04,
        4.81417953e+03,  5.18697686e+03,  1.61221952e+04,  1.33794944e+04,
       -1.48375101e+03,  1.80891807e+04,  1.39740243e+04,  6.57156849e+04,
        3.32962481e+04,  5.71332087e+05,  1.79130092e+03,  5.25642370e+04,
        2.08111172e+04,  4.31060127e+04])
Run Code Online (Sandbox Code Playgroud)

提前致谢。

python regression analysis scikit-learn

8
推荐指数
1
解决办法
6048
查看次数