小编Joh*_*ica的帖子

为什么这些矩阵乘法的性能如此不同?

我用Java编写了两个矩阵类,只是为了比较矩阵乘法的性能.一个类(Mat1)存储矩阵double[][] A行所在的成员.其他类(MAT2)存储和其中是的转置.iA[i]ATTA

假设我们有一个方矩阵M,我们想要它的乘积M.mult(M).打电话给产品P.

当M是Mat1实例时,使用的算法是直截了当的:

P[i][j] += M.A[i][k] * M.A[k][j]
    for k in range(0, M.A.length)
Run Code Online (Sandbox Code Playgroud)

在M是我使用的Mat2的情况下:

P[i][j] += M.A[i][k] * M.T[j][k]
Run Code Online (Sandbox Code Playgroud)

这是相同的算法,因为T[j][k]==A[k][j].在1000x1000矩阵上,第二个算法在我的机器上花费大约1.2秒,而第一个算法花费至少25秒.我期待第二个更快,但不是这么多.问题是,为什么这么快?

我唯一的猜测是第二个更好地利用了CPU缓存,因为数据以大于1个字的块的形式被拉入缓存,第二个算法通过仅遍历行来获益,而第一个算法忽略了拉入的数据缓存通过立即到达下面的行(在内存中大约1000个字,因为数组以行主要顺序存储),没有缓存的数据.

我问了一个人,他认为这是因为更友好的内存访问模式(即第二个版本会导致更少的TLB软故障).我根本没有想到这一点,但我可以看到它如何导致更少的TLB故障.

那么,这是什么?还是有其他原因导致性能差异?

java performance matrix-multiplication

11
推荐指数
1
解决办法
436
查看次数

将Double转换为二进制表示?

我有以下问题,所以我试图将一个double转换为它的二进制表示,但使用这个Long.toBinaryString(Double.doubleToRawLongBits(d))没有帮助,因为我有大数字,Long不能存储它们,即2^900.

感谢任何帮助:).

java binary double type-conversion long-integer

11
推荐指数
3
解决办法
3万
查看次数

Java - 反编译时字符串等于

我前几天反编译了一些Java代码并发现了这个:

String s1 = "something";
String s2 = "something_else";

if (s1 == s2) {
// Path 1
} else {
// Path 2
}
Run Code Online (Sandbox Code Playgroud)

显然使用'=='来测试字符串相等是不好的

但我想知道 - 这段代码已被编译和反编译.如果在编译时已经定义了所有字符串并且已经编译并且代码已经编译 - 是否可能s1.equals(s2)已经优化到's1 == s2'?

java string optimization equality string-interning

11
推荐指数
1
解决办法
570
查看次数

整数是如何存储在内存中的?

这很可能是任何人都会问的最愚蠢的问题,但不管我希望我能找到一个明确的答案.

我的问题是 - 整数存储在计算机内存中怎么样?

在c#中,整数的大小为32位.MSDN说我们可以在整数变量中存储-2,147,483,648到2,147,483,647的数字.

根据我的理解,一个位只能存储2个值,即0和1.如果我只能存储0或1,我怎么能在一个位内存储2到9的数字?

更确切地说,我说这个代码int x = 5; 这将如何在内存中表示,或者换句话说如何将5转换为0和1,它背后的惯例是什么?

c# binary twos-complement

11
推荐指数
2
解决办法
5951
查看次数

VBA从SAP中提取数据以获取虚拟对象

有谁知道如何使用VBA从SAP Netweaver中提取数据?

我有许多日常报告,需要将数据从SAP导出到Excel并将其格式化为报告.我已经编写了可以进行格式化的工作VBA宏.我必须手动提取数据并单独运行每个报表宏.如果我的宏可以进入SAP,获取报告#1的数据,格式化它,获取报告#2的数据等,那么可以节省很多时间.

我使用SAP NetWeaver(版本730,版本7300.1.3.1079).报告只是Excel数据透视表和图表.

谢谢!

excel sap vba netweaver

11
推荐指数
1
解决办法
16万
查看次数

char*s []和char(*s)[]之间有什么区别?

当我阅读有关C语言的书籍时,两级指针给我带来了很多困扰.

char s[5][5];
char *s[5];
char (*s)[5];
Run Code Online (Sandbox Code Playgroud)

那么他们之间有什么区别?

c pointers

11
推荐指数
2
解决办法
2565
查看次数

为什么不能通过"数据执行预防"修复Javascript shellcode漏洞?

"堆喷洒"维基百科的文章表明,许多的JavaScript漏洞涉及脚本的可执行代码或数据存储空间的某处定位的shellcode,然后有解释跳到那里,然后执行它.我不明白的是,为什么不能将解释器的整个堆标记为"数据",以防止解释器通过DEP执行shellcode?同时javascript派生字节码的执行将由虚拟机完成,该虚拟机不允许它修改属于解释器的内存(这在V8似乎执行机器代码时不起作用,但可能适用于使用某种类型的Firefox字节码).

我想上面的声音听起来很微不足道,而且很可能就是这样的事情.所以,我试图了解推理中的缺陷或现有解释器实现中的缺陷.例如,当javascript请求内存时,解释器是否依赖于系统的内存分配而不是实现自己的内部分配,从而使得分离属于解释器和javascript的内存过于困难?或者为什么基于DEP的方法不能完全消除shellcode?

javascript exploit data-execution-prevention shellcode

11
推荐指数
1
解决办法
892
查看次数

Deque随机访问python中的O(n)而C++中的O(1),为什么?

C++ deque:

随机访问 - 常数O(1)

Python deque:

索引访问在两端都是O(1),但在中间减慢到O(n).

如果我没有遗漏任何东西,那么其他一切对于python和C++中的deques都同样快,至少在复杂性方面.在某些情况下,有什么能让python的deque变得更好吗?如果没有,为什么他们不切换到C++有什么?

python deque

11
推荐指数
1
解决办法
618
查看次数

如何枚举字符串向量?

let output_sorted: Vec<String> = four_digit_ouput
        .iter()
        .map(|tok| tok.chars().sorted().collect::<String>())
        .collect();

let output = 0;
for (idx, digit) in output_sorted.enumerate() {
Run Code Online (Sandbox Code Playgroud)

当我尝试对字符串向量进行枚举 for 循环时,出现此错误:

let output_sorted: Vec<String> = four_digit_ouput
        .iter()
        .map(|tok| tok.chars().sorted().collect::<String>())
        .collect();

let output = 0;
for (idx, digit) in output_sorted.enumerate() {
Run Code Online (Sandbox Code Playgroud)

这是怎么回事?哪些特征边界不允许枚举?

iterator enumerate rust

11
推荐指数
1
解决办法
2万
查看次数

内置运算符 == 重载的解析

在以下代码中,struct A有两个隐式转换运算符到charint,并且将结构体的实例与整数常量进行比较2

struct A {
    constexpr operator char() { return 1; }
    constexpr operator int() { return 2; }
};
static_assert( A{} == 2 );
Run Code Online (Sandbox Code Playgroud)

代码在 GCC 和 MSVC 中顺利通过,但 Clang 抱怨:

<source>:5:20: error: use of overloaded operator '==' is ambiguous (with operand types 'A' and 'int')
static_assert( A{} == 2 );
               ~~~ ^  ~
<source>:5:20: note: because of ambiguity in conversion of 'A' to 'float'
<source>:2:15: note: candidate function
    constexpr operator …
Run Code Online (Sandbox Code Playgroud)

c++ language-lawyer overload-resolution implicit-conversion

11
推荐指数
1
解决办法
391
查看次数