相关疑难解决方法(0)

public class Main {
    private static final int NUM_ITERS = 100;

    public static void main(String[] args) {
        long tInit = System.nanoTime();
        int c = 0;

        for (int i = 0; i < NUM_ITERS; ++i) {
            for (int j = 0; j < NUM_ITERS; ++j) {
                for (int k = 0; k < NUM_ITERS; ++k) {
                    if (i*i + j*j == k*k) {
                        ++c;
                        System.out.println(i + " " + j + " " + k); …

Run Code Online (Sandbox Code Playgroud)

java performance rust

Div*_*dir

2021 04-23

12
推荐指数

1
解决办法

1万
查看次数

如何在Java或C++中表示128位整数？

是否可以在Java或C++中使用128位整数？

c++ java integer 128-bit

dat*_*ili

2016 03-27

11
推荐指数

2
解决办法

2万
查看次数

在x86-64中使用32位寄存器/指令的优点

有时gcc使用32位寄存器,当我希望它使用64位寄存器时.例如以下C代码:

unsigned long long 
div(unsigned long long a, unsigned long long b){
    return a/b;
}

Run Code Online (Sandbox Code Playgroud)

使用-O2选项编译(省略一些样板文件):

div:
    movq    %rdi, %rax
    xorl    %edx, %edx
    divq    %rsi
    ret

Run Code Online (Sandbox Code Playgroud)

对于无符号除法,寄存器%rdx需要0.这可以通过xorq %rdx, %rdx但xorl %edx, %edx似乎具有相同的效果来实现.

至少在我的机器上没有性能提升(即加速)进行xorl了xorq.

我实际上不只是一个问题:

为什么gcc更喜欢32位版本？
为什么gcc会停止xorl并且不使用xorw？
有没有xorl比这更快的机器xorq？
如果可能的话,总是更喜欢32位寄存器/操作而不是64位寄存器/操作吗？

assembly gcc x86-64 micro-optimization

ead*_*ead

2019 10-28

7
推荐指数

2
解决办法

749
查看次数

现代 X86 处理器如何实际计算乘法？

我正在看一些关于算法的讲座，教授用乘法作为如何改进朴素算法的例子......

它让我意识到乘法并不是那么明显，虽然在我编码时我只是认为它是一个简单的原子操作，乘法需要一个算法来运行，它不像对数字求和那样工作。

所以我想知道，现代桌面处理器实际使用什么算法？我猜他们不依赖对数表，也不用数以千计的总和进行循环......

algorithm x86 cpu-architecture alu micro-architecture

spe*_*der

2020 05-31

4
推荐指数

1
解决办法

470
查看次数

英特尔和 AMD 如何不同但仍然兼容？

正如我一直所理解的那样，AMD 通过对英特尔的指令集进行逆向工程来构建他们的 CPU，现在支付给英特尔使用他们的指令集，而英特尔对 AMD 的 64 位指令也是如此。

这就是 Windows 可以安装在两种类型的 CPU 上的方式，而无需购买特定版本，例如为 ARM 编译的版本，因此所有应用程序、游戏等都以相同的方式工作，可在 CPU 上互换工作......

然而最近有些事情让我质疑其中的一些......

首先，我注意到一些游戏在我的系统 (AMD) 上有点滞后，阅读后发现游戏针对 Intel CPU 进行了优化......

此外，OSX 是在 Intel CPU 上销售的，但在发现 hackintosh 社区之后，事实证明让 OSX 在 AMD 上运行是可能的，但非常困难。这是因为 OSX 再次是为英特尔设计的......

这些事情之后..

针对 Intel 或 AMD 进行优化意味着什么？如果它们旨在相互替换，怎么可能对一个而不是另一个进行不同/优化？即都支持相同的指令等。

optimization x86 intel cpu-architecture amd-processor

bin*_*ker

2020 06-27

3
推荐指数

1
解决办法

2336
查看次数

x86乘法3：3：IMUL vs SHL + ADD

我在x86-64汇编中开发了一个程序，该程序需要通过相同的操作进行多次迭代：

IMUL rdx, 3   # rdx is always different

Run Code Online (Sandbox Code Playgroud)

但是，我需要使运行时更快，因此我从上面想到了对该特定行的优化：

MOV rcx, rdx
SHL rdx, 1
ADD rdx, rcx

Run Code Online (Sandbox Code Playgroud)

现在我问你们：这种修改会改善程序的运行时间（减少时钟），还是我应该坚持使用该IMUL命令？

x86 assembly x86-64 intel micro-optimization

作者

2019 07-19

1
推荐指数

1
解决办法

161
查看次数

标签统计

x86 ×3

algorithm ×2

assembly ×2

cpu-architecture ×2

intel ×2

java ×2

micro-optimization ×2

x86-64 ×2

128-bit ×1

alu ×1

amd-processor ×1

c ×1

c++ ×1

computer-science ×1

gcc ×1

hash ×1

integer ×1

mathematical-optimization ×1

micro-architecture ×1

optimization ×1

performance ×1

rust ×1

标签 统计

标签统计