如何删除提交,等待推送到远程?

我的情况是,那些排队提交(更改)已被推送(更严重),现在服务器拒绝接受那些因为他们在HEAD后面.
我尝试重置为另一个提交,但是当我回到HEAD时,再次重新出现.
单击存储库>刷新远程状态将无济于事,它实际上添加了第二个等待推送:)
PS:我为我的术语道歉,我对git很新.
.
更新1
当我将feature2提交到master分支时,问题就开始了.我没有权利在那里提交所以它被卡住了.然后我再次回到我的个人分支,这很好.然后我有一个等待提交,永远不会被推,即使我单击Push时选择了正确的(个人)分支.

好吧,我有一个非常微妙的问题:)
让我们从我拥有的东西开始:
我想要的:基本上只是想让它尽可能有效(快速),例如.避免将CUDA编译为PTX.解决方案甚至可以完全针对特定设备,这里不需要大的兼容性:)
我所知道的:我已经知道函数cuLoadModule,它可以从存储在文件中的PTX代码加载和创建内核.但我想,必须有一些其他方法可以直接创建内核,而不必先将其保存到文件中.或者也许可以将其存储为字节码?
我的问题:你会怎么做?您可以发布一个示例或链接到类似主题的网站吗?TY
编辑:好了,PTX内核可以直接从PTX字符串(char数组)运行.无论如何我仍然想知道,有没有更好/更快的解决方案呢?仍然存在从字符串到某些PTX字节码的转换,应该可以避免.我也怀疑,从PTX创建设备特定的Cuda二进制文件的一些聪明的方法可能存在,这将删除JIT编译器滞后(很小,但如果你有大量的内核要运行它可以加起来):)
问:如何从a-priory未知范围生成(多个)均匀分布的整数?在性能方面(生成的数字的数百万),首选的方式是什么?
上下文:在我的应用程序中,我必须在许多地方生成许多伪随机数.我使用单例模式生成器来保持应用程序运行的可重复性.在我的情况下,分布总是一致的,但问题是在C++ 11样式中预先制作分发对象有太多可能的范围.
我尝试过:有两个明显的解决方案,第一个是一次性分配对象,第二个是使用modulo将随机数从最宽的范围转换为所需的范围.但不知何故,我怀疑这些是最好的:)
#include <random>
#include <iostream>
#include "limits.h"
using namespace std;
mt19937 mt;
uniform_int_distribution<int> * fixedDist;
uniform_int_distribution<int> * variableDist;
// this version creates and delete dist after just one use
int getIntFromRange1(int from, int to){
variableDist = new uniform_int_distribution<int>(from,to);
int num = (*variableDist)(mt);
delete variableDist;
return num;
}
// this version contains modulo
int getIntFromRange2(int from, int to){
int num = (*fixedDist)(mt);
int diff = to - from;
num = num % diff;
return num + from;
} …Run Code Online (Sandbox Code Playgroud)