我想在pyspark数据框中从指定的数字开始创建具有连续数字的列。例如,我想将A列添加到我的数据帧df中,该列将从5开始到数据帧的长度,递增 1,因此5、6、7,...,长度( df )。
使用pyspark方法的一些简单解决方案?
是否有托管系统级序列号生成器?DateTime.Now.Ticks不会这样做,因为我正在做的操作有时每次打勾都会发生多次.
要求澄清:
它必须是以下之一:
以下是用于创建从1到10的连续数字列表的代码.我想使用innerHTML获取此列表并在div"pagination"中输出.但是,当我执行脚本时,输出的唯一内容是数字10.当我使用document.write覆盖页面时,它会输出整个列表.有人能告诉我我做错了什么吗?谢谢.
function generateNumbers() {
var numbers = new Array();
// start generating numbers
for(var i = 1; i <= 10; i+= 1) {
numbers.push( i );
}
// print numbers out.
for(var i = 0; i < numbers.length; i++) {
document.getElementById("pagination").innerHTML = numbers[i] + "<br>";
}
}
Run Code Online (Sandbox Code Playgroud)
在HTML中:
<div id="pagination"></div>
Run Code Online (Sandbox Code Playgroud) 这个问题是我之前关于发现未使用的序列号范围的问题的后续问题,而不必使用游标(在没有游标的情况下使用SQL Server 2005中的序列号).我正在使用SQL Server 2005.
我需要对这些数字做的是将这些数字分配给表格中的记录.我似乎无法想出一种方法来实际将数字表与需要这些数字的记录联系起来.
我想到的一个可能的解决方案是使用标识将记录插入临时表中,并使用数字范围的开头作为标识种子.这种方法的唯一问题是,如果数字序列中存在间隙,那么我将最终得到重复的控制数.
这就是我的表格的样子(过于简化):
数字表:
Number
-------
102314
102315
102319
102320
102324
102329
Run Code Online (Sandbox Code Playgroud)
数据表:
CustomerId PaymentAmt ControlNumber
---------- ---------- -------------
1001 4502.01 NULL
1002 890.00 NULL
9830 902923.34 NULL
Run Code Online (Sandbox Code Playgroud)
我需要一种方法来实现它,所以我最终得到:
CustomerId PaymentAmt ControlNumber
---------- ---------- -------------
1001 4502.01 102314
1002 890.00 102315
9830 902923.34 102319
Run Code Online (Sandbox Code Playgroud)
这是否可以在不使用游标的情况下实现?我之所以避免使用游标是因为我们当前的实现使用了游标,因为它很慢(超过12,000条记录的8分钟),我一直在寻找替代方案.
注意:感谢所有发布答案的人.所有这些都很棒,我不得不选择一个看起来更容易实现并且最容易维护的人.非常感激.
假设您要创建2D numpy数组,并希望使用顺序整数填充它.有哪些选择?
例:
import numpy
a=numpy.array([[0,1,2,3,4],[5,6,7,8,9],[10,11,12,13,14]])
Run Code Online (Sandbox Code Playgroud)
在这种情况下,我当然可以range(15)用来确定上边界,但如何告诉numpy在5值之后创建一个新行?我正在寻找一个通用的解决方案,因为我的真正问题围绕着一个包含466列和365行的2D数组.