我正在尝试编写一个 bash 脚本,用于按行和列计算数字的平均值。我正在阅读的文本文件的一个例子是:
1 2 3 4 5
4 6 7 8 0
Run Code Online (Sandbox Code Playgroud)
行数未知,列数未知。目前,我只是想用 while 循环对每一行求和。所需的输出是:
1 2 3 4 5 Sum = 15
4 6 7 8 0 Sum = 25
Run Code Online (Sandbox Code Playgroud)
依此类推,每一行。目前这是我的代码:
while read i
do
echo "num: $i"
(( sum=$sum+$i ))
echo "sum: $sum"
done < $2
Run Code Online (Sandbox Code Playgroud)
要调用程序,它是 stats -r test_file。“-r”表示行——我还没有开始列。我当前的代码实际上只是取每列的第一个数字并将它们加在一起,然后其余的数字作为语法错误出现。它说错误来自像 16,这是 (( sum=$sum+$i )) 行,但老实说,我无法弄清楚问题是什么。我应该告诉你,我对 bash 脚本非常陌生,我在谷歌上搜索并搜索了很多关于这个问题的答案,但找不到。任何帮助是极大的赞赏。
我有表中的数据如下
DEPTNO ENAME SALARY
------ ---------- ------
Developer SENIOR 100000
Developer JUNIOR 100000
Tester SENIOR 200000
Tester JUNIOR 100000
Architect SENIOR 300000
Architect JUNIOR 300000
Run Code Online (Sandbox Code Playgroud)
我需要向他们展示
Occupation Senior Sal Junior Sal
------ ---------- ------
Developer SENIOR JUNIOR
Developer 100000 100000
Tester SENIOR JUNIOR
Tester 200000 100000
Architect SENIOR JUNIOR
Architect 300000 300000
Run Code Online (Sandbox Code Playgroud)
我坚持这个如何实现这一目标
我正在用 HTML 生成一个表格。我有许多行,其计数保存在变量中{{ items|length }}
如何使除标题行之外的所有行都具有相同的高度?
我试过了:
<style>
table.equalDivide th { width:100 / {{ items|length }} %; }
</style>
Run Code Online (Sandbox Code Playgroud)
但这不起作用。
所有行都应具有最高行的高度(下图中的 12:00 - 14:00)。
我有一个大约有 9k 行和 57 列的数据框,这是“df”。
我需要一个新的数据框:'df_final' - 对于 'df' 的每一行,我必须复制每一行 'x' 次,并逐行增加每一行的天数,也是 'x' 次。虽然我可以在几次迭代中执行此操作,但当我为 'df' 'len(df)' 的全长执行此操作时,循环需要很长时间(> 3 小时),以至于我实际上不得不取消它。我从未见过它的尽头。这是当前的代码:
df.shape
output: (9454, 57)
df_int = df[0:0]
df_final = df_int[0:0]
range_df = len(df)
for x in range(0,2):
df_int = df.iloc[0+x:x+1]
if abs(df_int.iat[-1,3]) > 0:
df_int = pd.concat([df_int]*abs(df_int.iat[-1,3]), ignore_index=True)
for i in range(1, abs(df_int.iat[-1,3])):
df_int['Consumption Date'][i] = df_int['Consumption Date'][i-1] + datetime.timedelta(days = 1)
i += 1
df_final = df_final.append(df_int, ignore_index=True)
x += 1
Run Code Online (Sandbox Code Playgroud)
'df' 前两行的循环结果如下。
是否有另一种方法可以获得所需的输出。似乎熊猫不太擅长处理循环。在 VBA excel 中,相同的循环大约需要 3/4 …
在 Julia 中使用 DataFrame,我想根据列中的值选择行。
用下面的例子
using DataFrames, DataFramesMeta
DT = DataFrame(ID = [1, 1, 2,2,3,3, 4,4], x1 = rand(8))
Run Code Online (Sandbox Code Playgroud)
我想提取 ID 取值为 1 和 4 的行。目前,我提出了该解决方案。
@where(DT, findall(x -> (x==4 || x==1), DT.ID))
Run Code Online (Sandbox Code Playgroud)
当仅使用两个值时,它是可管理的。
但是,我想让它适用于要选择的 ID 具有多行和大量值的情况。因此,如果我需要写下所有要选择的值,这个解决方案是不切实际的
有什么更好的解决方案可以使这个选择通用?
达米安
我目前有一个跟踪已完成 5 次测试的数据集,但是它只显示那些已完成测试的人,而不是那些尚未参加的人 - 示例如下:
Name Test Completed
John Math-Test1 Yes
John Math-Test2 Yes
John Math-Test3 Yes
John Math-Test4 Yes
John Math-Test5 Yes
Lauren Math-Test1 Yes
Lauren Math-Test2 Yes
Lauren Math-Test3 Yes
Tom Math-Test1 Yes
Tom Math-Test2 Yes
Tom Math-Test3 Yes
Tom Math-Test4 Yes
Tom Math-Test5 Yes
Run Code Online (Sandbox Code Playgroud)
如您所见,Lauren 尚未参加“Math-Test4”和“Math-Test5”测试,因此她的名字没有出现。我想添加一个选项,让“已完成”列在有人尚未完成测试时显示“否”。
所需的输出如下:
Name Test Completed
John Math-Test1 Yes
John Math-Test2 Yes
John Math-Test3 Yes
John Math-Test4 Yes
John Math-Test5 Yes
Lauren Math-Test1 Yes
Lauren Math-Test2 Yes
Lauren Math-Test3 Yes
*Lauren Math-Test4 No* …Run Code Online (Sandbox Code Playgroud) 我有一个喜欢下面的示例数据。开始和结束在列中配对。
而且我不知道一个 Start 和 End 之间有多少行,因为实际数据很大。
df = pd.DataFrame({'Item':['Item_A','<Start>','A1','A2','<End>','Item_B','<Start>','B1','B2','B3','<End>']})
print (df)
Item
0 Item_A
1 <Start>
2 A1
3 A2
4 <End>
5 Item_B
6 <Start>
7 B1
8 B2
9 B3
10 <End>
Run Code Online (Sandbox Code Playgroud)
如何使用 Pandas 将其更改为以下格式?谢谢。
我有一个表(id ="docsTable"),其行看起来类似于:
<tr bgcolor="#E7DDCC">
<td align="center"><input type="checkbox" name="docsToAddToClass[]" value="35" /></td>
<td>Document Title</td>
<td>Document Description.</td>
</tr>
Run Code Online (Sandbox Code Playgroud)
我需要遍历表,确定用户已选中的复选框,对于带有复选复选框的行,请获取第一个的值和下两个的文本.
我不需要构建集合:在每次迭代中,我想在其他地方更改一些元素.这不是困难的部分(对我来说).它试图弄清楚如何遍历表并仅选中带有选中复选框的s.
我在Pandas中有一个如上所述的数据框:
A B C
0 1 10 43
1 2 12 34
2 1 9 57
3 2 7 47
4 1 6 30
5 2 10 31
Run Code Online (Sandbox Code Playgroud)
我想做的是根据A列计算每两行的差异(当A = 1-A = 2时,基本上得到所有其他列的差异)。所以,我想提出这样的事情:
B C
0 -2 9
1 2 10
2 -4 -1
Run Code Online (Sandbox Code Playgroud)
我知道diff()函数,但似乎没有完成我想要的事情。有办法吗?
我是一个新的 Python 用户,我正在尝试学习它,以便我可以完成一个关于加密货币的研究项目。我想要做的是在找到条件后立即检索值,然后在另一个变量中检索 7 行后的值。
我正在处理一个包含 2250 行和 25 列的 Excel 电子表格。通过添加如下详述的 4 列,我得到了 29 列。它有很多 0(未找到模式)和几个 100(已发现模式)。我希望我的程序能够获取 100 所在行之后的行,并返回其收盘价。这样,我可以看到该模式当天和该模式之后一天之间的差异。我还想连续执行 7 天,以找出该模式在一周内的表现。
您也可以看到 -100 个单元格,这些是看跌模式识别。现在我只想使用“100”个单元格,这样我至少可以完成这项工作。
我希望这样的事情发生:
import pandas as pd
import talib
import csv
import numpy as np
my_data = pd.read_excel('candlesticks-patterns-excel.xlsx')
df = pd.DataFrame(my_data)
df['Next Close'] = np.nan_to_num(0) #adding these next four columns to my dataframe so I can fill them up with the later variables#
df['Variation2'] = np.nan_to_num(0)
df['Next Week Close'] = np.nan_to_num(0)
df['Next Week Variation'] = np.nan_to_num(0) …Run Code Online (Sandbox Code Playgroud)