我有一个仅由一列数据组成的熊猫数据框。我想将数据列转换为列表。该列具有浮点数据类型。
例如:
ColA
341321432
132184900
173840143
1432473928
Run Code Online (Sandbox Code Playgroud)
期望的:341321432、132184900、173840143、1432473928
下面是我的Python代码:
df_gearME = pd.read_excel('Gear M&Es.xlsx')
df_gearME['ColA'].to_list()
Run Code Online (Sandbox Code Playgroud)
但是我得到的错误如下:
AttributeError: 'Series' object has no attribute 'to_list'
Run Code Online (Sandbox Code Playgroud) 我是全新的pyspark,想将我现有的pandas/python代码转换为PySpark.
我想对 my 进行子集化,dataframe以便只'original_problem'返回包含我在字段中查找的特定关键字的行。
下面是我在 PySpark 中尝试的 Python 代码:
def pilot_discrep(input_file):
df = input_file
searchfor = ['cat', 'dog', 'frog', 'fleece']
df = df[df['original_problem'].str.contains('|'.join(searchfor))]
return df
Run Code Online (Sandbox Code Playgroud)
当我尝试运行上述程序时,出现以下错误:
AnalysisException: u"无法从 original_problem#207 中提取值:需要结构类型但得到字符串;"
我有以下数据框:
ID Minutes Datetime
1 30 6/4/2018 23:47:00
2 420
3 433 6/10/2018 2:50
4 580 6/9/2018 3:10
5 1020
Run Code Online (Sandbox Code Playgroud)
我想计算某个范围内 Minutes 出现的次数。我想对日期时间字段进行类似的计数(时间戳落在一定的时间范围内)。
下面是我想要的输出:
MIN_RANGE COUNT
6-8 hours 2
8-10 hours 1
10-12 hours 0
12-14 hours 0
14-16 hours 0
16+ hours 1
RANGE COUNT
8pm - 10pm 0
10pm - 12am 1
12am - 2am 0
2am-4am 2
4am-6am 0
6am-8am 0
8am -10am 0
10am - 12pm 0
12pm - 2pm 0
2pm - 4pm 0
4pm …Run Code Online (Sandbox Code Playgroud) 我有下面的代码。在这种情况下,我有意尝试使用 forEach。
function check(arr, el) {
arr.forEach((element) => {
console.log(element)
if (element === el) {
return true
}
})
}
check([1, 2, 3, 4, 5], 3)
Run Code Online (Sandbox Code Playgroud)
我期望代码返回 true,因为 el 值 3 在数组中。但它返回未定义。我究竟做错了什么?
我目前拥有的 python 数据框包含两列:“EVENT”和“NAME”。
EVENT NAME
A DEN
B HAU
C TOT
D ABC
E DEN
Run Code Online (Sandbox Code Playgroud)
我想实现逻辑,以便我的 EVENT 列如下:
EVENT
A_DEN
B
C
D
E_DEN
Run Code Online (Sandbox Code Playgroud)
我想实现逻辑,如果“NAME”列包含 DEN 值,然后将它连接到“EVENT”列中的值。否则,保留“EVENT”列中的值。
我已经在互联网上搜索了如何执行此操作,但无法找到任何特定于我要完成的任务。
我有以下数据框:
+---+---+------+
| id| ts|days_r|
+---+---+------+
|123| T| 32|
|342| I| 3|
|349| L| 10|
+---+---+------+
Run Code Online (Sandbox Code Playgroud)
我想创建一个新列,并根据在“ ts”列和“ days_r”列上是否满足某些条件来填充值。
这是我想要的数据框:
+---+---+------+----------+
| id| ts|days_r|0to2_count|
+---+---+------+----------+
|123| T| 32| 1|
|342| I| 3| 0|
|349| L| 10| 0|
+---+---+------+----------+
Run Code Online (Sandbox Code Playgroud)
我在pyspark中尝试了以下代码:
df = df.withColumn('0to2_count', F.when((F.col("ts") == 'I') & (F.col('days_r') >=0) & (F.col('days_r') <= 2), 1) \
.otherwise(F.when((F.col("ts") == 'T') & (F.col('days_r') >=0) & (F.col('days_r') <= 48), 1) \
.otherwise(F.when((F.col("ts") == 'L') & (F.col('days_r') >=0 & F.col('days_r') <= 7), 1) \
.otherwise(0))))
Run Code Online (Sandbox Code Playgroud)
我收到以下错误: …
我正在尝试使用带有键值对的字典,其中的值是一个列表,并将它们转换为一个元组列表。
我有以下字典:
d={'a': [33, 21, 4, 32], 'b': [6, 100, 8, 14]}
Run Code Online (Sandbox Code Playgroud)
期望的输出:
[(33, 6), (21, 100), (4, 8), (32, 14)]
Run Code Online (Sandbox Code Playgroud)
下面是我试过的代码,但它没有让我到达那里。
d={'a': [33, 21, 4, 32], 'b': [6, 100, 8, 14]}
# Converting into list of tuple
list = [(key, value) for key, value in d.items()]
# Printing list of tuple
print(list)
Run Code Online (Sandbox Code Playgroud)
该代码输出一个列表值:
[('a', [33, 21, 4, 32]), ('b', [6, 100, 8, 14])]
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?
我在 Python 环境中编写脚本。我已成功将 Pandas 数据框写入 MSSQL 中的表。
我想使用 Python 代码删除 MSSQL 表中的所有行。我知道执行此操作的 SQL 语法(如下所示)。
DELETE FROM [LON].[dbo].[MREPORT]
Run Code Online (Sandbox Code Playgroud)
但是如何将 SQL 语法合并到我的 python 代码中,以便我可以在我的 python 环境中运行代码并让它删除 MSSQL 表中的所有行?
我有一个示例数据框文本列,其中包含包含单词 'eng' 和单词 'engine' 的字符串。
ID Text
1 eng is here
2 engine needs washing
3 eng is overheating
Run Code Online (Sandbox Code Playgroud)
我想用“引擎”这个词代替“eng”这个词。我使用下面的代码:
df['Text'] = df['Text'].str.replace('eng', 'engine')
Run Code Online (Sandbox Code Playgroud)
但这弄乱了我第二行的文字。第二行变成
ID Text
2 engineine needs washing
Run Code Online (Sandbox Code Playgroud)
有没有办法做这个词替换,以便它只在整个词说“eng”时才替换?
python ×6
pandas ×4
string ×3
dataframe ×2
list ×2
pyspark ×2
arrays ×1
bin ×1
button ×1
conditional ×1
count ×1
dictionary ×1
element ×1
execute ×1
function ×1
if-statement ×1
input ×1
javascript ×1
labels ×1
replace ×1
search ×1
sql-server ×1
subset ×1
substring ×1
tuples ×1