重命名pandas dataframe列后遇到错误:
B=pd.DataFrame(data=[[1,1,1],[2,2,2]],columns={'A','B','C'})
print(B.loc[0,'B'])
B = B.rename(index=str,columns={'B':'B_B'})
print(B.loc[0,'B_B'])
Run Code Online (Sandbox Code Playgroud)
此代码导致以下输出:
> 1
>Traceback (most recent call last):
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\IPython\core\interactiveshell.py", line 2881, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
File "<ipython-input-29-6df9197203b9>", line 4, in <module>
print(B.loc[0,'B_B'])
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 1310, in __getitem__
return self._getitem_tuple(key)
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 796, in _getitem_tuple
return self._getitem_lowerdim(tup)
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 922, in _getitem_lowerdim
section = self._getitem_axis(key, axis=i)
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 1482, in _getitem_axis
self._has_valid_type(key, axis)
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 1409, in _has_valid_type
key = self._convert_scalar_indexer(key, axis)
File "C:\Users\FreieL01\AppData\Local\Continuum\Anaconda3\lib\site-packages\pandas\core\indexing.py", line 196, …Run Code Online (Sandbox Code Playgroud) 由于多次连接,我有一个数据框。我想调查重复的情况。但每次我调查时,数据框看起来都不一样。特别是,以下命令会导致不同IDs但结果数量保持不变。
from pyspark.sql import SparkSession
from pyspark.sql.types import StructType, StructField, IntegerType, StringType
import pyspark.sql.functions as f
from pyspark.sql.functions import lit
# Create a Spark session
spark = SparkSession.builder.appName("CreateDataFrame").getOrCreate()
# User input for number of rows
n_a = 10
n_a_c = 5
n_a_c_d = 3
n_a_c_e = 4
# Define the schema for the DataFrame
schema_a = StructType([StructField("id1", StringType(), True)])
schema_a_b = StructType(
[
StructField("id1", StringType(), True),
StructField("id2", StringType(), True),
StructField("extra", StringType(), True),
]
)
schema_a_c = StructType(
[ …Run Code Online (Sandbox Code Playgroud) 我面临的问题是我有一个 Pandas 数据框每天保存变量 V1 的状态。我只对变量何时更改其状态以及新状态是什么的信息感兴趣。
test_dataframe = pd.DataFrame()
test_dataframe['V1'] = ['X','Y','X','X','Y','X','Y','X']
test_dataframe['Status'] = ['A','C','B','B','D','B','D','A']
test_dataframe['Date'] = [pd.to_datetime('2017-1-1'),pd.to_datetime('2017-1-2'),pd.to_datetime('2017-1-3'),pd.to_datetime('2017-1-4'),pd.to_datetime('2017-1-5'),pd.to_datetime('2017-1-6'),pd.to_datetime('2017-1-7'),pd.to_datetime('2017-1-8')]
print(test_dataframe)
Run Code Online (Sandbox Code Playgroud)
导致以下数据框
V1 Status Date
0 X A 2017-01-01
1 Y C 2017-01-02
2 X B 2017-01-03
3 X B 2017-01-04
4 Y D 2017-01-05
5 X B 2017-01-06
6 Y D 2017-01-07
7 X A 2017-01-08
Run Code Online (Sandbox Code Playgroud)
我感兴趣的是:变量什么时候改变其状态,新的状态是什么?
结果应该是:
V1 Status Date
-----------------
X A date_1
X B date_3
X A date_8
Y C date_2
Y D date_5
Run Code Online (Sandbox Code Playgroud)
有人可以帮忙吗?谢谢
我面临的问题是,我只需要分配在不同行和列上的原始数据帧的子集.例如:
# My Original dataframe
import pandas as pd
dfTest = pd.DataFrame([[1,2,3],[4,5,6],[7,8,9]])
Run Code Online (Sandbox Code Playgroud)
输出:
0 1 2
0 1 2 3
1 4 5 6
2 7 8 9
Run Code Online (Sandbox Code Playgroud)
我可以提供一个列表,其中包含我想要的值所在的行和列索引:
array_indices = [[0,2],[1,0],[2,1]]
Run Code Online (Sandbox Code Playgroud)
我想要的输出是一系列:
3
4
8
Run Code Online (Sandbox Code Playgroud)
有人可以帮忙吗?
我想用 python 生成音频背景噪音并将其保存在 mp3 中。理想情况下,我还可以调整幅度和频率。有我可以使用的包吗?
谢谢拉兹鲁
我想将选定节点的颜色更改为与预定义背景颜色不同的颜色。但是,只要我在“样式”中为节点定义了背景颜色,颜色就不会更改为蓝色(默认行为)。
这是我定义的样式:
selector: 'node',
style: {
'content': 'data(d2)',
'background-color': '#ccc',
}
Run Code Online (Sandbox Code Playgroud)
有人可以帮忙吗?拉兹卢
python ×5
pandas ×3
dataframe ×2
apache-spark ×1
audio ×1
cytoscape ×1
cytoscape.js ×1
databricks ×1
indexing ×1
indices ×1
javascript ×1
noise ×1
pyspark ×1
renaming ×1
subset ×1
typeerror ×1