我有一个由一列组成的大型数据帧('数据').列中的每一行都由一个字符串组成,每个字符串由逗号分隔的类别组成.我希望对这些数据进行热编码.
例如,
data = {"mesh": ["A, B, C", "C,B", ""]}
Run Code Online (Sandbox Code Playgroud)
从这里我想得到一个包含以下内容的数据框:
index A B. C
0 1 1 1
1 0 1 1
2 0 0 0
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?
我有两个相关的numpy数组,X和y.我需要从中选择n随机行X并将其存储在一个数组中,相应的y值并将随机选择的点的索引追加到它.
我有另一个数组index存储索引列表,我不想采样.
我怎样才能做到这一点?
样本数据:
index = [2,3]
X = np.array([[0.3,0.7],[0.5,0.5] ,[0.2,0.8], [0.1,0.9]])
y = np.array([[0], [1], [0], [1]])
Run Code Online (Sandbox Code Playgroud)
如果这些X是随机选择的(在哪里n=2):
randomylSelected = np.array([[0.3,0.7],[0.5,0.5]])
Run Code Online (Sandbox Code Playgroud)
期望的输出将是:
index = [0,1,2,3]
randomlySelectedY = [0,1]
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?
我有两个列表predictedY,其中包含n从 0 到 1 的元素,并且unlabelledY包含n元素 1 或 0。
predictedY我希望在数轴上绘制 的值,如果 中的相应元素unlabeledY是 1,则将其着色为红色,否则将其着色为黑色。
我怎样才能做到这一点?
predictedY =[0.456,0.962,0.231]
UnlabelledY=[0,1,0]
Run Code Online (Sandbox Code Playgroud)