我想以这种方式一致地使用sklearn.compose.ColumnTransformer
(不是并行的,因此,第二个变换器应该仅在第一个变换器之后执行)来相交列列表:
log_transformer = p.FunctionTransformer(lambda x: np.log(x))
df = pd.DataFrame({'a': [1,2, np.NaN, 4], 'b': [1,np.NaN, 3, 4], 'c': [1 ,2, 3, 4]})
compose.ColumnTransformer(n_jobs=1,
transformers=[
('num', impute.SimpleImputer() , ['a', 'b']),
('log', log_transformer, ['b', 'c']),
('scale', p.StandardScaler(), ['a', 'b', 'c'])
]).fit_transform(df)
Run Code Online (Sandbox Code Playgroud)
所以,我想使用SimpleImputer
for 'a'
, 'b'
,然后log
for 'b'
, 'c'
,然后StandardScaler
for 'a'
, 'b'
, 'c'
。
但:
(4, 7)
。Nan
进入a
专栏b
。那么,如何ColumnTransformer
以以下方式用于不同的列Pipeline
?
更新:
pipe_1 …
Run Code Online (Sandbox Code Playgroud) 我尝试通过本教程使用SslStream的 .NET 实现。我按照本文中的方式做了所有事情,但我有一些问题。我下载了 RawCap 并从本地主机捕获了数据包,之后我使用 Wireshark 打开转储文件(.pcap),但我看到的不是 SSL 或 TLS 类型的协议,而是 TCP:这是 TCP 流的一部分:
....l...h..T.....Y.2..1...t.4....8.J...../.5 ... .... .2.8......'......Ssl服务器。......................M..T...M.<.......eE
...M.%c...Kg.. .....iKku.^q(C.$..;..Mx
......g&./. .................0...0.........L.^..F.)...{.0. ..+......0.1 0...U....MyCA0.. 150228143257Z。391231235959Z0.1.0...U....SslServer0.."0 ..*.H...........0.. ......p9.cq...F. ^....Bm...S... .....Bg.B.<]..f[...<...q'..Tc......R... ZCDD..N...1..0.v..l. <...d[=C.7.8.+^..j(...X.........D'. !*5.^.^Ef..=.6y@.=..)|...Sp..Sv.|h.-.. UT..&bG.......J{.7k. X.........:.[o..o.,r..0..Wi.s..8.Jn9........4...WU....fkmw..........D0B0@..U...907..m.....@.. ...
f...0.1 0...U.. ..MyCA..(J..j+..K......0...+..h..X.+.M..{...n .....@.'.F........~....@9J.......A4,>.9.DE.R.V4t._bGY.,v.> G......J ....3....@..c,%[S._..u...$....!Vr...~...'.~ ..T*[.#[.?.B{..Z..mp9.7.Uu}.e..c..H^n.:...-AJxs.. ...:... ..u.....YB..2n...yg=...(.Fv...B.Is..GK.....;.F..Ln..... L...ao ......@...q0o1.0...U....SE1.0...U. ..AddTrust AB1&0$..U....AddTrust 外部 TTP 网络1 “0 ..U...AddTrust 外部 CA 根..0..1.0...U....US1.0...U. .GeoTrust Inc.1907..U...0(c) 2008 GeoTrust Inc. - 仅供授权使用1604..U...-GeoTrust 主要证书颁发机构 - G3.g0e1.0...U....US1.0...U。
这是正确的 SSL/TLS 流吗?为什么Wireshark将其标记为TCP?
更新:
我尝试像这样将 ffmpeg 连接到 Visual C++ ,但是当我输入“./configure --toolchain=msvc”时出现此错误:
\n\n\n\n\nc99wrap cl 无法创建可执行文件。
\n\n如果 c99wrap cl 是交叉编译器,请使用 --enable-cross-compile\n 选项。仅当您知道交叉编译的含义时才执行此操作。
\n\nC编译器测试失败
\n
配置日志:
\n\n\n\n\n警告:未找到 pkg-config,库检测可能会失败。mktemp -u\n XXXXXX ./configure: 第 728 行:mktemp: 未找到命令警告:\n 未知的 C 编译器 C:\\c99\\c99wrap cl,无法选择最佳 CFLAGS\n check_ld cc check_cc BEGIN /tmp/ffconf ..ZHENYA.500.5884.c\n 1 int main(void){ return 0; } END /tmp/ffconf..ZHENYA.500.5884.c C:\\c99\\c99wrap cl -c -o /tmp/ffconf..ZHENYA.500.5884.o\n /tmp/ffconf..ZHENYA.500.5884.c致命错误 C1510: 无法加载语言资源 clui.dll。C 编译器测试失败。
\n
有什么问题?或者只是将您用此编译后获得的文件发送给我(我不会问,但我修复了这两个月):
\n\n\n\n\n …./配置--toolchain=msvc
\n\n制作
\n\n进行安装
\n
我尝试在 scikit-learn 中使用 t-SNE 算法:
import numpy as np
from sklearn.manifold import TSNE
X = np.array([[0, 0, 0], [0, 1, 1], [1, 0, 1], [1, 1, 1]])
model = TSNE(n_components=2, random_state=0)
np.set_printoptions(suppress=True)
model.fit_transform(X)
Run Code Online (Sandbox Code Playgroud)
输出:
array([[ 0.00017599, 0.00003993], #1
[ 0.00009891, 0.00021913],
[ 0.00018554, -0.00009357],
[ 0.00009528, -0.00001407]]) #2
Run Code Online (Sandbox Code Playgroud)
之后,我尝试将一些坐标与第一个数组中的坐标完全相同的点添加X
到现有模型中:
Y = np.array([[0, 0, 0], [1, 1, 1]])
model.fit_transform(Y)
Run Code Online (Sandbox Code Playgroud)
输出:
array([[ 0.00017882, 0.00004002], #1
[ 0.00009546, 0.00022409]]) #2
Run Code Online (Sandbox Code Playgroud)
但第二个数组中的坐标不等于第一个数组中的第一个和最后一个坐标。
我知道这是正确的行为,但是如何向model
输入数组中的相同坐标添加新坐标并在输出数组中获得相同的坐标?
此外,即使在附加新点之后,我仍然需要获取最近的点。
我需要使用以下方式接收此请求Spring
:
POST /test HTTP/1.1
user-agent: Dart/2.8 (dart:io)
content-type: multipart/form-data; boundary=--dio-boundary-3791459749
accept-encoding: gzip
content-length: 151
host: 192.168.0.107:8443
----dio-boundary-3791459749
content-disposition: form-data; name="MyModel"
{"testString":"hello world"}
----dio-boundary-3791459749--
Run Code Online (Sandbox Code Playgroud)
但不幸的是这个Spring
端点:
@PostMapping(value = "/test", consumes = MediaType.APPLICATION_OCTET_STREAM_VALUE)
public void test(@Valid @RequestPart(value = "MyModel") MyModel myModel) {
String testString = myModel.getTestString();
}
Run Code Online (Sandbox Code Playgroud)
返回415
错误:
Content type 'multipart/form-data;boundary=--dio-boundary-2534440849' not supported
Run Code Online (Sandbox Code Playgroud)
给客户。
这是(相同的端点,但带有consumes = MULTIPART_FORM_DATA_VALUE
):
@PostMapping(value = "/test", consumes = MediaType.MULTIPART_FORM_DATA_VALUE)
public void test(@Valid @RequestPart(value = "MyModel") MyModel myModel) {
String testString = …
Run Code Online (Sandbox Code Playgroud) 我想添加额外的Dense
预训练的后层TFDistilBertModel
,TFXLNetModel
并TFRobertaModel
Huggingface模型。我已经看到了如何使用 . 来做到这一点TFBertModel
,例如在这个笔记本中:
output = bert_model([input_ids,attention_masks])
output = output[1]
output = tf.keras.layers.Dense(32,activation='relu')(output)
Run Code Online (Sandbox Code Playgroud)
所以,在这里我需要使用输出元组的第二项(即带有索引的项1
)BERT
。根据该文档 TFBertModel
已pooler_output
在这个元组指数。但其他三个模型没有pooler_output
。
那么,如何为其他三个模型输出添加额外的层?
我需要为一个大学项目制作一棵哈夫曼树,但我真的很困惑它是如何工作的。我实现了哈夫曼树的编码部分,但它始终与http://huffman.ooz.ie/不同。
一个人向另一个人编码可能会有所不同,但正确吗?
我想在我的 Firefox Web 扩展中使用一些数据库,我已经找到了这个,但它只是键值对的存储。
那么如何在 Firefox Web 扩展中使用数据库呢?
python ×3
scikit-learn ×2
compilation ×1
encryption ×1
ffmpeg ×1
firefox ×1
firefox-addon-webextensions ×1
http ×1
huffman-code ×1
keras ×1
mingw ×1
nlp ×1
pandas ×1
rest ×1
scipy ×1
spring ×1
spring-boot ×1
spring-mvc ×1
ssl ×1
sslstream ×1
tensorflow ×1
wireshark ×1