小编Mad*_*kar的帖子

fit_transform()采用2个位置参数,但3个是使用LabelBinarizer

我是机器学习的新手,我一直在使用无监督学习技术.

该图显示了我的样本数据(完全清理后)屏幕截图: 示例数据

我有两个Pipline用于清理数据:

num_attribs = list(housing_num)
cat_attribs = ["ocean_proximity"]

print(type(num_attribs))

num_pipeline = Pipeline([
    ('selector', DataFrameSelector(num_attribs)),
    ('imputer', Imputer(strategy="median")),
    ('attribs_adder', CombinedAttributesAdder()),
    ('std_scaler', StandardScaler()),
])

cat_pipeline = Pipeline([
    ('selector', DataFrameSelector(cat_attribs)),
    ('label_binarizer', LabelBinarizer())
])
Run Code Online (Sandbox Code Playgroud)

然后我做了这两个管道的联合,相同的代码如下所示:

from sklearn.pipeline import FeatureUnion

full_pipeline = FeatureUnion(transformer_list=[
        ("num_pipeline", num_pipeline),
        ("cat_pipeline", cat_pipeline),
    ])
Run Code Online (Sandbox Code Playgroud)

现在我试图在数据上做fit_transform 但它显示我的错误.

转型代码:

housing_prepared = full_pipeline.fit_transform(housing)
housing_prepared
Run Code Online (Sandbox Code Playgroud)

错误消息:fit_transform()需要2个位置参数,但是给出了3个

scikit-learn data-science

67
推荐指数
6
解决办法
2万
查看次数

有没有简单的方法来删除完整的Vespa文档集?

和雅虎的vespa.ai一起,我现在处于一个我很满意的搜索定义,但仍然存储着一堆垃圾测试文件.

有没有一种简单的方法可以一次删除/清除/删除所有这些,ala SQL DROP TABLE还是DELETE FROM X

我在文档JSON格式页面中明确提到了删除文档的唯一地方.据我所知,它需要逐个删除文档,这很好,但是当一个人玩游戏时会有点麻烦.

我尝试使用默认租户通过Deploy API删除应用程序,但在发出搜索请求时数据仍然存在.

我错过了什么?或者这是设计?

vespa

6
推荐指数
1
解决办法
202
查看次数

如何在 SQL Server 列中的两个字符串之间选择一个字符串?

我想获取表列中两个字符串之间的字符串。如何选择列?我已经写了两边的字符串。谁能帮助我如何在此处包含带有字符串的列名称?

DECLARE @Text NVARCHAR(MAX)

SELECT 
    SUBSTRING(@Text, CHARINDEX('Manufacturer Name : ', @Text), 
                     CHARINDEX('Manufacturer Part',@text) - CHARINDEX('Manufacturer Name : ', @Text) + LEN('Manufacturer Part')) 
FROM 
    tbIMPACArchiveNew 
WHERE 
    (Description LIKE '%Manufacturer Name: %' 
     OR Description LIKE '%Manufacturer Name : %') 
    AND Description LIKE '%Manufacturer Part%' 
Run Code Online (Sandbox Code Playgroud)

预期结果:

Column A                                                       Expected result
Manufacturer Name : ABC Manufacturer Part Number : XVB-C2B4         ABC
Manufacturer Name : DEF Manufacturer Part Number : 3RH1924-1GP11    DEF
Manufacturer Name : ABJ Manufacturer Part Number : FLDP-IOM248-0001 ABJ
Manufacturer Name : …
Run Code Online (Sandbox Code Playgroud)

sql sql-server sql-server-2008

5
推荐指数
1
解决办法
2万
查看次数

如何在网站中为Facebook像素创建选择退出选项?

**我在寻找:**我正在寻找的是,如何限制我网站上的facebook像素来跟踪并将我的网站用户信息发送到Facebook.

我已经知道的: Facebook像素跟踪用户的数据,如谷歌标签.但Google提供了一个脚本,允许用户选择此选项,这意味着将跟踪用户的信息,但不会将其发送给Google.

以下是google(来源)提供的退出选项代码:

<script>
// Set to the same value as the web property used on the site
var gaProperty = 'UA-XXXX-Y';

// Disable tracking if the opt-out cookie exists.
var disableStr = 'ga-disable-' + gaProperty;
if (document.cookie.indexOf(disableStr + '=true') > -1) {
window[disableStr] = true;
}

// Opt-out function
function gaOptout() {
document.cookie = disableStr + '=true; expires=Thu, 31 Dec 2099 23:59:59 UTC; path=/';
window[disableStr] = true;
}
</script>
Run Code Online (Sandbox Code Playgroud)

现在我想为我的facebook像素提供类似的选项,因此用户可以禁用Facebook上的数据跟踪.我实际使用的是facebook提供的代码,用于跟踪我网站上特定事件的信息.这是我现在使用的代码(来源):

<!-- Facebook Pixel Code …
Run Code Online (Sandbox Code Playgroud)

facebook facebook-pixel

5
推荐指数
1
解决办法
4327
查看次数

聚集索引默认排序顺序

I\xe2\x80\x99m 创建一个带有主键聚集索引的表。当我\xe2\x80\x99m在没有asc/desc的情况下创建时,默认的排序顺序是什么?哪种排序顺序(ASC 或 DESC)更有效?这是示例代码。

\n\n
Create table employee (\n  Name nvarchar(30),\n  City nvarchar(30),\n  Dob date,\n  Constraint pk_employee primary key clustered\n  (Name asc, dob asc)\n)\nGo\n
Run Code Online (Sandbox Code Playgroud)\n

t-sql sql-server sql-server-2008 sql-server-2008-r2 sql-server-2012

5
推荐指数
1
解决办法
1584
查看次数

SQL:如何显示通过和失败学生的百分比?

我有一张桌子,里面有学生的数据和结果.

ID  Name  Result
1   St1   FAIL
2   St2   PASS
3   St3   PASS
4   St4   PASS
5   St5   FAIL
6   St6   PASS
Run Code Online (Sandbox Code Playgroud)

我希望通过和失败的学生的总百分比四舍五入到小数点后两位.我怎么能做到这一点?

sql sql-server sql-server-2008

2
推荐指数
1
解决办法
1000
查看次数