我有一个熊猫系列sf:
email
email1@email.com [1.0, 0.0, 0.0]
email2@email.com [2.0, 0.0, 0.0]
email3@email.com [1.0, 0.0, 0.0]
email4@email.com [4.0, 0.0, 0.0]
email5@email.com [1.0, 0.0, 3.0]
email6@email.com [1.0, 5.0, 0.0]
Run Code Online (Sandbox Code Playgroud)
我想将其转换为以下DataFrame:
index | email | list
_____________________________________________
0 | email1@email.com | [1.0, 0.0, 0.0]
1 | email2@email.com | [2.0, 0.0, 0.0]
2 | email3@email.com | [1.0, 0.0, 0.0]
3 | email4@email.com | [4.0, 0.0, 0.0]
4 | email5@email.com | [1.0, 0.0, 3.0]
5 | email6@email.com | [1.0, 5.0, 0.0]
Run Code Online (Sandbox Code Playgroud)
我找到了一种方法,但我怀疑它是更有效的方法:
df1 = pd.DataFrame(data=sf.index, columns=['email']) …
Run Code Online (Sandbox Code Playgroud) 根据此文档,我只能在具有相同名称的字段之间进行连接.
您知道是否可以在具有不同名称的字段上加入两个DataFrame?
SQL中的等价物是:
SELECT *
FROM df1
LEFT OUTER JOIN df2
ON df1.id_key = df2.fk_key
Run Code Online (Sandbox Code Playgroud) 我Counter
在列表上用来计算这个变量:
final = Counter(event_container)
Run Code Online (Sandbox Code Playgroud)
打印最终给出:
Counter({'fb_view_listing': 76, 'fb_homescreen': 63, 'rt_view_listing': 50, 'rt_home_start_app': 46, 'fb_view_wishlist': 39, 'fb_view_product': 37, 'fb_search': 29, 'rt_view_product': 23, 'fb_view_cart': 22, 'rt_search': 12, 'rt_view_cart': 12, 'add_to_cart': 2, 'create_campaign': 1, 'fb_connect': 1, 'sale': 1, 'guest_sale': 1, 'remove_from_cart': 1, 'rt_transaction_confirmation': 1, 'login': 1})
Run Code Online (Sandbox Code Playgroud)
现在我想转换final
成熊猫DataFrame
,但是当我做的时候:
final_df = pd.DataFrame(final)
Run Code Online (Sandbox Code Playgroud)
但是我收到了一个错误.
我猜最终不是一个合适的字典,所以如何转换final
为字典?或者它是另一种转换final
为DataFrame
?的方式?
我的目标是在用户向下滚动时更改应用栏的颜色和不透明度。
我的逻辑是:
我想出了以下代码:
import 'package:flutter/material.dart';
import 'package:gradient_app_bar/gradient_app_bar.dart';
void main() => runApp(MyApp());
class MyApp extends StatelessWidget {
@override
Widget build(BuildContext context) {
return MaterialApp(
title: 'Flutter Demo',
theme: ThemeData(
primarySwatch: Colors.blue,
),
home: MyHomePage(title: 'Flutter Demo Home Page'),
);
}
}
class MyHomePage extends StatefulWidget {
MyHomePage({Key key, this.title}) : super(key: key);
final String title;
@override
_MyHomePageState createState() => _MyHomePageState(); …
Run Code Online (Sandbox Code Playgroud) 给定一个 html 代码让我们说:
<div class="class1">
<span class="class2">some text</span>
<span class="class3">some text</span>
<span class="class4">some text</span>
</div>
Run Code Online (Sandbox Code Playgroud)
如何检索所有类名?即:['class1','class2','class3','class4']
我试过:
soup.find_all(class_=True)
Run Code Online (Sandbox Code Playgroud)
但它检索整个标签,然后我需要对字符串做一些正则表达式
我想将tom_test2 postgresql表导出到弹性搜索.该表有176805行:
=> select count(*) from tom_test2;
count
--------
176805
(1 row)
Run Code Online (Sandbox Code Playgroud)
以下logstach conf文件将我的数据正确导入弹性搜索:
input {
jdbc {
# Postgres jdbc connection string to our database, mydb
jdbc_connection_string => "xxx"
# The user we wish to execute our statement as
jdbc_user => "xxx"
jdbc_password => "xxx"
# The path to our downloaded jdbc driver
jdbc_driver_library => "xxx"
# The name of the driver class for Postgresql
jdbc_driver_class => "org.postgresql.Driver"
# our query
statement => "select * from tom_test2"
}
} …
Run Code Online (Sandbox Code Playgroud) 我的映射如下:
PUT places
{
"mappings": {
"test": {
"properties": {
"id_product": { "type": "keyword" },
"id_product_unique": { "type": "integer" },
"location": { "type": "geo_point" },
"suggest": {
"type": "text"
},
"active": {"type": "boolean"}
}
}
}
}
POST places/test
{
"id_product" : "A",
"id_product_unique": 1,
"location": {
"lat": 1.378446,
"lon": 103.763427
},
"suggest": ["coke","zero"],
"active": true
}
POST places/test
{
"id_product" : "A",
"id_product_unique": 2,
"location": {
"lat": 1.878446,
"lon": 108.763427
},
"suggest": ["coke","zero"],
"active": true
}
POST places/test
{ …
Run Code Online (Sandbox Code Playgroud) 我想聚类一个数据集(600000个观测值),对于每个集群,我想获得主要组件.我的载体由一个电子邮件和30个定性变量组成.每个定量变量有4个类:0,1,2和3.
所以我要做的第一件事是加载库FactoMineR并加载我的数据:
library(FactoMineR)
mydata = read.csv("/home/tom/Desktop/ACM/acm.csv")
Run Code Online (Sandbox Code Playgroud)
然后我将我的变量设置为定性(虽然我不包括变量'email'):
for(n in 1:length(mydata)){mydata[[n]] <- factor(mydata[[n]])}
Run Code Online (Sandbox Code Playgroud)
我正在从我的向量中删除电子邮件:
mydata2 = mydata[2:31]
Run Code Online (Sandbox Code Playgroud)
我正在这个新数据集中运行MCA:
mca.res <- MCA(mydata2)
Run Code Online (Sandbox Code Playgroud)
我现在想要使用hcpc函数对我的数据集进行聚类:
res.hcpc <- HCPC(mca.res)
Run Code Online (Sandbox Code Playgroud)
但是我收到以下错误消息:
Error: cannot allocate vector of size 1296.0 Gb
Run Code Online (Sandbox Code Playgroud)
你觉得我应该怎么做?我的数据集太大了吗?我用的是hcpc功能吗?
我在col中有一些span元素:
<div class="container-fluid">
<div class="row">
<div class="col">
<span class="myClass">some text</span>
<span class="myClass">some text</span>
</div>
<div class="col"></div>
</div>
</div>
Run Code Online (Sandbox Code Playgroud)
myClass元素有一些填充:
.myClass{
background: #ecedea;
padding: 10px 10px;
margin-right: 20px;
}
Run Code Online (Sandbox Code Playgroud)
由于第一个列中有多个span元素,因此将创建新行。我的问题是由于填充,我在第一行的跨度和第二行的跨度之间有一些重叠:
我试图在myClass上添加一些页边距,但这没有帮助
在卡片内,我有一个堆栈,其中包含 1)图像和 2)容器内的文本。如何使容器宽度与卡片宽度一致?
Card(
clipBehavior: Clip.antiAlias,
child: Stack(
children: <Widget>[
Positioned.fill(child: Image.network(
image_url,
fit: BoxFit.fitWidth,
),
),
Positioned(
bottom: 0,
child: Container(
padding: new EdgeInsets.fromLTRB(10.0, 5.0, 10.0, 5.0),
decoration: new BoxDecoration(color: Colors.black12),
child: Row(
children: <Widget>[
Text("test1"),
Text("test2"),
Text("test3"),
],
),
),
),
],
)
);
Run Code Online (Sandbox Code Playgroud)