小编wos*_*tom的帖子

将pandas Series转换为DataFrame

我有一个熊猫系列sf:

email
email1@email.com    [1.0, 0.0, 0.0]
email2@email.com    [2.0, 0.0, 0.0]
email3@email.com    [1.0, 0.0, 0.0]
email4@email.com    [4.0, 0.0, 0.0]
email5@email.com    [1.0, 0.0, 3.0]
email6@email.com    [1.0, 5.0, 0.0]

Run Code Online (Sandbox Code Playgroud)

我想将其转换为以下DataFrame:

index | email             | list
_____________________________________________
0     | email1@email.com  | [1.0, 0.0, 0.0]
1     | email2@email.com  | [2.0, 0.0, 0.0]
2     | email3@email.com  | [1.0, 0.0, 0.0]
3     | email4@email.com  | [4.0, 0.0, 0.0]
4     | email5@email.com  | [1.0, 0.0, 3.0]
5     | email6@email.com  | [1.0, 5.0, 0.0]

Run Code Online (Sandbox Code Playgroud)

我找到了一种方法,但我怀疑它是更有效的方法:

df1 = pd.DataFrame(data=sf.index, columns=['email']) …

Run Code Online (Sandbox Code Playgroud)

python series dataframe pandas

wos*_*tom

2018 12-09

70
推荐指数

6
解决办法

16万
查看次数

Pandas:在不同名称的字段上加入DataFrames？

根据此文档,我只能在具有相同名称的字段之间进行连接.

您知道是否可以在具有不同名称的字段上加入两个DataFrame？

SQL中的等价物是:

SELECT *
FROM df1
LEFT OUTER JOIN df2
  ON df1.id_key = df2.fk_key

Run Code Online (Sandbox Code Playgroud)

python field join dataframe pandas

wos*_*tom

2016 12-12

38
推荐指数

1
解决办法

3万
查看次数

将Counter对象转换为Pandas DataFrame

我Counter在列表上用来计算这个变量:

final = Counter(event_container)

Run Code Online (Sandbox Code Playgroud)

打印最终给出:

Counter({'fb_view_listing': 76, 'fb_homescreen': 63, 'rt_view_listing': 50, 'rt_home_start_app': 46, 'fb_view_wishlist': 39, 'fb_view_product': 37, 'fb_search': 29, 'rt_view_product': 23, 'fb_view_cart': 22, 'rt_search': 12, 'rt_view_cart': 12, 'add_to_cart': 2, 'create_campaign': 1, 'fb_connect': 1, 'sale': 1, 'guest_sale': 1, 'remove_from_cart': 1, 'rt_transaction_confirmation': 1, 'login': 1})

Run Code Online (Sandbox Code Playgroud)

现在我想转换final成熊猫DataFrame,但是当我做的时候:

final_df = pd.DataFrame(final)

Run Code Online (Sandbox Code Playgroud)

但是我收到了一个错误.

我猜最终不是一个合适的字典,所以如何转换final为字典？或者它是另一种转换final为DataFrame？的方式？

python counter dataframe pandas

wos*_*tom

2015 06-29

35
推荐指数

3
解决办法

2万
查看次数

Flutter：在滚动时更改小部件不透明度和颜色的最佳方法

我的目标是在用户向下滚动时更改应用栏的颜色和不透明度。

我的逻辑是：

滚动偏移 = 0 : appbar 是红色的，不透明度 = 1
0 < 滚动偏移 < 40 ：appbar 为蓝色，不透明度 = 0.4
40 <= 滚动偏移：appbar 是蓝色的，不透明度与滚动偏移成正比

我想出了以下代码：

import 'package:flutter/material.dart';
import 'package:gradient_app_bar/gradient_app_bar.dart';

void main() => runApp(MyApp());

class MyApp extends StatelessWidget {
  @override
  Widget build(BuildContext context) {
    return MaterialApp(
      title: 'Flutter Demo',
      theme: ThemeData(
        primarySwatch: Colors.blue,
      ),
      home: MyHomePage(title: 'Flutter Demo Home Page'),
    );
  }
}

class MyHomePage extends StatefulWidget {
  MyHomePage({Key key, this.title}) : super(key: key);

  final String title;

  @override
  _MyHomePageState createState() => _MyHomePageState(); …

Run Code Online (Sandbox Code Playgroud)

scroll colors opacity flutter flutter-appbar

wos*_*tom

lucky-day

12
推荐指数

1
解决办法

9164
查看次数

Python，美汤，获取所有类名

给定一个 html 代码让我们说：

 <div class="class1">
    <span class="class2">some text</span>
    <span class="class3">some text</span>
    <span class="class4">some text</span>
    </div>

Run Code Online (Sandbox Code Playgroud)

如何检索所有类名？即：['class1','class2','class3','class4']

我试过：

soup.find_all(class_=True)

Run Code Online (Sandbox Code Playgroud)

但它检索整个标签，然后我需要对字符串做一些正则表达式

html python class beautifulsoup

wos*_*tom

2017 05-03

9
推荐指数

1
解决办法

1万
查看次数

logstach:jdbc_page_size不会将我的所有数据转储到弹性搜索

我想将tom_test2 postgresql表导出到弹性搜索.该表有176805行:

=> select count(*) from tom_test2;
 count  
--------
 176805
(1 row)

Run Code Online (Sandbox Code Playgroud)

以下logstach conf文件将我的数据正确导入弹性搜索:

input {
    jdbc {
        # Postgres jdbc connection string to our database, mydb
        jdbc_connection_string => "xxx"
        # The user we wish to execute our statement as
        jdbc_user => "xxx"
        jdbc_password => "xxx"
        # The path to our downloaded jdbc driver
        jdbc_driver_library => "xxx"
        # The name of the driver class for Postgresql
        jdbc_driver_class => "org.postgresql.Driver"
        # our query
        statement => "select * from tom_test2"
    }
} …

Run Code Online (Sandbox Code Playgroud)

database postgresql dump elasticsearch logstash

wos*_*tom

lucky-day

6
推荐指数

1
解决办法

960
查看次数

Elasticsearch,按地理距离和分数排序聚合

我的映射如下:

PUT places
{
  "mappings": {
    "test": {
      "properties": {
        "id_product": { "type": "keyword" },
        "id_product_unique": { "type": "integer" },
        "location": { "type": "geo_point" },
        "suggest": {
          "type": "text"
        },
        "active": {"type": "boolean"}
      }
    }
  }
}

POST places/test
{
   "id_product" : "A",
   "id_product_unique": 1,
   "location": {
      "lat": 1.378446,
      "lon": 103.763427
   },
   "suggest": ["coke","zero"],
   "active": true
}

POST places/test
{
   "id_product" : "A",
   "id_product_unique": 2,
   "location": {
      "lat": 1.878446,
      "lon": 108.763427
   },
   "suggest": ["coke","zero"],
   "active": true
}

POST places/test
{ …

Run Code Online (Sandbox Code Playgroud)

distance aggregation elasticsearch

wos*_*tom

2018 03-28

6
推荐指数

1
解决办法

730
查看次数

R,在多重对应分析之后发生分层聚类

我想聚类一个数据集(600000个观测值),对于每个集群,我想获得主要组件.我的载体由一个电子邮件和30个定性变量组成.每个定量变量有4个类:0,1,2和3.

所以我要做的第一件事是加载库FactoMineR并加载我的数据:

library(FactoMineR)
mydata = read.csv("/home/tom/Desktop/ACM/acm.csv")

Run Code Online (Sandbox Code Playgroud)

然后我将我的变量设置为定性(虽然我不包括变量'email'):

for(n in 1:length(mydata)){mydata[[n]] <- factor(mydata[[n]])}

Run Code Online (Sandbox Code Playgroud)

我正在从我的向量中删除电子邮件:

mydata2 = mydata[2:31]

Run Code Online (Sandbox Code Playgroud)

我正在这个新数据集中运行MCA:

mca.res <- MCA(mydata2)

Run Code Online (Sandbox Code Playgroud)

我现在想要使用hcpc函数对我的数据集进行聚类:

res.hcpc <- HCPC(mca.res)

Run Code Online (Sandbox Code Playgroud)

但是我收到以下错误消息:

Error: cannot allocate vector of size 1296.0 Gb

Run Code Online (Sandbox Code Playgroud)

你觉得我应该怎么做？我的数据集太大了吗？我用的是hcpc功能吗？

r cluster-computing acm bigdata

wos*_*tom

lucky-day

5
推荐指数

2
解决办法

2418
查看次数

Bootstrap 4如何在col内的元素上增加边距？

我在col中有一些span元素：

<div class="container-fluid">
  <div class="row">
    <div class="col">
        <span class="myClass">some text</span>
        <span class="myClass">some text</span>
    </div>
    <div class="col"></div>
  </div>
</div>

Run Code Online (Sandbox Code Playgroud)

myClass元素有一些填充：

.myClass{
  background: #ecedea;
  padding: 10px 10px;
  margin-right: 20px;
}

Run Code Online (Sandbox Code Playgroud)

由于第一个列中有多个span元素，因此将创建新行。我的问题是由于填充，我在第一行的跨度和第二行的跨度之间有一些重叠：

我试图在myClass上添加一些页边距，但这没有帮助

html css twitter-bootstrap bootstrap-4

wos*_*tom

2018 02-10

5
推荐指数

1
解决办法

3658
查看次数

填充堆栈中所有可用的水平空间

在卡片内，我有一个堆栈，其中包含 1）图像和 2）容器内的文本。如何使容器宽度与卡片宽度一致？

Card(
  clipBehavior: Clip.antiAlias,
  child: Stack(
    children: <Widget>[
      Positioned.fill(child: Image.network(
          image_url,
          fit: BoxFit.fitWidth,
        ),
      ),
      Positioned(
        bottom: 0,
        child: Container(
          padding: new EdgeInsets.fromLTRB(10.0, 5.0, 10.0, 5.0),
          decoration: new BoxDecoration(color: Colors.black12),
          child: Row(
            children: <Widget>[
              Text("test1"),
              Text("test2"),
              Text("test3"),
            ],
          ),
        ),
      ),
    ],
  )
);

Run Code Online (Sandbox Code Playgroud)