小编Sri*_*mar的帖子

从一列熊猫创建一个 NxN 矩阵

我有数据框,每一行都有一个列表值。

id     list_of_value
0      ['a','b','c']
1      ['d','b','c']
2      ['a','b','c']
3      ['a','b','c']
Run Code Online (Sandbox Code Playgroud)

我必须用一行和所有其他行计算分数

例如:

Step 1: Take value of id 0: ['a','b','c'],
Step 2: find the intersection between id 0 and id 1 , 
        resultant = ['b','c']
Step 3: Score Calculation => resultant.size / id.size
Run Code Online (Sandbox Code Playgroud)

在 id 0 和 id 1,2,3 之间重复步骤 2,3,对于所有 id 都类似。

并创建一个 N x N 数据框;像这样:

-  0  1    2  3
0  1  0.6  1  1
1  1  1    1  1 
2  1  1    1  1
3 …
Run Code Online (Sandbox Code Playgroud)

python numpy pandas

11
推荐指数
1
解决办法
1092
查看次数

Docker 与 Maven 和 Tomcat

我正在尝试使用 Java、Maven 和 Tomcat 创建一个 doket 容器。

到目前为止,我能够使用 Maven 创建一个容器并编译我的 java 代码并创建最终的 WAR 文件。

但我想将此 WAR 文件复制到另一个 Tomcat 容器的特定文件夹(tomcat 的 webapp 文件夹)。

方法一、Dockerfile

FROM maven:3.6.1-jdk-8 as maven_builder

ENV HOME=/app

WORKDIR $HOME

ADD pom.xml $HOME

RUN ["/usr/local/bin/mvn-entrypoint.sh", "mvn", "verify", "clean", "--fail-never"]

ADD . $HOME

RUN ["mvn","clean","install","-T","2C","-DskipTests=true"]

FROM tomcat:8.5.43-jdk8

COPY --from=maven_builder $HOME/wc_admin/target/wc-admin.war /usr/local/tomcat/webapps
Run Code Online (Sandbox Code Playgroud)

我尝试简单地复制它,但中间容器在复制之前被删除。

方法 2,我正在尝试为 docker-compose 编写 YAML 并使用共享卷概念。

version: '3'
services:
    maven-build:
        build: .
        volumes:
            - 'myshare:/shared'

    tomcat-build:
        image: 'tomcat:8.5.43-jdk8'
        ports:
            - '8080:8080'
        volumes:
            - 'myshare:/shared'

volumes:
  myshare: …
Run Code Online (Sandbox Code Playgroud)

java tomcat maven docker

6
推荐指数
1
解决办法
8780
查看次数

熊猫矩阵计算直到对角线

我正在使用 python 中的 Pandas 进行矩阵计算。

我的原始数据是字符串列表的形式(每行都是唯一的)。

id     list_of_value
0      ['a','b','c']
1      ['d','b','c']
2      ['a','b','c']
3      ['a','b','c']
Run Code Online (Sandbox Code Playgroud)

我必须用一行和所有其他行计算分数

分数计算算法:

Step 1: Take value of id 0: ['a','b','c'],
Step 2: find the intersection between id 0 and id 1 , 
        resultant = ['b','c']
Step 3: Score Calculation => resultant.size / id(0).size
Run Code Online (Sandbox Code Playgroud)

在 id 0 和 id 1,2,3 之间重复步骤 2,3,对于所有 id 都类似。

创建 N * N 矩阵:

-  0    1    2  3
0  1    0.6  1  1
1  0.6  1    1  1 
2 …
Run Code Online (Sandbox Code Playgroud)

python pandas

6
推荐指数
1
解决办法
536
查看次数

从 json 字段 mysql 中的键值对列表中提取一个键

我有以下格式的数据:

"article_body" : [
        {
            "article_desc" : "THURSDAY, Sept. 1, 2016 (HealthDay News) -- Dapagliflozin improves insulin sensitivity and increases lipid oxidation and plasma ketone concentration in patients with type 2 diabetes mellitus (T2DM), according to a study published online Aug. 25 in Diabetes Care. \n\n Giuseppe Daniele",
            "links" : [{
                    "link_name" : "Full Text (subscription or payment may be required)"}
            ]}
    ],
Run Code Online (Sandbox Code Playgroud)

我想提取密钥

article_desc
Run Code Online (Sandbox Code Playgroud)

article_body.

我在 Mysql 中的代码片段:

SELECT 

    JSON_EXTRACT(full_article_json, '$.article_body."article_desc"') AS description,
FROM
    wc_article_full_data;
Run Code Online (Sandbox Code Playgroud)

我得到空数据,如何解析这些数据?

mysql sql json

5
推荐指数
1
解决办法
7565
查看次数

将标题添加到DataFrame熊猫

我有一个DataFrame:

Index   1   Dr. Santosh Kumar
0      NaN  BHR/ 6681/148/1/134094/2007-08/L
1      NaN  B/301, Laxmi Apartment
2      NaN  New Chitragupta Nagar, Kankerbagh
3      NaN  Patna – 800 020
4      NaN  NaN
5      2    Dr. Deepak Kumar
6      NaN  BHR/ 6682/148/2/134095/2007-08/L
7      NaN  At & P.o-  Bairia
8      NaN  P.s- Gourichak
9      NaN  Patna – 800 007
Run Code Online (Sandbox Code Playgroud)

我想向此数据框添加标题,

df = pd.DataFrame([df],columns = ["id","information"])
Run Code Online (Sandbox Code Playgroud)

但我得到这个错误:

ValueError: Shape of passed values is (1, 1), indices imply (2, 1)
Run Code Online (Sandbox Code Playgroud)

因此最终输出应为:

Index   id  information
0       1 …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

5
推荐指数
2
解决办法
1万
查看次数

pandas根据行值(条件)创建新列

我有一个这样的专栏,

A
1.0
1.0
2.0
3.0
4.0
5.0
5.0
5.0
Run Code Online (Sandbox Code Playgroud)

我需要根据条件创建一个新列,如果a [i]和[i-1]相同,则值为0,否则为1.

结果应该是这样的:

A       B
1.0     1
1.0     0
2.0     1
3.0     1   
4.0     1
5.0     1   
5.0     0   
5.0     0
Run Code Online (Sandbox Code Playgroud)

合适的熊猫方式呢?

python pandas

4
推荐指数
1
解决办法
274
查看次数

基于两列的 Pandas 数据透视(多索引)

我有一个数据帧:

u_id    date        social_interaction_type_id  Total_Count
4       2018-08-19  4                           5
4       2018-08-24  2                           3
4       2018-08-21  1                           4
Run Code Online (Sandbox Code Playgroud)

我想根据 u_id 和日期旋转 DataFrame。

所以结果应该是这样的:

u_id    date        4       2       1
4       2018-08-19  5       nan     nan
4       2018-08-24  nan     3       nan
4       2018-08-21  nan     nan     4               
Run Code Online (Sandbox Code Playgroud)

我的代码尝试:

df.pivot(index = ['u_id','date'] , columns='social_interaction_type_id',values='Total_Count')
Run Code Online (Sandbox Code Playgroud)

错误:

ValueError: Length of passed values is 8803, index implies 1
Run Code Online (Sandbox Code Playgroud)

python pandas

4
推荐指数
2
解决办法
4678
查看次数

无法使用 JSON_EXTRACT 提取 MySQL 中具有特殊字符的键

我的表(MySQL 数据库)中有一个 json 字段。

结构如下:

{
    "article":{
            "Key's 1":{
                "value":"24"
            }
            "Key's of the something's 2":{
                "value":"55"
            }
    }

}
Run Code Online (Sandbox Code Playgroud)

我正在尝试提取“Key's 1”“值”字段。

由于单引号空格等特殊字符,我无法使用 JSON_EXTRACT 函数。

它给出错误:无效的 JSON 路径表达式。此错误位于字符位置 no : 10 附近

我的查询:

select 
    JSON_EXTRACT(analytics_json,'$.article.Key\'s 1.value')As value
from
    tbl_json_data;
Run Code Online (Sandbox Code Playgroud)

即使在放置反斜杠之后,我也会收到错误。

mysql json

4
推荐指数
1
解决办法
2891
查看次数

Python 日志记录重复

我有四个文件,

  • 主要.py
  • py
  • py
  • 日志系统

我正在使用 main 来使用 A.py 和 B.py 的函数,所以现在我必须在调用它们时记录所有信息。

所以我编写了一个名为 log_system 的脚本来为每个脚本文件(例如 A.py、B.py)创建日志处理程序

import logging

def fetchLogger(name="None") :
    logger = logging.getLogger(__name__)
    logger.setLevel(logging.DEBUG)

    if (name == "None"):
        #create File for Log
        handler = logging.FileHandler('./engine_log/Generic.log')
        handler.setLevel(logging.DEBUG)
        #log format 
        formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
        handler.setFormatter(formatter)

        #adding the handler to Logging System
        logger.addHandler(handler)
    else: 
        #create File for Log
        handler = logging.FileHandler('./engine_log/'+str(name))
        handler.setLevel(logging.DEBUG)
        #log format 
        formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
        handler.setFormatter(formatter)
        #adding the handler …
Run Code Online (Sandbox Code Playgroud)

python logging

3
推荐指数
1
解决办法
6136
查看次数

带有值图、Pandas 和 MatPlotLib 的月、年

我有带月、年和值的 DataFrame,我想做一个时间序列图。

样本:

month   year    Value
12      2016    0.006437804129357764
1       2017    0.013850880792606646
2       2017    0.013330349031207292
3       2017    0.07663058273768052
4       2017    0.7822831457266424
5       2017    0.8089573099244689
6       2017    1.1634845000200715
Run Code Online (Sandbox Code Playgroud)

我试图用 X 轴中的年和月、年和月以及 Y 轴中的值来绘制此值数据。

python matplotlib pandas

3
推荐指数
1
解决办法
1万
查看次数

标签 统计

python ×7

pandas ×6

json ×2

mysql ×2

dataframe ×1

docker ×1

java ×1

logging ×1

matplotlib ×1

maven ×1

numpy ×1

sql ×1

tomcat ×1