我有数据框,每一行都有一个列表值。
id list_of_value
0 ['a','b','c']
1 ['d','b','c']
2 ['a','b','c']
3 ['a','b','c']
Run Code Online (Sandbox Code Playgroud)
我必须用一行和所有其他行计算分数
例如:
Step 1: Take value of id 0: ['a','b','c'],
Step 2: find the intersection between id 0 and id 1 ,
resultant = ['b','c']
Step 3: Score Calculation => resultant.size / id.size
Run Code Online (Sandbox Code Playgroud)
在 id 0 和 id 1,2,3 之间重复步骤 2,3,对于所有 id 都类似。
并创建一个 N x N 数据框;像这样:
- 0 1 2 3
0 1 0.6 1 1
1 1 1 1 1
2 1 1 1 1
3 …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用 Java、Maven 和 Tomcat 创建一个 doket 容器。
到目前为止,我能够使用 Maven 创建一个容器并编译我的 java 代码并创建最终的 WAR 文件。
但我想将此 WAR 文件复制到另一个 Tomcat 容器的特定文件夹(tomcat 的 webapp 文件夹)。
方法一、Dockerfile
FROM maven:3.6.1-jdk-8 as maven_builder
ENV HOME=/app
WORKDIR $HOME
ADD pom.xml $HOME
RUN ["/usr/local/bin/mvn-entrypoint.sh", "mvn", "verify", "clean", "--fail-never"]
ADD . $HOME
RUN ["mvn","clean","install","-T","2C","-DskipTests=true"]
FROM tomcat:8.5.43-jdk8
COPY --from=maven_builder $HOME/wc_admin/target/wc-admin.war /usr/local/tomcat/webapps
Run Code Online (Sandbox Code Playgroud)
我尝试简单地复制它,但中间容器在复制之前被删除。
方法 2,我正在尝试为 docker-compose 编写 YAML 并使用共享卷概念。
version: '3'
services:
maven-build:
build: .
volumes:
- 'myshare:/shared'
tomcat-build:
image: 'tomcat:8.5.43-jdk8'
ports:
- '8080:8080'
volumes:
- 'myshare:/shared'
volumes:
myshare: …Run Code Online (Sandbox Code Playgroud) 我正在使用 python 中的 Pandas 进行矩阵计算。
我的原始数据是字符串列表的形式(每行都是唯一的)。
id list_of_value
0 ['a','b','c']
1 ['d','b','c']
2 ['a','b','c']
3 ['a','b','c']
Run Code Online (Sandbox Code Playgroud)
我必须用一行和所有其他行计算分数
分数计算算法:
Step 1: Take value of id 0: ['a','b','c'],
Step 2: find the intersection between id 0 and id 1 ,
resultant = ['b','c']
Step 3: Score Calculation => resultant.size / id(0).size
Run Code Online (Sandbox Code Playgroud)
在 id 0 和 id 1,2,3 之间重复步骤 2,3,对于所有 id 都类似。
创建 N * N 矩阵:
- 0 1 2 3
0 1 0.6 1 1
1 0.6 1 1 1
2 …Run Code Online (Sandbox Code Playgroud) 我有以下格式的数据:
"article_body" : [
{
"article_desc" : "THURSDAY, Sept. 1, 2016 (HealthDay News) -- Dapagliflozin improves insulin sensitivity and increases lipid oxidation and plasma ketone concentration in patients with type 2 diabetes mellitus (T2DM), according to a study published online Aug. 25 in Diabetes Care. \n\n Giuseppe Daniele",
"links" : [{
"link_name" : "Full Text (subscription or payment may be required)"}
]}
],
Run Code Online (Sandbox Code Playgroud)
我想提取密钥
article_desc
Run Code Online (Sandbox Code Playgroud)
从article_body.
我在 Mysql 中的代码片段:
SELECT
JSON_EXTRACT(full_article_json, '$.article_body."article_desc"') AS description,
FROM
wc_article_full_data;
Run Code Online (Sandbox Code Playgroud)
我得到空数据,如何解析这些数据?
我有一个DataFrame:
Index 1 Dr. Santosh Kumar
0 NaN BHR/ 6681/148/1/134094/2007-08/L
1 NaN B/301, Laxmi Apartment
2 NaN New Chitragupta Nagar, Kankerbagh
3 NaN Patna – 800 020
4 NaN NaN
5 2 Dr. Deepak Kumar
6 NaN BHR/ 6682/148/2/134095/2007-08/L
7 NaN At & P.o- Bairia
8 NaN P.s- Gourichak
9 NaN Patna – 800 007
Run Code Online (Sandbox Code Playgroud)
我想向此数据框添加标题,
df = pd.DataFrame([df],columns = ["id","information"])
Run Code Online (Sandbox Code Playgroud)
但我得到这个错误:
ValueError: Shape of passed values is (1, 1), indices imply (2, 1)
Run Code Online (Sandbox Code Playgroud)
因此最终输出应为:
Index id information
0 1 …Run Code Online (Sandbox Code Playgroud) 我有一个这样的专栏,
A
1.0
1.0
2.0
3.0
4.0
5.0
5.0
5.0
Run Code Online (Sandbox Code Playgroud)
我需要根据条件创建一个新列,如果a [i]和[i-1]相同,则值为0,否则为1.
结果应该是这样的:
A B
1.0 1
1.0 0
2.0 1
3.0 1
4.0 1
5.0 1
5.0 0
5.0 0
Run Code Online (Sandbox Code Playgroud)
合适的熊猫方式呢?
我有一个数据帧:
u_id date social_interaction_type_id Total_Count
4 2018-08-19 4 5
4 2018-08-24 2 3
4 2018-08-21 1 4
Run Code Online (Sandbox Code Playgroud)
我想根据 u_id 和日期旋转 DataFrame。
所以结果应该是这样的:
u_id date 4 2 1
4 2018-08-19 5 nan nan
4 2018-08-24 nan 3 nan
4 2018-08-21 nan nan 4
Run Code Online (Sandbox Code Playgroud)
我的代码尝试:
df.pivot(index = ['u_id','date'] , columns='social_interaction_type_id',values='Total_Count')
Run Code Online (Sandbox Code Playgroud)
错误:
ValueError: Length of passed values is 8803, index implies 1
Run Code Online (Sandbox Code Playgroud) 我的表(MySQL 数据库)中有一个 json 字段。
结构如下:
{
"article":{
"Key's 1":{
"value":"24"
}
"Key's of the something's 2":{
"value":"55"
}
}
}
Run Code Online (Sandbox Code Playgroud)
我正在尝试提取“Key's 1”的“值”字段。
由于单引号和空格等特殊字符,我无法使用 JSON_EXTRACT 函数。
它给出错误:无效的 JSON 路径表达式。此错误位于字符位置 no : 10 附近
我的查询:
select
JSON_EXTRACT(analytics_json,'$.article.Key\'s 1.value')As value
from
tbl_json_data;
Run Code Online (Sandbox Code Playgroud)
即使在放置反斜杠之后,我也会收到错误。
我有四个文件,
我正在使用 main 来使用 A.py 和 B.py 的函数,所以现在我必须在调用它们时记录所有信息。
所以我编写了一个名为 log_system 的脚本来为每个脚本文件(例如 A.py、B.py)创建日志处理程序
import logging
def fetchLogger(name="None") :
logger = logging.getLogger(__name__)
logger.setLevel(logging.DEBUG)
if (name == "None"):
#create File for Log
handler = logging.FileHandler('./engine_log/Generic.log')
handler.setLevel(logging.DEBUG)
#log format
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
handler.setFormatter(formatter)
#adding the handler to Logging System
logger.addHandler(handler)
else:
#create File for Log
handler = logging.FileHandler('./engine_log/'+str(name))
handler.setLevel(logging.DEBUG)
#log format
formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')
handler.setFormatter(formatter)
#adding the handler …Run Code Online (Sandbox Code Playgroud) 我有带月、年和值的 DataFrame,我想做一个时间序列图。
样本:
month year Value
12 2016 0.006437804129357764
1 2017 0.013850880792606646
2 2017 0.013330349031207292
3 2017 0.07663058273768052
4 2017 0.7822831457266424
5 2017 0.8089573099244689
6 2017 1.1634845000200715
Run Code Online (Sandbox Code Playgroud)
我试图用 X 轴中的年和月、年和月以及 Y 轴中的值来绘制此值数据。