小编Nis*_*pta的帖子

在大型数据集的pandas数据框中搜索和替换

我有一个大小为100万的数据集并输入数据框.

Id      description
 1      bc single phase acr
 2      conditioning accum
 3      dsply value ac
和字典大小2927,如下所示:

Key     Value
accum   accumulator
bb      baseboard
dsply   display

执行以下代码以使用其值替换dataframe中找到的字典键

dataset=dataset.replace(dict, regex=True)
Run Code Online (Sandbox Code Playgroud)

但它会耗费更多的时间来实现,即2000.0数据集的104.07914903743769秒,并且需要8GB RAM,我需要为数百万的数据集应用此代码.所以有人能告诉我如何减少执行时间吗?还有其他方法可以完成任务吗?

python regex pandas

6
推荐指数
1
解决办法
626
查看次数

简单的 spring data jpa 事务到 mysql 数据库上的小表无限期挂起

我有一个 spring data jpa 查询,它使用悲观锁从 mysql 表中读取一行。在我的环境中,该表仅包含一行,因此它应该非常快。

\n

spring data jpa 函数名为 FindTopByIsCurrent(boolean iscurrent) ,它应该只检索表的唯一元素。

\n

当命令运行时,它会无限期挂起。检查 SHOW ENGINE INNODB STATUS 的输出

\n
---TRANSACTION 170279307,\n\nACTIVE 3859 sec\n2 lock struct(s), heap size 1136, 1 row lock(s)\nMySQL thread id 11665, OS thread handle 140237095196416, query id 770252923 10.51.5.32 root\nTABLE LOCK table `mydb`.`mytable` trx id 170279307 lock mode IS\nRECORD LOCKS space id 722 page no 3 n bits 72 index PRIMARY of table `mydb`.`mytable` trx id 170279307 lock mode S\nRecord lock, heap no …
Run Code Online (Sandbox Code Playgroud)

mysql sql spring-data-jpa

6
推荐指数
1
解决办法
449
查看次数

SQL查询查找具有相同技能的用户

我有三张桌子

  1. 用户信息(U-id、U-name)
  2. Skill(S-id,S-Name) 以及它们之间的桥接表(因为它们具有多对多关系)
  3. 用户技能(U-id,S-id)

我想编写一个查询来查找具有相同技能的用户,例如这是 UserSkill 表中的示例数据

U-id   S-id
1       1
1       2
1       7
2       1
2       6
Run Code Online (Sandbox Code Playgroud)

所以结果会是这样的

UserName1    UserName2   SkillName
A              B            Java
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

这是我的查询

{select ui.UserName,ui2.UserName,SkillName
  from 
  UserSkill us1 inner join UserSkill us2 
on us1.SkillID = us2.SkillID and us1.UserID <> us2.UserID
  inner join UsersINFO UI 
on ui.UserID = us1.UserID 
  inner join UsersINFO ui2 
on ui2.UserID = us2.UserID
  inner join Skill s 
on s.SkillID = us2.SkillID}
Run Code Online (Sandbox Code Playgroud)

我想知道是否有人知道更好的编写查询的方法

sql t-sql sql-server

5
推荐指数
1
解决办法
618
查看次数

标签 统计

sql ×2

mysql ×1

pandas ×1

python ×1

regex ×1

spring-data-jpa ×1

sql-server ×1

t-sql ×1