小编bsu*_*ire的帖子

如何使用SQLite3导入tsv文件

我有一个tsv(制表符分隔文件),我想用sqlite3导入.有人知道一个明确的方法吗?

我已经安装了sqlite3,但还没有创建任何数据库或表.

我试过这个命令

.import /path/filename.tsv my_new_table
Run Code Online (Sandbox Code Playgroud)

但它给了我错误:没有这样的表:my_new_table.

但是,根据我的阅读,它应该自动创建表,如果它不存在.这是否意味着我需要首先创建和使用数据库,还是有另一种技巧将.tsv文件导入sqlite?

csv sqlite tsv import-from-csv

35
推荐指数
2
解决办法
2万
查看次数

在 Neomodel 中使用多个标签

我想知道是否有办法将不同的标签与 NeoModel 的类相关联。如果没有,什么模块可以让我这样做?

我的理解是,在使用以下类声明时,“Person”是一个标签。

class Person(StructuredNode):
    name = StringProperty(unique_index=True)
    age = IntegerProperty(index=True, default=0)
Run Code Online (Sandbox Code Playgroud)

假设我想添加第二个标签,“就业”、“失业”、“学生”。

使用 Cypher,我可以使用: CREATE(p:Person:Student)

无论如何,我可以用 NeoModel 达到同样的效果吗?

注意: 根据我的研究,使用标签比使用属性 (neo4j/cypher) 产生更快的查询,这就是为什么我希望已就业/失业/学生成为标签。否则,我可以将“占领”添加为节点属性。

python neo4j neomodel

6
推荐指数
2
解决办法
1107
查看次数

使用 webRTC 在两个对等点之间创建和使用数据通道

我正在尝试使用 WebRTC 设置对等文件共享系统。我可以在每一侧打开一个数据通道,但我无法从一个用户向另一个用户发送消息。此外,如果一个对等方关闭通道,另一个对等方,则仅针对该用户触发 onclose 事件。

通过 webRTC 设置和使用数据通道的正确方法是什么?

你能告诉我我的代码有什么问题或缺失吗?

//create RTC peer objet.
var RTCPeerConnection = webkitRTCPeerConnection;
var RTCIceCandidate = window.RTCIceCandidate;
var RTCSessionDescription = window.RTCSessionDescription;

var iceServers = {
    iceServers: [{
        url: 'stun:stun.l.google.com:19302'
    }]
};
var p2p_connection = new RTCPeerConnection({
      iceServers: [
        { 'url': (IS_CHROME ? 'stun:stun.l.google.com:19302' : 'stun:23.21.150.121') }
  ]
});

// send offer (only executes in one browser)
function initiateConnection() {
    p2p_connection.createOffer(function (description) {
        p2p_connection.setLocalDescription(description);
        server_socket.emit('p2p request', description,my_username);
    });
};

// receive offer and send answer
server_socket.on('p2p request', …
Run Code Online (Sandbox Code Playgroud)

javascript real-time webrtc rtcdatachannel

5
推荐指数
1
解决办法
3578
查看次数

将pandas dataframe的double group打印为2D数组

我想在表中显示2分组依据的单个值聚合的结果。

这样的

df.groupby(['colA', 'colB']).size
Run Code Online (Sandbox Code Playgroud)

将产生:

   B1  B2  B3  B4 
A1 s11 s12 s13 ..
A2 s21 s22 s23 ..
A3 s31 s32 s33 ..
A4 ..  ..  ..  s44
Run Code Online (Sandbox Code Playgroud)

快速简便的方法是什么?

编辑:这是一个例子。我拥有所有用户的登录名,并且我想显示每个用户和一天的登录数(=行)

Day,User
1,John
1,John
1,Ben
1,Sarah
2,Ben
2,Sarah
2,Sarah
Run Code Online (Sandbox Code Playgroud)

应该产生:

D\U John  Ben  Sarah
1   2     1    1
2   0     1    2
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
1445
查看次数

如何使用wget下载页面但如果页面不存在则忽略404错误消息?

wget在下载URL或抓取网页时,有没有办法忽略HTTP错误响应代码?

wget

4
推荐指数
1
解决办法
4887
查看次数

使用Python从行列表中提取列

我有以下数据集,这是一系列存储为嵌套列表的行:

[['John', '35', 'UK'],
['Emma', '43', 'UK'],
['Lucy', '25', 'AU']]
Run Code Online (Sandbox Code Playgroud)

(行总长度相同)

我需要以'UK', 'AU'可迭代的方式返回(对排序无动于衷).

是否有一个单行程序返回第三列中包含的唯一值,哪个比这简单?

set(list(map(list, zip(*l)))[2])
Run Code Online (Sandbox Code Playgroud)

(参考:转置列表清单)

python transpose

3
推荐指数
1
解决办法
2337
查看次数

如何用py2neo声明一个独特的约束

我需要在我的图形数据库上强制执行一个独特的约束.我找到了以下方法:

graph.schema.create_uniqueness_constraint("Website", "url") 
Run Code Online (Sandbox Code Playgroud)

但它会产生以下错误:

graph.schema.create_uniqueness_constraint("Website", "url")
AttributeError: 'Schema' object has no attribute 'create_uniqueness_constraint' 
Run Code Online (Sandbox Code Playgroud)

我的导入和图形插入是:

from py2neo import neo4j,node 
graph = neo4j.GraphDatabaseService("http://localhost:7474/db/data/") 
Run Code Online (Sandbox Code Playgroud)

我做错了什么,我该如何解决?

另外,用py2neo添加唯一性约束的最简单,最简洁的方法是什么?

我对丰富的方法感到困惑,有时似乎没有理由失败(无法找到关于py2neo的全面教程),我开始觉得我会更好地编写原始Cypher查询...

python neo4j cypher py2neo

2
推荐指数
1
解决办法
1609
查看次数

计算每天在Pandas中看到的新ID的数量

鉴于以下数据,每天有哪些用户活跃,我想使用Pandas计算每天新用户的数量.

Data:
  Day | UserID
  ----------
   1  |  A 
   1  |  B
   1  |  C
   1  |  C
   ----------
   2  |  A 
   2  |  B
   2  |  D
   2  |  A 
   2  |  E
  ----------
   3  |  B 
   3  |  D
   3  |  F

Result:    
  Day | New Users
  ---------------
   1  |  3
   2  |  2
   3  |  1
Run Code Online (Sandbox Code Playgroud)

我看到它的方式,步骤是:

  1. 计算每天的最大用户ID: df.groupby('Day').UserID.max()
  2. 使用前一天的最大UserID过滤数据(初始化为0):这里我不知道如何使用Pandas做到这一点
  3. 计算过滤数据集中唯一用户的登录数.df.filtered.groupby( '日').UserID.nunique()

有没有一个干净的方法来实现这一目标?

python pandas

2
推荐指数
1
解决办法
53
查看次数

SQLAlchemy模型或基础SQL表中的别名字段名称

是否可以在表的架构或模型的类定义中为(My)SQL列或SQLAlchemy对象属性添加别名?

例如,给定下表:

Users
---------------------
username | ...
Run Code Online (Sandbox Code Playgroud)

我想要以下表格表示形式:

Users
---------------------
id | username | ...
Run Code Online (Sandbox Code Playgroud)

其中User.id映射到User.username而不重复此数据。

将其嵌入到表模式中将是理想的,但是使用ORM的解决方案就足够了。

class User():
    __tablename__ = 'Users'
    username = Column(STRING, primary_key=True, alias='id')
Run Code Online (Sandbox Code Playgroud)

详细

我的用例是,我要存储来自各个网站的抓取数据。我正在使用我拥有的最佳用户ID为该数据编制索引,其中可能是用户名,数字ID甚至全名。

但是,为了规范化跨表的操作,我希望每个表都有一个“ id”字段,该字段映射到可能的最佳ID。

当然,我有两种选择:

  1. 将选定的ID重命名为“ Users.id”,从而使分析人员失去可读性。
  2. 将所选ID中的数据复制到“ Users.id”中,除了浪费存储空间之外,还使数据库写操作更加复杂。

mysql sql sqlalchemy

2
推荐指数
1
解决办法
2884
查看次数