小编Jos*_*ira的帖子

SQL 查询多个 CSV 文件的好方法?

我正在寻找一种方法来遍历 CSV 文件作为关系数据库表。

我做了一些研究,因为我发现没有任何东西完全符合我的要求。我发现了几个部分不错的选择,即:

  1. termsql - 它接受 stdin 或一个文件,并允许在其中使用一些 sql - 但只设置一个“表”
  2. csv2sqlite - 这是非常有前途的,因为它允许比 termsql 具有更多的 sql 优点 - 但仍然只有一个“表”
  3. 这个 ULSE 问题- 描述了如何使用 unix 文件遍历命令实现集合操作 - 很有希望并且是一个可能的起点

单个csv/文本文件(列总和、平均值、最小值、最大值、子集等)上遍历和执行一些类似数据库的操作是可能的,而且非常简单,但不能在两个文件上执行,它们之间存在某种联系。也可以将文件导入临时数据库进行查询,我已经这样做了,尽管不如我希望的那么实用。

TL;DR - 我基本上想要一种方便的方法来对 csv 文件进行快速而肮脏的 sql 连接。不是在寻找一个完整的基于文本的 RDBMS,而是一个更好的方法来对 csv RDBMS 提取进行一些分析。

例子:

sqlthingy -i tbl1.csv tbl2.csv -o 'select 1,2,3 from tbl1, tbl2 where tbl1.1 = tbl2.1'

这似乎是一个足够有趣的问题,我可以花一些时间在上面,但我想知道它是否已经存在。

database csv sql

5
推荐指数
1
解决办法
3128
查看次数

标签 统计

csv ×1

database ×1

sql ×1