我有一个包含大量列的文件,我想在mysql表中输入此文件。
问题是,如果我们有8列的文件,那么我们将首先通过-创建表
CREATE TABLE `input` (
`idInput` varchar(45) DEFAULT NULL,
`row2` varchar(45) DEFAULT NULL,
`col3` varchar(45) DEFAULT NULL,
`col4` varchar(45) DEFAULT NULL,
`col5` varchar(45) DEFAULT NULL,
`col6` varchar(45) DEFAULT NULL,
`col7` varchar(45) DEFAULT NULL,
`col8` varchar(45) DEFAULT NULL
);
Run Code Online (Sandbox Code Playgroud)
那么我们将通过-输入文件
LOAD DATA INFILE "FILE" INTO TABLE input;
Run Code Online (Sandbox Code Playgroud)
但问题是,我有150列的文件,并且我想将此文件自动插入mysql表中(这样我就不必先创建表)。我文件的第一行是标题,应该作为表中的列名,而且每一列和每一行都有不同的数据类型。
那么,有什么简单的方法可以做到这一点,以便在此之后我可以对该表执行不同的操作?
我正在使用mysql命令行客户端版本5.5.20(Windows 7)。
我找到了一些解决方案但不完全是我想要的.我在R中有5个数据帧,每个数据帧有4列:
让我们说第一个数据帧的名称是"Gene1"
Ind1 Ind2 Ind3 Ind4 1 3 3.2 2.5 1 3 4 2 1.5 2 2.2 1 3.4 2 1 3
其余的数据帧称为"Gene2","Gene3","Gene4","Gene5",并且类似.
我想在所有数据帧和所有列的相同图中并排绘制箱线图.我没有找到这样的情节,所以我无法上传图片,但我会尝试解释.
现在从上面的数据来看,该图将有20个箱形图.前4个盒子图应该彼此接近,x轴名称应该是"Gene1"(对于所有4个盒子图)然后在图中有一点空间,再次是4个框图,其中x轴名称为"Gene2",依此类推.
我可以在一个图中轻松绘制所有箱形图,但我无法区分数据框.意思是,它应该清楚地告诉我们前4个箱形图来自"Gene1",接下来的4个箱形图来自"Gene2",依此类推.
如果问题不明确,请告诉我.
我有一个带有6列的文件(制表符分隔)(为简单起见,我在这里显示了2列)
46_#1 A
47_#1 B
49_#1 C
51_#1 D
51_#1 E
Run Code Online (Sandbox Code Playgroud)
我想计算第一列中的重复项(仅计数 - 不删除)和下一列中的存储计数.所以输出应该是 -
46_#1 1 A
47_#1 1 B
49_#1 1 C
51_#1 2 D
51_#1 2 E
Run Code Online (Sandbox Code Playgroud)
我用linux命令 -
uniq -c file
Run Code Online (Sandbox Code Playgroud)
但是我会使用整条线(不是第1列)
uniq -c -w5 file
Run Code Online (Sandbox Code Playgroud)
但是第一列中的字数可能会有所不同.
有人可以帮忙吗?
PS-我有一个非常大的文件(大约1GB).