使用Sequel Pro,我有这两个表:
Table1
Name Year x y
John Smith 2010 10 12
Adam Jones 2010 8 13
John Smith 2011 7 15
Adam Jones 2011 9 14
etc.
Run Code Online (Sandbox Code Playgroud)
和
Table2
Name Year z
Smith John Smith John 2010 27
Jones Adam Jones Adam 2010 25
Smith John Smith John 2011 29
Jones Adam Jones Adam 2011 21
etc.
Run Code Online (Sandbox Code Playgroud)
基本上,表2中的名称仅与姓氏和名字切换相同,然后重复一次.因此表1中的名称在表2的名称中找到("John Smith"在"Smith John Smith John"中找到).我想执行内部联接并将Table2的z值连接到Table1的其他值并得到如下内容:
Name x y z
John Smith 10 12 27
Adam Jones 8 13 25
Run Code Online (Sandbox Code Playgroud)
为此,我运行了这个查询:
Select Table1.*, …Run Code Online (Sandbox Code Playgroud) 我在MySQL中运行一个查询,我按四列分组并选择了很多东西,包括我正在分组的四个值.但是当我运行查询时出现此错误:
Duplicate entry '92-0-10-7' for key 'group_key'
Run Code Online (Sandbox Code Playgroud)
92,0,10和7都是特定行的四个分组列的值(实际上,我检查过,有63行符合这些参数).但我不知道这意味着什么,或者如何正确运行我的查询.
我的查询:
Create table table2 as
Select round(x, 0) as x, round(a, 0) as a, round(b, 0) as b, c, d, e, f
from table1
group by round(x, 0), round(a, 0), round(b, 0), c
Run Code Online (Sandbox Code Playgroud)
92将适合x,0 a,10 b和7 c.
我这张桌子上没有索引.
谢谢!
我正在尝试使用数据集在R中运行非线性多元回归,它有数千行,所以我只是将前几个放在这里:
Header.1 Header.2 Header.3 Header.4 Header.5 Header.6 Header.7
1 -60 -45 615 720 1.8318 0.428 -11.614
2 -59 -45 616 720 1.8322 0.429 -11.498
3 -58 -45 617 720 1.8326 0.430 -11.383
4 -57 -45 618 720 1.8330 0.430 -11.267
5 -56 -45 619 720 1.8334 0.431 -11.152
6 -55 -45 620 720 1.8338 0.432 -11.036
7 -54 -45 621 720 1.8342 0.433 -10.921
8 -53 -45 622 720 1.8346 0.433 -10.806
9 -52 -45 623 720 1.8350 0.434 -10.691 …Run Code Online (Sandbox Code Playgroud) 我正在尝试使用 Sequel Pro 连接到 MySQL,这是我以前做过很多次的事情。主机127.0.0.1,用户名root,无密码。我收到以下消息:
无法连接到主机 127.0.0.1,因为访问被拒绝。
仔细检查您的用户名和密码,并确保允许从您当前的位置访问。
MySQL说:用户'root'@'localhost'的访问被拒绝(使用密码:否)
无论如何,我在升级到新的 Mac OS(Mavericks)后收到了这条消息,意识到服务器没有运行,下载了一个新服务器(当前正在运行),然后再试一次 - 但我遇到了同样的问题.
在 MySQL 中,如何在 group by 函数中使用 round() 函数?我尝试过的示例:
Table 1
a b
1.3 5
1.4 6
2.7 8
3.0 9
Select round(a,0), avg(b)
from Table1
group by round(a,0)
Run Code Online (Sandbox Code Playgroud)
理想情况下,这会给我这样的输出:
round(a,0) avg(b)
1 5.5
3 8.5
Run Code Online (Sandbox Code Playgroud)
但这不起作用。有任何想法吗?
我在 Mac 上使用 Sequel Pro
在 R 中运行回归:
fit = lm(y ~ x + log(x) + z + log(z) + (z-1)^2, data=data)
Run Code Online (Sandbox Code Playgroud)
我得到了高得离谱的 R^2 值。我将 (z-1)^2 替换为一个我称之为 q 的变量,该变量被定义为 (z-1)^2 并且我得到了一个低得多的 R^2 值。
现在很清楚,我认为^不充当流明()指数,但什么也做什么呢?我在这里看了http://faculty.chicagobooth.edu/richard.hahn/teaching/FormulaNotation.pdf但我并没有真正理解它。
我一生都无法弄清楚如何做到这一点,但看起来它应该非常简单。
我有以下数据:
A B C
5 2 0.714972409
5 4 0.74183882
5 6 0.762162036
5 8 0.813707009
5 10 0.850703046
5 12 0.857035156
5 14 0.872640528
5 16 0.973139763
5 18 0.978478338
7 2 0.684788926
7 4 0.711897491
7 6 0.735098842
7 8 0.762857648
7 10 0.83291045
7 12 0.844075508
7 14 0.884207251
7 16 0.94815451
7 18 0.950971496
9 2 0.659268067
9 4 0.694214759
9 6 0.718271051
9 8 0.771301281
9 10 0.773598055
9 12 0.836032827
9 14 0.870630437 …Run Code Online (Sandbox Code Playgroud) 我在Stack Overflow中问了这个问题:R lm()中的^符号
我觉得这里是一个更好的地方来得到答案.^符号究竟对回归做了什么,为什么它使r ^ 2更高?
假设我在Sequel Pro中有一张这样的桌子:
SaleID VendorID
1 A
2 C
3 E
4 C
5 D
Run Code Online (Sandbox Code Playgroud)
我想找到卖方C为卖方的销售百分比。(在这种情况下,显然是40%,但我正在处理更大的表)。我该怎么做?我在考虑使用该Count函数,但不确定如何精确执行。谢谢!
在R中,如果我有7个逻辑语句并且我想检查它们中是否至少有5个是真的,那么最简单的方法是什么?
我可以做一大堆&和|s,但必须有一个更简单的方法,不是吗?