我有两个数据帧,我需要使用第一个数据帧向第二个数据帧添加一个新列,TRUE如果它存在于第一个数据帧 else 中,则该列具有一个值FALSE。
第一个数据框包含美国大学城的州和地区名称
State RegionName
0 Alabama Auburn
1 Alabama Florence
2 Alabama Jacksonville
3 Illinois Chicago
Run Code Online (Sandbox Code Playgroud)
第二个数据帧具有每季度的增长率。它在 State 和 RegionName 上建立索引
2008q3 2008q4
State RegionName
Alabama Jacksonville 499766.666667 487933.333333
California Los Angeles 469500.000000 443966.666667
Illinois Chicago 232000.000000 227033.333333
Run Code Online (Sandbox Code Playgroud)
所以输出数据帧将是
2008q3 2008q4 univ_town
State RegionName
Alabama Jacksonville 499766.666667 487933.333333 TRUE
California Los Angeles 469500.000000 443966.666667 FALSE
Illinois Chicago 232000.000000 227033.333333 TRUE
Run Code Online (Sandbox Code Playgroud)
任何帮助将不胜感激
我想将 TSV 读入 numpy 数组。是否有从文件中读取数据并将其转换为 numpy 浮点数数组的通用方法。(也有很少的缺失值)
该文件看起来像
Variable_1 ..... Variable_100
0.001 ..... 0.25
... ...
1.65 ..... 1.32
Run Code Online (Sandbox Code Playgroud)
我试过
def converter(x):
return float(x)
data = np.genfromtxt(fname="file.tsv", delimiter="\t", skip_header=0, names=True, converters={"Variable_" + str(n):converter for n in range(1554)})
Run Code Online (Sandbox Code Playgroud)
但是在读取文件形状后是一维数组而不是 ndarray of rows=200 cols=100
data.shape
(200,)
Run Code Online (Sandbox Code Playgroud) 我在SQLite中有两个表,看起来像这样
TABLE_X
____________________
| id | C1 | C2 | C3 | C4 |
| 10 | 99 | 03 | 04 | 00 |
| 60 | 88 | 20 | 30 | 40 |
TABLE_Y
___________
| id | C2 |
| 10 | 11 |
| 60 | 22 |
Run Code Online (Sandbox Code Playgroud)
我正在尝试根据表Y中的记录编写查询以更新表X上的记录.更新的条件如下所示
update table_x
set table_x.c1 = 100,
table_x.c2 = table_y.c2
where table_x.id = table_y.id
Run Code Online (Sandbox Code Playgroud)
但是当我尝试这样做时,我收到一条错误消息
没有这样的列:table_y.c2
我不得不在我的Mac OS 10.9.4上安装python 3.4.1但它没有被拿起来.首先我安装了Anaconda python发行版,当我检查conda时它显示我在我的macbook上安装了python 3.4.1
khurramsmacbook:~ kmajeed$ conda info
Current conda install:
platform : osx-64
conda version : 3.5.5
python version : 3.4.1.final.0
root environment : /Users/kmajeed/anaconda (writable)
default environment : /Users/kmajeed/anaconda
envs directories : /Users/kmajeed/anaconda/envs
package cache : /Users/kmajeed/anaconda/pkgs
channel URLs : http://repo.continuum.io/pkgs/free/osx-64/
http://repo.continuum.io/pkgs/pro/osx-64/
config file : None
is foreign system : False
Run Code Online (Sandbox Code Playgroud)
但是在终端中运行以下命令表明我安装了python 2.7.5
khurramsmacbook:~ kmajeed$ which python
/usr/bin/python
khurramsmacbook:~ kmajeed$ python --version
Python 2.7.5
khurramsmacbook:~ kmajeed$
Run Code Online (Sandbox Code Playgroud)
我还使用.bash_profile设置了我的$ PATH变量
khurramsmacbook:~ kmajeed$ $PATH
-bash: /sbin:/usr/sbin:/bin:/usr/bin:/usr/local/bin:/Users/kmajeed/anaconda/bin:/usr/bin:/bin:/usr/sbin:/sbin:/usr/local/bin:/opt/X11/bin:/usr/texbin: No such …Run Code Online (Sandbox Code Playgroud) python ×3
anaconda ×1
dataframe ×1
macos ×1
numpy ×1
pandas ×1
python-3.x ×1
sql ×1
sql-update ×1
sqlite ×1