小编j r*_*iot的帖子

R - 使用str_split和unlist创建两列

我有一个数据集,在同一列中有日期和利率.我需要将这两个数字拆分为两个单独的列,但是当我使用以下代码时:

 Split <- str_split(df$Dates, "[ ]", n = 2)
 Dates <- unlist(Split)[1]
 Rates <- unlist(Split)[2]

Run Code Online (Sandbox Code Playgroud)

它仅返回每个元素的第一个"值",即日期的"1971-04-01"和费率的"7.43".我需要它返回字符串拆分部分的所有值,并为字符串拆分的第二部分返回相同的值

下面是数据集的一部分,总行数= 518.

    1971-04-01   7.31
    1971-05-01   7.43
    1971-06-01   7.53
    1971-07-01   7.60
    1971-08-01   7.70
    1971-09-01   7.69
    1971-10-01   7.63
    1971-11-01   7.55
    1971-12-01   7.48
    1972-01-01   7.44

Run Code Online (Sandbox Code Playgroud)

谢谢

r strsplit

j r*_*iot

2015 09-20

8
推荐指数

2
解决办法

2万
查看次数

Python 熊猫 to_sql '追加'

我正在尝试使用 Python 的 pandas to_sql 命令将每月数据发送到 MySQL 数据库。我的程序一次运行一个月的数据，我想将新数据附加到现有数据库中。但是，Python 给了我一个错误：

_mysql_exceptions.OperationalError: (1050, "Table 'cps_basic_tabulation' already exists")

Run Code Online (Sandbox Code Playgroud)

这是我的连接和导出代码：

conn = MySQLdb.connect(host     = config.get('db', 'host'),
                       user     = config.get('db', 'user'),
                       passwd   = config.get('db', 'password'),
                       db       = 'cps_raw') 

combined.to_sql(name            = "cps_raw.cps_basic_tabulation",
               con              = conn,
               flavor           = 'mysql', 
               if_exists        = 'append')

Run Code Online (Sandbox Code Playgroud)

我也试过使用：

from sqlalchemy import create_engine

Run Code Online (Sandbox Code Playgroud)

将 conn = MySQLdb.connect... 替换为：

engine = mysql+mysqldb://<user>:<password>@<host>[:<port>]/<dbname>

conn   = engine.connect().connection

Run Code Online (Sandbox Code Playgroud)

关于为什么我不能附加到数据库的任何想法？

谢谢！

python mysql pandas

j r*_*iot

lucky-day

7
推荐指数

1
解决办法

1万
查看次数

在HTS R中创建分层数据结构,节点

我正在尝试使用R中的HTS包创建节点结构.有关节点的文档很稀疏,因此尝试对节点结构进行适当的编码很困难,并添加一个添加的层我试图创建两个层次结构,我们在其中拥有下列:

(层次1 - 地理:例子是美国特拉华州及其县)

Run Code Online (Sandbox Code Playgroud)

(层次结构2 - 行业:简化)

=> 10
     => 11
     => 12 
     => 21 
     => 22 
     => 31
     ...
     => 99

Run Code Online (Sandbox Code Playgroud)

编辑2 - 更正的层次结构和进一步的说明

所以每个时间序列都有一个地理代码和一个行业代码.地理代码遵循一个层次结构,行业代码另一个(如上所示).

我试图弄清楚如何指定"nodes"参数来表示两个层次结构的关系(文档示例仅显示单个层次结构).

当两个层次结构相互作用时,我们会获得更多级别.假设只有2个行业,11和12,我们简化.由(10001,11)和(10001,12)确定的时间序列必须加起来(10001,10); 而且,(10001,11)...(10999,11)必须加起来(10000,11)等等.再次,这些是简化的层次结构 - 在实际数据中有更多的层次.

问题是,两个层次结构的"节点"参数如何？希望这可以帮助.

r time-series hierarchy hierarchical-data forecasting

j r*_*iot

2014 06-13

6
推荐指数

1
解决办法

2236
查看次数

Python Pandas read_csv无法正确导入

我有一个.xls看起来与此类似的文件......

Value of Construction Put in Place...
(Millions of Dollars....)
Blank Row
Date    Total_Construction Total Residential Total Nonresidential...Columns 
Dec-15  1,116,570          435,454           681,217 
Nov-15  1,115,966          432,295           683,671
Oct-15  1,122,749          431,164           691,585   
.
.
.

Run Code Online (Sandbox Code Playgroud)

我正在尝试导入该文件以获取以下内容:

Date    Total_Construction Total Residential Total Nonresidential 
Dec-15  1,116,570          435,454           681,217 
Nov-15  1,115,966          432,295           683,671
Oct-15  1,122,749          431,164           691,585   
.
.
.

Run Code Online (Sandbox Code Playgroud)

使用以下代码:

for chunk in pandas.read_csv('/PATH/totsatime.xls',
                 names      = ['Date', 'Total Residential', 'Total Nonresidential'],
                 header     = 4,
                 chunksize  = 1,
                 skiprows   = range(1, 4),
                 thousands …

Run Code Online (Sandbox Code Playgroud)

python pandas

j r*_*iot

2016 04-28

0
推荐指数

1
解决办法

323
查看次数