我最近开始使用Python,因此我可以与Bloomberg API进行交互,而且我在将数据存储到Pandas数据帧(或面板)时遇到了一些麻烦.我可以在命令提示符中得到输出就好了,所以这不是问题.
这里提出了一个非常相似的问题: Bloomberg api的熊猫包装?
但是,该问题的已接受答案中引用的代码是针对旧API的,并且它不适用于新的开放API.显然,提出问题的用户能够轻松修改该代码以使用新API,但我习惯将手放在R中,这是我对Python的第一次尝试.
一些仁慈的用户可以告诉我如何将这些数据导入熊猫吗?有一个名为SimpleHistoryExample.py 的Python API(在这里提供:http://www.openbloomberg.com/open-api/),我一直在使用它,我已经在下面包含了这个例子.我相信我需要在'main()'函数的末尾围绕'while(True)'循环进行修改,但到目前为止我尝试的所有内容都有问题.
在此先感谢,我希望这对使用Pandas进行融资的任何人都有帮助.
# SimpleHistoryExample.py
import blpapi
from optparse import OptionParser
def parseCmdLine():
parser = OptionParser(description="Retrieve reference data.")
parser.add_option("-a",
"--ip",
dest="host",
help="server name or IP (default: %default)",
metavar="ipAddress",
default="localhost")
parser.add_option("-p",
dest="port",
type="int",
help="server port (default: %default)",
metavar="tcpPort",
default=8194)
(options, args) = parser.parse_args()
return options
def main():
options = parseCmdLine()
# Fill SessionOptions
sessionOptions = blpapi.SessionOptions()
sessionOptions.setServerHost(options.host)
sessionOptions.setServerPort(options.port)
print "Connecting to %s:%s" % (options.host, options.port)
# Create a Session
session …Run Code Online (Sandbox Code Playgroud) 我正在尝试对R中的数据集进行分区,2/3用于训练,1/3用于测试.我有一个分类变量和七个数值变量.每个观察被分类为A,B,C或D.
为简单起见,假设分类变量cl对于前100次观测是A,对于观察101到200是C,C到300,D到400.我正在尝试获得具有2/3的分区对于A,B,C和D中的每一个的观察结果(而不是简单地获得整个数据集的2/3的观察结果,因为它可能没有相同数量的每个分类).
当我尝试从数据的子集中进行采样时,例如sample(subset(data, cl=='A')),列被重新排序而不是行.
总而言之,我的目标是从A,B,C和D中的每一个随机观察67个作为我的训练数据,并将A,B,C和D中的每一个的剩余33个观测值存储为测试数据.我发现了一个与我非常相似的问题,但它没有考虑到多个变量.
我有一个要导出到 Excel 的数据框,人们想要它在 .xlsx 中。我使用to_excel,但是当我将扩展名从 .xls 更改为 .xlsx 时,导出步骤大约需要 9 秒而不是 1 秒。导出到 .csv 甚至更快,我相信这是因为它只是一个特殊格式的文本文件。
也许 .xlsx 文件只是添加了更多功能,因此写入它们需要更长的时间,但我希望我可以做些什么来防止这种情况发生。