我在网上搜索并没有找到连接的包Thomson Reuters Eikon.
它是一个或多或少类似的财务数据源Bloomberg.通过R此软件包支持Bloomberg :
http://findata.org/r-name-redacted/
似乎什么都没有Reuters,但也许我完全错了?理想情况下,我想连接到Reuters终端并自动废弃一些信息R.
我目前正在使用该服务的COM API和win32com成功下载彭博实时市场价格以及历史系列。有没有人对将路透社实时数据和历史数据输入Python进行同样的处理?
我知道实时提要可用于Excel中的两种服务,因此,路透社还必须具有我可以访问的API。唯一的问题是,彭博社的支持非常出色,并深入描述了其API,对于这种类型的查询,路透社已经有两个月无法与我联系了!而是继续尝试向我出售他们的电子邮件订阅服务,这不是我所需要的!
无论如何,对任何帮助都大加赞赏。
我使用的是windows系统,安装时python 3.7:
import nltk
nltk.download('reuters')
Run Code Online (Sandbox Code Playgroud)
导入没有问题,而且我也已经在我的cmd中安装了nltk
但是当我执行代码时:
import matplotlib.pyplot as plt
from collections import Counter
from nltk.corpus import reuters
import re
import spacy
nlp = spacy.load('en', disable=['parser', 'tagger'])
reuters_fileids = reuters.fileids()
reuters_nlp = [nlp(re.sub('\s+',' ', reuters.raw(i)).strip()) for i in reuters_fileids[:100]]
label_counter = Counter()
Run Code Online (Sandbox Code Playgroud)
它有一些错误,我不知道如何修复它...但是,代码在我的 MacBook 上运行良好我想知道 Windows 系统发生了什么事 ps 我使用 anaconda,在 Windows 计算机上, anaconda 安装在 E:\
Resource reuters not found.
Please use the NLTK Downloader to obtain the resource:
>>> import nltk
>>> nltk.download('reuters')
Searched in:
- 'C:\\Users\\user/nltk_data'
- 'C:\\nltk_data' …Run Code Online (Sandbox Code Playgroud) 我最近开始使用 keras 编码神经网络。我设法运行一个人工智能来预测路透社新闻专线数据集的类别。然而,我正在拼命寻找一种将我的预测(整数)转换为主题的方法。必须有一个字典 - 就像训练数据的 reuters.get_word_index - 有 46 个条目并将每个整数链接到其主题(字符串)。感谢您的帮助。
XmlReader具有以下内容:
<ns0:Fields>
<omm:Field DataType="Utf8String" Name="ROW80_3">
<omm:Utf8String> Latam News </omm:Utf8String>
</omm:Field>
<omm:Field DataType="Int32" Name="RECORDTYPE">
<omm:Int32>228</omm:Int32>
</omm:Field>
<omm:Field DataType="Utf8String" Name="ROW80_4">
<omm:Utf8String>ATDNEWSRUS</omm:Utf8String>
</omm:Field>
<omm:Field DataType="Utf8String" Name="ROW80_1">
<omm:Utf8String>12:28 27JUN09 PRODUCT LIST</omm:Utf8String>
</omm:Field>
<omm:Field DataType="Utf8String" Name="ROW80_2">
<omm:Utf8String>ATDNEWSLATAM</omm:Utf8String>
</omm:Field>
<omm:Field DataType="Utf8String" Name="BQOS">
<omm:Utf8String>0</omm:Utf8String>
</omm:Field>
</ns0:Fields>
Run Code Online (Sandbox Code Playgroud)
如何重新排列元素以从ROW80_1开始并在ROW80_4结束.
好吧,这可能是我曾经问过的一个不那么聪明的问题.可悲的是,谷歌让我没有回答(堆栈也没有).
在C++ DLL文件中,我有这一行:
pSDB->setString("Logger\\AppLogger\\fileLoggerFilename", "rfa.{P}.log")
在我的生命中,我无法找出{P}准确代表的东西.在目录中,我将获得如下所示的日志:'rfa.6702.log','rfa.6829.log'或'rfa.7024.log'.
我注意到它们在不断增加.这是否合法地表示C++中的任何内容,或者只是代码中的参数集?
编辑:
此代码涉及路透社的连接.该pSDB方法是:
"rfa :: config :: StagingConfigDatabase*ConnectionManager"
我正在尝试使用众所周知的Reuters-21578数据集进行一些工作,并且在将sgm文件加载到我的语料库时遇到了一些麻烦.
现在我正在使用该命令
require(tm)
reut21578 <- system.file("reuters21578", package = "tm")
reuters <-Corpus(DirSource(reut21578),
readerControl = list(reader = readReut21578XML))
Run Code Online (Sandbox Code Playgroud)
试图将所有文件都包含在我的语料库中,但这会给我以下错误:
Error in DirSource(reut21578) : empty directory
Run Code Online (Sandbox Code Playgroud)
知道我可能会出错吗?