小编Vin*_*mel的帖子

如何基于stanford-nlp条件随机场模型训练法语NER？

我发现了stanford-NLP的工具,发现它非常有趣.我是法国数据管理员/数据科学家,喜欢文本分析,并且很乐意使用你的工具,但是法语中没有的NER对我来说非常令人费解.

我很想制作我自己的法国NER,如果它被认为是值得的话,甚至可以提供它作为包的贡献,那么......你能否向我简要介绍基于stanford coreNLP训练法国NER的CRF的要求？

谢谢.

stanford-nlp

Vin*_*mel

2016 06-20

6
推荐指数

1
解决办法

1753
查看次数

如果我删除 mongodb 数据库文件会发生什么？

这是我的问题，我正在使用我自己的测试 VM 使用 Talend & Mongodb 进行数据转换项目。不幸的是，我尝试大规模启动 Map/Reduce 操作，但磁盘上的可用空间显然太少了。它坠毁了。

（我从 2Go csv 文件中加载了单个集合数据，它创建了一个 9Go db，我认为这只是分配了空间，而我的下一个操作不会让它再次变大......然后将一些聚合到一个新的使用 Map/Reduce 脚本的集合。）

现在我无法打开 mongo shell，即使我由于显然损坏的数据库文件而强制删除锁定文件。并且由于磁盘空间不足（10Go数据库文件，需要相同的磁盘空间，只有2Go）导致mongodb启动时的修复命令失败。

我想完全摆脱 db 以重新开始采样数据，所以基本上我不想在无法使用 shell 的情况下删除 db ......我可以删除文件 dbname.1 到 dbname.8 吗？数据库名称.ns ? 好像有点暴力...

谢谢你的帮助！

编辑：解决了我的问题，使用 --nojournal 启动 mongod，但仍然对 mongodb 如何处理这些被删除的文件感兴趣

linux centos mongodb

Vin*_*mel

2015 01-02

4
推荐指数

1
解决办法

4552
查看次数

使用新的 azure.storage.blob 包解决文件上传超时错误

我必须升级一个使用旧版本的 microsoft azure python 包从 api 下载数据的 docker 容器，然后将 json 上传到 Azure Blob 存储。因此，由于不再允许使用以前的“azure”元包的 pip 安装，我必须使用新的独立包（azure-storage-blob==12.6.0）。

从旧“azure”包中集成的 blockblobservice 中的函数“create_blob_from_path”切换到新的独立包，BlobClient.upload() 在较大文件上失败，并出现超时错误，完全忽略函数的超时参数。

我收到 ServiceResponseError 消息“连接中止/写入操作超时”

有什么办法可以解决这个错误吗？

新函数感觉像是从 create_blob_from_path 向后退了一大步，缺少progress_callback 主要是令人遗憾的......

python azure-blob-storage

Vin*_*mel

2020 12-02

4
推荐指数

1
解决办法

2万
查看次数