小编Kyl*_*erg的帖子

Google Scholar 是否有可供我们在研究应用程序中使用的 API?

我正在开展一个研究出版物和合作项目,其中有文献检索功能。Google Scholar 似乎可以工作,因为它是一个开源工具,但是当我研究 Google Scholar 时,我找不到任何有关它具有 API 的信息。

有谷歌学术的API吗?

journal google-scholar researchkit

33
推荐指数
2
解决办法
3万
查看次数

如何使用 Neovim Lua API 获取当前缓冲区文件路径?

我正在使用 Neovim 0.5,想要编写一个自定义函数来与telescope.nvim.

在执行该函数之前,我需要获取当前缓冲区中加载的文件的路径。在阅读 Neovim Lua API 文档后,我一直无法找到如何执行此操作。

到目前为止,我发现vim.api.nvim_get_current_buf()返回当前缓冲区编号,但是如何获取当前缓冲区的完整文件路径?

lua neovim

20
推荐指数
3
解决办法
3万
查看次数

在 Lua 中检查 nil 值的最佳方法是什么?

我已经开始学习 Lua 并看到了这两种检查方法nil

local stats = game.ServerStorage.PlayerMoney:FindFirstChild(player.Name)

if (stats ~= nil) then 
    -- do stuff
end
    
if (stats) then 
    -- do stuff
end
Run Code Online (Sandbox Code Playgroud)

这两个if语句等价吗?如果是这样,包含额外~= nil部分有什么好处吗?

lua if-statement

8
推荐指数
1
解决办法
7874
查看次数

哪些 HuggingFace 摘要模型支持超过 1024 个令牌?哪种模型更适合编程相关文章?

如果这不是提出这个问题的最佳地点,请引导我找到最准确的地点。

我计划使用 Huggingface 摘要模型之一 ( https://huggingface.co/models?pipeline_tag=summarization ) 来总结我的讲座视频转录。

到目前为止,我已经测试了facebook/bart-large-cnnsshleifer/distilbart-cnn-12-6,但它们最多只支持 1,024 个令牌作为输入。

所以,这是我的问题:

  1. 是否有支持更长输入(例如 10,000 字文章)的摘要模型?

  2. 对于给定的输入长度,最佳输出长度是多少?假设对于 1,000 个单词的输入,最佳(最小)输出长度(摘要文本的最小长度)是多少?

  3. 哪种模型可能适用于编程相关文章?

nlp summarization mlmodel huggingface-transformers huggingface

8
推荐指数
1
解决办法
3023
查看次数

PyTorch:“KeyError:在 DataLoader 工作进程 0 中捕获 KeyError。”

问题描述

我尝试使用 PyTorch 自定义数据集加载图像数据,但是,我收到了下面列出的错误消息。它发生后,我检查了数据,发现我的图像集由2种形状(512,512,3)和(1024,1024)组成。我的假设是该错误与此有关。

注意:代码能够读取某些图像,但会抛出其他图像的错误消息。

问题

  1. 应如何预处理此类图像数据以进行训练?

  2. 错误消息还有其他原因吗?

错误信息

KeyError                                  Traceback (most recent call last)
<ipython-input-163-aa3385de8026> in <module>
----> 1 train_features, train_labels = next(iter(train_dataloader))
  2 print(f"Feature batch shape: {train_features.size()}")
  3 print(f"Labels batch shape: {train_labels.size()}")
  4 img = train_features[0].squeeze()
  5 label = train_labels[0]

 ~/anaconda3/envs/pytorch_p36/lib/python3.6/site-packages/torch/utils  /data/dataloader.py in __next__(self)
519             if self._sampler_iter is None:
520                 self._reset()
521             data = self._next_data()
522             self._num_yielded += 1
523             if self._dataset_kind == _DatasetKind.Iterable and \

~/anaconda3/envs/pytorch_p36/lib/python3.6/site-packages/torch/utils/data/dataloader.py in _next_data(self)
1201             else:
1202                 del self._task_info[idx]
1203                 return self._process_data(data)
1204 …
Run Code Online (Sandbox Code Playgroud)

machine-learning image-processing dataset pytorch

7
推荐指数
1
解决办法
1万
查看次数

使用 mason 和 lsp-zero 在 Neovim 中设置格式化程序

我正在使用 lsp-zero & mason 来安装 LSP、格式化程序和 linter。但是,我不确定格式化程序如何工作以及如何配置它们。

例如,yml即使我已经安装了yamlls和,文件格式化程序似乎也无法工作yamlfmt。另一方面,Golang 的格式化程序似乎工作得很好,当我保存文件时*.go,它会自动格式化。

在这种情况下,您将如何设置 YAML 格式化程序?这是我的配置的片段:

lsp.lua

local lsp = require("lsp-zero")

lsp.preset("recommended")

-- Fix Undefined global 'vim'
lsp.nvim_workspace()

local cmp = require('cmp')
local cmp_select = {behavior = cmp.SelectBehavior.Select}
local cmp_mappings = lsp.defaults.cmp_mappings({
  ['<C-p>'] = cmp.mapping.select_prev_item(cmp_select),
  ['<C-n>'] = cmp.mapping.select_next_item(cmp_select),
  ['<CR>'] = cmp.mapping.confirm({ select = true }),
  ["<C-Space>"] = cmp.mapping.complete(),
})

cmp_mappings['<Tab>'] = nil
cmp_mappings['<S-Tab>'] = nil

lsp.setup_nvim_cmp({
  mapping = cmp_mappings
})

lsp.set_preferences({
    suggest_lsp_servers = false,
    sign_icons = …
Run Code Online (Sandbox Code Playgroud)

lua neovim

7
推荐指数
1
解决办法
8347
查看次数

设置同步按钮:在 Visual Studio 中找不到 user.config 文件

它并没有真正引起问题,但它让我很烦...有谁知道如何在 Visual Studio 中刷新用户配置的位置?

当我单击“项目属性”->“设置”表单中的“同步”按钮时,收到错误消息No user.config files were found in any of the following locations.

列出的路径不存在,所以我知道为什么会出现错误消息。但是,设置文件必须存储在一些不同的路径下。

有任何想法吗?我确实在注册表中快速搜索了路径,但对于我可以删除的内容没有任何明显的信息。也许它是解决方案中文件中包含的内容?

我使用的是 Visual Studio 2008、Windows XP。

visual-studio-2008

6
推荐指数
2
解决办法
6763
查看次数

如何检测两篇新闻文章是否具有相同的主题?(Python语义相似度)

我正在尝试从一些特定网站上的文章中抓取标题和正文,类似于谷歌对谷歌新闻的做法。

问题是,在不同的网站上,他们可能有关于同一主题的文章,措辞略有不同。

谁能告诉我我需要知道什么才能编写一个比较算法来自动检测相似的文章?或者,是否有任何库可用于文本比较并返回某种类型的相似度评级?需要使用 Python 的解决方案。

python comparison nlp similarity

6
推荐指数
1
解决办法
2629
查看次数

本地Lua函数的范围

我对 Lua 中的本地函数有点困惑。请看下面的简化示例:

function test()
  local function f()
    print("f")
    g()
  end

  local function g()
    print("g")
  end

  f()
end

test()
Run Code Online (Sandbox Code Playgroud)

运行此代码后,我在 function 中收到错误f,因为 functiongnil.

根据我的理解,一旦代码到达对 function 的调用,就应该声明这两个函数g。由于这两个函数尚未到达块的末尾(即它们仍在 function 内test),因此它们应该仍然可以访问。当将函数声明为全局时,此代码可以正常工作。所以,我真的不确定为什么它不能与本地函数一起使用。《Programming in Lua》一书也没有解释这种行为。

lua function local

6
推荐指数
1
解决办法
3626
查看次数

用于非英语术语提取的开源选项?

我正在寻找一个可以使用多种语言进行术语提取的开源项目。

我已经找到了Yahoo BOSS Term Extraction Web Service,它很好。但是,它不处理英语以外的语言。

有没有支持更多语言的开源术语提取项目?

谢谢!

nlp information-extraction

5
推荐指数
1
解决办法
1204
查看次数