小编Jer*_*rry的帖子

任何有效的方法来找到周围的ADJ尊重python中的目标短语?

我正在对给定的文件进行情感分析,我的目标是我想在我的句子中找出与目标短语相关的最接近或周围的形容词.我确实知道如何提取与目标短语相关的周围词,但我如何找到与目标短语相对接近或最接近的形容词或NNP/ VBN或其他POS标签.

这是关于如何使周围的单词尊重我的目标短语的草图概念.

sentence_List= {"Obviously one of the most important features of any computer is the human interface.", "Good for everyday computing and web browsing.",
"My problem was with DELL Customer Service", "I play a lot of casual games online[comma] and the touchpad is very responsive"}

target_phraseList={"human interface","everyday computing","DELL Customer Service","touchpad"}
Run Code Online (Sandbox Code Playgroud)

请注意,我的原始数据集是作为数据框给出的,其中给出了句子列表和相应的目标短语.这里我只是模拟数据如下:

import pandas as pd
df=pd.Series(sentence_List, target_phraseList)
df=pd.DataFrame(df)
Run Code Online (Sandbox Code Playgroud)

在这里我将句子标记为如下:

from nltk.tokenize import word_tokenize
tokenized_sents = [word_tokenize(i) for i in sentence_List]
tokenized=[i for i in tokenized_sents]
Run Code Online (Sandbox Code Playgroud)

然后我试着通过 …

python parsing nlp sentiment-analysis

5
推荐指数
1
解决办法
211
查看次数

有什么简单的方法来获取 imagenet 数据集以在张量流中训练自定义模型?

在我的实验中,我想在imagenet数据集上训练我的自定义模型。为简单起见,我对 10/100 类分类任务感兴趣。但是,直接下载imagenet数据集tfds需要大量的硬盘空间。是否有任何解决方法可以对imagenet数据集进行子集化,以便子集化的imagenet数据集适合 10/100 类分类任务?有谁知道有什么方法可以实现这一点吗?任何想法?

总的来说,cifar10使用cifar100TensorFlow 的函数式 api 非常方便。但是,在我的实验中,我想在 上训练我自己的模型imagenet。我想避免imagenet直接下载数据集,相反,我想要一些计算量较少的方法,这样我就可以在子集imagenet(10 或 100 类分类)上训练我的自定义模型。有什么办法可以做到这一点吗?有什么想法吗?

我尝试下载imagenet

这是我尝试imagenet在本地下载数据集,然后在数据集上训练我的自定义模型imagenet。但下载和加载数据进行训练非常耗时。但这就是我所做的:

import keras
import tensorflow as tf
import tensorflow_datasets as tfds

## fetch imagenet dataset directly
imagenet = tfds.image.Imagenet2012()

## describe the dataset with DatasetInfo
C = imagenet.info.features['label'].num_classes
n_train = imagenet.info.splits['train'].num_examples
n_validation = imagenet.info.splits['validation'].num_examples

assert C == 1000
assert n_train == …
Run Code Online (Sandbox Code Playgroud)

python tensorflow

5
推荐指数
1
解决办法
3876
查看次数

如何在张量流中自动选择空闲 GPU 进行模型训练?

我正在使用 nvidia 预构建的 docker 容器NVIDIA Release 20.12-tf2来运行我的实验。我正在使用TensorFlow Version 2.3.1. 目前,我在其中一个 GPU 上运行我的模型,我还有 3 个空闲的 GPU,所以我打算在任何空闲的 GPU 上使用我的替代实验。这是输出nvidia-smi

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 450.51.06    Driver Version: 450.51.06    CUDA Version: 11.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:6A:00.0 Off |                    0 |
| N/A   70C    P0    71W …
Run Code Online (Sandbox Code Playgroud)

python gpu tensorflow nvidia-docker

5
推荐指数
0
解决办法
235
查看次数

将项目上传到github时如何解决“拒绝合并无关的历史记录”?

我已经在Windows机器上安装了Github桌面和git,我有一个github帐户并创建了一个虚拟存储库。

当我打算通过git bash命令行上传程序包时,它失败并显示错误:致命:拒绝合并无关的历史记录

我使用几种方法来解决此问题,方法是使用该社区中的现有解决方案,但仍然无法解决问题。有人知道解决此问题的任何技巧吗?如何将项目成功上传到github?

git github git-bash

4
推荐指数
2
解决办法
2万
查看次数

如何在开发R包中添加外部数据文件?

我在Rstudio中构建我的R包,当我厌倦了创建包的小插图时遇到了一些意外的问题。当我在Rstudio中点击“构建/加载”面板时,在创建包文档时出现了晕影错误。为了可能解决我遇到的小插图错误,我必须将外部数据添加到我的程序包中,并使用此数据相应地编译程序包小插图。我使用devtools::install()命令安装了软件包,但未inst/创建目录。extdata必须位于inst目录中。我也曾经devtools::use_data()从PC添加数据,但是无法添加外部数据。如何为包裹加载外部数据?我认为我不应该手动创建extdata外部数据并将其放在那。为什么inst/在我使用时未创建devtools::install()?如何将一组csv文件作为外部数据添加到我的程序包中?

这是我将在小插图中使用的玩具助手功能,以读取外部数据:

myFunc <- function(myDir, ...) {
  files <- list.files(myDir, full.names = TRUE, "\\.csv$")
  readMe <- lapply(files, read.csv)
  return(readMe)
}
Run Code Online (Sandbox Code Playgroud)

这是我第一次构建R软件包,并遇到一些常见错误。如果我的问题陈述得不好,我会道歉。

要在其中找到文件inst/,我需要使用system.file(),但是我没有这个目录,加上myFunc接受文件目录来抓取文件并将其读取为.csv,这是玩具代码块,可以在小插图文件中执行:

```{r}
library(myPkg)
file.1 <- system.file("extdata", "xxx.csv", "myPkg")
file.2 <- system.file("extdata", "yyy.csv", "myPkg")
myFunc(list(file.1, file.2))

```
Run Code Online (Sandbox Code Playgroud)

如何使用此数据将外部数据加载到我的包中以编译包小插图?为什么inst/我点击时不创建devtools::installl()?任何人都可以帮我怎么做吗?谢谢!

r rstudio r-package

4
推荐指数
1
解决办法
1145
查看次数

有什么方法可以用python中的scikit-learn来预测每月的时间序列?

我想product' sales_index通过使用每月时间序列中的多个特征进行预测。一开始,我开始使用ARMA,ARIMA来做到这一点,但输出对我来说不是很令人满意。在我的尝试中,我只是使用datessales列进行预测,输出对我来说并不现实。我想我应该包括更多的特征列来预测sales_index列。但是,我想知道是否有任何方法可以通过使用每月时间序列中的多个特征来进行此预测。我没有使用scikit-learn. 任何人都可以指出我这样做的任何可能方法吗?任何可能的想法?

我尝试使用 ARMA/ARIMA

这是关于这个要点的重现的月度时间序列数据,这是我目前的尝试:

import pandas as pd
from statsmodels.tsa.arima_model import ARMA
from statsmodels.tsa.arima_model import ARIMA
from statsmodels.tsa.statespace.sarimax import SARIMAX
import matplotlib.pyplot as plt

df = pd.read_csv("tsdf.csv", sep=",")
dates = pd.date_range(start='2015-01', freq='MS', periods=len(df))
df.set_index(dates,inplace=True)
train = df[df.index < '2019-01']
test = df[df.index >= '2019-01']

model = ARMA(train['sales_index'],order=(2,0))
model_fit = model.fit()
predictions = model_fit.predict(start=len(train), end=len(train)+len(test)-1, dynamic=False)
# plot results
plt.figure(figsize=(12,6)) …
Run Code Online (Sandbox Code Playgroud)

python regression time-series scikit-learn u8darts

2
推荐指数
2
解决办法
5213
查看次数

如何轻松操作列表中的data.frame让它们具有相同的模式?

我实现了返回data.frame列表的函数,其中data.frame中索引向量的顺序不同.但是,我打算操纵这个列表,让第二个,第三个data.frame与列表中的第一个data.frame具有相同的模式.因为结果在列表中,所以我想轻松操作这个列表让data.frame对象具有相同的模式.我怎样才能轻松实现这一目标?有谁知道轻松操纵列表的任何有用技巧?提前致谢.

我的自定义函数的输出是:

dfList <- list(
  df_1 = data.frame(hola = c(1,2,3), ciao=c(NA,1,2), bonjour=c(1,1,2)),
  df_2 = data.frame(ciao = c(1,2,3), hola=c(2,3,NA), bonjour=c(1,2,4)),
  df_3 = data.frame(bonjour = c(1,2,3,4), hola=c(2,3,NA,NA), ciao=c(1,2,NA,3))
)
Run Code Online (Sandbox Code Playgroud)

我打算制作第二个,第三个data.frame与列表中的第一个data.frame具有相同的模式.如何轻松操作data.frame在列表中具有相同的模式?

期望的输出可能是:

$df_1
    hola ciao bonjour
1    1   NA       1
2    2    1       1
3    3    2       2

$df_2
    hola ciao bonjour
1    2    1       1
2    3    2       2
3    NA   3       4

$df_3
    hola ciao  bonjour 
1   2    1      1
2   3    2      2
3   NA   NA     3
4   NA   3 …
Run Code Online (Sandbox Code Playgroud)

r dataframe

1
推荐指数
1
解决办法
39
查看次数

如何在张量流中将多个 2dim 张量垂直连接成一个?

我想知道我们应该如何将多个不同形状的张量连接成 keras 中的一个张量。我尝试tf.keras.layers.concatenate如下:

import tensorflow as tf
from tf.keras.layers import concatenate

print(tensor_1.shape)
print(tensor_2.shape)

new_tensor = concatenate([tensor_1, tensor_2],axis=1)
new_tensor
Run Code Online (Sandbox Code Playgroud)

但我得到以下值错误:

shape of tensor_1 (?, 30, 30, 128)
shape of tensor_2 (?, 26, 26, 128)
---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-24-96d471a8e99e> in <module>()
----> 1 concatenate([tensor_1, tensor_2], axis=1)

4 frames
/usr/local/lib/python3.6/dist-packages/tensorflow/python/keras/layers/merge.py in build(self, input_shape)
    517             shape[axis] for shape in shape_set if shape[axis] is not None)
    518         if len(unique_dims) > 1:
--> 519           raise ValueError(err_msg)
    520 
    521   def _merge_function(self, …
Run Code Online (Sandbox Code Playgroud)

python tensorflow

0
推荐指数
1
解决办法
1815
查看次数