小编sta*_*010的帖子

如何在OSX for Android studio中设置NDK构建路径

我已经设定ANDROID_NDK_HOME/Users/Shajilshocker/Documents/Android/NDK/android-ndk-r10b使用一个被称为Mac OSX版应用程序环境变量.

我已经确认它在终端中正确设置了路径

echo $ANDROID_NDK_HOME

但是当我在调用的Android Studio项目中运行shell文件时,ndk-build我收到以下错误

ndk-build: command not found

如何确保ndk-build在您的构建路径中?

如何在我的构建路径中设置ndk-build?

谢谢你的帮助

macos terminal android android-ndk android-studio

23
推荐指数
3
解决办法
5万
查看次数

XGBoost plot_importance不显示功能名称

我正在使用XGBoost和Python,并使用train()名为DMatrix数据的XGBoost 函数成功训练了一个模型.矩阵是从Pandas数据框创建的,该数据框具有列的特征名称.

Xtrain, Xval, ytrain, yval = train_test_split(df[feature_names], y, \
                                    test_size=0.2, random_state=42)
dtrain = xgb.DMatrix(Xtrain, label=ytrain)

model = xgb.train(xgb_params, dtrain, num_boost_round=60, \
                  early_stopping_rounds=50, maximize=False, verbose_eval=10)

fig, ax = plt.subplots(1,1,figsize=(10,10))
xgb.plot_importance(model, max_num_features=5, ax=ax)
Run Code Online (Sandbox Code Playgroud)

我现在想要使用该xgboost.plot_importance()函数查看功能重要性,但结果图不显示功能名称.但是,这些功能被列为f1,f2,f3等如下所示.

在此输入图像描述

我认为问题是我将原来的Pandas数据帧转换为DMatrix.如何正确关联要素名称以使特征重要性图显示它们?

python machine-learning pandas xgboost

19
推荐指数
4
解决办法
1万
查看次数

在R数据帧或向量中查找非数字数据

我用read.csv()阅读了一些冗长的数据,令我惊讶的是数据是作为因子而不是数字出现的,所以我猜测数据中必须至少有一个非数字项.我怎样才能找到这些物品的位置?

例如,如果我有以下数据框:

df <- data.frame(c(1,2,3,4,"five",6,7,8,"nine",10))
Run Code Online (Sandbox Code Playgroud)

我想知道第5行和第9行有非数字数据.我该怎么办?

r dataframe

18
推荐指数
2
解决办法
4万
查看次数

Gnuplot:行不透明度/透明度?

我正在使用Gnuplot成功绘制一些时间序列数据.然而,该系列相当密集(大约5英寸空间中的10,000个样本),当我绘制多个系列时,很难看到在顶部绘制的系列下面.有没有办法让线条有一点不透明度或透明度(即使线条透明,以便在线条下方可见)?

Excel具有此功能,但我更喜欢使用Gnuplot.

以下是我所说的样本.你看不到绿线下面的红线.我实际上想添加第三个时间序列.我正在用命令密谋:

plot [][-3:3] 'samples_all.csv' using 1:7 title 'horizontal' w l ls 1, '' using 1:8 title 'vertical' w l ls 2"
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

gnuplot

14
推荐指数
1
解决办法
2万
查看次数

更新存储的Iterator时的ConcurrentModificationException(用于LRU缓存实现)

我正在尝试实现自己的LRU缓存.是的,我知道Java 为此目的提供了LinkedHashMap,但我试图使用基本数据结构来实现它.

通过阅读这个主题,我明白我需要一个HashMap来O(1)查找一个密钥和一个链表来管理"最近最少使用的"驱逐策略.我发现这些引用都使用标准库hashmap但实现了自己的链表:

哈希表应该直接存储链接列表节点,如下所示.我的缓存应该存储Integer键和String值.

在此输入图像描述

但是,在Java中,LinkedList集合不公开其内部节点,因此我无法将它们存储在HashMap中.我可以将HashMap存储索引放入LinkedList中,但是到达一个项目需要O(N)时间.所以我试着存储一个ListIterator.

import java.util.Map;
import java.util.HashMap;
import java.util.List;
import java.util.LinkedList;
import java.util.ListIterator;

public class LRUCache {

    private static final int DEFAULT_MAX_CAPACITY = 10;

    protected Map<Integer, ListIterator> _map = new HashMap<Integer, ListIterator>();
    protected LinkedList<String> _list = new LinkedList<String>();

    protected int _size = 0;
    protected int _maxCapacity = 0;

    public LRUCache(int maxCapacity) {
        _maxCapacity = maxCapacity;
    }

    // Put the key, value pair into …
Run Code Online (Sandbox Code Playgroud)

java caching linked-list hashmap lru

13
推荐指数
1
解决办法
595
查看次数

BertForSequenceClassification 与用于句子多类分类的 BertForMultipleChoice

我正在处理文本分类问题(例如情感分析),我需要将文本字符串分类为五个类别之一。

我刚开始在PyTorch 中使用Huggingface Transformer包和 BERT。我需要的是一个顶部带有 softmax 层的分类器,以便我可以进行 5 向分类。令人困惑的是, Transformer 包中似乎有两个相关选项:BertForSequenceClassificationBertForMultipleChoice

我应该使用哪一种来完成我的 5 向分类任务?他们的适当用例是什么?

BertForSequenceClassification的文档根本没有提到 softmax,尽管它确实提到了交叉熵。我不确定这个类是否仅用于 2 类分类(即逻辑回归)。

Bert 模型转换器,顶部带有序列分类/回归头(池化输出顶部的线性层),例如用于 GLUE 任务。

  • 标签(torch.LongTensor of shape (batch_size,), optional, defaults to None)——用于计算序列分类/回归损失的标签。索引应该在 [0, ..., config.num_labels - 1] 中。如果 config.num_labels == 1 计算回归损失(均方损失),如果 config.num_labels > 1 计算分类损失(交叉熵)。

BertForMultipleChoice的文档提到了 softmax,但是从描述标签的方式来看,这个类听起来像是用于多标签分类(即多个标签的二元分类)。

Bert 模型,顶部带有多项选择分类(池化输出顶部的线性层和 softmax),例如用于 RocStories/SWAG 任务。

  • 标签(torch.LongTensor of shape (batch_size,), optional, defaults to None)——用于计算多项选择分类损失的标签。索引应该在 [0, ..., num_choices] 中,其中 num_choices 是输入张量的第二维的大小。

感谢您的任何帮助。

python machine-learning pytorch bert-language-model huggingface-transformers

13
推荐指数
1
解决办法
6617
查看次数

Pandas infer_objects() 不会将字符串列转换为数字

我有一个数据源,其中所有值都以字符串形式给出。当我从这些数据创建 Pandas 数据框时,所有列自然都是类型object。然后我想让 Pandas自动将任何看起来像数字的列转换为数字类型(例如int64, float64)。

据推测,Pandas 提供了一个函数来执行这种自动类型推断:pandas.DataFrame.infer_objects()StackOverflow 帖子中也提到了这一点。文档说:

尝试对对象数据类型列进行软转换,使非对象列和不可转换列保持不变。推理规则与正常的 Series/DataFrame 构造期间相同。

但是,该功能对我不起作用。在下面的可重现示例中,我有两个字符串列(value1value2),它们分别明确地类似于intfloat值,但infer_objects()不会将它们从字符串转换为适当的数字类型。

import pandas as pd

# Create example dataframe.
data = [ ['Alice', '100', '1.1'], ['Bob', '200', '2.1'], ['Carl', '300', '3.1']]
df = pd.DataFrame(data, columns=['name', 'value1', 'value2'])

print(df)

#     name value1 value2
# 0  Alice    100    1.1
# 1    Bob    200    2.1
# 2   Carl    300    3.1

print(df.info()) …
Run Code Online (Sandbox Code Playgroud)

python pandas

12
推荐指数
1
解决办法
5983
查看次数

FFT系数问题

我是第一次从事DSP工作的软件工程师.

我成功地使用了产生频谱的FFT库.我也理解FFT如何根据其输入和输出工作,特别是两个输出数组的内容: 在此输入图像描述

现在,我的问题是我正在阅读一些新的研究报告,这些报告表明我提取:"FFT系数的能量,方差和总和".

  1. 什么是'FFT系数'?那些是上面显示的实数和虚数数组的值,(根据我的理解)对应于组成余弦和正弦波的幅度?

  2. FFT系数的"能量"是多少?这是来自统计学还是来自DSP的术语?

signal-processing fft

10
推荐指数
2
解决办法
7260
查看次数

R:如何将数据框分成训练,验证和测试集?

我正在用R做机器学习.遵循标准的机器学习方法,我想将我的数据随机分成训练,验证和测试数据集.我如何在R中做到这一点?

我知道有一些关于如何分成2个数据集的相关问题(例如这篇文章),但是如何对3个分割数据集进行分析并不明显.顺便说一句,正确的方法是使用3个数据集(包括验证集来调整超参数).

r machine-learning training-data

10
推荐指数
3
解决办法
3万
查看次数

PyTorch:是否有类似于 Keras 的 fit() 的明确训练循环?

我从 Keras 转到 PyTorch,我发现的一件令人惊讶的事情是我应该实现自己的训练循环。

在 Keras 中,有一个事实上的fit()函数:(1) 运行梯度下降和 (2) 收集训练集和验证集的损失和准确度指标的历史记录。

在 PyTorch 中,程序员似乎需要实现训练循环。由于我是 PyTorch 的新手,我不知道我的训练循环实现是否正确。我只想将 Apple-to-Apples 的损失和准确性指标与我在 Keras 中看到的进行比较。

我已经通读了:

  1. 官方PyTorch 60 分钟闪电战,他们提供了一个样本训练循环

  2. 官方PyTorch 示例代码,我发现训练循环与其他代码并排放置

  3. O'Reilly 的书籍Programming PyTorch for Deep Learning with its own training loop

  4. 斯坦福 CS230示例代码

  5. 各种博客文章(例如这里这里)。

所以我想知道:是否有一个明确的、通用的训练循环实现,它做同样的事情并报告与 Kerasfit()函数相同的数字?

我的不满点:

  1. 从数据加载器中提取数据在图像数据和 NLP 数据之间不一致。

  2. 在我见过的任何示例代码中,正确计算损失和准确性都不一致。

  3. 一些代码示例使用Variable,而其他代码示例不使用。

  4. 不必要的详细:将数据移入/移出 GPU;知道什么时候打电话zero_grad()

对于它的价值,这是我当前的实现。有没有明显的BUG?

import time …
Run Code Online (Sandbox Code Playgroud)

python machine-learning keras tensorflow pytorch

10
推荐指数
2
解决办法
5304
查看次数