小编Aga*_*ain的帖子

将行名称转换为第一列

我有一个这样的数据框:

df
              VALUE              ABS_CALL DETECTION P-VALUE    
    1007_s_at "957.729231881542" "P"      "0.00486279317241156"
    1053_at   "320.632701283368" "P"      "0.0313356324173416" 
    117_at    "429.842323161046" "P"      "0.0170004527476119" 
    121_at    "2395.7364289242"  "P"      "0.0114473584876183" 
    1255_g_at "116.493632746934" "A"      "0.39799368200131"   
    1294_at   "739.927122116896" "A"      "0.0668649772942343" 
Run Code Online (Sandbox Code Playgroud)

我想将行名称转换为第一列.目前我使用类似的东西将行名称作为第一列:

  d <- df
  names <- rownames(d)
  rownames(d) <- NULL
  data <- cbind(names,d)
Run Code Online (Sandbox Code Playgroud)

这样做有一条线吗?

r col dataframe rowname

114
推荐指数
7
解决办法
17万
查看次数

为什么空数据帧失败了is.null()测试?

如果我的问题非常基本,请原谅.我创建了一个空数据帧df <- data.frame(),显然数据帧是NULL(空).当我尝试检查数据框是否为空时is.null(df),结果为FALSE.在R NULLemptyR 之间是否有任何区别.在这种情况下,如果数据帧不是NULL,那么空数据帧中的内容以及它何时出现NULL.谢谢

null r dataframe is-empty

22
推荐指数
1
解决办法
3万
查看次数

如何获取未保存的脚本选项卡

我想知道,如果有可能在R studio中获得未保存的脚本选项卡.我不小心打开并切换到新项目,然后我未保存的脚本消失了.任何人都可以帮助我获取未保存的脚本选项卡.

r rstudio

19
推荐指数
5
解决办法
2万
查看次数

在R中使用TM软件包的VCorpus时遇到错误

使用R处理TM软件包时遇到以下错误

library("tm")
Loading required package: NLP
Warning messages:
1: package ‘tm’ was built under R version 3.4.2 
2: package ‘NLP’ was built under R version 3.4.1 
Run Code Online (Sandbox Code Playgroud)

corpus <- VCorpus(DataframeSource(data))

错误:全部(!is.na(匹配(c("doc_id","text"),名称(x))))不是TRUE

已尝试过各种方法,如重新安装软件包,使用新版本的R进行更新,但错误仍然存​​在.对于相同的数据文件,相同的代码在具有相同版本的R的另一个系统上运行.

r text-analysis text-mining tm

8
推荐指数
1
解决办法
5963
查看次数

在Django REST控件序列化器不会自动删除空格?

model.py

class Msg(models.Model):
    content = models.CharField(max_length=1024, null=True)
Run Code Online (Sandbox Code Playgroud)

serializer.py

class MessageSerializer(serializers.ModelSerializer):
    class Meta:
        model = Msg
        fields = ["content"]
Run Code Online (Sandbox Code Playgroud)

有数据:

{"content": "   space    test    "}
Run Code Online (Sandbox Code Playgroud)

print(data)
serializer = MessageSerializer(data=data)
if serializer.is_valid():
    serializer.save()
    print(serializer.data)
    return True, serializer.data
else:
    return False, serializer.errors
Run Code Online (Sandbox Code Playgroud)

第一次打印是 {'content': ' space test '} 第二次打印是 {'content': 'space test'} 因此数据库中的空格消失了.
我该如何保留空间?

python django django-models django-serializer django-rest-framework

8
推荐指数
1
解决办法
1053
查看次数

SVR 模型 --&gt; 特征缩放 - 预期的 2D 阵列,而是得到 1D 阵列

我试图了解下面的代码有什么问题。我知道Y变量是1D数组,预计是2D数组,需要重塑结构,但该代码以前工作正常,但有警告。

# Importing the libraries
  import numpy as np
  import matplotlib.pyplot as plt
  import pandas as pd

# Importing the dataset
  dataset = pd.read_csv('Position_Salaries.csv')
  X = dataset.iloc[:, 1:2].values
  y = dataset.iloc[:, 2].values



# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
sc_y = StandardScaler()
X = sc_X.fit_transform(X)
y = sc_y.fit_transform(y)
Run Code Online (Sandbox Code Playgroud)
ValueError: Expected 2D array, got a 1D array instead:
array=[  45000.   50000.   60000.   80000.  110000.  150000.  200000.  300000.
  500000. 1000000.].
Reshape your data …
Run Code Online (Sandbox Code Playgroud)

python pandas scikit-learn

8
推荐指数
1
解决办法
6697
查看次数

错误在R Ubuntu中安装topicmodel

我在安装topicmodels包时遇到错误R.

关于运行install.packages("topicmodels",dependencies=TRUE)以下是我得到的最后几行.请帮忙.我的R版本是3.1.3.

g++ -I/usr/share/R/include -DNDEBUG      -fpic  -g -O2 -fstack-protector --param=ssp-buffer-size=4 -Wformat -Wformat-security -Werror=format-security -D_FORTIFY_SOURCE=2 -g  -c utilities.cpp -o utilities.o

gcc -std=gnu99 -I/usr/share/R/include -DNDEBUG      -fpic  -g -O2 -fstack-protector --param=ssp-buffer-size=4 -Wformat -Wformat-security -Werror=format-security -D_FORTIFY_SOURCE=2 -g  -c utils.c -o utils.o

g++ -shared -L/usr/lib/R/lib -Wl,-Bsymbolic-functions -Wl,-z,relro -o topicmodels.so cokus.o common.o ctm.o dataset.o gsl-wrappers.o inference.o lda-alpha.o lda-inference.o lda-model.o model.o rGibbslda.o rctm.o rlda.o utilities.o utils.o -lgsl -lgslcblas -L/usr/lib/R/lib -lR

installing to /usr/local/lib/R/site-library/topicmodels/libs

** R

** data …
Run Code Online (Sandbox Code Playgroud)

r topic-modeling ubuntu-14.04

6
推荐指数
1
解决办法
2085
查看次数

如何在 bigglm 中消除“外部函数调用(arg 3)中的 NA/NaN/Inf”

我是 R 的新手,我正在做一些逻辑回归模型。我正在尝试对包含 100 多个变量的 200 万条记录的数据运行 bigglm。我的变量由数字和整数 (0/1) 组成,因为我已将其设置为指标,例如

isOK,quantity,weight,isUS,isEU,isASIA
0,2,1.1,0,0,1
1,1,0.9,1,1,0
Run Code Online (Sandbox Code Playgroud)

但是,bigglm 总是抛出错误

coef.bigqr(object$qr) 中的错误:外部函数调用中的 NA/NaN/Inf (arg 3)

从 traceback(),它显示了以下内容

14: coef.bigqr(object$qr)
13: coef(object$qr)
12: coef.biglm(iwlm)
11: coef(iwlm)
10: bigglm.function(formula = formula, data = datafun, ...)
9: bigglm(formula = formula, data = datafun, ...)
8: bigglm(formula = formula, data = datafun, ...)
7: bigglm.data.frame(myForm, data = myraw.data[i, , drop = FALSE], 
   family = binomial(link = logit))
6: bigglm(myForm, data = myraw.data[i, , drop = FALSE], family = binomial(link …
Run Code Online (Sandbox Code Playgroud)

r

6
推荐指数
1
解决办法
788
查看次数

在std :: vector中进行二进制搜索

我试图寻找向量元素在另一个向量中的位置.在这里,我有兴趣尽快使用实现binary search.我有不同的长度为100万或更多的向量,所以我想要更快地实现某些目标.

在我的情况下以下情况:

1) vector我在搜索中进行排序.

2)我正在搜索的元素将永远存在,即我没有一个案例not found,我想以更快的方式获得向量元素的索引.

我尝试了以下代码来获取向量元素的索引.

#include <iostream>
#include <vector>
#include <algorithm>

template<class Iter, class T>
Iter binary_find(Iter begin, Iter end, T val)
{
    Iter i = std::lower_bound(begin, end, val);
    return i;
}

int main() {
    std::vector<std::string> values = {"AAAAAA","AB", "AD" ,"BCD","CD", "DD" };
    std::vector<std::string> tests = {"AB", "CD","AD", "DD"};
    for(int i=0 ; i < tests.size(); i++) {
        int pos = binary_find(values.begin(), values.end(), tests.at(i))- values.begin();
    std::cout << tests.at(i) << " found at: …
Run Code Online (Sandbox Code Playgroud)

c++ vector std binary-search

5
推荐指数
1
解决办法
4403
查看次数

如何引用R data.table中的多个先前行

我有一个关于data.table的问题R 我有这样的数据集

data <- data.table(a=c(1:7,12,32,13),b=c(1,5,6,7,8,3,2,5,1,4))

     a b
 1:  1 1
 2:  2 5
 3:  3 6
 4:  4 7
 5:  5 8
 6:  6 3
 7:  7 2
 8: 12 5
 9: 32 1
 10: 13 4
Run Code Online (Sandbox Code Playgroud)

现在我想生成第三列c,它将a的每一行的值与b的所有先前值进行比较,并检查b的值是否大于a.例如,在第5行,a = 5,并且b的先前值是1,5,6,7.因此6和7大于5,因此c的值应该是1,否则它将是0.结果应该是这样的

     a b  c
 1:  1 1 NA
 2:  2 5  0
 3:  3 6  1
 4:  4 7  1
 5:  5 8  1
 6:  6 3  1
 7:  7 2  1
 8: 12 5  0
 9: 32 1  0 …
Run Code Online (Sandbox Code Playgroud)

r data.table

5
推荐指数
1
解决办法
493
查看次数