我有一个这样的数据框:
df
VALUE ABS_CALL DETECTION P-VALUE
1007_s_at "957.729231881542" "P" "0.00486279317241156"
1053_at "320.632701283368" "P" "0.0313356324173416"
117_at "429.842323161046" "P" "0.0170004527476119"
121_at "2395.7364289242" "P" "0.0114473584876183"
1255_g_at "116.493632746934" "A" "0.39799368200131"
1294_at "739.927122116896" "A" "0.0668649772942343"
Run Code Online (Sandbox Code Playgroud)
我想将行名称转换为第一列.目前我使用类似的东西将行名称作为第一列:
d <- df
names <- rownames(d)
rownames(d) <- NULL
data <- cbind(names,d)
Run Code Online (Sandbox Code Playgroud)
这样做有一条线吗?
如果我的问题非常基本,请原谅.我创建了一个空数据帧df <- data.frame(),显然数据帧是NULL(空).当我尝试检查数据框是否为空时is.null(df),结果为FALSE.在R NULL和emptyR 之间是否有任何区别.在这种情况下,如果数据帧不是NULL,那么空数据帧中的内容以及它何时出现NULL.谢谢
我想知道,如果有可能在R studio中获得未保存的脚本选项卡.我不小心打开并切换到新项目,然后我未保存的脚本消失了.任何人都可以帮助我获取未保存的脚本选项卡.
使用R处理TM软件包时遇到以下错误
library("tm")
Loading required package: NLP
Warning messages:
1: package ‘tm’ was built under R version 3.4.2
2: package ‘NLP’ was built under R version 3.4.1
Run Code Online (Sandbox Code Playgroud)
corpus <- VCorpus(DataframeSource(data))
错误:全部(!is.na(匹配(c("doc_id","text"),名称(x))))不是TRUE
已尝试过各种方法,如重新安装软件包,使用新版本的R进行更新,但错误仍然存在.对于相同的数据文件,相同的代码在具有相同版本的R的另一个系统上运行.
model.py
class Msg(models.Model):
content = models.CharField(max_length=1024, null=True)
Run Code Online (Sandbox Code Playgroud)
serializer.py
class MessageSerializer(serializers.ModelSerializer):
class Meta:
model = Msg
fields = ["content"]
Run Code Online (Sandbox Code Playgroud)
有数据:
{"content": " space test "}
Run Code Online (Sandbox Code Playgroud)
和
print(data)
serializer = MessageSerializer(data=data)
if serializer.is_valid():
serializer.save()
print(serializer.data)
return True, serializer.data
else:
return False, serializer.errors
Run Code Online (Sandbox Code Playgroud)
第一次打印是
{'content': ' space test '}
第二次打印是
{'content': 'space test'}
因此数据库中的空格消失了.
我该如何保留空间?
python django django-models django-serializer django-rest-framework
我试图了解下面的代码有什么问题。我知道Y变量是1D数组,预计是2D数组,需要重塑结构,但该代码以前工作正常,但有警告。
# Importing the libraries
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
# Importing the dataset
dataset = pd.read_csv('Position_Salaries.csv')
X = dataset.iloc[:, 1:2].values
y = dataset.iloc[:, 2].values
# Feature Scaling
from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
sc_y = StandardScaler()
X = sc_X.fit_transform(X)
y = sc_y.fit_transform(y)
Run Code Online (Sandbox Code Playgroud)
ValueError: Expected 2D array, got a 1D array instead:
array=[ 45000. 50000. 60000. 80000. 110000. 150000. 200000. 300000.
500000. 1000000.].
Reshape your data …Run Code Online (Sandbox Code Playgroud) 我在安装topicmodels包时遇到错误R.
关于运行install.packages("topicmodels",dependencies=TRUE)以下是我得到的最后几行.请帮忙.我的R版本是3.1.3.
g++ -I/usr/share/R/include -DNDEBUG -fpic -g -O2 -fstack-protector --param=ssp-buffer-size=4 -Wformat -Wformat-security -Werror=format-security -D_FORTIFY_SOURCE=2 -g -c utilities.cpp -o utilities.o
gcc -std=gnu99 -I/usr/share/R/include -DNDEBUG -fpic -g -O2 -fstack-protector --param=ssp-buffer-size=4 -Wformat -Wformat-security -Werror=format-security -D_FORTIFY_SOURCE=2 -g -c utils.c -o utils.o
g++ -shared -L/usr/lib/R/lib -Wl,-Bsymbolic-functions -Wl,-z,relro -o topicmodels.so cokus.o common.o ctm.o dataset.o gsl-wrappers.o inference.o lda-alpha.o lda-inference.o lda-model.o model.o rGibbslda.o rctm.o rlda.o utilities.o utils.o -lgsl -lgslcblas -L/usr/lib/R/lib -lR
installing to /usr/local/lib/R/site-library/topicmodels/libs
** R
** data …Run Code Online (Sandbox Code Playgroud) 我是 R 的新手,我正在做一些逻辑回归模型。我正在尝试对包含 100 多个变量的 200 万条记录的数据运行 bigglm。我的变量由数字和整数 (0/1) 组成,因为我已将其设置为指标,例如
isOK,quantity,weight,isUS,isEU,isASIA
0,2,1.1,0,0,1
1,1,0.9,1,1,0
Run Code Online (Sandbox Code Playgroud)
但是,bigglm 总是抛出错误
coef.bigqr(object$qr) 中的错误:外部函数调用中的 NA/NaN/Inf (arg 3)
从 traceback(),它显示了以下内容
14: coef.bigqr(object$qr)
13: coef(object$qr)
12: coef.biglm(iwlm)
11: coef(iwlm)
10: bigglm.function(formula = formula, data = datafun, ...)
9: bigglm(formula = formula, data = datafun, ...)
8: bigglm(formula = formula, data = datafun, ...)
7: bigglm.data.frame(myForm, data = myraw.data[i, , drop = FALSE],
family = binomial(link = logit))
6: bigglm(myForm, data = myraw.data[i, , drop = FALSE], family = binomial(link …Run Code Online (Sandbox Code Playgroud) 我试图寻找向量元素在另一个向量中的位置.在这里,我有兴趣尽快使用实现binary search.我有不同的长度为100万或更多的向量,所以我想要更快地实现某些目标.
在我的情况下以下情况:
1) vector我在搜索中进行排序.
2)我正在搜索的元素将永远存在,即我没有一个案例not found,我想以更快的方式获得向量元素的索引.
我尝试了以下代码来获取向量元素的索引.
#include <iostream>
#include <vector>
#include <algorithm>
template<class Iter, class T>
Iter binary_find(Iter begin, Iter end, T val)
{
Iter i = std::lower_bound(begin, end, val);
return i;
}
int main() {
std::vector<std::string> values = {"AAAAAA","AB", "AD" ,"BCD","CD", "DD" };
std::vector<std::string> tests = {"AB", "CD","AD", "DD"};
for(int i=0 ; i < tests.size(); i++) {
int pos = binary_find(values.begin(), values.end(), tests.at(i))- values.begin();
std::cout << tests.at(i) << " found at: …Run Code Online (Sandbox Code Playgroud) 我有一个关于data.table的问题R
我有这样的数据集
data <- data.table(a=c(1:7,12,32,13),b=c(1,5,6,7,8,3,2,5,1,4))
a b
1: 1 1
2: 2 5
3: 3 6
4: 4 7
5: 5 8
6: 6 3
7: 7 2
8: 12 5
9: 32 1
10: 13 4
Run Code Online (Sandbox Code Playgroud)
现在我想生成第三列c,它将a的每一行的值与b的所有先前值进行比较,并检查b的值是否大于a.例如,在第5行,a = 5,并且b的先前值是1,5,6,7.因此6和7大于5,因此c的值应该是1,否则它将是0.结果应该是这样的
a b c
1: 1 1 NA
2: 2 5 0
3: 3 6 1
4: 4 7 1
5: 5 8 1
6: 6 3 1
7: 7 2 1
8: 12 5 0
9: 32 1 0 …Run Code Online (Sandbox Code Playgroud) r ×7
dataframe ×2
python ×2
c++ ×1
col ×1
data.table ×1
django ×1
is-empty ×1
null ×1
pandas ×1
rowname ×1
rstudio ×1
scikit-learn ×1
std ×1
text-mining ×1
tm ×1
ubuntu-14.04 ×1
vector ×1