我是NLTK的新手.我想创造一个句子的否定(通常是现在时).例如,是否有一个允许我转换的功能:'我跑'到'我不跑'
要么
'她跑'到'她不跑'.
我想我可以使用POS来检测动词及其前面的代词但我只是想知道是否有更简单的内置函数
我有一个数据帧如下:
chr leftPos ZScore1 ZScore2 ZScore3 ZScore4
1 24352 34 43 19 43
1 53534 2 1 -1 -9
2 34 -15 7 -9 -18
3 3443 -100 -4 4 -9
3 3445 -100 -1 6 -1
3 3667 5 -5 9 5
3 7882 -8 -9 1 3
Run Code Online (Sandbox Code Playgroud)
我想只保留那些具有相同chr且具有ZScore的相邻列的行在同一方向上的行.换句话说,如果该chr之前或之后的行具有相同的符号(正或负),则应该保留一行.我希望在列名中运行ZS的所有列,以便输出最终只是满足每行标准的行数.
对于一列,代码应该导致:
chr leftPos ZScore
1 24352 34
1 53534 2
3 3443 -100
3 3445 -100
Run Code Online (Sandbox Code Playgroud)
但最终的输出应该是这样的
ZScore1 ZScore2 ZScore3 ZScore4
nrow 4 6 4 4
I have tried bits …Run Code Online (Sandbox Code Playgroud) 我有一个数据帧如下:
chr leftPos TBGGT 12_try 324Gtt AMN2
1 24352 34 43 19 43
1 53534 2 1 -1 -9
2 34 -15 7 -9 -18
3 3443 -100 -4 4 -9
3 3445 -100 -1 6 -1
3 3667 5 -5 9 5
3 7882 -8 -9 1 3
Run Code Online (Sandbox Code Playgroud)
我必须创建一个循环:
a)从第三列开始计算每列的上限和下限(UL和LL).
b)仅包括超出 UL和LL(Zoutliers)的行.
c)然后计算Zoutlier 与同一chr的前一行或后一行相同方向(即正或负)的行数.
因此输出将是:
ZScore1 TBGGT 12_try 324Gtt AMN2
nrow 4 6 4 4
Run Code Online (Sandbox Code Playgroud)
到目前为止,我的代码如下:
library(data.table)#v1.9.5
f1 <- function(df, ZCol){
#A) Determine …Run Code Online (Sandbox Code Playgroud) 我想从r脚本生成许多报告。从rmd文件进行编译时,我想避免重复,如果可能的话,我想从r脚本本身生成报告。
该脚本具有应从数据帧列表中生成每个报告的功能,其中每个报告代表一个数据帧的处理。我只是不明白如何分别生成每个报告。目前,报告将所有数据框显示在一个文件中
原始脚本很长,因此我在下面提供了最低版本。
structure(list(a = structure(c(1L, 3L, 2L), .Label = c("boo",
"saa", "yaew"), class = "factor"), b = structure(c(2L, 3L,
1L), .Label = c("mfds", "shu", "ren"), class = "factor"), c = structure(c(2L,
1L, 3L), .Label = c("22", "23", "5345"), class = "factor")), .Names = c("a",
"b", "c"), row.names = c(NA, -3L), class = "data.frame")
ReportOp<-function(n) {
this_is_a_name <- n;
this_is_my_data <- ldf[[n]]
#' ---
#' author: Me
#' date:
#' ---
#+results='asis', echo=FALSE
knitr::kable(this_is_my_data, digits = 2)
#'
}
Run Code Online (Sandbox Code Playgroud)
目前,我只是使用 …
目的
替换NA为"Nothing"字符向量
输入
data<-c(NA, NA, "SupineAcid", NA, NA, NA, "UprightAcid", "UprightAcid",
NA, NA, "UprightAcid", NA, "UprightAcid", NA, NA, "UprightAcid",
"TotalAcid", NA, NA, NA)
Run Code Online (Sandbox Code Playgroud)
尝试
gsub(NA,"dd",data)
Run Code Online (Sandbox Code Playgroud)
这导致所有结果均为 NA
我也尝试过使用"NA"andfixed=TRUE但同样的问题。
我有大约 18 个数据帧,它们本质上是存储在 Rptnames 列中的元素的频率计数。它们在 Rptnames 列中都有一些不同的元素和一些相同的元素,所以它们看起来像这样
名为 GroupedTableProportiondelAll 的数据框
Rptname freq
bob 4324234
jane 433
ham 4324
tim 22
dataframe called GroupedTableProportiondelLUAD
Rptname freq
bob 987
jane 223
jonny 12
jim 98092
Run Code Online (Sandbox Code Playgroud)
我试图建立一个表格,以便 Rptname 成为列,每一行都是频率。这样我就可以组合所有数据帧。
我已经尝试了以下
GroupedTableProportiondelAll_T <- as.data.frame(t(GroupedTableProportiondelAll))
GroupedTableProportiondelLUAD_T <- as.data.frame(t(GroupedTableProportiondelLUAD))
total <- rbind(GroupedTableProportiondelLUAD_T, GroupedTableProportiondelAll_T)
Run Code Online (Sandbox Code Playgroud)
但我收到错误 Error in rbind(deparse.level, ...) : numbers of columns of arguments are not match
所以问题是 a) 我怎么能做 rbind (我想 cbind 也可以不用转置),这样绑定就可以发生而无需匹配。
b) 在这里合并会更好 c) 有没有办法为空值输入零 d) P'raps 有更好的方法来做到这一点,比如我不太熟悉的矩阵?我知道它的 4 个问题,但中心问题是相同的 - 当并非所有行或列都匹配时如何绑定
我有一个简单的JTable,它显示来自另一个JTable的行的详细信息(以列格式).这很好用.但是,有时连续的文本很长,因此用户最终不得不滚动而不是整齐.
如何将文本连续包装并允许行高更改以显示其中的所有文本.
这是代码:
table.getSelectionModel().addListSelectionListener(new ListSelectionListener() {
@Override
public void valueChanged(ListSelectionEvent e) {
if (!e.getValueIsAdjusting()) {
int selectedRow = table.getSelectedRow();
DefaultTableModel newModel = new DefaultTableModel();
String rowName = "Row: " + selectedRow;
newModel.setColumnIdentifiers(new Object[]{rowName});
for (int i = 0; i < table.getModel().getColumnCount(); i++) {
newModel.addRow(new Object[]{table.getModel().getValueAt(selectedRow, i)});
}
JTable newTable = new JTable(newModel) {
/**
*
*/
private static final long serialVersionUID = 1L;
@Override
public Dimension getPreferredScrollableViewportSize() {
return new Dimension(140, 240);
}
};
newTable.setAutoResizeMode(JTable.AUTO_RESIZE_OFF);
newTable.setRowHeight(14, 30);
TableColumnAdjuster tcanewTable = …Run Code Online (Sandbox Code Playgroud) 我有一个字符串列表如下:
tofind<-c("aaa","bbb","ccc","ddd")
Run Code Online (Sandbox Code Playgroud)
我还有一个向量如下:
n<-c("aaabbb","aaa","aaacccddd","eee")
Run Code Online (Sandbox Code Playgroud)
我想找到我的tofind字符串的所有匹配项,以便输出应该是:
aaa,bbb
aaa
aaa,ccc,ddd
Run Code Online (Sandbox Code Playgroud)
我想我可以使用,str_extract_all但它没有给我预期的输出
library(stringr)
sapply(n, function(x) str_extract_all(n,tofind)
Run Code Online (Sandbox Code Playgroud)
我如何获得预期的输出?
R 中的日期和时间是如此混乱。我只想随机生成一些 24 小时制时间,然后添加到它们中。
随机生成:
library(lubridate)
hourTime <- as.list(format(seq.POSIXt(as.POSIXct(Sys.Date()),
as.POSIXct(Sys.Date()+1),
by = "5 min"),
"%H:%M", tz="GMT"))
Run Code Online (Sandbox Code Playgroud)
尝试转换为日期:
df$ARRIVALTIME <- replicate(1000, sample(hourTime, 1, replace=F))
Run Code Online (Sandbox Code Playgroud)
尝试添加到以前的时间:
df$TRETTIME <- df$ARRIVALTIME +
(hours(sample(1:3, 1000, replace=T)) + minutes(sample(1:60, 1000, replace=T)))
Run Code Online (Sandbox Code Playgroud)
我猜这失败了,因为我没有时间格式的对象。如何将随机时间添加到ARRIVALTIME?
我有一个数据帧如下
chr Type
1 Tum,B,B,Tum
2 B,B
3 Tum,Tum
4 B,B,B,Tum
Run Code Online (Sandbox Code Playgroud)
我想只选择那些将BOTH Tum和B插入到新数据帧中的行,结果如下:
chr Type
1 Tum,B,B,Tum
4 B,B,B,Tum
Run Code Online (Sandbox Code Playgroud)
我尝试了以下内容
PusungMix <- as.data.frame(Pusung[grep("Barr"&"Tum", Pusung$Type])
Run Code Online (Sandbox Code Playgroud)
但我得到了错误
Error in "Barr" & "Tum" :
operations are possible only for numeric, logical or complex types
Run Code Online (Sandbox Code Playgroud)