小编Seb*_*eki的帖子

如何在nltk中创建句子的否定

我是NLTK的新手.我想创造一个句子的否定(通常是现在时).例如,是否有一个允许我转换的功能:'我跑'到'我不跑'

要么

'她跑'到'她不跑'.

我想我可以使用POS来检测动词及其前面的代词但我只是想知道是否有更简单的内置函数

python nlp nltk

Seb*_*eki

2014 05-14

5
推荐指数

2
解决办法

1287
查看次数

如何根据上面或下面的行条件删除行

我有一个数据帧如下:

     chr   leftPos        ZScore1    ZScore2    ZScore3    ZScore4
      1     24352           34         43          19         43
      1     53534           2          1           -1         -9
      2      34            -15         7           -9         -18
      3     3443           -100        -4          4          -9
      3     3445           -100        -1          6          -1
      3     3667            5          -5          9           5
      3      7882          -8          -9          1           3

Run Code Online (Sandbox Code Playgroud)

我想只保留那些具有相同chr且具有ZScore的相邻列的行在同一方向上的行.换句话说,如果该chr之前或之后的行具有相同的符号(正或负),则应该保留一行.我希望在列名中运行ZS的所有列,以便输出最终只是满足每行标准的行数.

对于一列,代码应该导致:

     chr   leftPos         ZScore
      1     24352           34
      1     53534           2
      3     3443           -100
      3     3445           -100

Run Code Online (Sandbox Code Playgroud)

但最终的输出应该是这样的

         ZScore1    ZScore2    ZScore3    ZScore4
nrow        4         6          4          4


 I have tried bits …

Run Code Online (Sandbox Code Playgroud)

Seb*_*eki

2015 04-14

5
推荐指数

2
解决办法

1678
查看次数

仅包含数据框中每列的异常值

我有一个数据帧如下:

 chr   leftPos         TBGGT     12_try      324Gtt       AMN2
  1     24352           34         43          19         43
  1     53534           2          1           -1         -9
  2      34            -15         7           -9         -18
  3     3443           -100        -4          4          -9
  3     3445           -100        -1          6          -1
  3     3667            5          -5          9           5
  3     7882           -8          -9          1           3

Run Code Online (Sandbox Code Playgroud)

我必须创建一个循环:

a)从第三列开始计算每列的上限和下限(UL和LL).
b)仅包括超出 UL和LL(Zoutliers)的行.
c)然后计算Zoutlier 与同一chr的前一行或后一行相同方向(即正或负)的行数.

因此输出将是:

 ZScore1    TBGGT     12_try      324Gtt       AMN2
 nrow        4         6            4           4

Run Code Online (Sandbox Code Playgroud)

到目前为止,我的代码如下:

  library(data.table)#v1.9.5
  f1 <- function(df, ZCol){

  #A) Determine …

Run Code Online (Sandbox Code Playgroud)

r data.table

Seb*_*eki

2016 04-06

5
推荐指数

1
解决办法

359
查看次数

如何使用Knitr从R脚本函数生成多个文件

我想从r脚本生成许多报告。从rmd文件进行编译时，我想避免重复，如果可能的话，我想从r脚本本身生成报告。

该脚本具有应从数据帧列表中生成每个报告的功能，其中每个报告代表一个数据帧的处理。我只是不明白如何分别生成每个报告。目前，报告将所有数据框显示在一个文件中

原始脚本很长，因此我在下面提供了最低版本。

    structure(list(a = structure(c(1L, 3L, 2L), .Label = c("boo", 
    "saa", "yaew"), class = "factor"), b = structure(c(2L, 3L, 
    1L), .Label = c("mfds", "shu", "ren"), class = "factor"), c = structure(c(2L, 
    1L, 3L), .Label = c("22", "23", "5345"), class = "factor")), .Names = c("a", 
    "b", "c"), row.names = c(NA, -3L), class = "data.frame")

    ReportOp<-function(n) { 
  this_is_a_name <- n; 
  this_is_my_data <- ldf[[n]] 

  #' ---
  #' author: Me
  #' date:
  #' ---

  #+results='asis', echo=FALSE
  knitr::kable(this_is_my_data, digits = 2)
  #'
}

Run Code Online (Sandbox Code Playgroud)

目前，我只是使用 …

Seb*_*eki

2017 01-08

5
推荐指数

1
解决办法

1004
查看次数

为什么gsub不取代NA

目的

替换NA为"Nothing"字符向量

输入

data<-c(NA, NA, "SupineAcid", NA, NA, NA, "UprightAcid", "UprightAcid", 
NA, NA, "UprightAcid", NA, "UprightAcid", NA, NA, "UprightAcid", 
"TotalAcid", NA, NA, NA)

Run Code Online (Sandbox Code Playgroud)

尝试

gsub(NA,"dd",data)

Run Code Online (Sandbox Code Playgroud)

这导致所有结果均为 NA

我也尝试过使用"NA"andfixed=TRUE但同样的问题。

Seb*_*eki

lucky-day

5
推荐指数

2
解决办法

3900
查看次数

当只有某些列匹配时如何进行 rbind

我有大约 18 个数据帧，它们本质上是存储在 Rptnames 列中的元素的频率计数。它们在 Rptnames 列中都有一些不同的元素和一些相同的元素，所以它们看起来像这样

名为 GroupedTableProportiondelAll 的数据框

Rptname    freq

bob         4324234
jane        433
ham        4324
tim         22

dataframe called GroupedTableProportiondelLUAD

Rptname     freq

bob          987
jane         223
jonny        12
jim          98092

Run Code Online (Sandbox Code Playgroud)

我试图建立一个表格，以便 Rptname 成为列，每一行都是频率。这样我就可以组合所有数据帧。

我已经尝试了以下

   GroupedTableProportiondelAll_T <- as.data.frame(t(GroupedTableProportiondelAll))
    GroupedTableProportiondelLUAD_T <- as.data.frame(t(GroupedTableProportiondelLUAD))

   total <- rbind(GroupedTableProportiondelLUAD_T, GroupedTableProportiondelAll_T)

Run Code Online (Sandbox Code Playgroud)

但我收到错误 Error in rbind(deparse.level, ...) : numbers of columns of arguments are not match

所以问题是 a) 我怎么能做 rbind （我想 cbind 也可以不用转置），这样绑定就可以发生而无需匹配。
b) 在这里合并会更好 c) 有没有办法为空值输入零 d) P'raps 有更好的方法来做到这一点，比如我不太熟悉的矩阵？我知道它的 4 个问题，但中心问题是相同的 - 当并非所有行或列都匹配时如何绑定

Seb*_*eki

lucky-day

4
推荐指数

1
解决办法

2万
查看次数

如何在JTable行内自动换行

我有一个简单的JTable,它显示来自另一个JTable的行的详细信息(以列格式).这很好用.但是,有时连续的文本很长,因此用户最终不得不滚动而不是整齐.

如何将文本连续包装并允许行高更改以显示其中的所有文本.

这是代码:

 table.getSelectionModel().addListSelectionListener(new ListSelectionListener() {
            @Override
            public void valueChanged(ListSelectionEvent e) {
                if (!e.getValueIsAdjusting()) {
                    int selectedRow = table.getSelectedRow();
                    DefaultTableModel newModel = new DefaultTableModel();
                    String rowName = "Row: " + selectedRow;
                    newModel.setColumnIdentifiers(new Object[]{rowName});
                    for (int i = 0; i < table.getModel().getColumnCount(); i++) {
                        newModel.addRow(new Object[]{table.getModel().getValueAt(selectedRow, i)});
                    }
                    JTable newTable = new JTable(newModel) {
                        /**
                         * 
                         */
                        private static final long serialVersionUID = 1L;

                        @Override
                        public Dimension getPreferredScrollableViewportSize() {
                            return new Dimension(140, 240);
                        }
                    };
                    newTable.setAutoResizeMode(JTable.AUTO_RESIZE_OFF);
                    newTable.setRowHeight(14, 30);
                    TableColumnAdjuster tcanewTable = …

Run Code Online (Sandbox Code Playgroud)

java swing jtable

Seb*_*eki

2016 06-13

4
推荐指数

1
解决办法

3884
查看次数

使用 str_extract_all 查找多个字符串

我有一个字符串列表如下：

tofind<-c("aaa","bbb","ccc","ddd")

Run Code Online (Sandbox Code Playgroud)

我还有一个向量如下：

n<-c("aaabbb","aaa","aaacccddd","eee")

Run Code Online (Sandbox Code Playgroud)

我想找到我的tofind字符串的所有匹配项，以便输出应该是：

aaa,bbb
aaa
aaa,ccc,ddd

Run Code Online (Sandbox Code Playgroud)

我想我可以使用，str_extract_all但它没有给我预期的输出

library(stringr)
sapply(n, function(x) str_extract_all(n,tofind)

Run Code Online (Sandbox Code Playgroud)

我如何获得预期的输出？

Seb*_*eki

2017 08-29

4
推荐指数

1
解决办法

3912
查看次数

在 R 中添加时间

R 中的日期和时间是如此混乱。我只想随机生成一些 24 小时制时间，然后添加到它们中。

随机生成：

library(lubridate)

hourTime <- as.list(format(seq.POSIXt(as.POSIXct(Sys.Date()),
                                    as.POSIXct(Sys.Date()+1),
                                    by = "5 min"),
                         "%H:%M", tz="GMT"))

Run Code Online (Sandbox Code Playgroud)

尝试转换为日期：

df$ARRIVALTIME <- replicate(1000, sample(hourTime, 1, replace=F))

Run Code Online (Sandbox Code Playgroud)

尝试添加到以前的时间：

df$TRETTIME <- df$ARRIVALTIME +
    (hours(sample(1:3, 1000, replace=T)) + minutes(sample(1:60, 1000, replace=T)))

Run Code Online (Sandbox Code Playgroud)

我猜这失败了，因为我没有时间格式的对象。如何将随机时间添加到ARRIVALTIME?

datetime r

Seb*_*eki

2018 06-15

4
推荐指数

1
解决办法

6615
查看次数

如何在R中同时grep两个术语

我有一个数据帧如下

chr     Type
1     Tum,B,B,Tum
2     B,B
3     Tum,Tum
4     B,B,B,Tum

Run Code Online (Sandbox Code Playgroud)

我想只选择那些将BOTH Tum和B插入到新数据帧中的行,结果如下:

chr     Type
    1     Tum,B,B,Tum
    4     B,B,B,Tum

Run Code Online (Sandbox Code Playgroud)

我尝试了以下内容

PusungMix <- as.data.frame(Pusung[grep("Barr"&"Tum", Pusung$Type])

Run Code Online (Sandbox Code Playgroud)

但我得到了错误

Error in "Barr" & "Tum" : 
  operations are possible only for numeric, logical or complex types

Run Code Online (Sandbox Code Playgroud)

Seb*_*eki

lucky-day

3
推荐指数

1
解决办法

494
查看次数

标签统计

r ×8

data.table ×1

datetime ×1

java ×1

jtable ×1

nlp ×1

nltk ×1

python ×1

swing ×1

标签 统计

小编Seb_eki的帖子

标签统计