小编use*_*898的帖子

从TermDocumentMatrix创建稀疏矩阵

我创建了一个TermDocumentMatrix来自tm于R.它看起来像这个库:

> inspect(freq.terms)

A document-term matrix (19 documents, 214 terms)

Non-/sparse entries: 256/3810
Sparsity           : 94%
Maximal term length: 19 
Weighting          : term frequency (tf)

Terms
Docs abundant acid active adhesion aeropyrum alternative
  1         0    0      1        0         0           0
  2         0    0      0        0         0           0
  3         0    0      0        1         0           0
  4         0    0      0        0         0           0
  5         0    0      0        0         0           0
  6         0    1      0        0         0           0
  7 …
Run Code Online (Sandbox Code Playgroud)

r sparse-matrix tm term-document-matrix

5
推荐指数
1
解决办法
3325
查看次数

使用 fread 找不到文件

我有一些基本代码,用于从共享相同文件格式的文件夹中读取多个文件。每个文本文件本身包含一两个句子;没有列、标题或类似的东西。

我最初使用 read.table 来做到这一点,但在进行了一些阅读之后,特别是查看了最近的这篇文章后,我想我会看看我是否可以使用 fread 使事情变得更快一点。

library(data.table)

files <- list.files(path = "C:/Documents", pattern = "*.txt")

readdata <- function(x)
{
    mydata <- fread(x, sep=" ")
    return(mydata)
}

all.files <- lapply(files, readdata)
final.data <- rbindlist(all.files)
Run Code Online (Sandbox Code Playgroud)

当我运行此代码时,出现以下错误:

Error in fread(x, sep = " ") : File not found: 1.txt
Run Code Online (Sandbox Code Playgroud)

1.txt 是文件夹中的第一个文件。谁能弄清楚这是为什么?路径文件夹是正确的(我把上面的那个改成了通用的东西放在这儿)所以我似乎看不出问题是什么。

r data.table

3
推荐指数
1
解决办法
5742
查看次数

标签 统计

r ×2

data.table ×1

sparse-matrix ×1

term-document-matrix ×1

tm ×1