标签: mining

超聚合中的PBFT算法

任何人都可以详细解释PBFT算法而不给出相同的任何链接.以及它如何在hyperledger中工作.所以,一旦交易发送到blockchain:

(1).谁验证了交易?

(2).如何在交易中达成共识?

(3).交易如何承诺区块链?

mining blockchain hyperledger corda

29
推荐指数
1
解决办法
2万
查看次数

将文档术语矩阵转换为具有大量数据的矩阵会导致溢出

我们来做一些Text Mining

在这里,我站在一个文档术语矩阵(来自tm包)

dtm <- TermDocumentMatrix(
     myCorpus,
     control = list(
         weight = weightTfIdf,
         tolower=TRUE,
         removeNumbers = TRUE,
         minWordLength = 2,
         removePunctuation = TRUE,
         stopwords=stopwords("german")
      ))
Run Code Online (Sandbox Code Playgroud)

当我做的时候

typeof(dtm)
Run Code Online (Sandbox Code Playgroud)

我看到它是一个"列表",结构看起来像

Docs
Terms        1 2 ...
  lorem      0 0 ...
  ipsum      0 0 ...
  ...        .......
Run Code Online (Sandbox Code Playgroud)

所以我试试了

wordMatrix = as.data.frame( t(as.matrix(  dtm )) ) 
Run Code Online (Sandbox Code Playgroud)

这适用于1000份文件.

但是当我尝试使用40000时,它已不再存在了.

我收到此错误:

Fehler in vector(typeof(x$v), nr * nc) : Vektorgröße kann nicht NA sein
Zusätzlich: Warnmeldung:
In nr * nc : NAs durch Ganzzahlüberlauf erzeugt
Run Code Online (Sandbox Code Playgroud)

向量中的错误...:向量不能是NA附加:在nr*nc由整数溢出创建的NAs …

text memory-management r matrix mining

14
推荐指数
1
解决办法
2万
查看次数

计算文本之间相似性的算法

我试图在社交网络的帖子之间得分相似,但没有找到任何好的算法,思想?

我刚刚尝试过Levenshtein,JaroWinkler和其他人,但是那些人更习惯于比较没有情感的文本.在帖子中我们可以得到一个文字说"我真的喜欢狗"和另一个说"我真的很喜欢狗",我们需要将这个案例归类为完全不同.

谢谢

java text nlp artificial-intelligence mining

7
推荐指数
1
解决办法
2580
查看次数

比特币矿工如何检查双花或超支?

我可以将过程可视化的唯一方法是:在区块链中搜索与正在处理的交易具有相同源地址的所有交易,将它们全部加起来(包括正在处理的 trx)以验证它们加起来小于或等于到源交易金额。

对每笔比特币交易都这样做听起来效率极低。

他们是如何真正做到的?

mining bitcoin

3
推荐指数
1
解决办法
1039
查看次数

删除字符串中的所有标点符号,数字之间的标点符号除外

我有一篇包含单词和数字的文本。我将给出一个有代表性的文本示例:

string = "This is a 1example of the text. But, it only is 2.5 percent of all data"
Run Code Online (Sandbox Code Playgroud)

我想将其转换为类似的东西:

"This is a  1 example of the text But it only is  2.5  percent of all data"
Run Code Online (Sandbox Code Playgroud)

因此,删除标点符号(可以是. ,或 中的任何其他标点符号string.punctuation),并在连接时在数字和单词之间放置空格。但在我的示例中保持浮点数为 2.5。

我使用了以下代码:

item = "This is a 1example of the text. But, it only is 2.5 percent of all data"
item = ' '.join(re.sub( r"([A-Z])", r" \1", item).split())
# This a start but not …
Run Code Online (Sandbox Code Playgroud)

python regex string text mining

3
推荐指数
1
解决办法
7746
查看次数

poclbm没有报告哈希值或深陷

我在我的系统上运行poclbm,但由于某些原因,deepbit和slush都没有"看到"正在执行的工作.我的系统报告每秒大约200兆字节.我尝试使用相同的设置使用我的cpu挖掘,然后deepbit和slush都认识到正在执行的工作.

这些是我从各自的采矿硬件中获得的错误(每分钟左右):

poclbm错误: pit.deepbit.net : 8332 22/02/2013 21:50:59,验证失败,检查硬件!(0:0:赛普拉斯,d47b7ba0)

cgminer错误: [2013-02-22 22:18:51] GPU0:nonce无效 - HW错误

我正在使用Ubuntu 12.10(Quantal Quetzal)和12.10版本的poclbm以及ATI 5800系列视频卡.视频驱动程序已安装并尽我所能工作.当我运行"aticonfig --odgc --adapter = all"时,gpu似乎与poclbm一起使用(利用率约为70%左右).

mining bitcoin

2
推荐指数
1
解决办法
4449
查看次数

tm 包 R 中的自定义分词器不起作用

请参阅下面的 MWE,自定义的标记生成器不起作用,为什么?tm包版本是0.71

library(tm)

ts <- c("This is a testimonial")
corpDs <- Corpus(VectorSource(ts))

#This is not working
ownTokenizer <- function(x) unlist(strsplit(as.character(x), "i+"))
tdm <- DocumentTermMatrix(corpDs,control=list(tokenize=ownTokenizer))
as.matrix(tdm)

#This is working
ownTokenizer(ts)
Run Code Online (Sandbox Code Playgroud)

输出:

条款

文档证明了这一点

1 1 1

[1]“Th”“s”“sa 测试”“mon”“al”

谢谢你,

托比亚斯

text r mining tm

1
推荐指数
1
解决办法
1272
查看次数

情绪计算的公式是什么

使用情绪评级词典来计算情绪的实际公式是什么.我使用的词典包含-5到5之间的等级.我想计算单个句子的情绪.要么我必须计算句子中所有情绪排名单词的平均值,要么只计算它们.

nlp mining sentiment-analysis

0
推荐指数
1
解决办法
6906
查看次数