标签: mining

超聚合中的PBFT算法

任何人都可以详细解释PBFT算法而不给出相同的任何链接.以及它如何在hyperledger中工作.所以,一旦交易发送到blockchain:

(1).谁验证了交易？

(2).如何在交易中达成共识？

(3).交易如何承诺区块链？

mining blockchain hyperledger corda

Sau*_*abh

2019 10-15

29
推荐指数

1
解决办法

2万
查看次数

将文档术语矩阵转换为具有大量数据的矩阵会导致溢出

我们来做一些Text Mining

在这里,我站在一个文档术语矩阵(来自tm包)

dtm <- TermDocumentMatrix(
     myCorpus,
     control = list(
         weight = weightTfIdf,
         tolower=TRUE,
         removeNumbers = TRUE,
         minWordLength = 2,
         removePunctuation = TRUE,
         stopwords=stopwords("german")
      ))

Run Code Online (Sandbox Code Playgroud)

当我做的时候

typeof(dtm)

Run Code Online (Sandbox Code Playgroud)

我看到它是一个"列表",结构看起来像

Docs
Terms        1 2 ...
  lorem      0 0 ...
  ipsum      0 0 ...
  ...        .......

Run Code Online (Sandbox Code Playgroud)

所以我试试了

wordMatrix = as.data.frame( t(as.matrix(  dtm )) )

Run Code Online (Sandbox Code Playgroud)

这适用于1000份文件.

但是当我尝试使用40000时,它已不再存在了.

我收到此错误:

Fehler in vector(typeof(x$v), nr * nc) : Vektorgröße kann nicht NA sein
Zusätzlich: Warnmeldung:
In nr * nc : NAs durch Ganzzahlüberlauf erzeugt

Run Code Online (Sandbox Code Playgroud)

向量中的错误...:向量不能是NA附加:在nr*nc由整数溢出创建的NAs …

text memory-management r matrix mining

Cap*_*ook

2015 05-29

14
推荐指数

1
解决办法

2万
查看次数

计算文本之间相似性的算法

我试图在社交网络的帖子之间得分相似,但没有找到任何好的算法,思想？

我刚刚尝试过Levenshtein,JaroWinkler和其他人,但是那些人更习惯于比较没有情感的文本.在帖子中我们可以得到一个文字说"我真的喜欢狗"和另一个说"我真的很喜欢狗",我们需要将这个案例归类为完全不同.

谢谢

java text nlp artificial-intelligence mining

作者

2010 08-28

7
推荐指数

1
解决办法

2580
查看次数

比特币矿工如何检查双花或超支？

我可以将过程可视化的唯一方法是：在区块链中搜索与正在处理的交易具有相同源地址的所有交易，将它们全部加起来（包括正在处理的 trx）以验证它们加起来小于或等于到源交易金额。

对每笔比特币交易都这样做听起来效率极低。

他们是如何真正做到的？

mining bitcoin

use*_*142

lucky-day

3
推荐指数

1
解决办法

1039
查看次数

删除字符串中的所有标点符号，数字之间的标点符号除外

我有一篇包含单词和数字的文本。我将给出一个有代表性的文本示例：

string = "This is a 1example of the text. But, it only is 2.5 percent of all data"

Run Code Online (Sandbox Code Playgroud)

我想将其转换为类似的东西：

"This is a  1 example of the text But it only is  2.5  percent of all data"

Run Code Online (Sandbox Code Playgroud)

因此，删除标点符号（可以是. ,或中的任何其他标点符号string.punctuation），并在连接时在数字和单词之间放置空格。但在我的示例中保持浮点数为 2.5。

我使用了以下代码：

item = "This is a 1example of the text. But, it only is 2.5 percent of all data"
item = ' '.join(re.sub( r"([A-Z])", r" \1", item).split())
# This a start but not …

Run Code Online (Sandbox Code Playgroud)

python regex string text mining

del*_*nce

2017 03-31

3
推荐指数

1
解决办法

7746
查看次数

poclbm没有报告哈希值或深陷

我在我的系统上运行poclbm,但由于某些原因,deepbit和slush都没有"看到"正在执行的工作.我的系统报告每秒大约200兆字节.我尝试使用相同的设置使用我的cpu挖掘,然后deepbit和slush都认识到正在执行的工作.

这些是我从各自的采矿硬件中获得的错误(每分钟左右):

poclbm错误: pit.deepbit.net : 8332 22/02/2013 21:50:59,验证失败,检查硬件!(0:0:赛普拉斯,d47b7ba0)

cgminer错误: [2013-02-22 22:18:51] GPU0:nonce无效 - HW错误

我正在使用Ubuntu 12.10(Quantal Quetzal)和12.10版本的poclbm以及ATI 5800系列视频卡.视频驱动程序已安装并尽我所能工作.当我运行"aticonfig --odgc --adapter = all"时,gpu似乎与poclbm一起使用(利用率约为70%左右).

mining bitcoin

Ste*_*das

lucky-day

2
推荐指数

1
解决办法

4449
查看次数

tm 包 R 中的自定义分词器不起作用

请参阅下面的 MWE，自定义的标记生成器不起作用，为什么？tm包版本是0.71

library(tm)

ts <- c("This is a testimonial")
corpDs <- Corpus(VectorSource(ts))

#This is not working
ownTokenizer <- function(x) unlist(strsplit(as.character(x), "i+"))
tdm <- DocumentTermMatrix(corpDs,control=list(tokenize=ownTokenizer))
as.matrix(tdm)

#This is working
ownTokenizer(ts)

Run Code Online (Sandbox Code Playgroud)

输出：