小编use*_*388的帖子

Corpus参数上的DocumentTermMatrix错误

我有以下代码:

# returns string w/o leading or trailing whitespace
trim <- function (x) gsub("^\\s+|\\s+$", "", x)

news_corpus <- Corpus(VectorSource(news_raw$text)) # a column of strings.

corpus_clean <- tm_map(news_corpus, tolower)
corpus_clean <- tm_map(corpus_clean, removeNumbers)
corpus_clean <- tm_map(corpus_clean, removeWords, stopwords('english'))
corpus_clean <- tm_map(corpus_clean, removePunctuation)
corpus_clean <- tm_map(corpus_clean, stripWhitespace)
corpus_clean <- tm_map(corpus_clean, trim)

news_dtm <- DocumentTermMatrix(corpus_clean) # errors here
Run Code Online (Sandbox Code Playgroud)

当我运行该DocumentTermMatrix()方法时,它给了我这个错误:

错误:inherits(doc,"TextDocument")不为TRUE

为什么我会收到此错误?我的行不是文本文件吗?

这是检查时的输出corpus_clean:

[[153]]
[1] obama holds technical school model us

[[154]]
[1] oil boom produces jobs bonanza archaeologists

[[155]] …
Run Code Online (Sandbox Code Playgroud)

r corpus tm

56
推荐指数
3
解决办法
5万
查看次数

如何在MVC中循环遍历WebForms中的数据

如何像在ASP.NET MVC中那样遍历WebForms中的数据?例如,在MVC中,这很简单:

<table>
    @foreach (var myItem in g)
    { 
        @<tr><td>@MyItem.title<td></tr>
    }
</table>
Run Code Online (Sandbox Code Playgroud)

在WebForms中执行此操作最简单,最简单的方法是什么?背后的代码会是什么样的?

或者,我可以将MVC项目添加到webforms应用程序,以便我可以使用MVC功能吗?

谢谢.

asp.net asp.net-mvc webforms

46
推荐指数
2
解决办法
3万
查看次数

尝试write.table时未实现的类型列表

我有以下data.table(data.frame)调用输出:

> head(output)
        Id                                           Title IsProhibited
1 10000074                             Renault Logan, 2005            0
2 10000124              Ñêëàäñêîå ïîìåùåíèå, 345 ì<U+00B2>            0
3 10000175                                          Ñó-øåô            0
4 10000196             3-ê êâàðòèðà, 64 ì<U+00B2>, 3/5 ýò.            0
5 10000387        Samsung galaxy S4 mini GT-I9190 (÷¸ðíûé)            0
6 10000395 Êàðòèíà ""Êðûì. Ïîñåëîê Àðîìàò"" (õîëñò, ìàñëî)            0
Run Code Online (Sandbox Code Playgroud)

我试图将其导出为CSV,如下所示:

> write.table(output, 'output.csv', sep = ',', row.names = FALSE, append = T)
Run Code Online (Sandbox Code Playgroud)

但是,这样做时我收到以下错误:

Error in .External2(C_writetable, x, file, nrow(x), p, rnames, sep, eol,  : 
unimplemented type 'list' in 'EncodeElement' …
Run Code Online (Sandbox Code Playgroud)

r dataframe write.table

29
推荐指数
4
解决办法
5万
查看次数

通过PDO ODBC将PHP连接到MSSQL

当我执行此代码时:

print_r(PDO::getAvailableDrivers()); 
Run Code Online (Sandbox Code Playgroud)

它说我有odbc司机可用.

Array ( [0] => mysql [1] => odbc [2] => sqlite )
Run Code Online (Sandbox Code Playgroud)

但是,当我尝试使用它时:

$handle = new PDO("odbc:Server=dbServerIpAddress,myportnumber;Database=mydatabase", "myusername", 'mypassword');
Run Code Online (Sandbox Code Playgroud)

它没有做任何事情 - 没有错误,根本不起作用.它甚至不会执行该行!

如何通过PDO和ODBC将PHP连接到此MSSQL数据库?

php sql-server odbc pdo

24
推荐指数
2
解决办法
8万
查看次数

在Visual Studio中使用NumPy

我下载了http://pytools.codeplex.com/(Visual Studio的Python工具),以便我可以在Visual Studio中编写Python.

问题是当我尝试使用最基本的包"numpy"时,如下所示:

import numpy
Run Code Online (Sandbox Code Playgroud)

它说" 没有名为'numpy'的模块."

如何在Visual Studio中使用NumPy和SciPy?

注意:我在另一台运行良好的机器上使用Canopy Expres ; 但是,我不想在这台机器上安装它,因为我已经安装了Visual Studio.

我通过右键单击Python环境并单击添加环境,将Python 3.3环境添加到我的Python"解决方案"中.但是,在右键单击我的环境并单击安装Python包后,我输入"numpy"并在尝试安装时出现此错误:

...
creating build
creating build\src.win32-3.3
creating build\src.win32-3.3\numpy
creating build\src.win32-3.3\numpy\distutils
building library "npymath" sources
No module named 'numpy.distutils.msvccompiler' in numpy.distutils; trying from distutils
error: Unable to find vcvarsall.bat
----------------------------------------
Cleaning up...
Command python setup.py egg_info failed with error code 1 in c:\users\dom\appdata\local\temp\pip_build_Dom\numpy
Storing complete log in C:\Users\Dom\pip\pip.log
'numpy' failed to install. Exit code: 1
Run Code Online (Sandbox Code Playgroud)

我该如何安装NumPy?

python numpy pip visual-studio

16
推荐指数
3
解决办法
4万
查看次数

无法导出Azure的数据层应用程序

我正在尝试创建SQL 2012数据库的.bacpac文件.

在SSMS 2012中,我右键单击我的数据库,转到"任务",然后选择"导出数据层应用程序".然后我单击Next,它给了我这个错误:

Error SQL71564: Element Login: [myusername] has an unsupported property IsMappedToWindowsLogin set and is not supported when used as part of a data package.
 (Microsoft.SqlServer.Dac)
Run Code Online (Sandbox Code Playgroud)

我正在尝试按照本教程进行操作,以便将数据库放在Azure的云上:

http://blogs.msdn.com/b/brunoterkaly/archive/2013/09/26/how-to-export-an-on-premises-sql-server-database-to-windows-azure-storage.aspx

如何导出数据库的.bacpac文件?

sql azure sql-server-2012 bacpac ssms-2012

16
推荐指数
2
解决办法
2万
查看次数

HTML 5画布中的一手拉圆模拟

下面的代码创建使用jQuery在HTML 5画布的圆:

码:

//get a reference to the canvas
var ctx = $('#canvas')[0].getContext("2d");

DrawCircle(75, 75, 20);

//draw a circle
function DrawCircle(x, y, radius)
{
    ctx.beginPath();
    ctx.arc(x, y, radius, 0, Math.PI*2, true); 
    ctx.fillStyle = 'transparent';
    ctx.lineWidth = 2;
    ctx.strokeStyle = '#003300';
    ctx.stroke();
    ctx.closePath();
    ctx.fill();
}
Run Code Online (Sandbox Code Playgroud)

我正在尝试模拟以下任何类型的圈子:

例子

我已经研究并发现了这篇文章,但无法应用它.

我希望绘制圆而不仅仅是出现.

有一个更好的方法吗?我感觉会有很多数学问题:)

PS我喜欢PaperJs的简单性,也许这是使用简化路径的最简单方法?

javascript jquery canvas html5-canvas

15
推荐指数
2
解决办法
1万
查看次数

了解matplotlib xticks语法

我正在读一本书,我遇到了这段代码:

import matplotlib.pyplot as plt
plt.scatter(x,y)
plt.title("Web traffic over the last month")
plt.xlabel("Time")
plt.ylabel("Hits/hour")
plt.xticks([w*7*24 for w in range(10)], 
  ['week %i'%w for w in range(10)])
plt.autoscale(tight=True)
plt.grid()
plt.show()
Run Code Online (Sandbox Code Playgroud)

对于上下文,x是一个对应于一小时的整数数组. y是在特定时间内的"点击"(从用户到网站)的数组.

我知道代码累积了所有时间,以便它可以在一周内显示它们,但有人可以解释这些功能的作用吗?我的目标是了解这一行的所有语法:

plt.xticks([w*7*24 for w in range(10)], 
  ['week %i'%w for w in range(10)])
Run Code Online (Sandbox Code Playgroud)

特别:

  • 什么是range

这是生成的: 在此输入图像描述

以下是其他上下文的示例数据:

1   2272
2   nan
3   1386
4   1365
5   1488
6   1337
7   1883
8   2283
9   1335
10  1025
11  1139
12  1477
13  1203
14  1311 …
Run Code Online (Sandbox Code Playgroud)

python matplotlib scipy

15
推荐指数
2
解决办法
6万
查看次数

MVC DropDownList不从模型中选择值

我已经阅读了这个问题ASP.NET MVC DropDownList没有从模型和答案中选择值,但我不知道我的问题的解决方案.

这是我的看法:

@foreach (var adjusterLanguages in Model.adjusterLanguages)
{
    <div class="editor-field row">
        @Html.DropDownListFor(model => Model.adjusterLanguages[i].languageID,
                              (SelectList)ViewBag.ForeignLanguages) 
        @Html.ValidationMessageFor(model =>Model.adjusterLanguages[i].languageID)
    </div>

    <div style="clear: left;"></div>

    i++;
}
Run Code Online (Sandbox Code Playgroud)

我可以确认正在填充模型数据(来自我的控制器):

model.adjusterLanguages = adjLangs;
Run Code Online (Sandbox Code Playgroud)

那么,如何在模型发送到视图时选择项目?

生成的html如下:

<div class="editor-field row">
    <select id="adjusterLanguages_0__languageID" name="adjusterLanguages[0].languageID"><option value="">--Select--
        </option>
        <option value="94c5be88-814e-4719-9784-587eb88aa975">Afrikanns</option>
        <option value="37b7bf71-7f4e-47c2-8b81-652b0d63dbcb">Albanian</option>
        <option value="c94d6d85-0ba2-47d7-932e-2a61feba37b3">Arabic</option>
        <!-- ... truncated for brevity ... -->
    </select> 
    <span class="field-validation-valid" data-valmsg-for="adjusterLanguages[0].languageID" data-valmsg-replace="true"></span>
</div>
<div style="clear: left;"></div>
<div class="editor-field row">
     <select id="adjusterLanguages_1__languageID" name="adjusterLanguages[1].languageID">
          <option value="">--Select--</option>
          <option value="94c5be88-814e-4719-9784-587eb88aa975">Afrikanns</option>
          <option value="37b7bf71-7f4e-47c2-8b81-652b0d63dbcb">Albanian</option>
          <option value="c94d6d85-0ba2-47d7-932e-2a61feba37b3">Arabic</option>
          <!-- …
Run Code Online (Sandbox Code Playgroud)

c# asp.net-mvc razor asp.net-mvc-4

13
推荐指数
1
解决办法
2万
查看次数

创建具有4M行的语料库和DTM的更有效方法

我的文件有超过4M的行,我需要一种更有效的方法将我的数据转换为语料库和文档术语矩阵,以便我可以将它传递给贝叶斯分类器.

请考虑以下代码:

library(tm)

GetCorpus <-function(textVector)
{
  doc.corpus <- Corpus(VectorSource(textVector))
  doc.corpus <- tm_map(doc.corpus, tolower)
  doc.corpus <- tm_map(doc.corpus, removeNumbers)
  doc.corpus <- tm_map(doc.corpus, removePunctuation)
  doc.corpus <- tm_map(doc.corpus, removeWords, stopwords("english"))
  doc.corpus <- tm_map(doc.corpus, stemDocument, "english")
  doc.corpus <- tm_map(doc.corpus, stripWhitespace)
  doc.corpus <- tm_map(doc.corpus, PlainTextDocument)
  return(doc.corpus)
}

data <- data.frame(
  c("Let the big dogs hunt","No holds barred","My child is an honor student"), stringsAsFactors = F)

corp <- GetCorpus(data[,1])

inspect(corp)

dtm <- DocumentTermMatrix(corp)

inspect(dtm)
Run Code Online (Sandbox Code Playgroud)

输出:

> inspect(corp)
<<VCorpus (documents: 3, metadata (corpus/indexed): 0/0)>>

[[1]]
<<PlainTextDocument (metadata: 7)>> …
Run Code Online (Sandbox Code Playgroud)

r corpus term-document-matrix qdap data.table

13
推荐指数
2
解决办法
1万
查看次数