我想对一些意大利语文本进行词素化,以便对单词进行频率计数,并对这种词素化内容的输出进行进一步调查。
我更喜欢使用词组比词干,因为我可以从句子中的上下文中提取单词含义(例如,区分动词和名词)并获取语言中存在的单词,而不是那些通常没有的单词的词根一个意义。
我发现这个名为pattern(pip2 install pattern)的库应该进行补充nltk以执行意大利语的词素化,但是我不确定以下方法是否正确,因为每个单词都是由词素化的,而不是在句子的上下文中。
可能我应该pattern负责将一个句子标记化(因此也要用有关动词/名词/形容词的元数据对每个单词进行注释),然后检索经过修饰的单词,但是我无法做到这一点,我甚至不确定是目前可能吗?
另外:在意大利语中,有些文章带有撇号,因此“ l'appartamento”(英语为“ the flat”)实际上是2个字:“ lo”和“ appartamento”。现在,我无法找到将组合在一起的两个单词分开的方法nltk,pattern因此无法以正确的方式计算单词的出现频率。
import nltk
import string
import pattern
# dictionary of Italian stop-words
it_stop_words = nltk.corpus.stopwords.words('italian')
# Snowball stemmer with rules for the Italian language
ita_stemmer = nltk.stem.snowball.ItalianStemmer()
# the following function is just to get the lemma
# out of the original input word (but right now
# it may be loosing the context about …Run Code Online (Sandbox Code Playgroud) 我正在尝试创建SQL Server的新Azure实例,然后在其中创建一些新数据库。
我从Azure门户知道,某种管理员用户可能是:
我想创建一个具有SA用户的SQL Server来管理服务器。在Azure门户中,我找不到为SQL Server实例的SA用户生成ARM模板的方法。
我要从10000行的ARM模板复制粘贴,以获得很长的SQL服务器和数据库列表,但是我无法隔离基本步骤,以期获得一个希望干净且简短的ARM模板。
这是我正在尝试在Azure上部署的ARM模板:
{
"$schema": "https://schema.management.azure.com/schemas/2015-01-01/deploymentTemplate.json#",
"contentVersion": "1.0.0.0",
"parameters": {
"location": {
"type": "string",
"defaultValue": "westeurope"
},
"foo_sql_server_name": {
"defaultValue": "foo-sql-server",
"type": "String"
}
},
"resources": [
{
"type": "Microsoft.Sql/servers",
"kind": "v12.0",
"name": "[parameters('foo_sql_server_name')]",
"apiVersion": "2015-05-01-preview",
"location": "[parameters('location')]",
"scale": null,
"properties": {
"administratorLogin": "<MY_SA_USER_THAT_I_CAN_NOT_CREATE>",
"version": "12.0"
},
"dependsOn": []
}
]
}
Run Code Online (Sandbox Code Playgroud)
使用以下命令运行以上命令时:
az group deployment create \
--name "deployDBs" \
--resource-group "MyCustomResourceGroup" \
--template-file ./templates/db.json …Run Code Online (Sandbox Code Playgroud) sql-server azure azure-resource-manager azure-cli azure-sql-database
我试图selenium在基于 miniconda/anaconda 的 docker 容器内使用该库运行一些 python 脚本,但我不断收到此错误:selenium.common.exceptions.WebDriverException: Message: unknown error: Chrome failed to start: exited abnormally。我还使用 python 包装器来xvfb避免打开真正的 Chrome 窗口。
要重现此内容(从正在运行的 docker 容器):
root@304ccd3bae83:/opt# python
Python 3.6.4 |Anaconda, Inc.| (default, Jan 16 2018, 18:10:19)
[GCC 7.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>
>>>
>>> from selenium import webdriver
>>> from xvfbwrapper import Xvfb
>>>
>>> with Xvfb(width=1366, height=768) as xvfb:
... my_driver = webdriver.Chrome('/opt/chromedriver/2.33/chromedriver')
...
Traceback (most recent …Run Code Online (Sandbox Code Playgroud) google-chrome xvfb selenium-chromedriver selenium-webdriver docker
我想得到一个VB6变量的名称作为字符串值,以便在我正在使用的日志工具中处理它,如下所示(请检查!!! VariableName !!!).
有没有办法实现这个目标?我是VB6的新手,我应该维护和调试现有的旧VB6代码.
Public Sub AddVariableValue2Log(ByVal checkDebug, _
ByVal sFunctionName As String, _
ByVal sVariableValue As String, _
ByVal sTimeStamp As String)
If checkDebug Then
Dim sLogPath As String
sLogPath = "C:\Temp\Log_" & sTimeStamp & ".txt"
Dim fn As Integer
fn = FreeFile
Open sLogPath For Append As #fn
Write #fn, Now & "|" & sFunctionName & "|>>>!!!VariableName!!! value: [" & sVariableValue & "]"
Close #fn
End If
End Sub
Run Code Online (Sandbox Code Playgroud) 使用Spring Batch我试图将输入文件的每一行都String放到ItemProcessor没有任何"CSV解析"的情况下ItemReader.
我出来了一个配置Java类(使用@Configuration和@EnableBatchProcessing)包含以下reader()方法,它使下一个ItemProcessor抛出一个ClassCastException.
这ItemReader应该读取一个输入文件并作为输入传递给输入文件的ItemProcessor每一行String.
@Bean
public ItemReader<String> reader() {
FlatFileItemReader<String> reader = new FlatFileItemReader<>();
reader.setResource(new ClassPathResource("data-to-process.txt"));
reader.setLineMapper(new DefaultLineMapper() {{
setLineTokenizer(new DelimitedLineTokenizer());
setFieldSetMapper(new PassThroughFieldSetMapper());
}});
return reader;
}
Run Code Online (Sandbox Code Playgroud)
当运行前面的代码时,我得到一个异常,ItemProcessor期望String来自reader():
java.lang.ClassCastException: org.springframework.batch.item.file.transform.DefaultFieldSet cannot be cast to java.lang.String
Run Code Online (Sandbox Code Playgroud)
ItemProcessor我写的自定义定义为:
public class MyOwnCustomItemProcessor implements ItemProcessor<String, MyOwnCustomBusinessBean> {
Run Code Online (Sandbox Code Playgroud)
我相信我应该用这个PassThroughFieldSetMapper的ItemReader,我不希望使用任何类型的标记生成器.根据文档,我认为我必须使用它,我无法避免它,但我一直在抛出异常.
我如何"转",每个输入线直接作为String一个 …
我正在通过带有请求正文的HTTP GET从REST API中检索图像。
我设法通过测试使用node.js和检查了返回的内容chai.js:
expect(res).to.have.header('Content-Type', 'image/jpeg');
expect(res).to.have.header('Access-Control-Allow-Origin', '*');
expect(res).to.have.header('Access-Control-Allow-Headers', 'Access-Control-Allow-Headers, Origin, X-Requested-With, Content-Type, Accept, Authorization');
expect(res).to.have.header('Access-Control-Allow-Methods', 'GET, POST, PUT, DELETE, OPTIONS, HEAD');
expect(res).to.have.status(200);
expect(res.body).to.be.instanceof(Buffer); // the image content
Run Code Online (Sandbox Code Playgroud)
在vue.js文件中,我习惯将图像附加到<img ...>HTML标记上,如下所示:
<img v-bind:src="urlImg">
Run Code Online (Sandbox Code Playgroud)
然后在javascript部分中指定如下网址:
# this string representing the URL is returned by a function
this.urlImg = 'http://example.com/my_img.jpeg'
Run Code Online (Sandbox Code Playgroud)
但是在这种情况下,我无法提供URL,因为HTTP GET希望正文返回具有内容类型的图像image/jpeg。
我什至不确定这是否可行,而且我可能误会了内容类型image/jpeg应该如何工作。我该怎么做vue.js?有可能吗?有没有一种方法可以检查此HTTP响应的图像内容,就像Postman(Chrome应用程序)之类的东西一样,我无法检查将其伪装为text / Json的响应。
编辑
关于已接受的答案:最近提出的解决方案(UPDATE 2)为我工作(使用HTTP POST为请求提供JSON正文)。确保使用axios(https://github.com/axios/axios)执行HTTP请求(您可以将其导入<script>Vue文件的一部分中,如下所示:)import axios …
我从以前编写的代码开始编写VB6.0项目(带COM +的DLL).我有一个带有"主要"功能的"主"类模块CLS文件,以及工艺流程等.我还有一个"侧面"模块BAS,我保存所有函数/子程序,用作我的"主"类模块中的工具.
我写了一个非常简单的日志系统(因为我觉得App.LogEvent("blablabla")非常不舒服)但我无法编译DLL.该消息指向我的CLS调用,我认为问题与应该返回值的Sub有关,但我不想从该Sub返回任何值!我对VB6.0很新,改进现有的源代码非常困难.
这是我的模块BAS
Public Sub LogMyApp(ByVal sFunctionName As String, ByVal sLogEntry As String)
Dim sLogPath As String
sLogPath = "C:\Temp\MyLog.txt"
Dim fn As Integer
fn = FreeFile
Open sLogPath For Append As #fn
Write #fn, Now & "|" & sFunctionName & "|" & sLogEntry
Close #fn
End Sub
Run Code Online (Sandbox Code Playgroud)
这是我在BAS模块中对该Sub的类模块CLS调用
LogMyApp ( "FunctionBlaBla" , "blablabla" )
Run Code Online (Sandbox Code Playgroud)
任何帮助真的很感激!非常感谢!
我在 Chrome 浏览器中遇到以下错误消息:
无法加载http://localhost:5000/my_endpoint:预检响应中的 Access-Control-Allow-Headers 不允许请求标头字段 Access-Control-Allow-Origin。
浏览器正在使用 webpack 等和vue-resource从 Vue.js 前端应用程序加载网页,以向 REST 后端执行 HTTP 请求。
URLhttp://localhost:5000/my_endpoint是由 python Flask 应用程序提供服务的 HTTP GET/POST 端点。
在前端 Javascript 上,我有这些 CORS 设置:
import VueResource from 'vue-resource'
Vue.use(VueResource)
Vue.http.options.crossOrigin = true
Vue.http.headers.common['Access-Control-Allow-Origin'] = '*'
Run Code Online (Sandbox Code Playgroud)
在 Flask 应用程序的后端 python 代码中,我有以下 CORS 配置详细信息:
@app.after_request
def add_header(response):
response.headers['Access-Control-Allow-Origin'] = '*'
response.headers['Access-Control-Allow-Headers'] = 'Access-Control-Allow-Headers, Origin, X-Requested-With, Content-Type, Accept, Authorization'
response.headers['Access-Control-Allow-Methods'] = 'GET, POST, PUT, DELETE, OPTIONS, HEAD'
response.headers['Access-Control-Expose-Headers'] = '*'
return response
Run Code Online (Sandbox Code Playgroud)
在 Javascript …
我正在尝试安装一个私有依赖项(不是 Python 可以在 PyPI 上找到的东西)。
我已setup.py将此添加到文件中(如下所述:https : //python-packaging.readthedocs.io/en/latest/dependencies.html#packages-not-on-pypi):
dependency_links = [
'https://gitlab.com/<PRIVATE_ORG>/<PRIVATE_REPO>.git@<COMMIT_ID>'
]
Run Code Online (Sandbox Code Playgroud)
在该官方文档中,他们并没有真正详细解释该 URL 的格式,但是在<COMMIT_ID后面使用 a@听起来很合理(因为它在各种其他语言和依赖项管理工具中都是这样做的)。
执行命令时,python setup.py install我在日志/输出中看到:
Reading https://gitlab.com/<PRIVATE_ORG>/<PRIVATE_REPO>.git@<COMMIT_ID>
Run Code Online (Sandbox Code Playgroud)
但是后来我没有看到该软件包被实际安装,正如我从其他依赖项的日志/输出中看到的那样。
我知道我的git命令有一个有效的 GitLab 访问令牌设置,因为我已经运行了这个:
Reading https://gitlab.com/<PRIVATE_ORG>/<PRIVATE_REPO>.git@<COMMIT_ID>
Run Code Online (Sandbox Code Playgroud)
我可以在检查git配置时看到它:
git config \
--global \
url."https://<ACCESS_TOKEN_NAME>:<ACCESS_TOKEN_VALUE>@gitlab.com".insteadOf \
"https://gitlab.com"
Run Code Online (Sandbox Code Playgroud)
git在运行时是否使用该命令setup.py?setup.py文件中指定私有 GitLab 依赖项?它应该基于提交 ID 而不是包版本pip install和定位setup.py而不是运行时python setup.py install,这可能会以不同的方式运行,是否有一种独特的方法可以使这两种风格的 Python 安装都能正常工作?我问这个是因为在摆弄时dependency_links我正在尝试各种不同的东西,比如 …在从以下位置创建docker镜像的过程结束时,我收到了这个奇怪的错误Dockerfile:
/bin/sh: 1: gradle: not found
INFO[0003] The command [/bin/sh -c gradle test jar] returned a non-zero code: 127
Run Code Online (Sandbox Code Playgroud)
相关部分Dockerfile:
FROM debian:jessie
[...]
RUN curl -L https://services.gradle.org/distributions/gradle-2.4-bin.zip -o gradle-2.4-bin.zip
RUN apt-get install -y unzip
RUN unzip gradle-2.4-bin.zip
RUN echo 'export GRADLE_HOME=/app/gradle-2.4' >> $HOME/.bashrc
RUN echo 'export PATH=$PATH:$GRADLE_HOME/bin' >> $HOME/.bashrc
RUN /bin/bash -c "source $HOME/.bashrc"
RUN gradle test jar
[...]
Run Code Online (Sandbox Code Playgroud)
我使用的命令是: docker build -t java_i .
奇怪的是,如果:
RUN gradle test jar(命令:) docker run -d -p …我正在尝试使用 Go 库 Chromedp 从网页中抓取一些数据。
我基本上需要单击一个按钮,例如 W3C 学校网站上的“Click me”按钮。我需要使用valueHTML 标记的 HTML 属性来过滤该按钮input(因为没有要定位的特定 ID,并且大多数 Chromedp 示例使用基于 ID 属性的选择器)。
以下代码似乎永远挂在初始网页上,无需单击按钮。
package main
import (
"context"
"log"
"time"
"github.com/chromedp/chromedp"
)
func main() {
var err error
// create context
ctxt, cancel := context.WithCancel(context.Background())
defer cancel()
// create chrome instance
c, err := chromedp.New(ctxt, chromedp.WithLog(log.Printf))
if err != nil {
log.Fatal(err)
}
// …Run Code Online (Sandbox Code Playgroud) 我有一个与此类似的ansiblehost文件(称为my_host_file):
[my_group_name]
MY_PUBLIC_IP_FOR_VM_XYZ
Run Code Online (Sandbox Code Playgroud)
然后我在my_playbook.yml类似于此的 YAML 剧本(称为)中尝试了几种不同的方法:
---
- hosts: my_group_name
sudo: yes
tasks:
- debug: var=hostvars
- setup:
register: allfacts
- debug: var=allfacts
- debug: var=ansible_default_ipv4.address
- debug: var=ansible_hostname
- command: bash -c "dig +short myip.opendns.com @resolver1.opendns.com"
register: my_public_ip_as_ansible_var
Run Code Online (Sandbox Code Playgroud)
我像这样运行一切: ansible-playbook -v -i my_host_file my_playbook.yml
我想在运行时以不同于使用命令然后将其存储到变量中的方式获取my_host_file文件 ( MY_PUBLIC_IP_FOR_VM_XYZ)中的公共 IP 地址。digopendnsmy_public_ip_as_ansible_var
毕竟这个已经被ansible自己用来建立SSH会话了,所以可能会存放在某个地方。
我也找不到此信息:
hostvars(实际上在这里我可以在这里找到它,但我也可以看到所有其他主机,所以我无法从主机组中识别当前的 SSH 会话)allfacts(using setup: [...]) 变量中(只有专用网络中的 …docker ×2
java ×2
parsing ×2
vb6 ×2
vue.js ×2
activex ×1
ansible ×1
azure ×1
azure-cli ×1
build ×1
chromedp ×1
com+ ×1
content-type ×1
cors ×1
debugging ×1
dependencies ×1
dll ×1
dockerfile ×1
dom ×1
flask ×1
git ×1
gitlab ×1
go ×1
gradle ×1
imagejpeg ×1
javascript ×1
networking ×1
nlp ×1
nltk ×1
python ×1
python-2.7 ×1
setup.py ×1
spring ×1
spring-batch ×1
sql-server ×1
ssh ×1
stemming ×1
string ×1
subroutine ×1
vue-resource ×1
web-scraping ×1
xvfb ×1