小编sma*_*ish的帖子

什么是远程监督?

根据我的理解,远程监督是指定一个段落(通常是一个句子)的单个词试图传达的概念的过程.

例如,数据库维护结构化关系 concerns( NLP, this sentence).

我们的远程监督系统将把句子作为输入: "This is a sentence about NLP."

基于这句话会认识到实体,因为作为一个预处理步骤判决将已通过命名实体识别通过,NLPthis sentence.

由于我们的数据库具有它NLP并且this sentence通过concern(s)它的关系相关联,因此将输入句子识别为表达关系Concerns(NLP, this sentence).

我的问题有两个:

1)有什么用?是不是以后我们的系统可能会在"狂野"中看到一个句子,That sentence is about OPP并且意识到它看起来与以前的类似,从而实现了这样的新颖关系concerns(OPP, that sentence).,仅仅基于单词/个体标记?

2)是否考虑了句子的实际用语?动词'是'和副词'关于',例如,实现(通过WordNet或其他一些下位系统),这在某种程度上类似于高阶概念"关注"?

有没有人有一些代码用于生成我可以看到的远程监控系统,即交​​叉引用KB的系统(如Freebase)和语料库(如NYTimes),并生成远程监管数据库?我认为这将有助于澄清我对远程监督的看法.

nlp stanford-nlp unsupervised-learning supervised-learning

9
推荐指数
2
解决办法
8911
查看次数

google cloud sdk:设置环境变量_ python - > linux

ERROR: Python 3 is not supported by the Google Cloud SDK.  Please use a Python 2.x version that is 2.6 or greater.

If you have a compatible Python interpreter installed, you can use it by setting the CLOUDSDK_PYTHON environment variable to point to it.
Run Code Online (Sandbox Code Playgroud)

我想我们应该问的第一个问题是"谷歌利用他们的客户赚取的所有钱为什么他们不能雇用某人来确保他们的云sdk与python 3一起使用?"

如何在linux上克服这个错误?需要编辑哪些特定文件?这些文件应该放在哪里?

我搜索了很多,发现了关于如何在Windows上解决这个问题的问题,但答案并不是那么全面.


到目前为止,我尝试过:

一个文件来源修改一个名为的文件app.yaml,但是我使用该命令进行了搜索,find . -name "app.yaml"并且不存在这样的文件.

具体来说我使用的是arch linux,我最初尝试使用AUR包,但是它失效了.

所以我从文档安装,确保编辑./install.sh文件,根据谷歌小组的python2讨论指定,这也不起作用.运行命令后,我得到与上面发布的相同的错误.gcloud auth login

python linux google-app-engine gcloud

7
推荐指数
2
解决办法
1万
查看次数

如何将JSON对象解析为`Map <String,HashSet <String >>`

我想解析这个JSON对象:

"{
  \"Rao\":[\"Q7293658\",\"\",\"Q7293657\",\"Q12953055\",\"Q3531237\",\"Q4178159\",\"Q1138810\",\"Q579515\",\"Q3365064\",\"Q7293664\",\"Q1133815\"],
  \"Hani Durzy\":[\"\"],
  \"Louise\":[\"\",\"Q1660645\",\"Q130413\",\"Q3215140\",\"Q152779\",\"Q233203\",\"Q7871343\",\"Q232402\",\"Q82547\",\"Q286488\",\"Q156723\",\"Q3263649\",\"Q456386\",\"Q233192\",\"Q14714149\",\"Q12125864\",\"Q57669\",\"Q168667\",\"Q141410\",\"Q166028\"],
  \"Reyna\":[\"Q7573462\",\"Q2892895\",\"Q363257\",\"Q151944\",\"Q3740321\",\"Q2857439\",\"Q1453358\",\"Q7319529\",\"Q733716\",\"Q16151941\",\"Q7159448\",\"Q5484172\",\"Q6074271\",\"Q1753185\",\"Q7319532\",\"Q5171205\",\"Q3183869\",\"Q1818527\",\"Q251862\",\"Q3840414\",\"Q5271282\",\"Q5606181\"]
}"
Run Code Online (Sandbox Code Playgroud)

并用这些数据生成一个Map<String, HashSet<String>>.

基本上我想要扭转这个过程.

这个项目的所有代码都可以在我的github页面上找到,它很短.


更新

        File f = new File("/home/matthias/Workbench/SUTD/nytimes_corpus/wdtk-parent/wdtk-examples/JSON_Output/user.json");

        String jsonTxt = null;

        if (f.exists())
        {
            InputStream is = new FileInputStream("/home/matthias/Workbench/SUTD/nytimes_corpus/wdtk-parent/wdtk-examples/JSON_Output/user.json");
            jsonTxt = IOUtils.toString(is);


        }
        //System.out.println(jsonTxt);


        Gson gson=new Gson(); 


        Map<String, HashSet<String>> map = new HashMap<String, HashSet<String>>();
        map=(Map<String, HashSet<String>>) gson.fromJson(jsonTxt, map.getClass());

        //// \\ // ! PRINT IT ! // \\ // \\ // \\ // \\ // \\ // \\
       for (Map.Entry<String, HashSet<String>> entry : map.entrySet()) …
Run Code Online (Sandbox Code Playgroud)

java json

5
推荐指数
1
解决办法
3155
查看次数

有 Golang 终端外壳吗?编译语言有可能吗?

最近对 Golang 感兴趣。

当我学习 Python 时,我启动了一个终端 shell,只是练习向它扔不同的数据、文件,进行许多琐碎的愚蠢操作,这是与新语言交互的好方法,并且对编写新程序非常有帮助。

我想知道 - 我猜因为 Golang 是一种像 Java 这样的编译语言,所以不可能有这样的终端 shell。那正确吗?如果是这样 - 它无法工作的真正技术原因是什么?

python shell go

5
推荐指数
2
解决办法
1695
查看次数

使用 SFTP 从本地计算机上的 Sublime Text 编辑 Docker 容器(“远程”)中的文件

目前我正在使用 Docker 容器内编辑文件vim,但我希望有更好的方法。

根据我的研究,在本地计算机(例如 Sublime Text)的文本编辑器上编辑 Docker 容器内的文件的最佳方法似乎是使用Sublime SFTP

这需要编辑sftp-config.json文件,它看起来像这样:

{
    // The tab key will cycle through the settings when first created
    // Visit http://wbond.net/sublime_packages/sftp/settings for help

    // sftp, ftp or ftps
    "type": "sftp",

    "sync_down_on_open": true,
    "sync_same_age": true,

    "host": "192.168.129.8",
    "user": "root",
    "password": "666",
    //"port": "22",

    "remote_path": "/",
    //"file_permissions": "664",
    //"dir_permissions": "775",

    //"extra_list_connections": 0,

    "connect_timeout": 30,
    //"keepalive": 120,
    //"ftp_passive_mode": true,
    //"ftp_obey_passive_host": false,
    //"ssh_key_file": "~/.ssh/id_rsa",
    //"sftp_flags": ["-F", "/path/to/ssh_config"],

    //"preserve_modification_times": false,
    //"remote_time_offset_in_hours": 0,
    //"remote_encoding": "utf-8", …
Run Code Online (Sandbox Code Playgroud)

sftp sublimetext3 docker

5
推荐指数
1
解决办法
7328
查看次数

为Github项目创建Docker镜像

我有一个GitHub项目(我正在使用它(我没有创建它)),名为OpenRefine,我想将其封装在Docker镜像中,这样其他人就可以从"Docker"中提取Docker镜像了Hub"并在其基本的交互式Docker实体上安装了OpenRefine,即.图片.

我想将其上传到我可以与他人共享的存储库.

如果它有一个名字而不是一个疯狂的哈希值会很好.


是不是我只是用git clone命令创建一个"docker file"文本文件?

但是如何将其上传到诸如docker hub之类的存储库?我只是把那个文本文件放在那里?

就像是

来自ubuntu

主持人:/ WTF?!

运行git clone blah

CMD在这?

在此输入图像描述


这似乎是一个非常基本的问题,但在Docker提供的教程中无法轻易获取信息,Stackoverflow上也没有明确的答案,但这些是无可争辩的优秀资源,可用于制作终端输出" Hello World " 的非常复杂的方法.

docker dockerhub

4
推荐指数
1
解决办法
3619
查看次数

通过从Scanner读取行来实例化ArrayList,在哪里声明对象?

我想用输入文件中的行填充数组列表,输入文件如下所示:

7f00000000000000000000000000000000000000000000000000000000000000027f00000000000000000000000000000000000000000000000000000000000000027f00000000000000000000000000000000000000000000000000000000000000020101
7f00000000000000000000000000000000000000000000000000000000000000037f00000000000000000000000000000000000000000000000000000000000000037f00000000000000000000000000000000000000000000000000000000000000030101
7f00000000000000000000000000000000000000000000000000000000000000047f00000000000000000000000000000000000000000000000000000000000000047f00000000000000000000000000000000000000000000000000000000000000040101
7f00000000000000000000000000000000000000000000000000000000000000057f00000000000000000000000000000000000000000000000000000000000000057f00000000000000000000000000000000000000000000000000000000000000050101
7f00000000000000000000000000000000000000000000000000000000000000067f00000000000000000000000000000000000000000000000000000000000000067f00000000000000000000000000000000000000000000000000000000000000060101
Run Code Online (Sandbox Code Playgroud)

我想基于此创建的Java中的数据对象将这些行中的每一行作为新字符串,并且它们将一起存在于列表中,可以这么说*.

因此,在我尝试将文件行读入此数组列表的不同组件时,我无法弄清楚我需要在主程序中声明数组列表的位置.我的计划是用一个单独的方法填充它:

import java.io.*;
import java.util.Scanner;
import java.util.List;
import java.util.Array;
import java.util.ArrayList;

class evmTest {

public static void main(String[] args) {


    Array<String> inputLinesObject = new ArrayList<String>();

    // populate from file
    inputLinesObject = readFile("/Users/s.matthew.english/codes.txt", inputLinesObject);


    System.out.println(Array.toString(inputLinesObject));

}

    private static void readFile(String fileName, Array<String> inputLines) {
        try {
            File file = new File(fileName);
            Scanner scanner = new Scanner(file);
            while (scanner.hasNextLine()) {
                // System.out.println(scanner.nextLine());
                inputLines.add(scanner.nextLine());
            }
            scanner.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        }
        return inputLines;
    } …
Run Code Online (Sandbox Code Playgroud)

java arrays arraylist java.util.scanner

3
推荐指数
1
解决办法
407
查看次数

本体和地名词典之间的区别?

根据gate.ac.uk,地名词典是:

地名词典由一组列表组成,这些列表包含诸如城市,组织,星期几等实体的名称。这些列表用于查找文本中这些名称的出现,例如,用于命名实体的识别任务。“地名词典”一词通常既可用于实体列表集,又可用于处理资源,该资源使用这些列表来查找文本中名称的出现。

这与“本体论”有何不同?

semantic-web ontology gate

2
推荐指数
1
解决办法
203
查看次数

使用python(或其他东西)查询fuseki服务器

我正在尝试针对我通过浏览器本地运行但仍然崩溃的fuseki服务器发出一个复杂的查询 - 是否可以通过python脚本来实现?如果是这样的话?

rdf sparql fuseki

2
推荐指数
1
解决办法
1780
查看次数

Haskell:无法将类型“[Char]”与“文本”匹配

出于某种原因——我希望通过提出这个问题来找出这一点——最近对 haskell 脚本实施了一系列更新,包括添加:

import System.Directory (doesFileExist, removeFile,getPermissions)
Run Code Online (Sandbox Code Playgroud)

这有助于促进以下功能:

validFile :: FilePath -> IO Bool
validFile path = do
    exists <- (doesFileExist path)
    if exists
    then (readable <$> getPermissions path)
    else return False
Run Code Online (Sandbox Code Playgroud)

调用为:

pwds <- case cfgPasswords of
    Just passPath -> do
         pathChecksOut <- validFile passPath
         when (not pathChecksOut) $ 
             errorL' ("Failed to access file at : " ++ passPath)
         (map (Just . T.unpack) . lines) <$> readFileUtf8 passPath
    Nothing       -> return $ replicate (length cfgPublicKeys) Nothing
Run Code Online (Sandbox Code Playgroud)

我无法再在我的机器上构建项目。 …

haskell

2
推荐指数
1
解决办法
1318
查看次数