小编use*_*238的帖子

如何在Python中打印Unicode字符代码？

我想打印一个unicode的字符代码,而不是它在Python中表示的实际字形.

例如,if u是unicode字符列表:

>>> u[0]
u'\u0103'
>>> print u[0]
?

Run Code Online (Sandbox Code Playgroud)

我想将字符代码输出为原始字符串:u'\u0103'.

我曾尝试将其打印到文件中,但如果不对其进行编码,则无法正常工作UTF-8.

>>> w = open('~/foo.txt', 'w')
>>> print>>w, u[0].decode('utf-8')

Traceback (most recent call last):
  File "<pyshell#33>", line 1, in <module>
    print>>w, u[0].decode('utf-8')
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/encodings/utf_8.py", line 16, in decode
    return codecs.utf_8_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\u0103' in position 0: ordinal not in range(128)
>>> print>>w, u[0].encode('utf-8')
>>> w.close()

Run Code Online (Sandbox Code Playgroud)

对其进行编码会导致字形?被写入文件.

我怎么写字符代码？

python unicode

use*_*238

lucky-day

11
推荐指数

1
解决办法

1万
查看次数

如何使用Java JSch库逐行读取远程文件？

我正在尝试使用Java逐行读取文件,这很简单(在stackoverflow.com上有多个解决方案),但需要注意的是该文件位于远程服务器上,而不是可以获得本地副本(它是单个.txt文件中数百万亚马逊评论的大量集合).

JSch附带了两个示例类,用于将文件复制到远程主机或从远程主机复制文件,即ScpTo和ScpFrom.我有兴趣逐行从远程主机读取文件; ScpFrom会尝试将整个内容复制到本地文件中,这需要很长时间.

以下是ScpFrom的链接:http://www.jcraft.com/jsch/examples/ScpFrom.java.html

我会尝试将代码存放在那里,然后修改它以逐行读取远程文件而不是写入本地文件,但是一旦作者声明了一个字节数组并开始从中读取字节,大部分代码都是希腊语.远程文件.我承认这是我几乎不了解的事情; BufferedReader提供了更高级别的接口.基本上我想这样做:如何使用Java逐行读取大型文本文件？

除了使用BufferReader,它还可以逐行读取远程文件,如果提供了主机名和用户凭据(密码等),即RemoteBufferReader？

这是我写的测试代码; 如何使用JSCh逐行读取远程文件？

public class test2
 {
    static String user = "myusername";
    static String host = "user@remotehost";
    static String password = "mypasswd";
    static String rfile = "/path/to/remote/file/on/remote/host";
    public static void main(String[] args) throws FileNotFoundException, IOException, JSchException
    {
        JSch jsch=new JSch();
        Session session=jsch.getSession(user, host, 22);
        session.setPassword(password);
        session.connect();
        // exec 'scp -f rfile' remotely
        String command="scp -f "+rfile;
        Channel channel=session.openChannel("exec");
        ((ChannelExec)channel).setCommand(command);

        // get I/O streams for remote scp
        OutputStream out=channel.getOutputStream();
        channel.connect()
        //no …

Run Code Online (Sandbox Code Playgroud)

java io jsch

use*_*238

2017 05-23

9
推荐指数

2
解决办法

3万
查看次数

如何用master更新本地仓库？

我习惯使用SVN,最近才切换到GitHub.

我正在尝试更新GitHub仓库中的一些文件,但我收到此消息:

To https://github.com/.../
 ! [rejected]        master -> master (non-fast-forward)
error: failed to push some refs to 'https://github.com/.../'
hint: Updates were rejected because the tip of your current branch is behind
hint: its remote counterpart. Integrate the remote changes (e.g.
hint: 'git pull ...') before pushing again.
hint: See the 'Note about fast-forwards' in 'git push --help' for details.

Run Code Online (Sandbox Code Playgroud)

我试图像命令git fetch origin和git pull,但这些都不让,所以我的当前分支并没有落后.

在SVN我只是做svn update,然后提交我的更改.

我也试过了git pull origin,但是我弹出一条奇怪的短信,我不知道如何与它交互:用Github存储库中的更改来更新本地存储库

svn git github

use*_*238

2017 05-23

9
推荐指数

2
解决办法

7万
查看次数

如何让CRFSuite在Mac OS X上运行？

我试图让CRFSuite在Mac OS X上运行.作者只有Windows和Linux的二进制文件,但确实提供了源代码包.我猜我需要以某种方式将源代码编译成Mac OS X可执行文件？这个我不知道该怎么做.我对此做了一些研究,但实际上没有任何效果.我还问过大学的博士生特别是这个问题 - 他告诉我这将是非常困难的.

我已经能够通过使用WineSkin让CRFSuite工作,但这是一种解决方法而不是真正的解决方案.

理想情况下,当我打开终端时,我应该能够通过输入"crfsuite"来调用CRFSuite,而不是跳过箍到管道命令到WineSkin Windows终端.

linux macos crf

use*_*238

lucky-day

5
推荐指数

1
解决办法

1583
查看次数

如何自动转录 Skype 会议，并正确归属于每个参与者？

假设每个参与者都同意 Skype 通话的录音和转录，是否有一种方法可以转录会议（实时或离线或两者兼而有之），以便生成文本记录，其中每个口头文本都正确归属于发言者。然后可以将转录本输入到任何类型的搜索或 NLP 算法中。

“自动转录 Skype”的 Google 搜索前 3 名指的是使手动转录变得更容易的应用程序：

(1) http://www.dummies.com/how-to/content/how-to-convert-skype-audio-to-text-with-transcribe.html

(2) http://ask.metafilter.com/231400/How-to-record-and-transcribe-Skype-conversation

(3) https://www.ttetranscripts.com/blog/how-to-record-and-transcribe-your-skype-conversations

虽然录制音频并将其发送到语音转文本引擎很简单，但我怀疑它的质量是否会非常高，因为最好的结果通常是依赖于说话者的模型（否则我们就不必花时间来训练龙自然言）。

但是，在我们选择说话者相关转录模型之前，我们需要知道音频的哪个片段属于哪个说话者。有两种方法可以解决这个问题：

有一种简单的方法可以检索来自每个参与者的所有音频，例如，您只需在通话期间记录每个扬声器麦克风的所有音频，而无需进行任何分段。
如果第一个选项在某种程度上不可行或令人望而却步，我们必须使用说话人分类算法，该算法将音频分割成 N 个簇/说话人（大多数算法允许知道音频中有多少个说话人，但有些算法可以自己解决这个问题）。对于通话过程中的实时转录，我想我们需要一些奇特的实时说话者分类算法。

无论如何，一旦解决了分割问题，每个参与者都会拥有经过训练的说话者模型，然后将其应用于他们的音频部分。一天结束时，每个人都会得到一份不错的对话记录，稍后我们可以做一些花哨的事情，比如主题分析，或者也许老大哥想要筛选每个人的项目会议，而不必听几个小时的音频。

我的问题是，在实践中实施这一点的方法是什么？

nlp skype audio-recording speech-to-text transcription

use*_*238

lucky-day

5
推荐指数

0
解决办法

4452
查看次数

如何使Maven与Python子进程一起使用？

我正在尝试编写Python脚本来自动执行一些Maven命令。

以下Python代码不起作用：

import subprocess
args = ['mvn', '-version']
process = subprocess.Popen(args, stdout=subprocess.PIPE)

Run Code Online (Sandbox Code Playgroud)

导致以下错误：

Traceback (most recent call last):
  File "<pyshell#2>", line 1, in <module>
    process = subprocess.Popen(args, stdout=subprocess.PIPE)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 679, in __init__
    errread, errwrite)
  File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/subprocess.py", line 1249, in _execute_child
    raise child_exception
OSError: [Errno 2] No such file or directory

Run Code Online (Sandbox Code Playgroud)

下一步，我为子进程提供mvn二进制文件的完整路径：

import subprocess
args = ['/usr/local/Cellar/maven/3.2.3/libexec/bin/mvn', '-version']
process = subprocess.Popen(args, stderr=subprocess.PIPE)
out, err = process.communicate()

Run Code Online (Sandbox Code Playgroud)

该命令进行了进一步处理，但是打印err显示出以下抱怨：

Error: JAVA_HOME is not defined correctly.
  We cannot …

Run Code Online (Sandbox Code Playgroud)

python subprocess maven

use*_*238

lucky-day

2
推荐指数

1
解决办法

2046
查看次数

Hadoop：JobConf 类中的方法 setMapperClass 不能应用于给定类型

我对在 Java 中使用 Hadoop 框架很陌生。我正在尝试为JobConf只有一个映射器的特定 map reduce 作业设置。reducer 没有真正的中间值。我的映射器类在这里：

public static class GetArticlesMapper extends Mapper<LongWritable, WikipediaPage, Text, Text> 
{
    public static Set<String> peopleArticlesTitles = new HashSet<String>();

    @Override
    protected void setup(Mapper<LongWritable, WikipediaPage, Text, Text>.Context context)
            throws IOException, InterruptedException {
        // TODO: You should implement people articles load from
        // DistributedCache here
        super.setup(context);
    }

    @Override
    public void map(LongWritable offset, WikipediaPage inputPage, Context context)
            throws IOException, InterruptedException {
        // TODO: You should implement getting article mapper here
    }
}

Run Code Online (Sandbox Code Playgroud)

但是，当我编译 …

java hadoop

use*_*238

lucky-day

0
推荐指数

1
解决办法

2222
查看次数