我无法在R中读取包含下面一行的文件.
__CODE__
任何的想法?我怎样才能使read.table明白"是引用的逃脱?
干杯,亚历山大
我有一个文本文件,每行一个句子.我想使用hunspell(-s选项)对每行中的世界进行lemmatize.由于我想分别对每行的引理进行处理,因此将整个文本文件提交给hunspell是没有意义的.我需要一个接一个地发送一行,并为每一行提供hunspell输出.
以下是如何处理Steel Bank Common Lisp中的输入和输出流的答案?,我能够为hunspell发送一行接一行的整个文本文件但是我无法捕获每行的hunspell输出.如何在发送另一条线之前与发送线路和读取输出的进程进行交互?
我当前读取整个文本文件的代码是
(defun parse-spell-sb (file-in)
(with-open-file (in file-in)
(let ((p (sb-ext:run-program "/opt/local/bin/hunspell" (list "-i" "UTF-8" "-s" "-d" "pt_BR")
:input in :output :stream :wait nil)))
(when p
(unwind-protect
(with-open-stream (o (process-output p))
(loop
:for line := (read-line o nil nil)
:while line
:collect line))
(process-close p))))))
Run Code Online (Sandbox Code Playgroud)
再一次,这段代码为我提供了整个文本文件的hunspell输出.我想分别为每个输入行输出hunspell.
任何的想法?
我有一个代码,如果从emacs内的slime提示执行运行没有错误.如果我从提示符启动sbcl,我收到错误:
* (ei:proc-file "BRAvESP000.log" "lixo")
debugger invoked on a SB-INT:STREAM-ENCODING-ERROR:
:UTF-8 stream encoding error on
#<SB-SYS:FD-STREAM for "file /Users/arademaker/work/IBM/scolapp/lixo"
{10049E8FF3}>:
the character with code 55357 cannot be encoded.
Type HELP for debugger help, or (SB-EXT:EXIT) to exit from SBCL.
restarts (invokable by number or by possibly-abbreviated name):
0: [OUTPUT-NOTHING ] Skip output of this character.
1: [OUTPUT-REPLACEMENT] Output replacement string.
2: [ABORT ] Exit debugger, returning to top level.
(SB-IMPL::STREAM-ENCODING-ERROR-AND-HANDLE #<SB-SYS:FD-STREAM for "file /Users/arademaker/work/IBM/scolapp/lixo" {10049E8FF3}> 55357)
0]
Run Code Online (Sandbox Code Playgroud)
问题是,在这两种情况下,我使用相同的sbcl 1.1.8和相同的机器,Mac OS …
按照我的上一个问题提供的答案如何使用Closure XML将元素注入字符内容?我实现了cxml的子类:sax-proxy处理程序(广播处理程序的一个特例).不幸的是,它看起来像库中的一个错误,但它尝试使用内部文档类型定义生成XML,但doc是一个无效的XML.
也就是说,使用以下命令运行解析器:
(with-open-file (out #P"teste.xml" :if-exists :supersede :direction :output)
(let ((h (make-instance 'preproc :chained-handler (cxml:make-character-stream-sink out))))
(cxml:parse #P"harem.xml" h :validate t)))
Run Code Online (Sandbox Code Playgroud)
harem.xml文件的开头位置(请参阅doctype):
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE colHAREM SYSTEM "harem.dtd">
<colHAREM versao="Segundo_dourada_com_relacoes_14Abril2010">
<DOC DOCID="H2-dftre765">
<p>...
Run Code Online (Sandbox Code Playgroud)
该命令在teste.xml输出文件中生成:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE colHAREM SYSTEM "harem.dtd"<!ELEMENT EM #PCDATA>
<!ATTLIST EM ID CDATA #REQUIRED>
<!ATTLIST EM CATEG CDATA #IMPLIED>
<!ATTLIST EM TIPO CDATA #IMPLIED>
<!ATTLIST EM COMENT CDATA #IMPLIED>
<!ATTLIST EM SUBTIPO CDATA #IMPLIED>
<!ELEMENT ALT (#PCDATA|EM)*>
<!ELEMENT OMITIDO (#PCDATA|EM|ALT|p)*>
<!ELEMENT colHAREM …Run Code Online (Sandbox Code Playgroud) 有人在课堂上使用过http://www.neilvandyke.org/racket-sicp吗?是否足够成熟?