我希望我的Python函数分割一个句子(输入)并将每个单词存储在一个列表中.我当前的代码拆分了句子,但没有将单词存储为列表.我怎么做?
def split_line(text):
# split the text
words = text.split()
# for each word in the line:
for word in words:
# print the word
print(words)
Run Code Online (Sandbox Code Playgroud) 考虑..
dict = {
'?????':'?????',
'russianA':'englishA'
}
s = '????? russianA'
Run Code Online (Sandbox Code Playgroud)
我想用它们各自的dict值替换所有dict键s.
我有一个脚本可以运行到我的文本中并搜索并替换我在数据库中编写的所有句子.
剧本:
with open('C:/Users/User/Desktop/Portuguesetranslator.txt') as f:
for l in f:
s = l.split('*')
editor.replace(s[0],s[1])
Run Code Online (Sandbox Code Playgroud)
和数据库示例:
Event*Evento*
result*resultado*
Run Code Online (Sandbox Code Playgroud)
等等...
现在发生的事情是我需要在那个剧本中使用"全字",因为我发现自己遇到了问题.
例如,使用Result和Event,因为当我替换Resultado和时Evento,我再次在文本中运行脚本,脚本再次替换Resultado和Evento.
后,我运行脚本的结果保持这样的Resultadoado和Eventoo.
只是让你们知道..它不仅仅针对事件和结果,还有超过1000多个句子我已经为搜索设置并替换为工作..
我不需要简单的搜索和替换两个单词..因为我将一遍又一遍地为不同的句子编辑数据库..
所以我从官方文档中得到了这些例子. https://docs.python.org/2/library/timeit.html
究竟是什么让第一个例子(生成器表达式)比第二个(列表理解)慢?
>>> timeit.timeit('"-".join(str(n) for n in range(100))', number=10000)
0.8187260627746582
>>> timeit.timeit('"-".join([str(n) for n in range(100)])', number=10000)
0.7288308143615723
Run Code Online (Sandbox Code Playgroud)