我有一个很长的文本文件(剧本).我想把这个文本文件转换成一个列表(每个单词都是分开的),这样我以后就可以搜索它了.
我现在的代码是
file = open('screenplay.txt', 'r')
words = list(file.read().split())
print words
Run Code Online (Sandbox Code Playgroud)
我认为这可以将所有单词拆分成一个列表,但是我无法删除所有额外的东西,比如逗号和单词结尾处的句点.我也希望将大写字母设为小写(因为我希望能够以小写字母搜索并且显示大写字母和小写字母).任何帮助都会很棒:)
在我正在尝试编写的函数中,用户输入一组数字,例如"648392".我把这个字符串变成这样的列表:['6','4','8','3','9','2'].
我希望能够对这些数字进行求和,因此我将列表中的数字转换为整数而不是字符串.这一切都运行良好,但我也希望用户能够输入字母,然后我只是将它们从列表中删除 - 这就是我被困住的地方.例如,用户输入"6483A2".
我无法检查元素是否是带有isDigit的数字,因为元素显然必须首先是整数,并且我无法将列表中的元素转换为整数,因为有些元素是字母...我我确定有一个简单的解决方案,但我在python中非常糟糕,所以任何帮助都将非常感激!
我正在查看单个单词列表并创建一个字典,其中单词是键,单词的索引是值.
dictionary = {}
for x in wordlist:
dictionary[x] = wordlist.index(x)
Run Code Online (Sandbox Code Playgroud)
这个目前工作正常,但我希望在第二次或第三次发现同一个单词时添加更多索引.所以如果短语是"我要去城里",我会期待创建一个这样的字典:
{'I': 0, 'am' : 1, 'going' : 2, 'to': (3, 5), 'go' : 4, 'town' : 6}
Run Code Online (Sandbox Code Playgroud)
所以我想我需要字典里面的列表?然后为它们添加更多索引?关于如何实现这一点的任何建议都会很棒!
python ×3