我正在尝试清理推文以分析他们的情绪。我想把表情符号变成它们的意思。
例如,我希望我的代码转换
'I ? New York'
'Python is '
Run Code Online (Sandbox Code Playgroud)
到
'I love New York'
'Python is cool'
Run Code Online (Sandbox Code Playgroud)
我见过这样的包,emoji但他们把表情符号变成了它们所代表的东西,而不是它们的意思。例如,他们把我的推文变成:
print(emoji.demojize('Python is '))
'Python is :thumbs_up:'
print(emoji.demojize('I ? New York'))
'I :heart: New York'
Run Code Online (Sandbox Code Playgroud)
由于“heart”或“thumbs_up”在 中没有正面或负面的含义textblob,因此这种转换是无用的。但如果“?” 转化为“爱”,情感分析的结果会大幅提升。
我一直在尝试使用python 3在650 MB的csv文件上进行文本挖掘,而我的计算机功能不足以执行此操作。我的第二个解决方案是接触Google Cloud。我已经在谷歌云上设置了虚拟机和jupyter笔记本,并且运行良好。但是问题是,我一直担心会断开连接。实际上,我与Google服务器的连接丢失了几次,我的整个工作也丢失了。
我的问题:有没有办法让云运行我的代码而不必担心断开连接?我需要能够访问我的csv文件以及输出文件。
我知道有多种方法可以做到这一点,并且已经阅读了很多材料。但是,对于像我这样的初学者来说,它们太技术化了。我真的很欣赏一个更友好的版本。谢谢!
更新:这是我如何访问Google Cloud上的Jupyter笔记本:
1-我在Google云端上运行实例
2-我点击SSH
3-在出现的窗口中,键入以下内容:
jupyter notebook --ip=0.0.0.0 --port=8888 --no-browser &
我见过有人建议nohup在同一赞词的开头加上一些内容。我已经尝试过并收到以下消息:
nohup: ignoring input and appending output to 'nohup.out'
没有任何反应。