这肯定是一个简单的,但它真的很烦我.
我有一个脚本可以读入网页并使用Beautiful Soup来解析它.从汤中我提取所有链接,因为我的最终目标是打印出link.contents.
我正在解析的所有文本都是ASCII.我知道Python将字符串视为unicode,我确信这非常方便,只是在我的小脚本中没用.
每次我打印出一个包含'String'的变量时,我都会[u'String']打印到屏幕上.是否有一种简单的方法可以将其恢复为ascii,还是应该编写正则表达式来删除它?
我有这个代码:
import nltk
import pypyodbc
text = raw_input()
token = nltk.word_tokenize(text) //return a list value
def search(self, lists):
if not self.connected:
self.connect()
for word in lists:
self.cur.execute('SELECT Ybanag FROM Words WHERE English IN (%s)' % (','.join('?'*len(lists))), lists)
result = self.cur.fetchall()
return result
Run Code Online (Sandbox Code Playgroud)
其中输出是单个元素元组的列表(例如,我输入we all there):(
[('tore',), ('ngaming',), ('sittam',)]将输入翻译成母语).我想将输出转换为字符串以消除[],(),'','符号.如何将其转换为字符串?