我有一个csv数据,如下所示,其中数据每10分钟以以下格式出现一次。我需要通过使用不同的列名映射列名来将数据插入到配置单元中。(列的顺序不是恒定不变的,它们改变顺序,我们总共有10列,有时我们会错过许多列,例如下面的一个示例):csv文件示例:
1 2 6 4
u f b h
a f r m
q r b c
Run Code Online (Sandbox Code Playgroud)
现在,当插入到蜂巢中时,我需要替换例如列名
1 -> NBR
2 -> GMB
3 -> GSB
4 -> KTC
5 -> VRV
6 -> AMB
Run Code Online (Sandbox Code Playgroud)
现在我需要插入到蜂巢表如下
NBR GMB GSB KTC VRV AMB
u f NULL h NULL b
a f NULL m NULL r
Run Code Online (Sandbox Code Playgroud)
谁能帮我这个如何将这个值插入蜂巢
我想删除列中的几个单词,我写下了代码正常工作
finaldata['keyword'] = finaldata['keyword'].str.replace("Washington Times", "")
finaldata['keyword'] = finaldata['keyword'].str.replace("Washington Post", "")
finaldata['keyword'] = finaldata['keyword'].str.replace("Mail The Globe", "")
Run Code Online (Sandbox Code Playgroud)
现在我有大约30个字要删除,但我不能重复这行代码30次有没有办法解决我的问题,如果是,请指导我
嗨,我被打到这里了,请帮助我解决这个问题
我收到此错误
TypeError: language_model_learner() missing 1 required positional argument: 'arch'
Run Code Online (Sandbox Code Playgroud)
我正在关注本教程:-https: //www.analyticsvidhya.com/blog/2018/11/tutorial-text-classification-ulmfit-fastai-library/
我有一个大型数据框如下:
df1(样本数据)
a name keywords
1 ramesh rrahul,rapple
2 venkat rtemple
3 rajesh rcake,rphone,rmaths
4 lamda rcon
5 feast rcamera,rtab
Run Code Online (Sandbox Code Playgroud)
我想删除在由逗号分隔的单词组成的字符串中每个单词的开头r出现的字母.输出应如下:
a name keywords
1 ramesh rahul,apple
2 venkat temple
3 rajesh cake,phone,maths
4 lamda con
5 feast camera,tab
Run Code Online (Sandbox Code Playgroud) python ×3
pandas ×2
python-3.x ×2
string ×2
hadoop ×1
hive ×1
hiveql ×1
mysql ×1
natural-language-processing ×1
nlp ×1