我是数据分析的新手。我正在 python Sklearn 中尝试一些模型。我有一个数据集,其中一些列有文本列。像下面,
数据集

有没有办法将这些列值转换为 Pandas 或 Sklearn 中的数字?为这些值分配数字是否正确?。如果测试数据中弹出一个新字符串怎么办?
请指教。
我一直在关注此链接以使用textsum.我使用提供的命令训练了模型.但我没有在'textsum/log_root /'目录中看到任何文件夹'train'.由于对样本文件进行了培训,模型是否能够处理实时测试数据?如果没有,我如何制作培训数据并培训模型?最重要的是,我如何测试/使用模型来查看结果汇总?