如何使用文本分析来调查问卷调查？

Question

如何使用文本分析来调查问卷调查？

Sim*_*n F 6 python statistics computer-science text-analysis lexical-analysis

我是一个学生团队的"程序员",旨在调查我的文法学校的满意度和一般问题.我们有一个基于1-6的量表构建的问题,我们通过我在python中编写的图表软件来解释这些答案.

现在,<textarea>在我们的问号结束时,人们可以随心所欲地使用它.我目前正在考虑如何使这些数据可用(我们不想阅读超过800多个答案).

如何在Python中使用文本分析来调查学生写的内容？我想到了一种方法来"标记"任何写下来的句子,例如:

I don't like being in school. [wellbeing][negative]
I have way too much homework. [homework][much]
I think there should be more interesting projects. [projects][more]

Run Code Online (Sandbox Code Playgroud)

有没有可行的方法来获得它？使用现有的标记化器是否有意义？

谢谢你的帮助!

Answer 1

小智 2

好吧，我只是在这里提出想法......但我能想到的一种方法是，

首先使用聚类算法对响应进行聚类。像 K-means 之类的东西，或者你可以使用 LDA 之类的东西进行主题建模。
然后，您可以使用标记方法进行文本分析，在从步骤 1 获得的每个集群/主题中生成频繁/相关的关键字。

为什么第 1 步是个好主意？好吧，在我看来，在进行文本分析时，如果你随意标记句子，你可以生成很多标签，其中很多标签在上下文中都是相似的。因此，您的可用性可能会下降，您仍然需要分析每个句子的大量标签。

使用聚类/主题建模也可以帮助在一定程度上减少上下文问题。因此，我认为更有用。

归档时间：	13 年，5 月前
查看次数：	844 次
最近记录：	9 年，10 月前