小编Nuh*_*hdy的帖子

文本分类超出了关键字的依赖性,并推断出实际含义

我正在尝试开发一个文本分类器,将一个文本分类为PrivatePublic。以医疗或健康信息为例。我可以想到的典型分类器将关键字视为主要的区分符,对吗?像波纹管这样的场景呢?如果两条文本都包含相似的关键字但含义不同,该怎么办。

以下文字揭示了某人的私人(健康)状况(患者患有癌症):

我去过两个clinics和我的pcp。我ultrasound只能被告知这是一个解决方案cyst或解决方案hematoma,但是它越来越大,开始使我的腿变大ache。之所以PCP说不能,是cyst因为它起步太大,我发誓injured我的腿永远都没有,甚至没有bump。我现在感到害怕和恐惧cancer。仅在大约9个月前蹲下时,我才感到有点不适。3个月前我去蹲下收起衣服,有点麻烦hurt。在pain促使我开始审视自己leg,这是当我注意到lump在我小腿的底部muscle和弯曲只有变得更加明显。最终在四次clinic拜访之后,一个ultrasound和一个pcp结果似乎是积极的,而且人数越来越大。
[私人](正确分类)

接下来的一段文字是医生的评论,绝对没有透露健康状况。它介绍了典型分类器模型的缺点:

不要害怕,不要承担任何坏事cancer。我已经经历了几次案件,对我clinic来说似乎很熟悉。正如您提到的,它可能是a cyst或a hematoma,并且越来越大,它必须需要一些其他字符,diagnosis例如biopsy。有一个ache在该领域或的大小lump并没有真正告诉任何东西bad。你应该访问专门clinics几次,并且在某些特定的测试,如走biopsyCT scanpcpultrasound在此之前,lump变得更加大。
[私人](分类错误。应为[公开]) …

python nlp text-classification natural-language-processing

9
推荐指数
1
解决办法
301
查看次数