我目前正在使用 Gensim LDA 进行主题建模。
在调整超参数时,我发现该模型总是给出负对数困惑度
模特有这样的表现正常吗?(这可能吗?)
如果是的话,较小的困惑是否比较大的困惑更好?(-100 比 -20 好??)
我正在处理 presto sql 并被卡住了。
我想将列变成新行并保存值。
例如:
前
NAME COMDEDY HORROR ROMANCE
brian 10 20 14
tom 20 10 11
Run Code Online (Sandbox Code Playgroud)
后
NAME GANRE RATING
brian comedy 10
brian horror 20
brian romance 14
tom comedy 20
tom horror 10
tom romance 11
Run Code Online (Sandbox Code Playgroud)
如果我不能用 prestodb 做到这一点,我至少需要用 python pandas 做到这一点
谢谢!