RM-*_*RM- 6 python bert-language-model
我想修复BERTopic库中的随机种子以获得可重现的结果。查看 BERTopic 的代码,我发现它使用了 numpy。使用就np.random.seed(123)足够了吗?或者我是否还需要其他库,如这个问题中的 random 或 pytorch 。
您可以使用 UMAP 修复该random_state变量,但还必须将其他默认参数发送到 UMAP 构造函数,否则模型将损坏。
这在实践中看起来是这样的:
umap = UMAP(n_neighbors=15,
n_components=5,
min_dist=0.0,
metric='cosine',
low_memory=False,
random_state=1337)
model = BERTopic(language="multilingual", umap_model=umap)
topics, probs = model.fit_transform(content)
Run Code Online (Sandbox Code Playgroud)
默认情况下,在构造函数中umap_model设置为。在内部,如果未提供,它会在代码中使用默认参数进行设置。NoneBERTopic
请注意,low_memory是两个构造函数中的参数,如果BERTopic调用构造函数时未使用该参数,则会在内部将其设置为False。
| 归档时间: |
|
| 查看次数: |
3098 次 |
| 最近记录: |