我正在寻找 LDA 和 NTM 之间的区别。您将在 NTM 上使用 LDA 的一些用例是什么?
根据 AWS 文档:
LDA:Amazon SageMaker 潜在狄利克雷分配 (LDA) 算法是一种无监督学习算法,它试图将一组观察结果描述为不同类别的混合。LDA 最常用于发现文本语料库中文档共享的用户指定数量的主题。
虽然您可以同时使用 Amazon SageMaker NTM 和 LDA 算法进行主题建模,但它们是不同的算法,预计会对相同的输入数据产生不同的结果。
是否有任何公式可用于确定multipart_threshold和mutilpart_chunksize的最佳设置?假设如果我尝试使用分段上传在S3中上传2 TB文件,那么阈值和块大小的最佳值是什么。任何使用多部分上传/下载的脚本将不胜感激。