我想从头开始训练 gpt 2,但我发现的文章中只有基于预训练模型的微调方法。我已经使用这个https://github.com/nshepperd/gpt-2来训练现有模型。我应该编辑这些 Python 脚本以从头开始训练吗?
我正在使用SimpleNLG 4.4.2复数形式的名词:
final XMLLexicon xmlLexicon = new XMLLexicon();
final WordElement word = xmlLexicon.getWord("apple", LexicalCategory.NOUN);
System.out.println(word);
System.out.println(word.getFeature(LexicalFeature.PLURAL));
Run Code Online (Sandbox Code Playgroud)
然而即使是这样一个简单的例子,getFeature返回null代替apples.我究竟做错了什么?
我们已经建立了一个系统来分析一些数据并以简单的英语输出一些结果(即没有图表等)。当前的实现依赖于大量模板和一些随机化,以便为文本提供尽可能多的多样性。
我们想切换到更高级的东西,希望生成的文本不那么重复,听起来不那么机械化。我在谷歌上搜索了很多,但我找不到具体的东西开始。有任何想法吗?
编辑:馈送到 NLG 机制的数据采用 JSON 格式。这是一个关于网络分析数据的示例。json 文件可能包含例如一个指标(例如访问量)、它在过去 X 天的值、最后一个值是否是预期的以及哪些维度(例如国家或营销渠道)影响了它的变化。
当前的实现可以给出这样的东西:
主要来自 ABC 电子邮件活动的英国总体访问量达到 10K(+20% DoD),比预期值高 10%。用户主要登陆 XXX 页面,而跨设备的增长是一致的。
我们正在寻找一种方法来减少对模板的依赖,听起来更自然并增加词汇量。
我正在使用 TensorFlow version=2.0.0 python version=3.7.3 我正在尝试导入以下语句
from tensorflow.contrib import rnn
Run Code Online (Sandbox Code Playgroud)
它给出了错误,因为模块 'tensorflow' 没有属性 'contrib' 我该如何解决这个问题?
我正在尝试在 NLG 的帮助下生成产品描述。例如,如果我指定产品的属性(例如手机),例如其操作系统、RAM、处理器、显示器、电池等,它应该向我输出手机的可读描述。我看到有一些付费服务(Quill、Wordsmith 等)也是如此。然后我遇到了 NLG 的开源 Java API - simplenlg。我看到如何通过指定句子短语和特征(如时态、询问等)来创建句子,但没有看到从文本创建描述的选项。
有谁知道如何使用 simplenlg 从单词创建文本描述?
是否有其他工具/框架/API 可用于完成此任务(不限于 Java)?