我正在启动一个关于知识库的项目,并想从下载最近的维基数据转储开始。我发现了一个名为“truthy”的数据转储,但我不确定是否可以信任它。
\n\n我对流行文化的理解是,“真实”的陈述是不真实的,仅基于直觉和感知。谢谢,科尔伯特先生。
\n\n为什么维基数据会产生一个数据不准确的“真实”数据转储?
\n\n同样令人困惑的是存在相互冲突的定义。例如,这是“真实”数据的定义直接来自维基媒体组织的
\n\n\n\n\n真实的语句表示对于给定属性具有最佳\n 未弃用排名的语句。也就是说,如果属性 P2 存在首选语句,则只有 P2 的首选语句才会被视为真实。
\n
对我来说,这句话意味着真实的陈述(事实三重)是首选。
\n\n这个其他网页是这样描述“真相”的:
\n\n\n\n\n这仅包含 \xe2\x80\x9ctruthy\xe2\x80\x9d 或 \xe2\x80\x9cbest\xe2\x80\x9d 语句,没有限定符或引用。
\n
我这有什么用?这个“真实”的数据可靠可信吗?
\n在维基数据中,每个语句都有一个关联的排名:首选排名、正常排名、不推荐排名。默认值是正常排名,但每个人(注册和匿名用户)都可以将排名更改为其他值之一。没有强制执行如何分配等级的规则。通常,已弃用的等级用于已证明的错误。首选排名通常用于时间序列中的最新值。
“真实”数据转储不包含任何具有已弃用等级的语句,并且如果存在具有正常等级和首选等级的语句,则只有具有首选等级的语句位于转储中。
如果您想与 Wikidata 社区取得联系,请转至Wikidata 项目聊天。如果您希望直接与维基数据/维基库的开发者沟通,请访问此页面。