在花了几天试图完成这项任务之后,我想分享一下我如何回答这个问题的经验:
如何使用TS对象检测来训练使用我自己的数据集?
我决定深入研究ML并且通过大量的试验和错误能够使用TS'开始创建模型.
为了更进一步,我想使用他们的Object Detection API.但他们的输入准备说明,参考Pascal VOC 2012数据集的使用,但我想在我自己的数据集上进行培训.
这是否意味着我需要将我的数据集设置为Pascal VOC或Oxford IIT格式?如果是,我该怎么做呢?
如果不是(我的直觉就是这种情况),那么在我自己的数据集中使用TS对象检测的替代方案是什么?
旁注: 我知道我训练过的初始模型不能用于本地化,因为它是一个分类器
编辑:
对于那些仍在寻求实现这一目标的人来说,这就是我去做的方式.
我正在创建一个简单的计算器应用程序,目前正在努力删除我的按钮被点击时的最后一个字符.我正在使用该dropLast()
方法,但我一直收到错误
在调用中缺少参数#1的参数
@IBAction func onDelPressed (button: UIButton!) {
runningNumber = runningNumber.characters.dropLast()
currentLbl.text = runningNumber
}
Run Code Online (Sandbox Code Playgroud) cv2.HOGDescriptor()
我正在尝试使用默认的人员分类器从摄像机的源中检测人员。
识别器有点工作,但老实说,我在理解分别分配给winStride
、padding
和scale
的值时遇到了问题groupThreshold
。
目前,相机输入的帧大小为1280 X 720,我将其大小调整为400 X 400detectMultiScale
,然后使用参数执行
hogParams = {'winStride': (8, 8), 'padding': (32, 32), 'scale': 1.05, 'finalThreshold': 2}
Run Code Online (Sandbox Code Playgroud)
根据这个答案,我了解这些参数的作用和代表的含义。
我的问题是,有没有办法将图像大小与这些值映射?数学方程?一种估算方法?我不一定要求一种具体的方法,甚至一种给出所有值的方法,但比试错或幻数更好的方法。
大多数参考文献和教程几乎都使用幻数,但没有给出它们如何获得它们的建议。
我正在尝试在Ubuntu 16.04中安装nana C ++库。
我下载了该文件并将其解压缩到带有helloworld文件的目录中,然后转到带有makefile的目录;nana / build / makefile,并输入make
但出现错误
X11 / Xft / Xft.h:没有这样的文件或目录
我检查了/ usr / include / X11是的,它不存在。谷歌搜索并没有帮助解决Xft的安装问题。我该怎么做?还是我做错了其他事?
我正在尝试转换以下Swift 2.3代码:
//Example usage:
//(0 ..< 778).binarySearch { $0 < 145 } // 145
extension CollectionType where Index: RandomAccessIndexType {
/// Finds such index N that predicate is true for all elements up to
/// but not including the index N, and is false for all elements
/// starting with index N.
/// Behavior is undefined if there is no such N.
func binarySearch(predicate: Generator.Element -> Bool)
-> Index {
var low = startIndex
var high = endIndex
while low …
Run Code Online (Sandbox Code Playgroud) 这个问题的扩展,这一个.
TLDR; 我正在尝试使用自己的数据集训练TS Object Detection API.为了证明概念,我决定将我的数据集粘贴到Pascal VOC 2012基准测试中.
目前,我正在尝试使用Pascal VOC注释创建TFRecord.
在他们的create_pascal_tf_record.py脚本中查看这一行,他们只是抓住飞机的描述符 ; 一个更好的词,文本文件的运气.为什么会这样?那些其他类的描述符怎么样?
边注
这个文件; 标题为aeroplane_train.txt,与VOC2012/ImageSets/Main /中的Pascal VOC 2012数据集一起被包括在内.
查看文件,第一个条目表示图像名称,-1或1表示该特定图像是否包含我们感兴趣的类(飞机).
aeroplane_train.txt文件的部分内容
2008_000008 -1
2008_000015 -1
2008_000019 -1
2008_000023 -1
2008_000028 -1
2008_000033 1
2008_000036 -1
2008_000037 1
2008_000041 -1
2008_000045 -1
2008_000053 -1
2008_000060 -1
2008_000066 -1
2008_000070 -1
2008_000074 -1
2008_000085 -1
2008_000089 -1
2008_000093 -1
2008_000095 -1
2008_000096 -1
2008_000097 -1
2008_000099 -1
2008_000103 -1
2008_000105 …
Run Code Online (Sandbox Code Playgroud)