在线求职很繁琐.帮我自动化它

ehs*_*nul 7 ruby python regex perl nlp

许多工作网站已经破坏了不会让您按经验水平缩小工作范围的搜索.即使他们这样做,通常也是错误的.这需要您在找到相关的帖子之前浏览数百个您无法申请的帖子,这非常繁琐.由于我宁愿专注于写封面信等,我想编写一个程序来查看大量的帖子,并保存那些不需要多年经验的工作的URL.

我不需要帮助编写刮刀来获取可能相关职位的html主体.问题是准确地检测工作所需的经验水平.这不应该太困难,因为工作岗位通常非常明确("必须有5年的经验......"),但是过于简单的解决方案可能存在一些问题.

就我而言,我正在寻找入门级职位.他们通常不会说"入门级",但包含这些词语可能意味着应该保存这份工作.

接下来,我可以安全地排除一项工作说它需要"5年"的经验,所以像/\d\syears /这样的正则表达式似乎是合理的排除工作.但后来,我意识到一些工作表明他们将花费0到2年的经验,与排除的正则表达相匹配但显然是我想看的工作.嗯,我可以用另一个正则表达式处理它.但有人说"不到2年"或"不到2年".也可以处理,但它让我想知道我没有想到的其他模式,并可能排除许多工作.这就是把我带到这里的原因,找到比正则表达式更好的方法来做到这一点,如果有的话.

我想尽量减少假阴性率,并保存所有似乎可能不需要多年经验的工作.排除匹配/ [3-9]\syears | 1\d\syears /似乎合理的任何内容?或者,还有更好的方法?培训贝叶斯过滤器可能吗?

编辑:有一个类似但更难的问题,可能更有用的解决.有很多工作需要"工程学位",因为你只需要了解一些技术方面的东西.但是,搜索"工程"可以为您提供数千个工作,这些工作大多无关紧要.

我如何将其缩小到那些需要任何工程学位而不是特定学位的工作,而不是自己看每一个?

MJB*_*MJB 1

好吧,这个答案可能不会有帮助——我会先说这一点。但是,在我看来,仅仅以这种方式思考问题就足以让你在我工作过的大多数地方被录用。我的建议?联系您感兴趣的任何职位的招聘经理,告诉他们这就是您正在做的事情。告诉他们到目前为止您已经编码了哪些内容,并寻求帮助来学习他们在编写广告时使用的模式。

如果我是这封信的收件人,我想我会邀请这个人接受采访。