小编Ben*_*oop的帖子

你如何实现一个良好的亵渎过滤器？

我们中的许多人需要处理用户输入,搜索查询以及输入文本可能包含亵渎语言或不良语言的情况.通常需要将其过滤掉.

哪里可以找到各种语言和方言的咒骂词？

是否有可用于包含良好列表的源的API？或者也许一个API只是简单地说"是的这是干净的"或"没有这是脏的"一些参数？

有什么好方法可以让人们试图欺骗系统,比如$$,azz或a55？

如果您提供PHP解决方案,则可获得奖励积分.:)

编辑:响应答案,只是避免程序问题:

例如,我认为这种过滤器有一个位置,例如,用户可以使用公共图像搜索来查找添加到敏感社区池的图片.如果他们可以搜索"阴茎",那么他们很可能会得到许多照片,是的.如果我们不想要那些图片,那么防止这个词作为搜索词是一个很好的看门人,尽管不可否认这不是一个万无一失的方法.首先获取单词列表是真正的问题.

所以我真的指的是一种方法来弄清楚单个令牌是否脏,然后简单地禁止它.我不打算像完全搞笑的"长颈长颈鹿"参考那样阻止一种情绪.你无能为力.:)

php regex multilingual user-input

Ben*_*oop

2019 04-26

200
推荐指数

11
解决办法

10万
查看次数

MD5产生碰撞之前有多少随机元素？

我在Amazon S3上有一个图像库.对于每个图像,我md5我的服务器上的源URL加上一个时间戳来获取唯一的文件名.由于S3不能有子目录,我需要将所有这些图像存储在一个平面文件夹中.

我是否需要担心产生的MD5哈希值中的冲突？

额外奖励:在我开始看到MD5产生的哈希值发生冲突之前,我可以拥有多少个文件？

random hash md5

Ben*_*oop

2012 04-30

155
推荐指数

6
解决办法

7万
查看次数

通过在图像内容上运行MD5来为随机图像生成唯一文件名的任何警告？

我想为每个图像生成唯一的文件名,所以我使用MD5来制作文件名.由于两个相同的图像可能来自不同的位置,我想实际上将哈希基于图像内容.这有什么警告？

(使用PHP5执行此操作以获得它的价值)

random hash filenames md5 image

Ben*_*oop

lucky-day

6
推荐指数

2
解决办法

2346
查看次数

标签统计

hash ×2

md5 ×2

random ×2

filenames ×1

image ×1

multilingual ×1

php ×1

regex ×1

user-input ×1

你如何实现一个良好的亵渎过滤器？

编辑:响应答案,只是避免程序问题:

MD5产生碰撞之前有多少随机元素？

通过在图像内容上运行MD5来为随机图像生成唯一文件名的任何警告？

标签 统计

小编Ben_oop的帖子

标签统计