标签: anonymize

匿名化nginx中的IP日志记录?

为了尊重我的用户的隐私,我试图在nginx日志文件中匿名他们的IP地址.

一种方法是定义自定义日志格式,如下所示:

log_format noip '127.0.0.1 - [$time_local]  '
    '"$request" $status $body_bytes_sent '
    '"$http_referer" "$http_user_agent" $request_time';
Run Code Online (Sandbox Code Playgroud)

这种方法有两个缺点:我无法区分两个用户,也无法使用地理位置工具.

最好的办法是"缩短"IP地址(87.12.23.55会变成87.12.23.1).

是否有可能使用nginx配置脚本来实现这一目标?

谢谢.

ip logging nginx anonymize

27
推荐指数
2
解决办法
9764
查看次数

符合GDPR标准

刚刚发现这项新法规,它将成为2018年的法律,并影响任何存储欧盟公民数据的人,可以用来识别一个人.更多细节在这里.

我有一个页面,不存储名称和确切的地址,但它存储出生日期和国家/城市作为位置,并使用这两个提供服务(这是核心服务,所以我不能只是停止收集这些数据) .

根据我的理解,我必须采取一些行动以确保遵守GDPR,但我没有找到合理的解释.有十几篇文章重新阐述了GDPR的段落,这根本没有帮助.

我不介意完全删除,解释我存储给用户的数据和类似点...我最担心的是关于匿名数据的部分,所以如果发生违规,他们不能用来识别一个人.我该怎么做?如果我存储用于验证用户帐户的电子邮件地址,并通过PK将出生日期和位置数据绑定到经过验证的电子邮件,则他们不再是匿名的......他们不能,对吧?

是否考虑过符合GDPR标准的实用解决方案?

security data-security anonymize

22
推荐指数
1
解决办法
3871
查看次数

电子邮件匿名化与C#中的Craigslist类似

我正在开发一个网站,我希望通过匿名化他们的电子邮件地址来保护买家.与craigslist的系统类似,当卖家需要联系买家时,他们应该能够发送电子邮件到匿名地址,如1425415125 @ mysite.然后将com路由到用户的电子邮件地址.

我现在的计划是:

  1. 设置一个桶(全包)收件箱
  2. 为每个买家生成一个随机密钥,该密钥将是电子邮件地址的用户特定('1425415125'上方)部分
  3. 监视存储桶收件箱并解析此用户特定部分.一旦我知道了用户,就可以将电子邮件转发到正确的地址

我的问题如下:

  1. 你能看到上述解决方案的任何问题吗?
  2. 是否存在针对现有问题的开源解决方案
  3. 在开发这样的系统时,是否有人应该注意的问题?

提前致谢

J.P

c# email anonymize craigslist

9
推荐指数
1
解决办法
2361
查看次数

MySQL 转储的动态匿名化

我正在使用 mysqldump 创建实时应用程序的数据库转储以供开发人员使用。

该数据包含客户数据。我想匿名化这些数据,即删除客户姓名/信用卡数据。

一个选项是:

  • 创建数据库副本(创建转储和导入转储)
  • 触发对数据进行匿名化的 SQL 查询
  • 转储新数据库

但这需要很大的开销。更好的解决方案是在转储创建期间进行匿名化。

我想我最终会解析所有输出mysqlsqldump?有没有更聪明的解决方案?

php mysql anonymize

7
推荐指数
1
解决办法
6169
查看次数

匿名化您的应用程序数据库

我想将真实姓名,电子邮件和任何其他个人身份信息保存在我的主应用程序数据库和其他数据库/加密文件中.而且我很好奇是否有针对此的最佳实践解决方案,或者我是否完全在寻找某些东西.

我有一些想法如下:

  • 用户使用在主数据库中进行哈希处理的用户名和密码登录
  • 然后,此服务器使用用户的id对成员数据库进行某种安全调用
  • 作为回报,会员数据库返回姓名,电子邮件,地址等.

我想知道这是否是正确的方法,如果是这样,密钥存储和验证等等.

database security anonymize hipaa

5
推荐指数
1
解决办法
316
查看次数

在Pandas DataFrame Python中使用pii匿名化特定列

我已经用json文件加载了一个s3存储桶,并将其解析/展平为pandas数据框。现在我有一个175列的数据框,其中4列包含个人身份信息。

我正在寻找一种匿名化这些列(名称和地址)的快速解决方案。我需要保留多个信息,以便如果多次出现的同一个人的姓名或地址具有相同的哈希值。

我可以在熊猫或其他软件包中使用现有功能吗?

python privacy anonymize pii pandas

5
推荐指数
1
解决办法
1914
查看次数

5
推荐指数
1
解决办法
402
查看次数

加密mysql数据库

我正在尝试为将存储客户机密数据的用户构建一个平台.上下文非常简单:法国法律禁止我访问我的用户将存储的数据(例如患者的医疗记录).

因此,当用户提交将存储在数据库中的数据时,他应该是唯一可以访问该信息的人.例如,用密码加密它.这样,如果我登录到mysql,我只会看到加密的废话并且没有可读数据.

我的哲学可能是错的,就是通过这样做来学习.希望你们对我的方法感到满意.

问题是:我不知道从哪里开始,如何做到这一点......实际上甚至没有在谷歌搜索什么.我甚至试图在codecanyon.net上找到适合的东西,并且不喜欢任何相关的脚本.

提前致谢 :) !

PS:我实际上会遇到与文件相同的问题(jpg,word,pdf,xls ......应该足够用户).但这是另一个故事.

php mysql encryption anonymize

4
推荐指数
1
解决办法
1531
查看次数

如何为选定的标签匿名XML数据?

我的问题如下:

我必须读取一个大的XML文件,50 MB; 并匿名一些与私人问题相关的标签/字段,如姓氏地址,电子邮件,电话号码等...

我确切地知道XML中的哪些标签是匿名的.

 s|<a>alpha</a>|MD5ed(alpha)|e;
 s|<h>beta</h>|MD5ed(beta)|e;
Run Code Online (Sandbox Code Playgroud)

其中alphabeta引用其中的任何字符,也可以使用像MD5这样的算法进行哈希处理.

我只会转换标记值,而不是标记本身.

我希望,我对我的问题很清楚.我该如何实现这一目标?

python xml perl anonymize

3
推荐指数
1
解决办法
969
查看次数

用正则表达式匿名化html

我正在尝试使用正则表达式使HTML字符串匿名化,以进行SQL查询。

https://regex101.com/r/QWt1E1/1

(?<!\<)[^<>\s](?!\>)
Run Code Online (Sandbox Code Playgroud)
<p><em>Hi [User</em></p>
<p><em>Tack f&ouml;r visat intresse.</em></p>
<p><em>Good luck!</em><em>&nbsp;</em></p>
<p><em>Sincerely</em></p>
Run Code Online (Sandbox Code Playgroud)
<p><em>nn nnnnn</nm></p>
<p><em>nnnn nnnnnnnn nnnnn nnnnnnnnn</nm></p>
<p><em>nnnn nnnnn</nm><em>nnnnnn</nm></p>
<p><em>nnnnnnnnn</nm></p>
Run Code Online (Sandbox Code Playgroud)

计划是用<代替所有不在<>内的字符n。它几乎可以工作,但是在我的示例中,它代替了ein </em>。不知道为什么以及如何解决。

如何调整正则表达式以不替换e示例中的?

html regex anonymize

3
推荐指数
1
解决办法
49
查看次数

在R中 - 如何用其他字母替换字符串中的所有字母?

我需要匿名化名称,但是以非常具体的方式使整个字符串的格式仍然相同(空格,连字符,句点被保留)但所有字母都被加扰.我想一直用C代替所有A',用Z代替所有D',依此类推.我该怎么办?

r anonymize

2
推荐指数
1
解决办法
100
查看次数

匿名数据/替换名称

通常我通过使用 hashlib 和使用 .apply(hash) 函数来匿名化我的数据。

现在我正在尝试一种新方法,想象一下我必须遵循名为“数据”的 df:

df = pd.DataFrame({'contributor':['eric', 'frank', 'john', 'frank', 'barbara'],
                   'amount payed':[10,28,49,77,31]})

  contributor  amount payed
0        eric            10
1       frank            28
2        john            49
3       frank            77
4     barbara            31
Run Code Online (Sandbox Code Playgroud)

我想通过转动名称全部变成匿名化person1person2等等,是这样的:

output = pd.DataFrame({'contributor':['person1', 'person2', 'person3', 'person2', 'person4'],
                       'amount payed':[10,28,49,77,31]})

  contributor  amount payed
0     person1            10
1     person2            28
2     person3            49
3     person2            77
4     person4            31
Run Code Online (Sandbox Code Playgroud)

所以我的第一个虽然是总结name列,以便名称附加到唯一索引,我可以使用该索引作为“person”之后的数字。

hash anonymize pandas

2
推荐指数
1
解决办法
2935
查看次数

如何设置gtag anonymize_ip?我做错了吗?

因此,通过阅读这一小页进行阅读,首先我想,我只需将以下行添加到我的gtag脚本中,一切就可以了:

gtag('config', '<GA_TRACKING_ID>', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)

但是今天我意识到,也许我不太了解它,而我所做的只是愚蠢的。:)

gtag('config', 'UA-2180247-1');
gtag('config', '<GA_TRACKING_ID>', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)

所以现在我不知道第二行的外观:

gtag('config', '<UA-2180247-1>', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)

要么

gtag('config', 'UA-2180247-1', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)

或者根本不应该有两行,只有已经包含anonymize_ip的那一行...

不知何故,这对我来说不是自我解释,因为Google在文档的其他地方都有这样的示例:

gtag('config', 'GA_TRACKING_ID');
gtag('config', '<UA-2180247-1>');
Run Code Online (Sandbox Code Playgroud)

不喜欢这样,用这些括号('<>')。所以这只是拼写错误?

google-analytics anonymize gtag.js

1
推荐指数
1
解决办法
762
查看次数