为了尊重我的用户的隐私,我试图在nginx日志文件中匿名他们的IP地址.
一种方法是定义自定义日志格式,如下所示:
log_format noip '127.0.0.1 - [$time_local] '
'"$request" $status $body_bytes_sent '
'"$http_referer" "$http_user_agent" $request_time';
Run Code Online (Sandbox Code Playgroud)
这种方法有两个缺点:我无法区分两个用户,也无法使用地理位置工具.
最好的办法是"缩短"IP地址(87.12.23.55
会变成87.12.23.1
).
是否有可能使用nginx配置脚本来实现这一目标?
谢谢.
刚刚发现这项新法规,它将成为2018年的法律,并影响任何存储欧盟公民数据的人,可以用来识别一个人.更多细节在这里.
我有一个页面,不存储名称和确切的地址,但它存储出生日期和国家/城市作为位置,并使用这两个提供服务(这是核心服务,所以我不能只是停止收集这些数据) .
根据我的理解,我必须采取一些行动以确保遵守GDPR,但我没有找到合理的解释.有十几篇文章重新阐述了GDPR的段落,这根本没有帮助.
我不介意完全删除,解释我存储给用户的数据和类似点...我最担心的是关于匿名数据的部分,所以如果发生违规,他们不能用来识别一个人.我该怎么做?如果我存储用于验证用户帐户的电子邮件地址,并通过PK将出生日期和位置数据绑定到经过验证的电子邮件,则他们不再是匿名的......他们不能,对吧?
是否考虑过符合GDPR标准的实用解决方案?
我正在开发一个网站,我希望通过匿名化他们的电子邮件地址来保护买家.与craigslist的系统类似,当卖家需要联系买家时,他们应该能够发送电子邮件到匿名地址,如1425415125 @ mysite.然后将com路由到用户的电子邮件地址.
我现在的计划是:
我的问题如下:
提前致谢
J.P
我正在使用 mysqldump 创建实时应用程序的数据库转储以供开发人员使用。
该数据包含客户数据。我想匿名化这些数据,即删除客户姓名/信用卡数据。
一个选项是:
但这需要很大的开销。更好的解决方案是在转储创建期间进行匿名化。
我想我最终会解析所有输出mysqlsqldump
?有没有更聪明的解决方案?
我想将真实姓名,电子邮件和任何其他个人身份信息保存在我的主应用程序数据库和其他数据库/加密文件中.而且我很好奇是否有针对此的最佳实践解决方案,或者我是否完全在寻找某些东西.
我有一些想法如下:
我想知道这是否是正确的方法,如果是这样,密钥存储和验证等等.
我已经用json文件加载了一个s3存储桶,并将其解析/展平为pandas数据框。现在我有一个175列的数据框,其中4列包含个人身份信息。
我正在寻找一种匿名化这些列(名称和地址)的快速解决方案。我需要保留多个信息,以便如果多次出现的同一个人的姓名或地址具有相同的哈希值。
我可以在熊猫或其他软件包中使用现有功能吗?
我想知道是否可以以匿名方式使用 iOS 版 Google Analytics。
目前可以:
- 禁用 IDFA ( https://developers.google.com/analytics/devguides/collection/ios/v3/optional-features )
- 匿名 IP ( https://developers.google.com/analytics/ devguides/collection/ios/v3/advanced )
但是 Google Analytics 是否可以使用其他任何标识符?
例如,Google Analytics 是否使用 IDFV?( https://developer.apple.com/documentation/uikit/uidevice/1620059-identifierforvendor )
我正在尝试为将存储客户机密数据的用户构建一个平台.上下文非常简单:法国法律禁止我访问我的用户将存储的数据(例如患者的医疗记录).
因此,当用户提交将存储在数据库中的数据时,他应该是唯一可以访问该信息的人.例如,用密码加密它.这样,如果我登录到mysql,我只会看到加密的废话并且没有可读数据.
我的哲学可能是错的,就是通过这样做来学习.希望你们对我的方法感到满意.
问题是:我不知道从哪里开始,如何做到这一点......实际上甚至没有在谷歌搜索什么.我甚至试图在codecanyon.net上找到适合的东西,并且不喜欢任何相关的脚本.
提前致谢 :) !
PS:我实际上会遇到与文件相同的问题(jpg,word,pdf,xls ......应该足够用户).但这是另一个故事.
我的问题如下:
我必须读取一个大的XML文件,50 MB; 并匿名一些与私人问题相关的标签/字段,如姓氏地址,电子邮件,电话号码等...
我确切地知道XML中的哪些标签是匿名的.
s|<a>alpha</a>|MD5ed(alpha)|e;
s|<h>beta</h>|MD5ed(beta)|e;
Run Code Online (Sandbox Code Playgroud)
其中alpha
和beta
引用其中的任何字符,也可以使用像MD5这样的算法进行哈希处理.
我只会转换标记值,而不是标记本身.
我希望,我对我的问题很清楚.我该如何实现这一目标?
我正在尝试使用正则表达式使HTML字符串匿名化,以进行SQL查询。
https://regex101.com/r/QWt1E1/1
(?<!\<)[^<>\s](?!\>)
Run Code Online (Sandbox Code Playgroud)
<p><em>Hi [User</em></p>
<p><em>Tack för visat intresse.</em></p>
<p><em>Good luck!</em><em> </em></p>
<p><em>Sincerely</em></p>
Run Code Online (Sandbox Code Playgroud)
<p><em>nn nnnnn</nm></p>
<p><em>nnnn nnnnnnnn nnnnn nnnnnnnnn</nm></p>
<p><em>nnnn nnnnn</nm><em>nnnnnn</nm></p>
<p><em>nnnnnnnnn</nm></p>
Run Code Online (Sandbox Code Playgroud)
计划是用<代替所有不在<>内的字符n
。它几乎可以工作,但是在我的示例中,它代替了e
in </em>
。不知道为什么以及如何解决。
如何调整正则表达式以不替换e
示例中的?
我需要匿名化名称,但是以非常具体的方式使整个字符串的格式仍然相同(空格,连字符,句点被保留)但所有字母都被加扰.我想一直用C代替所有A',用Z代替所有D',依此类推.我该怎么办?
通常我通过使用 hashlib 和使用 .apply(hash) 函数来匿名化我的数据。
现在我正在尝试一种新方法,想象一下我必须遵循名为“数据”的 df:
df = pd.DataFrame({'contributor':['eric', 'frank', 'john', 'frank', 'barbara'],
'amount payed':[10,28,49,77,31]})
contributor amount payed
0 eric 10
1 frank 28
2 john 49
3 frank 77
4 barbara 31
Run Code Online (Sandbox Code Playgroud)
我想通过转动名称全部变成匿名化person1
,person2
等等,是这样的:
output = pd.DataFrame({'contributor':['person1', 'person2', 'person3', 'person2', 'person4'],
'amount payed':[10,28,49,77,31]})
contributor amount payed
0 person1 10
1 person2 28
2 person3 49
3 person2 77
4 person4 31
Run Code Online (Sandbox Code Playgroud)
所以我的第一个虽然是总结name列,以便名称附加到唯一索引,我可以使用该索引作为“person”之后的数字。
因此,通过阅读这一小页进行阅读,首先我想,我只需将以下行添加到我的gtag脚本中,一切就可以了:
gtag('config', '<GA_TRACKING_ID>', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)
但是今天我意识到,也许我不太了解它,而我所做的只是愚蠢的。:)
gtag('config', 'UA-2180247-1');
gtag('config', '<GA_TRACKING_ID>', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)
所以现在我不知道第二行的外观:
gtag('config', '<UA-2180247-1>', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)
要么
gtag('config', 'UA-2180247-1', { 'anonymize_ip': true });
Run Code Online (Sandbox Code Playgroud)
或者根本不应该有两行,只有已经包含anonymize_ip的那一行...
不知何故,这对我来说不是自我解释,因为Google在文档的其他地方都有这样的示例:
gtag('config', 'GA_TRACKING_ID');
gtag('config', '<UA-2180247-1>');
Run Code Online (Sandbox Code Playgroud)
不喜欢这样,用这些括号('<>')。所以这只是拼写错误?