Doordash 的大规模隐私工程实践:地址遮蔽和数据保护
创始人
2024-01-08 08:41:18
0

原标题:Doordash 的大规模隐私工程实践:地址遮蔽和数据保护

作者 | Eran Stiller

译者 | 平川

策划 | Tina

最近,DoorDash 公布了他们是如何主动将隐私保护纳入其产品的。他们说明了隐私工程的重要性——这是一个经常被忽视的软件架构实践,并提供了一个例子,介绍如何隐蔽用户地址数据以更好地保护用户隐私。

DoorDash 软件工程师 Alex Dougherty 解释了实施隐私工程的动机:

为了方便送货,用户必须向我们提供一些个人信息,包括 […] 姓名、地址和电话号码 […]。Dasher 需要这些信息才能知道在哪里、向谁交付订单。由于这些信息可用于重新识别个人,所以可能被不良行为者利用并带来危害,包括身份盗窃和人肉搜索。

这就是为什么我们要确保在交付完成后的一个合理时间段内在我们的平台上削减(删除或混淆)这些个人数据。这样,即使不良行为者未经授权访问了我们的数据库,也获取不到个人数据,从而防止这些数据被滥用。

数据削减(data redaction)由 DoorDash 分布式系统中的异步作业触发。当用户的数据符合削减条件时,该作业会将消息推送到 Kafka 主题,发出清洗与该用户相关数据的信号。持有用户数据副本的服务会监听该主题,并根据请求削减数据。

利用 Kafka 消息执行数据削减的异步过程(图片来源 :https://doordash.engineering/2023/11/14/privacy-engineering-at-doordash-drive/)

用户数据削减的一个例子是地址遮蔽(geomasking)。Dougherty 指出,在保护个人敏感信息和利用数据进行分析之间存在一个错误的二分法。

他进一步解释说,DoorDash 并没有完全删除地址数据,而是使用 高斯扰动 来偏移用户的位置。该过程可防止不良行为者重新识别用户,同时又让业务人员可以执行所需的分析和业务优化。

对用户地址进行地理编码并随机偏移其坐标(图片来源 :https://doordash.engineering/2023/11/14/privacy-engineering-at-doordash-drive/)

DoorDash 使用 Spatial k-anonymity 来评估地址遮蔽过程的有效性:

Spatial k-anonymity 会生成一个值“K”,它测量在地理遮蔽完成之后可以被识别为用户“真实位置”的潜在位置的数量。有了这个值我们就可以知道,坏人选择真实位置的概率是 1/K。K 值越大,表明地理遮蔽在保护用户实际位置方面越有效。

Spatial k-anonymity 示例( 图片来源 :https://ij-healthgeographics.biomedcentral.com/articles/10.1186/s12942-020-00201-9/figures/1)

Dougherty 表示,用户所在地区的人口密度也会影响地理遮蔽的效果。在城市地区,会有许多其他的用户在实际用户附近的地方购物,这可以降低基于削减数据重新识别用户的几率。但是,在偏远地区,将位置坐标偏移相同的量可能并不足以防止用户的身份被重新识别。

Doordash 设法使 K 值保持在 5 到 20 之间。有了这个值和一个地区人口密度的近似值,他们就可以确定适当的标准偏差数,从而保证用户地址偏移可以成功地削减数据。

原文链接:

https://www.infoq.com/news/2023/12/doordash-privacy-engineering/

网游新规致腾讯网易市值半天蒸发5200亿;吴泳铭“爆改”淘天:管理层全换成有功绩的年轻人;字节年收入超腾讯、逼近Meta|Q资讯

创始人 3 天狂砍 5 万行代码后,应用程序更快、更易使用了

选择哪种编程语言已经不重要了,只提倡程序员下班后“多看看书”提升竞争力是误人子弟|独家专访亚马逊 CTO

一代更比一代强,AI 时代的至强如何为云服务保驾护航?

相关内容

热门资讯

原创 中... 今天继续分享安兔兔性价比榜单,价格区间为2000-2999元,因为新机的开售,榜单的排名再次洗牌。比...
“三大梯队”已形成,3月AI原... 5月7日,第三方智能数据服务商QuestMobile发布《2025年中国移动互联网春季报告》。报告显...
联想集团杨元庆:超级智能体已成... 智能体的玩家范围还在扩大。根据市场研究机构Gartner数据,到2027年,全球个人智能体市场规模将...
赛力斯申请电池包碰撞测试专利,... 金融界2025年5月7日消息,国家知识产权局信息显示,赛力斯汽车有限公司申请一项名为“电池包碰撞测试...
原创 科... 本文刊载于《中国科学院院刊》2025年第3期"政策与管理研究” 韩阳1 彭杰1 李东2 贾雷坡1* ...
无锡先导智能装备取得挖槽机构和... 金融界2025年5月7日消息,国家知识产权局信息显示,无锡先导智能装备股份有限公司取得一项名为“挖槽...
IBM 首席执行官:AI 已取... IT之家 5 月 7 日消息,华尔街日报今天(5 月 7 日)发布博文,报道称 IBM 首席执行官 ...
乌海推出智能适老化产品“一站式... 在老龄化与残疾人关怀需求日益增长的当下,内蒙古乌海市老年人残疾人辅具服务中心全新打造的适老化产品体验...
百度公布动物语言转换方法及装置... IT之家 5 月 7 日消息,IT之家从中国专利公布公告网获悉,北京百度网讯科技有限公司申请的“动物...
广东朝阳电子取得夹耳式耳机专利... 金融界2025年5月7日消息,国家知识产权局信息显示,广东朝阳电子科技股份有限公司取得一项名为“夹耳...
联想发布多款超级智能体,端侧A... 2025年5月7日,中国—— 在上海世博中心的舞台,联想Tech World 2025创新科技大会以...
华为鸿蒙+昇腾,盘点10家公司 在数字经济与人工智能深度融合的背景下,华为鸿蒙与昇腾技术正重塑产业格局。 鸿蒙系统自诞生便一路高歌猛...
机器人引领工业变革 科创板公司... 本报讯 (记者毛艺融)从工业机器人到具身智能,我国机器人产业发展蹄疾步稳,正成为我国制造业升级、赋能...
黄烨:谈社区居民健康产业发展策... 2003年深圳开启社区居家养老产业试点到现在已经过去二十多年,积累了很多的经验,在大数据和AI技术全...
科学家首次验证空间站3D活细胞... 本报讯(记者刁雯蕙)近日,神舟十九号载人飞船携空间站第八批空间科学实验样品顺利返回地球。其中,中国科...
四川志嘉取得一项破碎机专利,优... 金融界2025年5月7日消息,国家知识产权局信息显示,四川志嘉机械设备有限公司取得一项名为“一种破碎...
京华信息亮相2025数字中国建... 导语 2025年4月29-30日,2025年第八届数字中国建设峰会在福建省福州市隆重举办。本届峰会以...
我国重型燃机关键部件获重大突破 2025-05-07 09:21:05 作者:狼叫兽 近日,我国在重型燃气轮机关键部件自主研发领...
港科大(广州)首届“AI驱动·... 南都讯 记者孙小鹏 5月7日,首届“AI驱动·学科共融:大中协同创新人才培养研讨会”在香港科技大学(...
为什么要在每个光伏组件上并接旁... 光伏板是光伏发电系统的动力源,在讲旁路二极管之前,我们首先来讲讲什么是热斑效应。在日常的应用中,光伏...