我们公司通讯录想拿去给AI去重,涉及手机号和邮箱,法务不在我能不能先传?

深圳龙华,我们这边一个30人的小团队,我是运营,这周老板让我把全公司员工通讯录去重整理,方便后面群发通知。表格里有姓名、部门、手机号、公司邮箱、部分家庭紧急联系人。我昨天用Excel搞半天还是有重复,打算丢到某个在线AI表格工具里一键去重。 问题是卡在隐私这块。时间挺赶的,今晚就要给领导初版。我翻了下那个AI工具的说明,写着“数据仅用于处理,短期存储”,但也有云端训练的字样,而且服务器在哪也没写清。我们公司没有明确的AI使用规范,法务和IT今天都出差,微信也没回。 我现在有点...

Viewed 0

深圳龙华,我们这边一个30人的小团队,我是运营,这周老板让我把全公司员工通讯录去重整理,方便后面群发通知。表格里有姓名、部门、手机号、公司邮箱、部分家庭紧急联系人。我昨天用Excel搞半天还是有重复,打算丢到某个在线AI表格工具里一键去重。

问题是卡在隐私这块。时间挺赶的,今晚就要给领导初版。我翻了下那个AI工具的说明,写着“数据仅用于处理,短期存储”,但也有云端训练的字样,而且服务器在哪也没写清。我们公司没有明确的AI使用规范,法务和IT今天都出差,微信也没回。

我现在有点慌:1) 这种包含手机号和邮箱的内部通讯录能不能上传到第三方AI工具?算不算个人敏感信息泄露风险?2) 如果必须要用,有没有相对稳妥的做法,比如脱敏到什么程度才安全,去掉姓名只保留手机号也不行吧?3) 有没有离线的工具或Excel公式能快速做去重、合并、查重标记,起码先把版本交上去不挨骂。

我是真的不太懂合规这块,又不想明天被追责,懂的指条路,今晚得搞定。

1 Answers

不建议在没有明确授权、法务和IT均无法确认的情况下,把包含手机号、公司邮箱与紧急联系人的公司通讯录上传到第三方在线AI工具。员工通讯录属于个人信息,外传存在合规与泄露双重风险;你提到该工具“短期存储、可能参与云端训练且服务器位置不明”,风险不可控。今晚要交初版,优先用离线方案即可在本地安全完成去重与标记。

公司通讯录能不能上传给AI去重?风险点在哪

  • 合规与授权边界
    • 你不是数据处理决策方,是否交由第三方处理应由公司授权并留痕(邮件/制度/合同),个人业务便利不是合法依据。
    • 员工在入职时通常仅同意“内部联络使用”,并不等于同意外部AI服务使用;若平台存在“用于模型训练/产品改进”,用途已超出内部联络范围。
  • 技术与平台不确定性
    • 工具未明确数据存储地域、保留时长、是否跨境传输、是否默认进入训练集、删除与退出机制,均为典型隐私黑箱。
    • 在线服务存在被入侵、误配置、二次使用等风险。平台写“短期存储”并不等于零风险,且责任链条复杂。
  • 建议对照平台隐私政策与数据处理条款
    • 在任何上传前,至少核对该平台的隐私政策/数据使用说明/企业数据处理协议(DPA)是否承诺“不开启训练”“限定用途”“可删除”。常见平台政策入口通常在官网页脚“隐私政策/Privacy/Terms”(示例:微信生态产品会在 https://weixin.qq.com/ 统一挂接隐私与条款链接;其他工具也应在其官网页脚列出隐私与服务条款)。
    • 若政策含糊或含“用于改进服务/训练模型”的字样,属高风险场景,不宜上传。

结论:在公司未明确授权、平台未签署数据处理协议且未关闭训练的情况下,上传通讯录不合规且不安全。

今晚要交付:离线去重/查重/合并的稳妥做法

优先本地完成,确保不出网、不外传。以下三种方案,任选其一即可交付初版。

  • Excel 原生功能(最快)
    1. 标记重复:假设手机号在B列,在C2输入“=COUNTIF(B:B,B2)”,向下填充;>1 即为重复。
    2. 高亮重复:选中B列 → 开始 → 条件格式 → 突出显示单元格规则 → 重复值。
    3. 一键去重:选中整表 → 数据 → 删除重复值 → 勾选“手机号”(可同时勾选“邮箱”避免跨字段误差)。
    4. 合并保留信息:先用“高级筛选”提唯一手机号,再用VLOOKUP/XLOOKUP把姓名、部门、邮箱回填。
  • WPS 表格(离线版)
    • 数据 → 删除重复项;或使用“智能工具箱-数据清理-重复项处理”。确保为桌面离线版,关闭云文档同步。
  • 本地 Python(适合数据量稍大)
    • 准备:离线安装 Python 与 pandas/openpyxl(无网环境可用企业镜像或U盘包)。
    • 示例脚本(本机运行,目录内读写):
      import pandas as pd
      df = pd.read_excel('通讯录.xlsx')
      df_clean = df.drop_duplicates(subset=['手机号','公司邮箱'], keep='first')
      df_clean.to_excel('去重后.xlsx', index=False)
    • 本地操作提示:
      • 在公司受控电脑、本地磁盘操作;不要放到个人网盘、同步盘或群聊中转。
      • 先制作加密压缩包备份(仅本机保存),设置访问权限,避免误删与扩散。
      • 处理完成后清理临时文件与回收站,确认仅保留“最小必要版本”。

对照小结:

  • 安全做法:Excel/WPS/本地Python离线处理、最小必要字段、加密备份、权限受控。
  • 不安全做法:在线AI工具上传、云盘中转、在个人设备或非受控账号处理、把含紧急联系人等敏感字段一并外传。

如果被要求“必须用AI”,最低限度的脱敏与前置条件

前置条件缺一不可:公司邮件或IM文字明确授权;平台隐私政策承诺“不会将上传数据用于训练”“限定用途于表格处理”“可随时删除/导出”;企业版/受控版工具优先,有DPA或企业级承诺(如一些办公套件的企业版会承诺不用于训练)。若无法满足,建议回绝。

在极端不得不传的情形,做最低限度脱敏(风险仍在):

  • 列级删除:紧急联系人、家庭号码、住址等与去重无关字段整列删除。
  • 姓名替换:用工号/内部ID替代姓名。
  • 手机号:仅保留前3后4位(用于人工核对),实际去重请在本地完成再上传脱敏版做辅助处理。
  • 邮箱:保留域名,前缀脱敏为匿名ID(emp001@company.com)。如公司邮箱前缀与姓名强关联,应改为内部UID。
  • 分文件最小化:仅上传为完成任务所需的最小字段子集(例如仅含去重结果标记与匿名ID映射表,不含原始清单)。

再次强调:脱敏不等于没风险,可被外部数据拼接还原,且越权性质不因脱敏而改变。

交付与留痕:今晚稳住,明天补齐合规

  • 书面留痕:给老板发一封简短邮件/IM,说明“已用离线工具完成去重与查重标记,未向任何第三方平台上传,等待法务与IT确认是否可使用在线工具处理后续工作”,抄送自己与项目群,保留截图。
  • 询问要点(明日对接法务/IT)
    • 是否允许将员工通讯录交给第三方处理?
    • 是否必须使用企业版工具且签署DPA?数据存储地域与训练开关能否关闭?
    • 是否提供公司内网/VDI/本地脚本方案替代?
  • 长期建议:推动采用企业级办公AI(如具备企业承诺的表格智能清洗/插件),由IT统一开关“数据不用于训练”,并完善“数据分级、最小必要、审批留痕、供应商评估、删除与退出机制”的流程。

一句话建议:今晚用离线工具交付可用版本,别冒在线外传的合规风险;待法务与IT确认后,再评估是否引入合规的企业级AI方案。

本文不构成法律意见或合规结论;具体政策与平台条款以公司制度与平台官方隐私/条款为准。如涉及较大数据量或潜在跨境传输,建议尽快咨询公司法务并保存全部授权与操作记录。