OpenAI隐私过滤器正式上线:本地运行防个人信息上传,Apache 2.0协议开源
5月10日,据至顶网报道,OpenAI最新发布的隐私过滤器(Privacy Filter)已正式在GitHub和Hugging Face平台上线,采用Apache 2.0开源协议。该工具定位为一款可在本地设备端运行的敏感信息检测与脱敏模型,旨在解决开发者在使用云端大模型时面临的个人信息泄露风险,确保用户数据在处理前的隐私合规安全性。
在技术架构上,Privacy Filter采用双向Token分类机制与混合专家(MoE)设计,模型总参数量为15亿,但每次推理仅激活约5000万参数,大幅降低了算力门槛。该模型借助约束维特比解码算法,能够对输入序列进行一次性标注,在浏览器或笔记本电脑上即可流畅运行,无需调用云端API,从根源上削减了敏感数据在传输过程中的网络暴露面。
该模型支持长达12.8万Token的上下文窗口,可单次扫描长篇法律文件或日志数据。在识别维度上,Privacy Filter覆盖了八类核心敏感信息,包括姓名、地址、电子邮箱、电话号码、URL链接、日期、账号(银行卡号等)以及机密信息(如API密钥)。相比传统正则表达式,其上下文感知能力能够有效区分企业公开地址与个人家庭住址,减少误判。性能方面,在修正标注问题的PII-Masking-300k基准测试中,其F1分数达到97.43%,精准率达到96.79%,召回率为98.08%。
对于企业开发者和合规人员而言,这一端侧隐私过滤机制是构建合规体系的关键环节。在用户将查询或私密文档发送给云端大模型前,作为预过滤层直接在本地屏蔽核心数据,有效契合了全球日趋严格的数据跨境传输与敏感信息保护法规。不过,OpenAI在模型文档中特别注明,该工具并非万能的匿名化软件,在法律、医疗和金融等高敏感领域仍需结合人工审核以规避重识别风险。
OpenAI正式上线Codex for Chrome浏览器扩展 深度集成AI编程智能体至网页工作流
« 上一篇
2026-05-10
OpenAI默认模型升级至GPT-5.5 Instant:幻觉率锐减52.5%,全量免费开放引行业震动
下一篇 »
2026-05-10