论文阅读笔记 | 模型水印 Embedding Watermarks into Deep Neural Networks

论文信息

摘要

最近深度神经网络取得了重大进展。共享深度神经网络的训练模型对于这些系统的研究和开发的快速进展非常重要。同时,有必要保护共享训练模型的权利。为此,我们建议使用数字水印技术来保护知识产权,并在使用训练好的模型时检测知识产权侵权情况。首先,我们提出一个新问题:将水印嵌入深度神经网络。我们还定义了深度神经网络中水印的要求、嵌入情况和攻击类型。其次,我们提出了一个使用参数正则化器在模型参数中嵌入水印的通用框架。我们的方法不会损害放置水印的网络的性能,因为水印是在训练主机网络时嵌入的。最后,我们进行了全面的实验,以揭示水印深度神经网络作为这项新研究工作基础的潜力。我们表明,我们的框架可以在从头开始训练深度神经网络期间以及微调和提炼期间嵌入水印,而不会损害其性能。即使经过微调或参数修剪,嵌入的水印也不会消失;即使修剪了 65% 的参数,水印仍然完整

背景

共享训练模型对于深度神经网络系统的研究和开发的快速发展非常重要。在这种情况下,有必要保护共享训练模型的权利。

贡献

  • 我们提出了一个新问题:在深度神经网络中嵌入水印。我们还定义了水印深度神经网络的要求、嵌入情况和攻击类型。

  • 我们提出了一种利用参数正则化器在模型参数中嵌入水印的通用框架。我们的方法不会影响网络的性能。

  • 我们进行了全面的实验,以揭示深度神经网络水印的潜力。

问题公式化

给定一个有或没有训练参数的模型网络,我们定义的水印任务为:将 $T$ 位向量 $b \in ^T$ 嵌入到一层或多层的神经网络的参数中。我们将嵌入水印的神经网络称为宿主网络,并将宿主网络最初试图执行的任务称为原始任务。

水印需求

版权声明:本博客所有文章除特别声明外,均采用 CC BY 4.0许可协议,转载请注明出处
本文链接:https://blog.redamancy.tech/academic/31