肖飒团队 | 个人信息也能用？AI抓取“度”在哪里？

AI大模型如今是愈发成熟、高效，几乎能满足人们的各式各样的需求。飒姐团队的小伙伴们工作之余也会用用各类AI大模型，体验一下科技的力量。但在这个过程中，飒姐团队却发现，有的AI大模型似乎会把网络上公开的个人信息进行采集，甚至可能向用户输出这些个人信息。那么问题来了，倘若大模型搜集网上公开的个人信息并反馈给了用户，这种行为是否违法甚至于构成犯罪呢？飒姐团队今日文章便为大家分析一下这个问题。

01公开的个人信息便能随意使用？

众所周知，AI大模型的训练离不开大量数据的投喂，而网络上的公开数据当然是极佳的投喂材料，能够提供大量信息和数据供AI大模型训练使用。而公开的个人信息自然也在其中。一个问题在于，个人信息一旦在网络公开，是否就能够供他人随意使用，乃至于用于AI训练以及输出呢？

对此，《民法典》第一千零三十八条虽然明确指出，“未经自然人同意，不得向他人非法提供其个人信息，但是经过加工无法识别特定个人且不能复原的除外”，但是第一千零三十六条同样指出，“合理处理该自然人自行公开的或者其他已经合法公开的信息，但是该自然人明确拒绝或者处理该信息侵害其重大利益的除外”的情况下，行为人是不承担民事责任的。

除此之外，根据《个人信息保护法》第二十七条“个人信息处理者可以在合理的范围内处理个人自行公开或者其他已经合法公开的个人信息；个人明确拒绝的除外。个人信息处理者处理已公开的个人信息，对个人权益有重大影响的，应当依照本法规定取得个人同意。”，以及《个人信息保护法》第十三条同样认为“依照本法规定在合理的范围内处理个人自行公开或者其他已经合法公开的个人信息”的情况下无须取得个人同意。

因此，综合以上法律规定，针对公开的个人信息，使用的规则如下：

（1）个人信息处理者能够处理个人自行公开或者其他已经合法公开的个人信息；

（2）但前述处理行为必须在合理范围内；且

（3）不得处理个人明确拒绝处理的个人信息；且

（4）不得未经个人同意处理会对个人权益造成重大影响的个人信息。

可见，即便是公开的个人信息，也不意味着AI大模型能够随意作为训练素材使用。

02哪些公开个人信息不能随意使用？

如前所述，对于个人明确拒绝的公开个人信息以及未经个人同意会对个人权益造成重大影响的公开个人信息便是不能随意使用的个人信息。实践中，由于后者的范畴难以确定，必须进行个案分析，飒姐团队在此仅针对个人明确拒绝处理的公开个人信息进行举例。我们认为，如下三种情况下的公开个人信息，AI大模型是不能将其作为训练材料进行使用的。

其一，所公开网站上的Robots协议明确拒绝抓取的情况。一般而言，网站上的Robots协议可以禁止某些特定主体的爬取功能，如个人信息所公开网站的Robots协议明确拒绝了爬取，那么在一定程度上能够认为公开该信息的个人不愿意其个人信息被搜索引擎、AI模型等进行爬取。因此可以被认为是不能随意使用的情况。

其二，在公开个人信息的内容中明确声明不能用于AI模型训练的情况。对于此种情况，由于个人明确拒绝他人使用其公开信息进行AI模型训练，因此应当认为该公开个人信息不能被随意使用。

其三，所公开网站或平台上的用户协议、声明、公告等文本明确其网站或平台上的公开个人信息不得用于AI模型训练的情况。此时，由于个人信息主体系在同意该用户协议、声明、公告等基础上公开了其个人信息，因此，可以认为该用户协议、声明、公告等所表达的不得用于AI模型训练的说明代表了个人的明确拒绝，进而使得该公开个人信息不得用于AI模型训练。

03违法使用公开个人信息，可能构成什么犯罪？

在明确了前述公开个人信息不得随意使用的基础上，违法使用此类个人信息就可能构成相关犯罪。其中，最可能构成的，便是侵犯公民个人信息罪。

《刑法》第二百五十三条之一规定：

“违反国家有关规定，向他人出售或者提供公民个人信息，情节严重的，处三年以下有期徒刑或者拘役，并处或者单处罚金；情节特别严重的，处三年以上七年以下有期徒刑，并处罚金。

违反国家有关规定，将在履行职责或者提供服务过程中获得的公民个人信息，出售或者提供给他人的，依照前款的规定从重处罚。

窃取或者以其他方法非法获取公民个人信息的，依照第一款的规定处罚。

单位犯前三款罪的，对单位判处罚金，并对其直接负责的主管人员和其他直接责任人员，依照各该款的规定处罚。”

根据该规定，违反国家有关规定，向他人出售或者提供公民个人信息的行为和窃取或者以其他方法非法获取公民个人信息的行为均涉嫌构成侵犯公民个人信息罪。

而根据《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第四条的规定，“违反国家有关规定，通过购买、收受、交换等方式获取公民个人信息，或者在履行职责、提供服务过程中收集公民个人信息的，属于刑法第二百五十三条之一第三款规定的‘以其他方法非法获取公民个人信息’。”在前述所获取的个人信息虽然公开但系个人明确拒绝的情况下，该行为属于违反国家有关规定，获取公民个人信息的行为，因此应当属于“以其他方法非法获取公民个人信息”的情况，进而在满足相关司法解释对于“情节严重”的要求的基础上，应当认为涉嫌构成侵犯公民个人信息罪。

04写在最后

AI大模型训练是形成好用、高效的大模型的必要过程，因而不可避免地需要大量数据的投喂，但各大企业切不可因小失大，在进行训练的同时，也要注意各类数据来源的合规，保障自身合规性。以上是今天的分享，感恩读者！

发表回复 取消回复

发表回复取消回复