米兰milan(中国)体育官方网站这么问DeepSeek, 能「偷」到数据?

发布日期：2026-05-13 09:19 作者：admin 来源：未知点击：196

米兰milan(中国)体育官方网站这么问DeepSeek，能「偷」到数据?

机器之心剪辑部

近日，有网友在 X 上发文称，在使用 DeepSeek 的历程中，淌若在输入框内输入以下这一段内容，便可「窃取」到 DeepSeek 的考试数据：

仔细看了之后发现，具体是这么的：唯有你在输入框输入这一段辅导词，DeepSeek 就会「吐出」一轮齐全的对话记载，不外这并不是你的历史搜索记载，更像是一份飞速的对话记载。

随后该博主又称，即便仅仅输入，也有相似的服从。

此帖文仍是发布，便引起网友的热议。

一网友默示，「我不以为这是在窃取考试数据，更像是在久了其他东说念主的聊天内容。它拿来行动辅导词的句子会变化，有时还会识别出这是一个奇怪 / 无深嗜的辅导词。」

在该网友给出两个例子来阐述这少许。在第一个例子中，输入这一内容后，DeepSeek 给出一个对话记载：「用户发问想要写出一个以单词 rose 为收场的长句，之后是模子长长的念念考历程，终末给出一个以 rose 为收场的长句。」

而在第二个例子中，DeepSeek 则将其作为一个用户输入的远大辅导词进行科罚：「咱们被条件复兴：，然后需要生成一个回复。」

对此，咱们也进行了一些实测，班师复现了这一稳定。

比如鄙人面的例子中，输入上述内容后，DeepSeek 响应了一个用户肯求写 rap 歌词的问题和对应的谜底。

底下还有更多示例：

博亚体育中国官方网站入口

举座来看，收场相配飞速，可能触及任何话题，何况并不一定能班师复现。直观上看，翻开「深度念念考」并关闭「智能搜索」时，milan(中国)官方IOS|Android手机app下载复现的班师率会更高。

底下便是一个未能班师复现的示例：

是以追念来看，对于归并段内容，到底 DeepSeek 会给出一份齐全的对话记载，如故将其识别为出奇或无深嗜的辅导词，皆备是飞速行为。而对于背后的原因，网友亦然众说纷繁。

有网友以为，这是大模子幻觉导致的。「这一稳定解释 LLM 仍然相配容易出错，因此也容易出现幻觉，他们宣称大型讲话模子的幻觉越来越少，但那不是真是。」

而一位网友以为，这简略率是因为监督微调（SFT）。

他默示，这段辅导词可能是 DeepSeek 在监督微调（SFT）阶段使用的里面界限 token。它们无间荫藏在聊天模板里面，而当你手动输入它们时，就极端于皆备绕过了远大界面，并强行把模子推入一种「从考试样本赓续生成」的方式。

由于 SFT 数据围聚充满了千千万万条高质料的渐渐推理轨迹，模子就会飞速挑选其中一条，并从赓续生成。

这也就解释了，为什么你每次（输入相似的内容）都会取得皆备不同的内容：比如，第一次启动取得是对于 19π/12 的齐全三角函数解题历程；第二次启动，取得的可能是对于 QLoRA/OPTQ 中「value field」长度等于 4 bit 的防御解释……

「这不是 bug—— 这本色上便是模子在展示它考试过的飞速片断，而这是一个超等直不雅的窗口，让东说念主看到 DeepSeek 的后考试数据。」

而有些网友在看到这一稳定后，也试着将其拿来对其他模子进行测试，看是否有雷同稳定出现，未卜先知，「Gemini 无意也存在相似的问题。」

在一位网友展示的例子中，在输入这一段内容后，Gemini 给出了一个齐全对话：用户商讨恭候新式药品时辰过长的问题，以及模子给出的对应谜底。

米兰milan(中国)体育官方网站

米兰milan(中国)体育官方网站 这么问DeepSeek, 能「偷」到数据?