开云体育官方Karpathy大神问懵DeepSeek！一个竟藏53个Token思考10分钟没解释出来

开云体育NEWS CENTER

您当前位置：首页 > 开云体育

2025-05-13

浏览次数：次

　　DeepSeek硬是思考了十分钟也还是没有答上来，觉得要是“lol”这个答案就太简单了。

　　随后他进一步解释了这背后的原因——提示词注入。将一些信息注入进字符中，表面上看没啥区别，但里面可以表达各种隐藏信息。对于善于思考的模型，就会很容易受到这个方法的影响。

　　他看到有人说，通过零宽连接符（ZWJ），可以把任意的文本藏在emoji符号当中。

　　结果一试发现真的可以，不过可以不需要ZWJ，隐藏信息的载体也不一定非得是emoji，任意Unicode字符都可以。

　　对于简单的字符（比如拉丁字母），Unicode编码点和字符之间有一对一的映射（例如u+0067表示字符g）。

　　此外，Unicode当中还设置了VS-1至VS-256的变体选择符（Variation Selector），可以针对基础字符做出相应的变体，但本身却没有自己的“长相”。

　　并且只作用于极少部分字符，主要是Unicode中的中日韩统一表意文字（CJKUI），其他大部分的Unicode字符都不会有任何变化。

　　而在Unicode当中，这样的变体选择符一共有256个之多，用来编码信息已经是绰绰有余了。

　　比如下面的这个a，只有U+0061表示的是其自身，剩下后面的10多个全都是变体选择符。

　　有了这一理论基础，接下来的事情无非就是建立正常字符和变体选择符之间的转换算法。

　　当然编码的内容越多，变体选择符也就越长，并且如果是汉字，还会产生更多的变体选择符。

　　比如我们试图将量子位的Slogan“追踪人工智能新趋势，关注科技行业新突破”藏在一个“100分”的emoji当中，产生的变体选择符数量达到了58个。

　　所以，看似是只有一个emoji，但实际上后面藏了多少字符，恐怕只有把文字装进去的人自己才知道了，甚至塞个《滕王阁序》进去也没问题。

　　DeepSeek-R1 花了10分钟思考差点就成功了。它认为隐藏的信息可能是Onli!n37e27i4h4he3ingle7odlol。因为觉得如果只是一个单词“lol”，那就是无稽之谈，所以就放弃了。

　　也有网友分享了相同的经历。Gemini无法解码，但Claude和GPT不仅识别出来，还能识别编码消息中的操作。

　　而DeepSeek-R1这次只花了153秒（有点进步）。它首先意识到这笔后跟着一系列Unicode字符。

　　对于这一意外发现，Karpathy表示，原则上模型可以通过「变体选择器」variation selectors中找到隐藏的信息并按照说明进行操作。但由于这种编码界面方法可能过于具体，需要用提示来解释它。

　　他提到了一个方法，那就是将其收录到预训练中。这些知识注入到模型参数，模型就能够在没有提示的情况下解码这种特定的编码。

　　原标题：《Karpathy大神问懵DeepSeek！一个竟藏53个Token，思考10分钟没解释出来》

　　本文为澎湃号作者或机构在澎湃新闻上传并发布，仅代表该作者或机构观点，不代表澎湃新闻的观点或立场，澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。