用不可描述之事修炼的AI们_热点_时事

让这个世界不仅是代码和关键词，还有更复杂也更简单的人性。

这篇文章的最高期望，是希望能为你理解AI与现实间的关系提供一个新的脑洞；最低期望，就是不要被删掉….

正在审查的那位朋友（或者AI），我们这里是很严肃很和谐的，真的真的…….

好，无论如何我们的讨论还是要继续。前不久微博上流行过一阵挑逗色情内容识别系统，具体做法是，把一张没什么问题的图片分成九宫格发布，然后看看系统AI会不会屏蔽其中的一部分。然后得到了如下结果：

咳咳，该说点什么呢？你们看马德华老师表情做得多到位？

总之这张图说明了两件事：

用人工智能来鉴定色情内容已经成为社交网络的主流（肯定是AI干的，人才没这么蠢呢）；

人工智能技术还有待提高…

图上这种问题，就是因为AI逐张审查图片时没有参照物，自然无法判断图上信息的性别，所以自然就屏蔽了。这可谓是AI鉴黄的死角，也说明有待完善的场景还非常多。

由于以上这种有点笨的AI已经广泛存在于我们使用的各种社交网络上，所以大家可能直觉上认为AI在成人内容领域就是扮演“监管者”与“垃圾清扫器”的角色。其实吧，成人内容对于AI来说绝不仅仅是种清扫工作。

正相反，如今AI正在利用成人与色情大幅度提升自身能力。甚至很多期待值非常高的技术，只能借助成人内容来进行训练。

是不是有点反常识？

其实假如我们在脑海中剔除对性和相关内容的莫名忌讳，会发现这个领域隐藏着机器通往智能的必经之路。

爱与恨催生了人类的艺术，战争和性进化了人类的技术，保不齐是个真理…

成人小说与对话式AI的自我救赎

为什么你家的智能音箱，经常被朋友嘲笑为“智障音箱”？

当然有很多原因。但原因之一在于，音箱里的对话式AI系统在跟你聊天的时候，只能冷冰冰的进行反馈。不会用修饰语、不会暗示、不会拐弯抹角、不会开玩笑。假如我们生活中有一个这样的人，大多数人对ta的评价一定是“无聊”。而这样的AI，当然很难让人有兴趣与之聊下去。

怎么破这件事呢？

为了让AI的对话不再枯燥乏味，谷歌大脑团队在去年干了很有意思的一件事：训练AI读成人小说。

通过阅读大量爱情与色情相关描写，AI可以丰富与用户对话时的话语模式、讲述风格，并从不同角度来理解同一个问题。这样对话系统在语言风格上会更加自然，相对贴近与真人的对话体验。

其实仔细想一下，这么做是非常有道理的。大部分“正常”小说当中，会出现各种各样的场景、人物、道具和情节，这些东西AI理解起来还是比较费力的。把语言要素与描述的物体一一对应起来进行学习更是不可能。

而成人小说则不然。在这类小说中的重点情节里，翻来覆去无非就是几件事。但描述这些事的语言风格、修饰语运用和修饰技巧使用却是千奇百怪的……否则古今中外怎么会有那么多相关作品？

研究人员把这些书籍中的相关描写剪切下来，让AI逐个阅读。这样AI模型就会搞懂如何对其实很简单的动作和细节进行千奇百怪的描述。将这种能力抽象出来，变成对话式AI与人类交流时的通用能力，那么整个画风也自然会唯美很多….

仔细想一想，很难有更合适的人类文学素材来训练AI这个能力了。至于AI会不会从中学会调戏人类，目前还不得而知…

如何理解成人网站飙科技车？

今年10月，世界最大的成人视频网站之一Pornhub推出了基于机器学习的内容识别系统，成为国内科技媒体报道的热点。

事实上，Pornhub一直都被称为顺带手分享点成人视频的科技公司。如果你能登上这个网站的话（其实根据Pornhub的大数据，他们很多频道的主要流量都来自中国大陆地区用户），会发现他们不仅率先搞起了VR专区，还有模拟运动监督软件、性知识智能教学系统、智能硬件等各种黑科技计划。大数据和流媒体技术满天飞更是不在话下。

但需要提醒的是，国内很多媒体将Pornhub刚刚推出的机器学习识别系统称为“鉴黄师”……这个就有点不合逻辑了。一个成人视频网站要鉴黄师干嘛呢？这用不着AI，随便找个人站那拿手一指，在座的各位都是黄的……

事实上，这个AI系统的意义是用来升级网站的智能推荐系统。

目前Pornhub上的机器学习模型，可以对视频中的主演进行面部识别。并学习视频中的内容，比如场景是家中还是办公室、主演是丰满还是苗条、姿势是这样还是那样……

有了这些学习成果，再结合每位用户的搜索、点击和浏览数据，系统将准确判断出用户的爱好。从而智能推荐出用户想要的影片。

由于Pornhub上的视频存量已经可以用“无边无际”来形容。而大多数用户都还是通过搜索关键词来找到自己想看的内容。但即使是关键词搜索之后，内容也依旧太多。如何在这些内容里推给用户最想看的作品呢？

通过机器学习来识别每一部视频的标签，然后学习用户行为来深化用户画像，可能就成了最好的办法。一个人对成人视频的品味往往不是单方面的，而是多个因素（甚至包含不自知的因素）组成的网络化价值依据。去了解用户喜好的深层次因素并匹配相似结果，才是这个系统的精华所在。

怎么样，明白了吧？还没有，那好吧我们换个角度聊聊…..为什么那些资讯类的内容分发平台，以及视频网站的内容推荐，也让我们觉得很蠢？因为这些推荐机制基本全是基于关键词的（甚至是标题关键词）来完成的。这些内容跟你的深度契合点在哪里呢？sorry，平台不管的哦。

举例来说，某人阅读了一篇《东南亚渔民奴隶的生存现状》，那么系统接下来会推荐什么呢？最大的可能是：东南亚人妖、东南亚养小鬼、东南亚水果、东南亚旅游……

但其实呢，这位对人妖丝毫兴趣都没有，而是对特殊阶层的人类学田野调查有兴趣。假如系统会推荐一篇《利比亚的农奴大逃亡》，他就乖乖点开来看了。

但是，内容推荐系统是永远无法知道这两篇文章间是有联系的。因为这类内容太小众，系统的机器学习模型没有办法将之关联。

毕竟内容这东西实在太多了，无数人有无数爱好，系统没办法一一兼顾。但成人网站却成为了“内容太多”这个问题的有效解决方案。因为一个人对成人内容的喜好，大体都是由角色、体型、姿势等简单因素决定的，AI学习起来相对容易。运用到实践中速度也会很快。

所以，成人网站的机器学习飙车，或许可以理解为AI对人类内容深度理解的开始——这只是成人网站的一小步，却是人类的一大步。

每一次不可描述，都是给性爱机器人进行深度学习训练

2010年，很多如今的老司机还只是纯洁的小朋友，那时他们注意到了一个新闻：世界首款性爱机器人Roxxxy诞生了。

时至如今，这款机器人依然在坚强的行走在高端成人用品市场上。并且其中加入了人工智能交互系统，机器人可以和你聊天；可以给你提供各种暗示与帮助；拥有不同的性格和爱好…..甚至还能给你发邮件（我也不知道这个功能价值何在）。

与此同时，世界上其他地区的“AI性爱硬件”（姑且这么叫吧），也在不断成熟起来。日本、英国，甚至中国，都开始出现搭载AI交互的硬件产品。

这些产品的特点，大多是可以通过智能语音系统来与使用者互动，听从使用者的指令（据说有的硬件是专门不听指令），并通过呼吸、音量、心跳等信息来判断用户状态，给予声音、温度、频率等门类的反馈。

这种功能听起来也无非是高级的成人用品。但仔细想一想，以往的成人用品不管是什么花样，归根结底都是单向施用的。但AI的加入，史无前例的让整个过程变成了互动。

而互动的价值在于，AI可以通过学习和理解，来分析出相应的解决方案，并将之在真人身上进行验证。

在讨论AI读懂用户时，始终存在的问题在于传感器太少，无法全面收集用户信息。并且很多用户的关键信息不希望透露给AI，这也就让大量理解用户的技术成为空谈。但在性爱机器人身上，传感器完全可以多到不要不要的，并且用户也没有什么秘密可言了。

虽然性爱机器人一直都伴随着物化女性的非议以及很多伦理争论。但从技术的角度讲，每一次人机间的不可描述，都可以是AI系统对用户数据理解并反馈的完整训练闭环。

尤其要注意的是，智能语音的作用体是语言；机器视觉的作用体是图像；工业机器人的作用体是工业效率，而性爱机器人的AI——也唯有其身上的AI——作用体是人类本身。

AI真正理解人类，未尝不可能从此开始。

成人领域，AI脱掉信息枷锁的地方

思考这样一个问题，互联网第一次赚钱是在哪里？答案是，成人网站。

知识付费第一次赚钱是在哪里？答案是，反正是差不多的地方吧。

总之，新技术的成熟和商业化从色情领域开始，或许不仅仅是一个巧合。

AI与成人，或者说色情领域的结合，当然也可以看到Pornhub这种成熟商业化的代表性平台。但真正让观察者在意的，是通过与之结合，学习并理解成人内容，AI或许可以迎来技术应用上的某种成熟。

我们知道，AI技术创立伊始，核心思路就是让机器去模拟和学习人类的能力。但随着经典计算和现代计算机的发展，我们周遭的一切都被打上了信息化的标签。内容是数据构成的、工业是数据构成的、互联网更是数据构成的。

在这种情况下，机器学习为代表的“成长性”AI技术，利用的一切学习资料基本都是数据的衍生品。那么这种情况下得出的AI之果，是否已经偏离了最初模仿与学习人类的AI之因呢？

巧合的是，成人内容中却极大程度保留了原始、生理、简单的人类信息。相比于信息化和符号化的现代社会外衣，这个领域其实保留了相当程度的属于“人”的那部分真实。

比如说在成人网站上，用AI来探索用户的真实喜好；比如说用性爱机器人来探索一个人的情感与冲动，都已经被证明是可以尝试的办法。

AI想要进一步了解人类本身，或许先要开始脱掉一些信息组成的枷锁。让这个世界不仅是代码和关键词，还有更复杂也更简单的人性。

平视我们自己，是一件比平视AI更难的事。假如我们能够做到，至少文章开头处的猪八戒就不会变成那个样子了……摘掉一些莫名其妙的猥琐和畏惧，或许会发现通向AI之路的脑洞还有很多。

上帝不是唯一的见证——此前有媒体在采访Pornhub总部时，发现办公室里有这样一句话。

快好知 kuaihz

用不可描述之事修炼的AI们

齐向东：奇安信将重新申报科创板 ...

曾祖母的死

快手百度投资半年后，知乎的难题解...

最新