我的世界大猩猩模组大战老虎，我的世界更多大猩猩免费模组

版块：科技头条类型：普通作者：科技资讯查看：61 回复：0 获赞：0 时间：2023-08-13 03:54:12

训练大猩猩和AI有很多共同的技能。在教GPT-4玩《我的世界》之后，人类也教大猩猩玩这个游戏。

图中的大猩猩叫Kanzi，是一只42岁的矮黑猩猩。它会通过点击触摸屏来玩游戏:点击屏幕中央前进；摸摸侧面，看看四周。如果表现优异，研究人员会给予奖励，比如花生或者其他零食。

或许是因为之前玩了一些游戏的缘故，坎齐一坐在屏幕前就进入了状态，几秒钟就学会了如何操作角色。只要能到达指定区域，屏幕上就会出现一个零食图案，工作人员也会给它相应的零食。在这样的奖励机制下，Kanzi很快学会了如何在游戏中行走。

下一个测试任务是使用工具(屏幕顶部的一个按钮)来打破游戏中的一些积木。这对Kanzi来说有点难，因为这个操作在Kanzi之前玩过的任何游戏中都没有出现过。为了给Kanzi一点提示，工作人员不停地指着屏幕上方的按钮，Kanzi还是没有说到点子上。

无奈之下，工作人员只好换了一个方法:让坎子观看人体演示。

坎子仔细看了看，在积木被砸的时候拿了零食。于是工作人员决定让它自己试一试。

最后，走到积木前时，Kanzi找到了上面的按钮，成功砸碎了积木，引来了工作人员的欢呼。

经过这两项任务，Kanzi已经掌握了两项基本技能:在环境中收集零食和打破积木。工作人员的下一个目标是让Kanzi在新的环境中使用这些技能，并说服网线另一端的一个人类玩家，它是一个真实的人。

在此之前，Kanzi被安排在特殊的洞穴环境中强化技能。只有打破一堵积木墙，坎子才能到达洞穴的尽头。

在打怪物升级的路上，坎齐熟悉了刚刚学到的新技能。但也有被卡在角落的时候，这种情况下它会寻求工作人员的帮助，脱困后直接去积木墙继续通关。

最终，在几乎没有任何帮助的情况下，Kanzi成功通过，到达了洞穴的尽头。这也意味着Kanzi已经准备好迷惑人类玩家了。

在测试过程中，人类玩家被告知，他将与一名特殊的玩家一起玩游戏。当然，他也注意到了一些不寻常的行为。比如Kanzi在游戏中的动作很慢，操作方式和普通玩家不一样。但他万万没想到，他的游戏伙伴是一只大猩猩。所以，当真相大白的时候，汤米的反应是既震惊又激动。

这个用人类玩家进行的测试被工作人员称为“多人”模式。接下来，他们让坎齐挑战《我的世界》中的其他环境类型，包括村庄、沙漠神庙、下传送门等等。Kanzi一路过关斩将，到达了游戏的终点。

这段视频在国外视频网站上引起了大量关注。视频制作人、YouTube博主克里斯达科(ChrisDaCow)原本是想呼吁人类关注野生动物，看到它们有趣的一面。

视频链接:https://www.youtube.com/watch? v = ukpfoyqn 9-0

然而，在AI研究人员看来，这不仅仅是有趣。他们观察到一些与智力有关的东西。

英伟达AI高级科学家吉姆·范(Jim Fan)表示，他观察到教AI玩《我的世界》和教大猩猩有很多相似的技能，包括:

情境强化学习(in-context reinforcement learning):当Kanzi到达游戏中标记的里程碑时，他会得到水果或花生作为奖励，以激励他按照游戏中的指示进行操作。

人类反馈强化学习(RLHF): Kanzi并不完全理解这种语言，但他能看到训练者在为他加油，他也会偶尔回应加油！这给他提供了一个强烈的信号，表明他走在正确的道路上。

模仿学习:训练者给Kanzi展示一个任务的演示，它只展示了一次，它就理解了这个概念。这比仅仅使用奖励更有效率。

课程学习:他们从一个非常简单的环境开始，逐步教授Kanzi控制技巧。最终，Kanzi可以在复杂的洞穴、迷宫和下界之间前进。

“我也很惊讶大猩猩的视觉系统如此强大。Kanzi这辈子都没见过我的世界，他的祖先也没见过。但是他很快就习惯了我的世界里的质感和物理，和自然界完全不同。这种程度的概括远远超出了我们今天最强大的视觉模型所能做到的。我们又一次陷入了莫拉维克悖论:我们最好的人工智能在理解语言方面接近人类水平，但在分析像素方面却远远落后于动物。吉姆·范评论道。

莫拉维克悖论是人工智能和机器人学者发现的一种违背常识的现象。与传统假说不同的是，人类特有的高阶智能需要的计算能力非常少，比如推理。但是无意识的技能和直觉需要巨大的计算能力。这个概念是由汉斯·莫拉维克、布鲁克斯、马文·明斯基等人在20世纪80年代解释的。正如莫拉维克所写的:“让一台计算机像成年人一样下棋相对容易，但让一台计算机像一岁的孩子一样感觉和行动却相当困难，甚至不可能。」

但也有人对此提出质疑，认为Kanzi其实一直走下去只是为了得到一个奖励。“它根本不知道发生了什么”，也没有真正学会玩我的世界。