收藏文章 楼主

我的世界大猩猩模组大战老虎,我的世界更多大猩猩免费模组

版块:科技头条   类型:普通   作者:科技资讯   查看:38   回复:0   获赞:0   时间:2023-08-13 03:54:12

训练大猩猩和AI有很多共同的技能。在教GPT-4玩《我的世界》之后,人类也教大猩猩玩这个游戏。

图中的大猩猩叫Kanzi,是一只42岁的矮黑猩猩。它会通过点击触摸屏来玩游戏:点击屏幕中央前进;摸摸侧面,看看四周。如果表现优异,研究人员会给予奖励,比如花生或者其他零食。

或许是因为之前玩了一些游戏的缘故,坎齐一坐在屏幕前就进入了状态,几秒钟就学会了如何操作角色。只要能到达指定区域,屏幕上就会出现一个零食图案,工作人员也会给它相应的零食。在这样的奖励机制下,Kanzi很快学会了如何在游戏中行走。

下一个测试任务是使用工具(屏幕顶部的一个按钮)来打破游戏中的一些积木。这对Kanzi来说有点难,因为这个操作在Kanzi之前玩过的任何游戏中都没有出现过。为了给Kanzi一点提示,工作人员不停地指着屏幕上方的按钮,Kanzi还是没有说到点子上。

无奈之下,工作人员只好换了一个方法:让坎子观看人体演示。

坎子仔细看了看,在积木被砸的时候拿了零食。于是工作人员决定让它自己试一试。

最后,走到积木前时,Kanzi找到了上面的按钮,成功砸碎了积木,引来了工作人员的欢呼。

经过这两项任务,Kanzi已经掌握了两项基本技能:在环境中收集零食和打破积木。工作人员的下一个目标是让Kanzi在新的环境中使用这些技能,并说服网线另一端的一个人类玩家,它是一个真实的人。

在此之前,Kanzi被安排在特殊的洞穴环境中强化技能。只有打破一堵积木墙,坎子才能到达洞穴的尽头。

在打怪物升级的路上,坎齐熟悉了刚刚学到的新技能。但也有被卡在角落的时候,这种情况下它会寻求工作人员的帮助,脱困后直接去积木墙继续通关。

最终,在几乎没有任何帮助的情况下,Kanzi成功通过,到达了洞穴的尽头。这也意味着Kanzi已经准备好迷惑人类玩家了。

在测试过程中,人类玩家被告知,他将与一名特殊的玩家一起玩游戏。当然,他也注意到了一些不寻常的行为。比如Kanzi在游戏中的动作很慢,操作方式和普通玩家不一样。但他万万没想到,他的游戏伙伴是一只大猩猩。所以,当真相大白的时候,汤米的反应是既震惊又激动。

这个用人类玩家进行的测试被工作人员称为“多人”模式。接下来,他们让坎齐挑战《我的世界》中的其他环境类型,包括村庄、沙漠神庙、下传送门等等。Kanzi一路过关斩将,到达了游戏的终点。

这段视频在国外视频网站上引起了大量关注。视频制作人、YouTube博主克里斯达科(ChrisDaCow)原本是想呼吁人类关注野生动物,看到它们有趣的一面。

视频链接:https://www.youtube.com/watch? v = ukpfoyqn 9-0

然而,在AI研究人员看来,这不仅仅是有趣。他们观察到一些与智力有关的东西。

英伟达AI高级科学家吉姆·范(Jim Fan)表示,他观察到教AI玩《我的世界》和教大猩猩有很多相似的技能,包括:

情境强化学习(in-context reinforcement learning):当Kanzi到达游戏中标记的里程碑时,他会得到水果或花生作为奖励,以激励他按照游戏中的指示进行操作。

人类反馈强化学习(RLHF): Kanzi并不完全理解这种语言,但他能看到训练者在为他加油,他也会偶尔回应加油!这给他提供了一个强烈的信号,表明他走在正确的道路上。

模仿学习:训练者给Kanzi展示一个任务的演示,它只展示了一次,它就理解了这个概念。这比仅仅使用奖励更有效率。

课程学习:他们从一个非常简单的环境开始,逐步教授Kanzi控制技巧。最终,Kanzi可以在复杂的洞穴、迷宫和下界之间前进。

“我也很惊讶大猩猩的视觉系统如此强大。Kanzi这辈子都没见过我的世界,他的祖先也没见过。但是他很快就习惯了我的世界里的质感和物理,和自然界完全不同。这种程度的概括远远超出了我们今天最强大的视觉模型所能做到的。我们又一次陷入了莫拉维克悖论:我们最好的人工智能在理解语言方面接近人类水平,但在分析像素方面却远远落后于动物。吉姆·范评论道。

莫拉维克悖论是人工智能和机器人学者发现的一种违背常识的现象。与传统假说不同的是,人类特有的高阶智能需要的计算能力非常少,比如推理。但是无意识的技能和直觉需要巨大的计算能力。这个概念是由汉斯·莫拉维克、布鲁克斯、马文·明斯基等人在20世纪80年代解释的。正如莫拉维克所写的:“让一台计算机像成年人一样下棋相对容易,但让一台计算机像一岁的孩子一样感觉和行动却相当困难,甚至不可能。」

但也有人对此提出质疑,认为Kanzi其实一直走下去只是为了得到一个奖励。“它根本不知道发生了什么”,也没有真正学会玩我的世界。

对此,有人反驳道,“这叫刺激反应学习,或者叫操作性条件反射。这是包括你在内的所有动物学习的基本方式之一。这个很好理解。这不是贬低学习,这是学习的本质。」

这个实验有趣的地方在于,它打开了人们的思维:现在ChatGPT和大猩猩可以玩我的世界了,如果未来脑机接口开发顺利会怎么样?

我的世界大猩猩模组大战老虎,我的世界更多大猩猩免费模组

我的世界大猩猩模组大战老虎,我的世界更多大猩猩免费模组

剧终

授权请联系本微信官方账号。

投稿或寻求报道:content@jiqizhixin.com。

 
回复列表
默认   热门   正序   倒序

回复:我的世界大猩猩模组大战老虎,我的世界更多大猩猩免费模组

Powered by 7.12.10

©2015 - 2025 90Link

90link品牌推广 网站地图

您的IP:10.1.228.218,2025-12-22 17:18:04,Processed in 0.27813 second(s).

豫ICP备2023005541号

头像

用户名:

粉丝数:

签名:

资料 关注 好友 消息
免责声明
  • 1、本网站所刊载的文章,不代表本网站赞同其观点和对其真实性负责,仅供参考和借鉴。
  • 2、文章中的图片和文字版权归原作者所有,如有侵权请及时联系我们,我们将尽快处理。
  • 3、文章中提到的任何产品或服务,本网站不对其性能、质量、适用性、可靠性、安全性、法律合规性等方面做出任何保证或承诺,仅供读者参考,使用者自行承担风险。
  • 4、本网站不承担任何因使用本站提供的信息、服务或产品而产生的直接、间接、附带或衍生的损失或责任,使用者应自行承担一切风险。

侵权删除请致信 E-Mail:3454251265@qq.com