面对这样一道问题,我选择了gpt-5-thinking、gemini-2.5-pro、grok4、claude sonnet 4、deepseek-v3.1-思考模式、kimi-k2、Qwen3-235B-A22B-2507-思考模式以及Qwen3-Coder进行同台竞技,提示词使用了统一的模板:

生成一个html版本的20*20标准贪食蛇,使用常见的算法自动寻路(需要考虑多种算法混合让AI尽可能的得高分),启动即可看到效果(吃掉1个食物得1分,在右上角展示分数,游戏结束后自动停止并展示分数即可,着重寻路部分的算法设计,使用requestAnimationFrame执行蛇的移动。

下面是各个AI的表现,首先是使用了A*+bfs的gpt-5-thinking,最终分数是40分:

接下来是gemini-2.5-pro,由于aistudio不能运行网页,所以是下载到本地打开到浏览器执行的,可以看到gemini-2.5-pro很鸡贼的使用了环形回路来吃子,虽然理论上可以吃到最多子,但是时间成本太高(运行了半天才2分)。

第三个是grok4,grok4最简洁,没有输出任何说明,只有代码。我把代码拿到后问了其他AI,它的算法主要还是A*,最终止步于79分

第四个是claude sonnet 4,也是A*+哈密顿路径,最终止步52分。

接下来上场的是deepseek-v3.1-思考模式,它同样使用了BFS,但是偶发性的每次初始化刷新会出现2个食物(这在其他几个AI的代码里没有出现过,算BUG),最终的分53

接着是kimi-k2,由于它的代码有点错乱(尝试两次均如此),遂我自行粘贴到html单页运行如下结果,它也是A*+哈密顿+贪心,最终得分2分。

然后是Qwen3-235B-A22B-2507-思考模式,同样的以BFS作为主要手段,另外它也有一个BUG就是第20列格子被遮挡了没有展示完全,最终得分80分:

最后压轴的是Qwen3-Coder,它也主要采用了A*,最终得分67分:

以上内容均为单次提示词输出(kimi由于第二次输出的格式混乱故采用的第一次输出的内容自行拼接),所有运行的html代码也仅为单次运行结果。不排除大模型本身输出不确定性和游戏本身的随机性,结果仅供娱乐!!!

2025年顶级AI模型html游戏设计大比拼,到底谁才是编码王者?的更多相关文章

  1. [libGDX游戏开发教程]使用libGDX进行游戏开发(1)-游戏设计

    声明:<使用Libgdx进行游戏开发>是一个系列,文章的原文是<Learning Libgdx Game Development>,大家请周知.后续的文章连接在这里 使用Lib ...

  2. 炸金花游戏(3)--基于EV(期望收益)的简单AI模型

    前言: 炸金花这款游戏, 从技术的角度来说, 比德州差了很多. 所以他的AI模型也相对简单一些. 本文从EV(期望收益)的角度, 来尝试构建一个简单的炸金花AI. 相关文章: 德州扑克AI--Prog ...

  3. 【SIGGRAPH 2015】【巫师3 狂猎 The Witcher 3: Wild Hunt 】顶级的开放世界游戏的实现技术。

    [SIGGRAPH 2015][巫师3 狂猎 The Witcher 3: Wild Hunt ]顶级的开放世界游戏的实现技术 作者:西川善司 日文链接  http://www.4gamer.net/ ...

  4. <发条游戏设计>粗翻——第一部分 理论(一)

    段落1 游戏 游戏设计定义 相对而言,游戏设计是一个新的学科,专业的作曲家.画家.作家.建筑师已经至少存在了500多年,然而游戏设计师只在最近50年才被特分出来单作一类.然而这个类别仅仅在最近20-2 ...

  5. <发条游戏设计>粗翻——序言、

    序言——————————————————————— 优雅 就像在英语里的很多单词一样,“优雅”有着一些不同意义的解释.一些习惯性的用法常常带有“美”的意思:例如“她穿着一条优雅的裙子”,代表着一种完全 ...

  6. Silverlight游戏设计(Game Design):(十四)练习用游戏素材资源的获取及相关工具使用心得 --转

    Silverlight游戏设计(Game Design):(十四)练习用游戏素材资源的获取及相关工具使用心得 通过前6节的Demo制作演示,大家应该已经相当熟悉这款Silverlight-2D游戏场景 ...

  7. 如何借助 JuiceFS 为 AI 模型训练提速 7 倍

    背景 海量且优质的数据集是一个好的 AI 模型的基石之一,如何存储.管理这些数据集,以及在模型训练时提升 I/O 效率一直都是 AI 平台工程师和算法科学家特别关注的事情.不论是单机训练还是分布式训练 ...

  8. MMORPG大型游戏设计与开发(客户端架构 part8 of vegine)

    脚本模块是游戏设计中争论比较多的话题,那是因为作为脚本本身所带来的利弊.其实这都无关紧要,取舍是人必须学会的一项技能,如果你不会取舍那么就让趋势给你一个满意的答复.自从魔兽世界以及传奇(世界)问世以来 ...

  9. MMORPG大型游戏设计与开发(概述)updated

    1.定义 MMORPG,是英文Massive(或Massively)Multiplayer Online Role-PlayingGame的缩写,即大型多人在线角色扮演游戏. 2.技术与知识 在这系列 ...

  10. 信息安全系统设计基础课程实践:简单TUI游戏设计

    简单TUI游戏设计                目       录               一                      Curses库简介与基本开发方法             ...

随机推荐

  1. 终极指南:Scrum中如何设置需求优先级

    需求众多不知道如何下手?总想先做简单的需求,复杂需求却一拖再拖?那么,我们是时候开始考虑如何设置需求优先级了. 本期终极指南将展示如何为需求设置有效优先级,如何有效管理工作量,让效率指数倍增长,搭配  ...

  2. 「Log」2023.8.15 小记

    序幕 七点多到校,整理博客,开始调昨天没整完的题. 手算哈希,把所有部分都先改成暴力. 好消息,暴力没问题,准备改成正解. 学长开始讲课,AC 自动机,秒了. 接着调题,过了.开心. \(\color ...

  3. Android studio虚拟机黑屏

    1.冷启动 cold boot now 2.新建一个 另外今天下午起来的比较晚,就在宿舍上的机,然后效果就比较差,我有罪,我下次要学习一定不在宿舍,今晚也是早早的吃了饭就来自习了,这就是成果.卡了我一 ...

  4. y.sum().backward()为什么需要.sum()的思考

    这是2.5小节的内容,在网上看了一些回答后仍然不是很清楚,深入思考后忽然想明白了,在此记录一下,希望对和我一样有疑惑的人有所帮助 : ) 首先,需要明确两点: backward是对标量的操作,没办法对 ...

  5. 速看!新版SpringAI的2个致命问题

    无论是使用最新正式版的 Spring AI,还是最新正式版 Spring AI Alibaba,在实现自定义 MCP 服务器端和客户端的时候,一定要注意这两个问题,不然你会发现你的 MCP 服务器端能 ...

  6. cf908(div2)题解(补题)

    第一次akdiv2,赛后ak怎么不算是ak呢 比赛链接cf908div2 A 这题是个骗人题,整个比赛会停下来就是一个人赢够了回合数,那么在谁这停下来就是谁赢了整个比赛,不用管每回合赢得规则. #in ...

  7. vue_模版语法、计算属性和监视、样式绑定

    vue引入 <html lang="en"> <head> <meta charset="UTF-8"> <title ...

  8. Milvus 使用

    Milvus记录:1.安装Python: $ pip install -U pymilvus #pymilvus 中包含的一个 python 库,可以嵌入到客户端应用程序中 $ pip install ...

  9. ts类型声明

    declare一般写在类声明/定义/描述文件xx.d.ts中,表示声明作用.可以用来声明变量(var/let/const).方法(function).命名空间(namespace).类(class). ...

  10. leetcode 53 最大自序列和

    简介 暴力只要变量两遍, 挺好的, 不过更好的应该是动态规划. 应该是最简单的动态规划了吧 code class Solution { public: int maxSubArray(vector&l ...