2025年顶级AI模型html游戏设计大比拼,到底谁才是编码王者?
面对这样一道问题,我选择了gpt-5-thinking、gemini-2.5-pro、grok4、claude sonnet 4、deepseek-v3.1-思考模式、kimi-k2、Qwen3-235B-A22B-2507-思考模式以及Qwen3-Coder进行同台竞技,提示词使用了统一的模板:
生成一个html版本的20*20标准贪食蛇,使用常见的算法自动寻路(需要考虑多种算法混合让AI尽可能的得高分),启动即可看到效果(吃掉1个食物得1分,在右上角展示分数,游戏结束后自动停止并展示分数即可,着重寻路部分的算法设计,使用requestAnimationFrame执行蛇的移动。
下面是各个AI的表现,首先是使用了A*+bfs的gpt-5-thinking,最终分数是40分:

接下来是gemini-2.5-pro,由于aistudio不能运行网页,所以是下载到本地打开到浏览器执行的,可以看到gemini-2.5-pro很鸡贼的使用了环形回路来吃子,虽然理论上可以吃到最多子,但是时间成本太高(运行了半天才2分)。


第三个是grok4,grok4最简洁,没有输出任何说明,只有代码。我把代码拿到后问了其他AI,它的算法主要还是A*,最终止步于79分


第四个是claude sonnet 4,也是A*+哈密顿路径,最终止步52分。

接下来上场的是deepseek-v3.1-思考模式,它同样使用了BFS,但是偶发性的每次初始化刷新会出现2个食物(这在其他几个AI的代码里没有出现过,算BUG),最终的分53

接着是kimi-k2,由于它的代码有点错乱(尝试两次均如此),遂我自行粘贴到html单页运行如下结果,它也是A*+哈密顿+贪心,最终得分2分。


然后是Qwen3-235B-A22B-2507-思考模式,同样的以BFS作为主要手段,另外它也有一个BUG就是第20列格子被遮挡了没有展示完全,最终得分80分:


最后压轴的是Qwen3-Coder,它也主要采用了A*,最终得分67分:


以上内容均为单次提示词输出(kimi由于第二次输出的格式混乱故采用的第一次输出的内容自行拼接),所有运行的html代码也仅为单次运行结果。不排除大模型本身输出不确定性和游戏本身的随机性,结果仅供娱乐!!!
2025年顶级AI模型html游戏设计大比拼,到底谁才是编码王者?的更多相关文章
- [libGDX游戏开发教程]使用libGDX进行游戏开发(1)-游戏设计
声明:<使用Libgdx进行游戏开发>是一个系列,文章的原文是<Learning Libgdx Game Development>,大家请周知.后续的文章连接在这里 使用Lib ...
- 炸金花游戏(3)--基于EV(期望收益)的简单AI模型
前言: 炸金花这款游戏, 从技术的角度来说, 比德州差了很多. 所以他的AI模型也相对简单一些. 本文从EV(期望收益)的角度, 来尝试构建一个简单的炸金花AI. 相关文章: 德州扑克AI--Prog ...
- 【SIGGRAPH 2015】【巫师3 狂猎 The Witcher 3: Wild Hunt 】顶级的开放世界游戏的实现技术。
[SIGGRAPH 2015][巫师3 狂猎 The Witcher 3: Wild Hunt ]顶级的开放世界游戏的实现技术 作者:西川善司 日文链接 http://www.4gamer.net/ ...
- <发条游戏设计>粗翻——第一部分 理论(一)
段落1 游戏 游戏设计定义 相对而言,游戏设计是一个新的学科,专业的作曲家.画家.作家.建筑师已经至少存在了500多年,然而游戏设计师只在最近50年才被特分出来单作一类.然而这个类别仅仅在最近20-2 ...
- <发条游戏设计>粗翻——序言、
序言——————————————————————— 优雅 就像在英语里的很多单词一样,“优雅”有着一些不同意义的解释.一些习惯性的用法常常带有“美”的意思:例如“她穿着一条优雅的裙子”,代表着一种完全 ...
- Silverlight游戏设计(Game Design):(十四)练习用游戏素材资源的获取及相关工具使用心得 --转
Silverlight游戏设计(Game Design):(十四)练习用游戏素材资源的获取及相关工具使用心得 通过前6节的Demo制作演示,大家应该已经相当熟悉这款Silverlight-2D游戏场景 ...
- 如何借助 JuiceFS 为 AI 模型训练提速 7 倍
背景 海量且优质的数据集是一个好的 AI 模型的基石之一,如何存储.管理这些数据集,以及在模型训练时提升 I/O 效率一直都是 AI 平台工程师和算法科学家特别关注的事情.不论是单机训练还是分布式训练 ...
- MMORPG大型游戏设计与开发(客户端架构 part8 of vegine)
脚本模块是游戏设计中争论比较多的话题,那是因为作为脚本本身所带来的利弊.其实这都无关紧要,取舍是人必须学会的一项技能,如果你不会取舍那么就让趋势给你一个满意的答复.自从魔兽世界以及传奇(世界)问世以来 ...
- MMORPG大型游戏设计与开发(概述)updated
1.定义 MMORPG,是英文Massive(或Massively)Multiplayer Online Role-PlayingGame的缩写,即大型多人在线角色扮演游戏. 2.技术与知识 在这系列 ...
- 信息安全系统设计基础课程实践:简单TUI游戏设计
简单TUI游戏设计 目 录 一 Curses库简介与基本开发方法 ...
随机推荐
- 终极指南:Scrum中如何设置需求优先级
需求众多不知道如何下手?总想先做简单的需求,复杂需求却一拖再拖?那么,我们是时候开始考虑如何设置需求优先级了. 本期终极指南将展示如何为需求设置有效优先级,如何有效管理工作量,让效率指数倍增长,搭配 ...
- 「Log」2023.8.15 小记
序幕 七点多到校,整理博客,开始调昨天没整完的题. 手算哈希,把所有部分都先改成暴力. 好消息,暴力没问题,准备改成正解. 学长开始讲课,AC 自动机,秒了. 接着调题,过了.开心. \(\color ...
- Android studio虚拟机黑屏
1.冷启动 cold boot now 2.新建一个 另外今天下午起来的比较晚,就在宿舍上的机,然后效果就比较差,我有罪,我下次要学习一定不在宿舍,今晚也是早早的吃了饭就来自习了,这就是成果.卡了我一 ...
- y.sum().backward()为什么需要.sum()的思考
这是2.5小节的内容,在网上看了一些回答后仍然不是很清楚,深入思考后忽然想明白了,在此记录一下,希望对和我一样有疑惑的人有所帮助 : ) 首先,需要明确两点: backward是对标量的操作,没办法对 ...
- 速看!新版SpringAI的2个致命问题
无论是使用最新正式版的 Spring AI,还是最新正式版 Spring AI Alibaba,在实现自定义 MCP 服务器端和客户端的时候,一定要注意这两个问题,不然你会发现你的 MCP 服务器端能 ...
- cf908(div2)题解(补题)
第一次akdiv2,赛后ak怎么不算是ak呢 比赛链接cf908div2 A 这题是个骗人题,整个比赛会停下来就是一个人赢够了回合数,那么在谁这停下来就是谁赢了整个比赛,不用管每回合赢得规则. #in ...
- vue_模版语法、计算属性和监视、样式绑定
vue引入 <html lang="en"> <head> <meta charset="UTF-8"> <title ...
- Milvus 使用
Milvus记录:1.安装Python: $ pip install -U pymilvus #pymilvus 中包含的一个 python 库,可以嵌入到客户端应用程序中 $ pip install ...
- ts类型声明
declare一般写在类声明/定义/描述文件xx.d.ts中,表示声明作用.可以用来声明变量(var/let/const).方法(function).命名空间(namespace).类(class). ...
- leetcode 53 最大自序列和
简介 暴力只要变量两遍, 挺好的, 不过更好的应该是动态规划. 应该是最简单的动态规划了吧 code class Solution { public: int maxSubArray(vector&l ...