# 注意:安装好gem5-gpu后再配置全系统环境

# 下载全系统模拟需要的工具,详见http://gem5.org/Running_gem5#Full_System_.28FS.29_Mode,将Linux image放在binaries目录,disk image放在disks目录
# 跳过此步,因为下面俩个链接提供的Full System Files旧,会出现kernel too old、NR_CPUS limit reached 错误信息:
http://www.m5sim.org/dist/current/x86/x86-system.tar.bz2
# Config files :
http://www.m5sim.org/dist/current/x86/config-x86.tar.bz2 # 较新的Linux kernel image和disk(parsec):
http://www.cs.utexas.edu/~parsec_m5/x86_64-vmlinux-2.6.28.4-smp
http://www.cs.utexas.edu/~parsec_m5/x86root-parsec.img.bz2

# 目录结构为:
# -x86-system
#   -binaries
#   -configs
#   -disks
# 修改gem-gpu/gem5/configs/common/SysPath.py,修改存放disk和image的目录:
path = [ '/dist/m5/system', '~/x86-system' ] # 修改gem5-gpu/gem5/configs/common/Benchmarks.py,X86对应的代码:
return env.get('LINUX_IMAGE', disk('x86root-parsec.img')) # 修改gem5-gpu/gem5/configs/common/FSConfig.py中的makeLinuxX86System方法
self.kernel = binary('x86_64-vmlinux-2.6.28.4-smp') # 下载linux-bigswap2.img ,放在x86-system/disks中
http://www.m5sim.org/dist/current/m5_system_2.0b3.tar.bz2 # 修改gem5/src/arch/X86/cpuid.cc,解决kernel bug、kernel panic问题,将后面的两个参数改成 0xe7dbfbff, 0x00000209);
# kernel BUG at arch/x86/kernel/xsave.c:!
# Kernel panic - not syncing: Attempted to kill the idle task!
# Ref:https://groups.google.com/d/msg/gem5-gpu-dev/2ATuMoTPRTE/JJihLqzPCwAJ
result = CpuidResult(0x00020f51, 0x00000805,0xe7dbfbff, 0x04000209);

# 注释gem5-gpu/gem5-gpu/configs/fs_fusion.py中的m5.disableAllListeners(),启动监听端口 # 此项改动可选
# 修改gem5/src/mem/packet_queue.cc,解决Packet queue %s has grown beyond packets
if (transmitList.size() > )
# 编译gem5-gpu,如果仅修改了Python脚本,则无需重新编译;重新编译时,有时会出现build目录下缺少文件,将build目录下的文件删除后再编译!
# WORKDIR gem5-gpu/gem5
cd gem5
scons -j 3 build/X86_VI_hammer_GPU/gem5.opt --default=X86 EXTRAS=../gem5-gpu/src:../gpgpu-sim/ PROTOCOL=VI_hammer GPGPU_SIM=True # 此步可选,编辑gem5-gpu/configs/fs_fusion.py,注释m5.disableAllListeners(),在Instantiate system前设置CPU核心数,设4
options.num_cpus = # 运行模拟器,未指定 workload,启动虚拟Linux后,进入bash shell
build/X86_VI_hammer_GPU/gem5.opt ../gem5-gpu/configs/fs_fusion.py # 打开另一个终端, 连接至虚拟终端,在终端中执行bash命令、运行benchmark。详见http://gem5.org/Running_gem5#Full_System_.28FS.29_Mode
telnet localhost

# 若要启动全系统模式完成后立即执行特定workload,需要启动gem5时使用“--script”选项
# 设rcS脚本为 backprop.rcS,内容为:
cd /rodinia/backprop
/sbin/m5 resetstats
./backprop_fusion [options?]
/sbin/m5 exit
# 要执行backprop_fusion,需要将可执行文件复制到disk中,路径如rcS文件中的一样
# 挂载镜像到/mnt目录,offset=起点 X sectorSize
sudo mount -o loop,offset=32256 x86root-parsec.img /mnt
# 复制benchmark到镜像中,并卸载镜像
sudo cp -r rodinia/backprop /mnt
sudo umount /mnt # 运行backprop.rcS
build/X86_VI_hammer_GPU/gem5.opt gem5-gpu_home/gem5-gpu/configs/fs_fusion.py --script=/path/to/your/rcS_File/backprop.rcS

# ——____———完———————————___—————__————————====———完_______________------______________=___________________--_完___-----




# 小插曲。
#运行某些程序时会出现DEADLOCK,可以修改deadlock_threshold,需要注意的是gem5-gpu/configs/gpu_protocol目录和gpgpu-sim/gpgpu-sim/gpu-sim.cc
# 查看磁盘镜像信息;
fdisk -lu x86root-parsec.img
# ls /mnt可以查看到镜像中的文件
# df -h查看磁盘镜像的可用容量,如果不够放benchmark,则需要扩充容量
http://zebinj.blog.163.com/blog/static/206290199201412114912137
http://www.somethingsomewhere.net/resize2fs-bad-magic-number-in-super-block

# rcS cd命令无法进入benchmark所在目录。可能需要将benchmark复制到镜像后,再改变镜像中目录的权限(a+wr),即可进入。

# 令我费解的是:将全新的镜像放入disk目录,rcS中的ls命令居然有chai-cuda-u-sim目录removing ptxinfo 很慢~~~?

# 运行chai-cuda-u-sim,serial8250: too much work for irq4

# Ref:https://groups.google.com/d/msg/gem5-gpu-dev/CSEH38SXKh8/_EGIaDw8COwJ

Pass the command line parameter --access-host-pagetable (or something like that).

gem5-gpu全系统模式的更多相关文章

  1. Gem5全系统模式下运行SPLASH-2 Benchmarks使用alpha ISA

    Steps to run the SPLASH-2 Benchmarks on M5 in full system mode using the alpha ISA. This Guide is ai ...

  2. guider – 全系统Linux性能分析器

    Guider是一个免费且开源的,功能强大的全系统性能分析工具,主要以Python for Linux 操作系统编写. 它旨在衡量系统资源使用量并跟踪系统行为,从而使其可以有效分析系统性能问题或进行性能 ...

  3. 从数据仓库双集群系统模式探讨,看GaussDB(DWS)的容灾设计

    摘要:本文主要是探讨OLAP关系型数据库框架的数据仓库平台如何设计双集群系统,即增强系统高可用的保障水准,然后讨论一下GaussDB(DWS)的容灾应该如何设计. 当前社会.企业运行当中,大数据分析. ...

  4. 一点公益商城开发系统模式Ring Buffer+

    一个队列如果只生产不消费肯定不行的,那么如何及时消费Ring Buffer的数据呢?简单的方案就是当Ring Buffer"写满"的时候一次性将数据"消费"掉. ...

  5. 内核知识第12讲,SSDT表.以用户模式到系统模式的两种方式.

    内核知识第12讲,SSDT表.以用户模式到系统模式的两种方式. 一丶IDT解析. 我们知道.IDT表中存放着各种中断信息.比如当我们调用int 3的时候,则会调用IDT表中的第三项来进行调用. 而函数 ...

  6. [LeetCode] Design Search Autocomplete System 设计搜索自动补全系统

    Design a search autocomplete system for a search engine. Users may input a sentence (at least one wo ...

  7. 一、变量.二、过滤器(filter).三、标签(tag).四、条件分支tag.五、迭代器tag.六、自定义过滤器与标签.七、全系统过滤器(了解)

    一.变量 ''' 1.视图函数可以通过两种方式将变量传递给模板页面 -- render(request, 'test_page.html', {'变量key1': '变量值1', ..., '变量ke ...

  8. Hadoop全分布式模式安装

    一.准备 1.准备至少三台linux服务器,并安装JDK 关闭防火墙如下 systemctl stop firewalld.service systemctl disable firewalld.se ...

  9. TOP全异步模式

    Top全异步方式调用技术方案 背景:目前top通过servlet3.0技术结合异步管道化框架做到半异步调用,半异步调用采用异步线程同步调用后端的方式来做api call @飞不起的奥特曼 的部分文档) ...

随机推荐

  1. 吴裕雄 Bootstrap 前端框架开发——Bootstrap 表格:表示信息变化的操作

    <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title> ...

  2. hdu 1599 find the mincost route floyd求无向图最小环

    find the mincost route Time Limit: 1000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/O ...

  3. 暴强贴:从.NET平台调用Win32 API----转载

      水之真谛 关注 17人评论 27649人阅读 2007-02-28 17:03:47 作者:刘铁猛日期:2005-12-20关键字:C# .NET Win32 API 版权声明:本文章受知识产权法 ...

  4. GreenPlum 提取数据表信息

    参考: https://www.alberton.info/postgresql_meta_info.html https://my.oschina.net/Kenyon/blog/226600 列信 ...

  5. jQuery设置input的type属性

    $("#inputName").attr("type","text");

  6. springcloud-alibaba手写负载均衡的坑,采用restTemplate,不能添加@loadbalanced注解,否则采用了robbin

    采用springcloud-alibaba整合rabbion使用DiscoveryClient调用restful时遇到的一个问题,报错如下: D:\javaDevlepTool\java1.8\jdk ...

  7. sdfsdsf

    1 $('.advert-title').each(function(){ 2 var TXTlength = $(this).text().length; // 当前文本的长度 3 if(TXTle ...

  8. Linux设备树学习

    1.概念 设备树用于实现驱动代码与设备信息相分离.驱动代码只负责处理驱动的逻辑而关于设备的具体信息存放到设备树文件中.(dts文件,编译后为dtb文件).一个dts文件对应一个ARM的machine, ...

  9. php 实现店铺装修7

    type_id=0的情况 type_id=1的情况                         type_id=2的情况 /** * @title 店铺装修--商品分类 * @param type ...

  10. 嵊州普及Day3T1

    题意:n座山,每天袭击k面,不能为同一座.问最少几天袭击所有山两面. 思路:不管如何,n,k<=10,做了就能过,考试时先想的暴力模拟,后来发现有规律,看看就好了. 见代码: #include& ...