Skip to content

lrg11/riscv-test

Repository files navigation

Bare Bear

A Baremetal Test Framework for RISC-V

Uni-ld

将C代码直接编译为UniCore32二进制并链接到RISC-V程序中

使用方法

准备测试样例

  • 目前Uni-ld只支持无外部链接(包括库函数、运行时)和系统调用的C代码,故不能使用printf,也不能包含不可强度消减的/%运算
  • 你可以在代码中写多个函数,但需要指定一个入口函数,Uni-ld将从入口函数开始执行,并返回入口函数的结果
  • 入口函数的示例如下,必须无参数,并且返回类型为int
    int my_entry() {
      ...
      return res;
    }
  • 建议将全局数据和非入口函数都标为static,避免和RISC-V主程序冲突
  • bench/中已经提供了数个样例程序供参考,下面的教程将基于bench/bubble.c

编译UniCore程序

  • 用unicore工具链生成可重定向文件
    $ unicore32-linux-gcc -std=c99 -O1 -c bench/bubble.c -o bubble.o
  • 确认无库函数和运行时调用
    $ unicore32-linux-objdump -D bubble.o  # 检查反汇编代码
    $ unicore32-linux-readelf -r bubble.o  # 检查重定位表

链接RISC-V程序

  • unild生成RISC-V可执行文件
    $ ./unild bubble.o -e do_bubble -o bubble
    • -e:指定入口函数,因为bubble.c中有两个函数,必须显式指定入口函数;若只有一个函数则无需指定
    • 注:unild需要调用riscv64-unknown-elf-gcc,你可以在chipyard-slim容器中运行
    • 注:unild依赖于barebear的库,故必须在barebear目录下执行

运行

  • 在本机架构下运行,得到参考结果
    $ gcc bench/bubble.c -DWITH_MAIN -o bubble_ref && ./bubble_ref
    # code = 4
  • 在BOOM中运行(请正确设置运行目录)
    $ <boom_split>/build/simulator-MediumUniCoreConfig <barebear>/bubble
    # This emulator compiled with JTAG Remote Bitbang client. To enable, use +jtag_rbb_enable=1.
    # Listening on port 41121
    # [UART] UART0 is here (stdin/stdout).
    # *** FAILED *** (code = 4, seed 1646491743) after 997647 cycles
    • 注:结果为code = 4,和上面相同,说明运行正确

进阶使用

使用Uni-ld进行性能评测

  • Uni-ld支持通过返回值获取RISC-V CSR性能计数器的值,且支持设置预热轮数,例如
    $ ./unild kmp.o -e do_kmp -o kmp --warmup 3 --hpm-counter mcycle
    • --warmup:先预热运行warmupdo_kmp,再正式运行1次do_kmp;预热运行与正式运行实际上并无差别
    • --hpm-counter:统计并返回正式运行时该计数器的值(增量);RISC-V默认提供mcycleminstret两个计数器,如有需要可在mhpmcounter{3-31}上扩展
    • 注:请确保你的程序每次执行的内容都是相同的;例如,如果你的程序是排序,请确保每次排序的数组都是相同的,否则可能得到错误的结果
  • 使用上述方法链接的程序执行方法与普通程序无异,除了返回值变为性能计数器的值,例如
    $ <boom_split>/build/simulator-MediumUniCoreConfig <barebear>/kmp
    # This emulator compiled with JTAG Remote Bitbang client. To enable, use +jtag_rbb_enable=1.
    # Listening on port 38671
    # [UART] UART0 is here (stdin/stdout).
    # *** FAILED *** (code = 30796, seed 1645908901) after 1201529 cycles
    • 容易知道,性能计数器的值为30796
    • 注:由于开启--hpm-counter选项后无法得知程序本身的返回值,建议先只开--warmup确认返回值无误后再开--hpm-counter

开启调试输出

  • 开启-v选项获取关于重定位的详细信息,例如
    $ ./unild matmul.o -e do_matmul -o matmul -v
    # debug: Accept section '.text'
    # debug: Accept section '.data'
    # debug: Accept section '.bss'
    # debug: Relocate ABS32 0x00003164 (.text+0x124) to 0x80004000 (.data+0x1000)
    # debug: Relocate ABS32 0x00003168 (.text+0x128) to 0x80005010 (.bss+0x0)
    # debug: Relocate ABS32 0x0000316c (.text+0x12c) to 0x80003000 (.data+0x0)
  • Uni-ld不保证支持所有的重定位方式,你可以从这里发现问题,完善和扩展Uni-ld

ReadCSR-BM

在baremetal模式下读RISC-V CSR寄存器

使用方法

准备Benchmark和CSR

  • 参考readcsr_bm.c中的调用方式和bench/中的小程序准备你的benchmark
  • 注:你只能读已经定义的CSR,否则会发生异常,即你需要将多余的__csrr_hpmcounter指令注释掉
  • 下面以bench/中已有的benchmark为例

编译

  • 开启浮点
    $ riscv64-unknown-elf-gcc -march=rv64g -mabi=lp64d -mcmodel=medany \
        -I. -O3 -nostdlib -nostartfiles -Tlink.ld \
        -o readcsr_bm readcsr_bm.c bench/*.c lib/crt.S lib/*.c
    • 注:若你的benchmark中有浮点运算,请务必使用该选项
  • 禁用浮点
    $ riscv64-unknown-elf-gcc -march=rv64g -mabi=lp64 -mcmodel=medany \
        -I. -O3 -nostdlib -nostartfiles -Tlink.ld \
        -DPRINTF_DISABLE_SUPPORT_FLOAT -DBAREBEAR_DISABLE_FS \
        -o readcsr_bm readcsr_bm.c bench/*.c lib/crt.S lib/*.c
  • 关于-march-mabi设置的更多细节请见SiFive Blog

运行

$ <boom_home>/simulator-MediumBoomConfig <barebear>/readcsr_bm
# This emulator compiled with JTAG Remote Bitbang client. To enable, use +jtag_rbb_enable=1.
# Listening on port 38551
# [UART] UART0 is here (stdin/stdout).
# begin
# "do_qsort": {
#   "cycle"    : 167355,
#   "instret"  : 126630,
# ...
#   "br_loop_flip"      : 53,
#   "br_loop_flip_misp" : 24
# }
# "do_matmul": {
#   "cycle"    : 106092,
#   "instret"  : 183146,
# ...
#   "br_loop_flip"      : 50,
#   "br_loop_flip_misp" : 0
# }
# ...

RunCSR

在Linux环境下定时读RISC-V CSR寄存器

使用方法

准备Benchmark

  • 自行准备一个可以运行的程序,这里以gcc_base.rv64为例
  • 如果要确认程序的正确性,请先单独运行该程序;套上runcsr后它的输出和返回值将难以获取
    $ ./gcc_base.rv64 166.i -o 166.s

编译

  • 直接编译即可,FPGA上已经有库,无需开-static
    $ riscv64-unknown-linux-gnu-gcc -O3 -o runcsr runcsr.c

运行

  • 直接运行,但若benchmark有输出会与runcsr的输出混在一起
    $ ./runcsr ./gcc_base.rv64 166.i -o 166.s 2>output.log
    • 注:若gcc_base.rv64不在PATH中,务必在前面加上./,因为runcsr用的是execvp系统调用
  • 套用bash运行,将benchmark的输出屏蔽掉
    $ ./runcsr bash -c "./gcc_base.rv64 166.i -o 166.s >/dev/null 2>&1" 2>output.log

关于输出

  • runcsr每隔约60秒输出一次,在程序结束时也会输出一次
  • 输出格式为JSON,一次一行(以\n为界),如下所示
    {"time":0.000020,"hpms":[64853,31771,83,59619,40856,19351,48972,5240,58258,23336,9135,63827,29214,38282,56573,45491]}
    {"time":60.038576,"hpms":[64968,31879,106,59635,40982,19356,49041,5374,58339,23412,9371,64006,29383,38436,56781,45605]}
    {"time":120.063710,"hpms":[65156,31885,282,59747,41185,19513,49243,5533,58569,23519,9472,64208,29531,38531,57000,45760]}
    ...
    • time:从runcsr启动开始的时间,秒
    • hpms:性能计数器的值,具体内容请在runcsr.c中自行设置;我们需要的即是每两次之间的差值
    • 注:请务必只读已经定义的CSR,否则会发生异常
  • 为了在terminal上及时看到结果,但又为了防止terminal断开导致结果消失,runcsr会将结果同时输出到stdoutstderr,你应该将其中一个重定向到备份文件

可视化

  • 代码仅供测试,建议看懂graphcsr.py后根据自己的需求写一份
  • 需安装Python3和matplotlib
  • 运行如下指令,会在命令行输出总结,同时得到output-{BrMispRate,BrMPKI,IPC}.png三张图
    $ python3 graphcsr.py -g output.log
    # IPC: 0.7830317206800169
    # Br Misp Rate: 0.0454508694335663
    # Br MPKI: 2.623381393198754

About

A Baremetal Test Framework

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published