侧信道攻击，从喊666到入门之——Unicorn的环境构建-安全KER

作者：backahasten

Unicorn可以模拟多种指令集的代码，在很多安全研究领域有很强大的作用，但是由于需要从头自己布置栈空间，代码段等虚拟执行环境，阻碍了他的使用，本文将会分析一个实例，并介绍Unicorn虚拟运行环境的构建。

本文的例子是一个白盒实现的DES算法，在riscrue的文章Unboxing the white box中介绍了白盒攻击的类侧信道和类错误注入方法，并用这个程序作为例子。在riscure的代码中，由于python2和3对于字符串和bytes关系的变化很大，代码基本不可用。让我们来从头分析这个程序并编写设计Unicorn的代码。

Unicorn虽然可以脱离平台执行，但是在程序虚拟运行环境的设计阶段，逆向甚至动态调试都是不可避免的，Unicorn的运行环境构建分为

代码与程序段加载
栈配置
特殊寄存器配置
外部调用patch
Unicorn中调试

代码与程序段加载

在这个过程中，我们需要把代码像正常程序加载一样放进我们的虚拟内存中，一般的步骤是，首先实例化一个CPU对象出来：

mu =Uc(UC_ARCH_X86, UC_MODE_32)

上面这句话就是实例化了一个x86架构32位的CPU出来，之后就可以开始代码的加载和其他初始化（其他架构的配置请参考Unicorn官方文档）。代码段的加载以及接下来内存栈的初始化都可以使用如下的模板：

mu.mem_map(address, size)            #分配一个内存空间，起始地址位address，大小为size
mu.mem_write(address, data)          #在内存地址为address的位置存入data

首先进行代码段的载入，我们需要扫描ELF文件，根据程序头找到其中的代码段并进行加载。

elf =ELFFile(open("./wbDES",'rb'))
for seg in elf.iter_segments():
    if seg.header.p_type =="PT_LOAD":
        data =seg.data()
        mapsz =PAGE_SIZE*int((len(data) +PAGE_SIZE)/PAGE_SIZE)
        addr =seg.header.p_vaddr -(seg.header.p_vaddr %PAGE_SIZE)
        mu.mem_map(addr, mapsz)
        mu.mem_write(seg.header.p_vaddr, data)

在进行内存分配的时候，要注意对齐，按内存页的最小值倍数进行分配。

栈配置

接下来需要对栈开始配置，在开始配置栈之前，我们需要动态调试确定一下指定函数调用之前，栈里有什么东西。使用gdb对main函数进行调试，在main函数的开始处 0x80484c4 设置断点并输入参数，启动GDB：

我们可以看出，main函数的栈结构是这样的：

地址	数值	内容	备注
0xffffce8c——(esp)	0xf7c29637	RET
0xffffce90——(esp+4)	9	argc
0xffffce94——(esp+8)	0xffffcf24	argv	传入指针

我们继续查看0xffffcf24的内容

pwndbg> x/16sx 0xffffcf24
0xffffcf24:    0xffffd125    0xffffd137    0xffffd13a    0xffffd13d
0xffffcf34:    0xffffd140    0xffffd143    0xffffd146    0xffffd149
0xffffcf44:    0xffffd14c    0x00000000    0xffffd14f    0xffffd15a
0xffffcf54:    0xffffd16c    0xffffd19a    0xffffd1b0    0xffffd1bf

继续查看0xffffd125的内容，发现

pwndbg> x/16wx 0xffffd125
0xffffd125:    0x6d6f682f    0x696d2f65    0x2f62772f    0x45446277
0xffffd135:    0x32310053    0x00343300    0x37003635    0x62610038
0xffffd145:    0x00646300    0x31006665    0x44580066    0x54565f47
0xffffd155:    0x373d524e    0x47445800    0x5345535f    0x4e4f4953

如果不够直观，可以选择打印字符串。

pwndbg> x/10s 0xffffd125
0xffffd125:    "/home/mi/wb/wbDES"
0xffffd137:    "12"
0xffffd13a:    "34"
0xffffd13d:    "56"
0xffffd140:    "78"
0xffffd143:    "ab"
0xffffd146:    "cd"
0xffffd149:    "ef"
0xffffd14c:    "1f"
0xffffd14f:    "XDG_VTNR=7"

到目前为止，我们可以确定栈空间是什么样子的

首先，main函数有两个参数，一个是argc为9，另一个是一个指针，指向一个指针数组，指针数组的第一个指针指向的是字符串"/home/mi/wb/wbDES"，第二个指向”12“，第三个指向”34“以此类推。

接下来，根据分析所得的信息，开始进行栈空间参数的构建。

首先，先申请一段栈空间

STACK = 0xbfff0000
STACK_SIZE = 0x10000
mu.mem_map(STACK, STACK_SIZE)

栈的开始地址选择除了0x0附近之外的什么地方都可以，满足对齐即可，大小尽量大一些。

SP = STACK +STACK_SIZE - 0x800

之后设置SP指针的位置，由于栈是向低地址增长的，所以我们有0x800大小的空间可以部署那些字符串参数。

mu.reg_write(UC_X86_REG_ESP, SP)
mu.reg_write(UC_X86_REG_EBP, SP)

设置ESP指针，有上图可知，EBP指针为0，表示函数中没有用到EBP寻址，为了安全起见设置程和ESP一样。

接下来开始布置值字符串，代码如下：

start =0x100
a = "./wbDESx00"
mu.mem_write(SP+start, a.encode())
argv =[SP+start]
start +=8
for i in range(8):
    argv.append(SP+start)
    mu.mem_write(SP+start, b'ab')
    start +=2
    mu.mem_write(SP+start, bytes('x00','utf-8'))
    start +=1

之后开始布置指针数组：

i =0
for arg in argv:
    mu.mem_write(SP+0x200+i*4, p32(arg))
    i +=1       
# NULL
mu.mem_write(SP+0x200+i*4, p32(0))

最后开始布置函数参数那个区域的栈：

RET = STACK
mu.mem_write(SP+0x0, p32(RET)) # Return address @ sp
mu.mem_write(SP+0x04, p32(len(argv))) # argc
mu.mem_write(SP+0x08, p32(SP +0x200)) # argv

把返回地址写为栈顶的意义在于，在我们启动unicorn的时候，需要传入程序开始执行的位置和终止的位置，这样写实际上就是让函数返回到栈里，之后把栈顶的指针设置成结束位置，就不用去找函数终止的位置了。

Unicorn中调试

配置好了栈空间之后，我们还要看一下自己的配置对不对，和调试器中的值进行对比。可以使用：

print(mu.mem_read(SP+0x100,64).hex())

打印出SP+0x100位置64个字节的值，与GDB进行对比。

现在我们来分别对比一下三个位置布置的对不对。

print(mu.mem_read(SP+0x100,64).hex())#字符串
print(mu.mem_read(SP+0x200,64).hex())#数组指针
print(mu.mem_read(SP,64).hex()) #main参数

对应得到：

2e2f7762444553006162006162006162006162006162006162006162006162000000000000000000000000000000000000000000000000000000000000000000 #字符串
00f9ffbf08f9ffbf0bf9ffbf0ef9ffbf11f9ffbf14f9ffbf17f9ffbf1af9ffbf1df9ffbf00000000000000000000000000000000000000000000000000000000 #数组指针
0000ffbf0900000000faffbf00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 #main参数

pwndbg> x/80xb 0xffffce8c
0xffffce8c:    0x37    0x96    0xc2    0xf7    0x09    0x00    0x00    0x00
0xffffce94:    0x24    0xcf    0xff    0xff    0x4c    0xcf    0xff    0xff
0xffffce9c:    0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0xffffcea4:    0x00    0x00    0x00    0x00    0x00    0x30    0xdc    0xf7
0xffffceac:    0x04    0xdc    0xff    0xf7    0x00    0xd0    0xff    0xf7
0xffffceb4:    0x00    0x00    0x00    0x00    0x00    0x30    0xdc    0xf7
0xffffcebc:    0x00    0x30    0xdc    0xf7    0x00    0x00    0x00    0x00
0xffffcec4:    0x67    0x1b    0x4d    0xc1    0x77    0xd5    0xfb    0xbb
0xffffcecc:    0x00    0x00    0x00    0x00    0x00    0x00    0x00    0x00
0xffffced4:    0x00    0x00    0x00    0x00    0x09    0x00    0x00    0x00
#0000ffbf0900000000faffbf00000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

pwndbg> x/80xb 0xffffcf24
0xffffcf24:    0x25    0xd1    0xff    0xff    0x37    0xd1    0xff    0xff
0xffffcf2c:    0x3a    0xd1    0xff    0xff    0x3d    0xd1    0xff    0xff
0xffffcf34:    0x40    0xd1    0xff    0xff    0x43    0xd1    0xff    0xff
0xffffcf3c:    0x46    0xd1    0xff    0xff    0x49    0xd1    0xff    0xff
0xffffcf44:    0x4c    0xd1    0xff    0xff    0x00    0x00    0x00    0x00
0xffffcf4c:    0x4f    0xd1    0xff    0xff    0x5a    0xd1    0xff    0xff
0xffffcf54:    0x6c    0xd1    0xff    0xff    0x9a    0xd1    0xff    0xff
0xffffcf5c:    0xb0    0xd1    0xff    0xff    0xbf    0xd1    0xff    0xff
0xffffcf64:    0xfd    0xd1    0xff    0xff    0x2c    0xd2    0xff    0xff
0xffffcf6c:    0x4e    0xd2    0xff    0xff    0x5f    0xd2    0xff    0xff
#00f9ffbf08f9ffbf0bf9ffbf0ef9ffbf11f9ffbf14f9ffbf17f9ffbf1af9ffbf1df9ffbf00000000000000000000000000000000000000000000000000000000

pwndbg> x/80xb 0xffffd125
0xffffd125:    0x2f    0x68    0x6f    0x6d    0x65    0x2f    0x6d    0x69
0xffffd12d:    0x2f    0x77    0x62    0x2f    0x77    0x62    0x44    0x45
0xffffd135:    0x53    0x00    0x31    0x32    0x00    0x33    0x34    0x00
0xffffd13d:    0x35    0x36    0x00    0x37    0x38    0x00    0x61    0x62
0xffffd145:    0x00    0x63    0x64    0x00    0x65    0x66    0x00    0x31
0xffffd14d:    0x66    0x00    0x58    0x44    0x47    0x5f    0x56    0x54
0xffffd155:    0x4e    0x52    0x3d    0x37    0x00    0x58    0x44    0x47
0xffffd15d:    0x5f    0x53    0x45    0x53    0x53    0x49    0x4f    0x4e
0xffffd165:    0x5f    0x49    0x44    0x3d    0x63    0x32    0x00    0x58
0xffffd16d:    0x44    0x47    0x5f    0x47    0x52    0x45    0x45    0x54
#2e2f7762444553006162006162006162006162006162006162006162006162000000000000000000000000000000000000000000000000000000000000000000

对比之后发现正确，如果不正确，需要更改代码进行微调。

接下来，我们需要设置一个调试hook，该hook函数的callback会在每句指令执行之前执行，便于我们发现问题。

def hook_code(mu, address, size, user_data):  
    print('>>> Tracing instruction at 0x%x, instruction size = 0x%x' %(address, size))

之后注册hook：

mu.hook_add(UC_HOOK_CODE, hook_code)

开始执行：

mu.emu_start(entry, RET)

很不幸，程序挂了，Unicorn给出里一个读取未分配空间的异常：

因为我们有调试，可以发现这个位置是在执行到0x80484e1的时候发生的，我们看下这个地址是什么指令。

发现是有关gs:0x14的操作，这个指令应该是栈cookie的操作，我们没分配的寄存器unicorn默认为0，所以我们需要在0x0空间给gs分配一个空间，这句话就可以跑过去了。

mu.mem_map(0, 0x1000)

之后再运行：

发现程序好像跑飞了，往上翻，找到：

下断点调试，发现是跑到外部函数调用上去了：

分析之后发现，在main函数中有两处外部函数调用，我们直接patch掉他们的plt，让他们直接返回。

mu.mem_write(0x80483BC, bytes('xc3','utf-8'))
mu.mem_write(0x80483EC, bytes('xc3','utf-8'))

之后再运行就没有问题了。

我还针对栈的读取设置了hook，每次内存的写地址都会被记录，得到如下的图：

可以清楚的发现DES算法的轮结构，unicorn的调教到此完成，为下一步的研究做准备。

参考

[1]https://www.riscure.com/publication/unboxing-white-box/

[2]https://www.unicorn-engine.org/

[3]http://www.whiteboxcrypto.com/challenges.php

PS：小米安全中心：https://sec.xiaomi.com/

查看更多文章可关注小米安全中心公众号:

侧信道攻击，从喊666到入门之——Unicorn的环境构建

译文声明

代码与程序段加载

栈配置

Unicorn中调试

参考

发表评论

TA的文章

极智守护驭见未来｜第一届小米汽车守护活动圆满结束

【百万奖金】小米汽车守护活动正式启动！

小米安全与隐私宣传月完满落幕

精彩回顾 | 第四届小米AIoT安全峰会成功举办

招聘 | 小米信息安全与隐私部招人了！

相关文章

2023年物联网安全发展新趋势

2022数字中国创新大赛车联网安全赛 best_agent 设计思路与解析

物联网终端安全入门与实践之了解物联网终端上篇

IOT Fuzzing框架AFL++ （上）

移动GS3101光猫分析 —— 狸猫换太子

IOTsec-Zone2.0全新上线！多重福利全面来袭

基于智能手机的近源渗透案例分享 —— 极深研几

热门推荐