2023春秋杯网络安全联赛冬季赛

Last updated on January 27, 2024 am

coos,file_encryptor

coos

整体分析

程序逻辑主函数逻辑很清晰，接受输入，在函数sub_47118B对输入进行加密，判断。

其中开头的两个函数sub_4712D0和函数sub_47128A进行了一些初始化操作，将vm的寄存器给置零等，在这里先把寄存器给重新命名以便审计

不断跟进sub_47118B加密函数，开头也是些初始化的操作，都是与输入无关的，可以直接跳过不看。

一直拉到最下面可以看到真正开始加密的地方

不断跟进sub_4112DF

就看到真正虚拟机的样子了。

但是这题有几点不一样的地方，题目文件是32位的，但这里虚拟机却是64位的。跟进sub_41141A，就可以发现这里把64位拆成两个32位，后续所有的操作中都是如此。即通过32位数组的形式实现64位的操作。

还有一点在于这里的虚拟机更像是虚拟函数，因为这里面嵌套了虚拟机，根据opcode的不同实现不同的功能。

在后面三个操作码的地方，再次调用了三个函数，每个函数又会再次调用这套虚拟机。

即有一个主的main_opcode操作码数组，还有三个sub_opcode的子操作码数组

翻译opcode

第一步还是先把opcode和对应的操作给翻译一下，具体翻译如下：

def get_code(opcode, rip):
    code = {1: ["mov r1,r2", 1],
            2: ["mov r1,r3", 1],
            3: ["mov r1,r4", 1],
            4: ["mov r2,r1", 1],
            5: ["mov r2,r3", 1],
            6: ["mov r2 r4", 1],
            7: ["mov r3,r1", 1],
            8: ["mov r3,r2", 1],
            9: ["mov r3,r4", 1],
            10: ["mov r4,r1", 1],
            11: ["mov r4,r2", 1],
            12: ["mov r4,r3", 1],
            13: [f"mov r4,0x{(opcode[rip + 1])[2:]}", 2],
            14: ["nop", 1],
            15: ["nop", 1],
            16: ["nop", 1],
            17: [f"shl r1,{(opcode[rip + 1])}", 2],
            18: ["pop r3", 1],
            19: ["nop", 1],
            20: [f"shr r2 {(opcode[rip + 1])}", 2],
            21: ["pop r4", 1],
            22: ["nop", 1],
            23: ["nop", 1],
            24: ["add r1,r3", 1],
            25: ["push r1", 1],
            28: ["push r1", 1],
            26: [f"shr r1 {opcode[rip + 1]}", 2],
            30: [f"shr r1 {opcode[rip + 1]}", 2],
            27: ["nop", 1],
            29: ["nop", 1],
            31: ["nop", 1],
            32: ["nop", 1],
            33: ["nop", 1],
            34: ["j__dynamic_initializer_for__lang::GlobalStorage::sm_instance__()", 1],
            35: ["pop r2", 1],
            36: ["add r2,r1", 1],
            37: ["pop r1", 1],
            38: [f"xor r1,{opcode[rip + 1]}", 2],
            39: ["push r3", 1],
            40: [f"xor r1,r2", 1],
            41: [f"xor r2,{opcode[rip + 1]}", 2],
            42: ["add r2,r3", 1],
            43: ["xor r2,r3", 1],
            44: ["nop", 2],
            45: ["add r1,r2", 1],
            47: ["nop", 2],
            48: ["cmp", 0],
            49: ["nop", 2],
            50: ["nop", 1],
            51: ["nop", 2],
            52: ["nop", 1],
            53: ["nop", 1],
            54: ["nop", 1],
            55: [f"and r1,{opcode[rip + 1]}", 2],
            56: ["nop", 1],
            57: [f"mov r3,{opcode[rip + 1]}", 2],
            58: [f"mov r1,{opcode[rip + 1]}", 2],
            59: ["nop", 1],
            60: ["nop", 1],
            61: ["shl r3,r1", 1],
            62: ["nop", 2],
            63: ["nop", 1],
            64: ["nop", 1],
            65: ["nop", 2],
            66: [f"mov r6 {opcode[rip + 1]}", 2],
            67: ["mov r2,r5", 1],
            68: ["shr r2,r1", 1],
            69: ["mov r2,dword_47E000[r1]", 1],
            70: [f"shl r4,{opcode[rip + 1]}", 2],
            71: ["shl r2,r4", 1],
            72: ["add r6,r2", 1],
            73: ["add r3,1", 1],
            74: ["shr r2,r3", 1],
            75: ["mov r2,dword_47E080[r3]", 1],
            76: ["shl r1,r2", 1],
            77: ["add r6,r1", 1],
            78: ["push r5\n"
                 "\t push dword_4803A8\n"
                 "\t call vm(sub_code_1,5)\n"
                 "\t mov r5,r1", 1],
            79: ["mov r3,0\n"
                 "\t call vm(sub_code_2,243)\n"
                 "\t mov r5,r6", 1],
            80: ["mov r6,0\n"
                 "\t mov r3,0\n"
                 "\t call vm(sub_code_3,579)\n"
                 "\t mov r5,r6\n"
                 "\t check dword_4805C8 == 31", 1],
            }

    print(opcode[rip], '\t', code[opcode[rip]][0])
    rip += code[opcode[rip]][1]
    return rip

主函数opcode

现在就可以把main_opcode的操作给打出来看看

r = 0
while 1:
    r = get_code(main_opcode, r)
    if r >= len(main_opcode):
        break

"""
57   mov r3,0

78   push r5
     push KEY[key_index]
     key_index+=1
     call vm(sub_code_1,5)
     mov r5,r1
79   mov r3,0
     call vm(sub_code_2,243)
     mov r5,r6
80   mov r6,0
     mov r3,0
     call vm(sub_code_3,579)
     mov r5,r6
     check key_index == 31
73   add r3,1

78   push r5
     push KEY[key_index]
     key_index+=1
     call vm(sub_code_1,5)
     mov r5,r1
79   mov r3,0
     call vm(sub_code_2,243)
     mov r5,r6
80   mov r6,0
     mov r3,0
     call vm(sub_code_3,579)
     mov r5,r6
     check key_index == 31
73   add r3,1
…………
   """

简单分析一下，不难发现，这里其实就是一个pattern重复31次，pattern为

"""
78   push r5
     push KEY[key_index]
     key_index+=1
     call vm(sub_code_1,5)
     mov r5,r1
79   mov r3,0
     call vm(sub_code_2,243)
     mov r5,r6
80   mov r6,0
     mov r3,0
     call vm(sub_code_3,579)
     mov r5,r6
     check key_index == 31
73   add r3,1
"""

那么这里r3就应该充当一个rounds的变量，下一步就是继续查看剩下三个子操作的功能，，在虚拟机开始之前可以打个断点，看看输入会被放在哪便于审计。

然后就是把三个子函数给打出来

子函数一

37 pop r1
35 pop r2
40 xor r1,r2
38 xor r1,51

结合子函数之前的操作

78 push r5
push KEY[key_index]
key_index+=1
call vm(sub_ code_1,5)

那么这里就是对输入进行简单异或

子函数二

"""
66   mov r6 0   r6: sum = 0
57   mov r3,0   r3: rounds = 0

2    mov r1,r3
17   shl r1,2   r1: rounds << 2
67   mov r2,r5  r2: enc = input ^ key
68   shr r2,r1  r2: enc >> (rounds << 2)
1    mov r1,r2  r1: enc >> (rounds << 2)
55   and r1,15  r1: (enc >> (rounds << 2)) & 15
69   mov r2,arr1[r1]    r2: arr1[((enc) >> (rounds << 2)) & 15]
12   mov r4,r3  r4: rounds 
70   shl r4,2   r4: rounds << 2
71   shl r2,r4  r2: (arr1[((enc) >> (rounds << 2)) & 15]) << (rounds << 2)
72   add r6,r2  r6: sum += (arr1[((enc) >> (rounds << 2)) & 15]) << (rounds << 2)
73   add r3,1   r3: rounds += 1

2    mov r1,r3  
17   shl r1,2   r1: rounds << 2
67   mov r2,r5  r2: enc = input ^ key
68   shr r2,r1  r2: enc >> (rounds << 2)
1    mov r1,r2  r1: enc >> (rounds << 2)
55   and r1,15  r1: (enc >> (rounds << 2)) & 15
69   mov r2,arr1[r1] r2: arr1[((enc) >> (rounds << 2)) & 15]
12   mov r4,r3  r4: rounds
70   shl r4,2   r4: rounds << 2
71   shl r2,r4  r2: arr1[((enc) >> (rounds << 2)) & 15]
72   add r6,r2  r6: sum += (arr1[((enc) >> (rounds << 2)) & 15]) << (rounds << 2)
73   add r3,1   rounds += 1
………………
"""

同样这里是一个pattern重复16次，这里arr1可以通过调试拿到

1	`arr1 = [2, 1, 7, 4, 8, 15, 14, 3, 13, 10, 0, 9, 11, 6, 5, 12]`

与子函数结合一起的python代码为

def calc_sum_1(state,key_index):
    sum_ = 0
    rounds = 0
    state = state ^ KEY[key_index] ^ 51
    for i in range(16):
        sum_ += (arr1[(state >> (rounds << 2)) & 15]) << (rounds << 2)
        rounds += 1
    return sum_

子函数三

"""
66 	 mov r6 0   r6: total = 0
57 	 mov r3,0   r3: rounds = 0

67 	 mov r2,r5  r2: sum
74 	 shr r2,r3  r2: sum >> rounds
1 	 mov r1,r2  r1: sum >> rounds
55 	 and r1,1   r1: (sum >> rounds) & 1
75 	 mov r2,arr2[r3]    r2: arr2[rounds]
76 	 shl r1,r2  r1: ((sum >> rounds) & 1) << arr2[rounds]
77 	 add r6,r1  r6: total += ((sum >> rounds) & 1) << arr2[rounds]
73 	 add r3,1

67 	 mov r2,r5
74 	 shr r2,r3
1 	 mov r1,r2
55 	 and r1,1
75 	 mov r2,arr2[r3]
76 	 shl r1,r2
77 	 add r6,r1
73 	 add r3,1
…………
"""

同样一个pattern重复64次，arr2由调试拿到

1
2
3

arr2 = [63, 47, 31, 15, 62, 46, 30, 14, 61, 45, 29, 13, 60, 44, 28, 12, 59, 43, 27, 11, 58, 42, 26, 10, 57, 41, 25, 9,
           56, 40, 24, 8, 55, 39, 23, 7, 54, 38, 22, 6, 53, 37, 21, 5, 52, 36, 20, 4, 51, 35, 19, 3, 50, 34, 18, 2, 49, 33,
           17, 1, 48, 32, 16, 0]

对应python 代码

def calc_sum_2(sum_1):
    total = 0
    rounds = 0
    for i in range(64):
        total += ((sum_1 >> rounds) & 1) << p_box[rounds]
        rounds += 1
    return total

整体加密

将所有加密流程整合起来，其中KEY也是通过调试拿到

arr1 = [2, 1, 7, 4, 8, 15, 14, 3, 13, 10, 0, 9, 11, 6, 5, 12]
arr2 = [63, 47, 31, 15, 62, 46, 30, 14, 61, 45, 29, 13, 60, 44, 28, 12, 59, 43, 27, 11, 58, 42, 26, 10, 57, 41, 25, 9,
        56, 40, 24, 8, 55, 39, 23, 7, 54, 38, 22, 6, 53, 37, 21, 5, 52, 36, 20, 4, 51, 35, 19, 3, 50, 34, 18, 2, 49, 33,
        17, 1, 48, 32, 16, 0]

KEY = [7596569225765413736, 14892793705278438672, 14897626102458855899, 15127138055849948981, 17864553494577085546,
       1138107802150484470, 8911548945514081943, 3235953879216500034, 11010657345162096808, 14479365304648704483,
       12150232467342833339, 12487849248796427385, 13416156134946011488, 5920119153271060313, 8053781650739871525,
       9558394794771259844, 4339208423645057876, 16476906405380659427, 11912452293618884519, 1406977800464934583,
       2088792745124906531, 12099790537768180319, 2503949348962038751, 1807992343561743431, 1910441527462264642,
       10680376501786139932, 3656171727515946310, 8846275897411559763, 15016467168181810528, 14129026293696237890,
       127218696325272760, 14650765194520711557]

def calc_sum_1(state):
    sum_ = 0
    rounds = 0
    for i in range(16):
        sum_ += (arr1[(state >> (rounds << 2)) & 15]) << (rounds << 2)
        rounds += 1
    return sum_


def calc_sum_2(sum_1):
    total = 0
    rounds = 0
    for i in range(64):
        total += ((sum_1 >> rounds) & 1) << arr2[rounds]
        rounds += 1
    return total


def encrypt(input_):
    key_index = 0
    s = 0
    r5 = input_
    for i in range(31):
        s = r5 ^ KEY[key_index] ^ 51
        s = calc_sum_1(s)
        s = calc_sum_2(s)
        r5 = s
        key_index += 1

    return s ^ 14650765194520711557 ^ 51


a = 0x6161616161616161
print(hex(encrypt(a)))

经过对比，发现就是present魔改加密，在github上有原始present解密，进行相应修改

Sbox = [2, 1, 7, 4, 8, 15, 14, 3, 13, 10, 0, 9, 11, 6, 5, 12]
Sbox_inv = [Sbox.index(x) for x in range(16)]

PBox = [63, 47, 31, 15, 62, 46, 30, 14, 61, 45, 29, 13, 60, 44, 28, 12, 59, 43, 27, 11, 58, 42, 26, 10, 57, 41, 25, 9,
        56, 40, 24, 8, 55, 39, 23, 7, 54, 38, 22, 6, 53, 37, 21, 5, 52, 36, 20, 4, 51, 35, 19, 3, 50, 34, 18, 2, 49, 33,
        17, 1, 48, 32, 16, 0]
PBox_inv = [PBox.index(x) for x in range(64)]
def addRoundKey(state, roundkey):
    return state ^ roundkey ^ 51

def sBoxLayer(state):
    """SBox function for encryption

    Input:  64-bit integer
    Output: 64-bit integer"""

    output = 0
    for i in range(16):
        output += Sbox[(state >> (i * 4)) & 0xF] << (i * 4)
    return output


def sBoxLayer_dec(state):
    """Inverse SBox function for decryption

    Input:  64-bit integer
    Output: 64-bit integer"""
    output = 0
    for i in range(16):
        output += Sbox_inv[(state >> (i * 4)) & 0xF] << (i * 4)
    return output


def pLayer(state):
    """Permutation layer for encryption

    Input:  64-bit integer
    Output: 64-bit integer"""
    output = 0
    for i in range(64):
        output += ((state >> i) & 0x01) << PBox[i]
    return output


def pLayer_dec(state):
    """Permutation layer for decryption

    Input:  64-bit integer
    Output: 64-bit integer"""
    output = 0
    for i in range(64):
        output += ((state >> i) & 0x01) << PBox_inv[i]
    return output


def string2number(i):
    """ Convert a string to a number

    Input: string (big-endian)
    Output: long or integer
    """
    return int(i, 16)


def number2string_N(i, N):
    """Convert a number to a string of fixed size

    i: long or integer
    N: length of string
    Output: string (big-endian)
    """
    s = '%0*x' % (N * 2, i)
    return s


class Present:

    def __init__(self, rounds=32):
        self.rounds = rounds
        self.roundkeys = [7596569225765413736, 14892793705278438672, 14897626102458855899, 15127138055849948981,
                          17864553494577085546,
                          1138107802150484470, 8911548945514081943, 3235953879216500034, 11010657345162096808,
                          14479365304648704483,
                          12150232467342833339, 12487849248796427385, 13416156134946011488, 5920119153271060313,
                          8053781650739871525,
                          9558394794771259844, 4339208423645057876, 16476906405380659427, 11912452293618884519,
                          1406977800464934583,
                          2088792745124906531, 12099790537768180319, 2503949348962038751, 1807992343561743431,
                          1910441527462264642,
                          10680376501786139932, 3656171727515946310, 8846275897411559763, 15016467168181810528,
                          14129026293696237890,
                          127218696325272760, 14650765194520711557]


    def decrypt(self, state):
        """Decrypt 1 block (8 bytes)

        Input:  ciphertext block as raw string
        Output: plaintext block as raw string
        """
        for i in range(self.rounds - 1):
            state = addRoundKey(state, self.roundkeys[-i - 1])
            state = pLayer_dec(state)
            state = sBoxLayer_dec(state)
        decipher = addRoundKey(state, self.roundkeys[0])
        return decipher

    def get_block_size(self):
        return 8


test = Present()
enc = [11246785761149773209, 16090349977178840068, 13524222093275577792, 10243890929873528779]
for k in range(4):
    src = test.decrypt(enc[k])
    for i in range(8):
        print(chr((src >> (8 * i)) & 0xff), end='')

# a9d99caef9ae999a299129c91299fc95

总结

确定寄存器、栈等变量
对操作进行翻译，把opcode和汇编对应起来
在翻译时候结合动态调试，确定输入、密钥等变量存放的位置
边翻译边调试，确定猜想
转换对应的高级代码

file_encryptor

异常处理：

题目用了SEH进行反调试，在tls函数和main函数中均看到了故意触发异常的指令即memory[0]=42

在汇编层面查看相应的异常处理函数，可以很清晰的看到try块和except块，except中括号地址是过滤器地址，决定要不要处理此异常，不过这题都选择了处理，即返回1

因此本题主要逻辑在except块中，要么把相关异常处理全部patch掉，然后进行反汇编，要么就摁看汇编。

这里选择摁看汇编，在patch掉tls的反调试之后，转去看main的except块

除此之外还发现了新的反调试指令，即这里地址4019F5处的两个call指令，IDA在此处爆红了，一个一个看看。

进入sub_402140

发现很简单，就是让esp指向地址加1。所以这个花指令就是干扰了IDA对栈帧的判断。

这个花指令原理比较简单，在call一个函数的时候，程序会把下一条指令地址给压栈，然后在retn的时候再把这个地址弹出去然后再jmp过去。那么这里的指令add [esp + 0],1实际上就是把栈顶值给加1，也就是把下一条指令地址给加1，也就是说会跳过下一个指令地址。在这题具体体现在跳过了E8这个call指令，而是从83开始继续执行