vic511 · May 3, 2021 16:07
diff --git a/Readme.md b/Readme.md
diff --git a/vdisas.py b/vdisas.py
 #!/usr/bin/env python3

 import argparse
 import functools
 import sys
 import struct
 import enum
 import typing
 import io

 from dataclasses import dataclass


 class OperandType(enum.Enum):
    IMM = enum.auto()
    REG = enum.auto()
    REL = enum.auto()


 @dataclass
 class Operand:
    type: OperandType
    value: int


 @dataclass
 class InsnMeta:
    opcode: int
    mnem: str
    operands: typing.List[OperandType]

    def size(self) -> int:
        return 4 * (1 + len(self.operands))


 @dataclass
 class Insn:
    meta: InsnMeta
    addr: int
    operands: typing.List[Operand]

    @property
    def pc(self):
        return self.addr + self.meta.size()

    def op_str(self, op):
        if self.meta.mnem == 'putchar' and op.type == OperandType.IMM:
            byte = functools.reduce(lambda a, b: a ^ b,
                                    Disassembler.PUTCHAR_XOR, op.value) & 0xff
            return repr(chr(byte))
        if op.type == OperandType.REG:
            return f'r{op.value}'
        elif op.type == OperandType.IMM:
            return hex(op.value if op.value >= 0 else 2**32 + op.value)
        elif op.type == OperandType.REL:
            return hex(self.pc + op.value * 4)


 class Insns(enum.Enum):
    exit_reg = InsnMeta([0x952db75f, 0x72c7f2f8, 0x2f206b0b, 0xab243ec5],
                        "exit", [OperandType.REG])
    dec = InsnMeta([0x140c2cf8, 0x66245e09, 0xb8ea3ec1, 0x437919f9], "dec",
                   [OperandType.REG])
    ret = InsnMeta([0x4517cc48, 0x8001e4c7, 0x371ee5a6, 0xd077bb5e], "ret", [])
    fetch_mem = InsnMeta([0xe80c7be2, 0xc0459d50, 0x5277de4d, 0x87d05da9],
                         "fetch_mem", [OperandType.REG])
    call = InsnMeta([0x950885b3, 0x4edce4c, 0x1a08a46e, 0x8bf4943f], "call",
                    [OperandType.REL])
    putchar_reg = InsnMeta([0xf85712c3, 0x53e8cf12, 0xf82ba570, 0xd365d099],
                           "putchar", [OperandType.REG])
    jmp = InsnMeta([0xd708325c, 0x6fe6d225, 0xa7f8d895, 0x4020f282], "jmp",
                   [OperandType.REL])
    xor = InsnMeta([0x1688047, 0x497f012f, 0xca7dcd4e, 0x9684106d], "xor", [])
    mul = InsnMeta([0x54d4c1e6, 0x525b9eb7, 0x6de1c5fd, 0x723c8b46], "mul", [])
    and_ = InsnMeta([0xa9475b13, 0x25846339, 0x16be1ae2, 0x6f1bb4d], "and", [])
    inc = InsnMeta([0x29cc50c7, 0xad2d69fe, 0x64f31e5b, 0x7861f11], "inc",
                   [OperandType.REG])
    je = InsnMeta([0xbf5e62ba, 0xdfa93118, 0x2f6e151d, 0x59d310e5], "je",
                  [OperandType.REL])
    tape_store = InsnMeta([0x81761c59, 0x317b5ad6, 0x6877d9f8, 0x2c998d3c],
                          "tape_store", [OperandType.REG])
    add = InsnMeta([0x2445bafc, 0x6ad4019a, 0xff957dd8, 0xd1befc4e], "add", [])
    push_imm = InsnMeta([0x37d5991b, 0xb33f88f0, 0xe0b77ad0, 0xafd8c046],
                        "push", [OperandType.IMM])
    rom_fetch = InsnMeta([0xeef14b6e, 0x7c5cdc7d, 0x355fca70, 0x8b29d9a0],
                         "rom_fetch", [OperandType.REG])
    push_reg = InsnMeta([0x3bd7549b, 0x8ecfaa1e, 0x6808acc9, 0x84f16f5c],
                        "push", [OperandType.REG])
    jne = InsnMeta([0x56ae0803, 0xff95601b, 0x13eb7cf1, 0x94c4b853], "jne",
                   [OperandType.REL])
    putchar_imm = InsnMeta([0xb46465f, 0xd2e1893d, 0x6675dc16, 0xf4afe29b],
                           "putchar", [OperandType.IMM])
    exit_imm = InsnMeta([0x8032f32e, 0xd2717ddc, 0x1fd474eb, 0xe3e320fb],
                        "exit", [OperandType.IMM])
    tape_shift_imm = InsnMeta([0x87ab3b02, 0xe8eb3552, 0x5c03ff97, 0x5a9c2232],
                              "tape_shift", [OperandType.IMM])
    tape_shift_reg = InsnMeta([0xfb0a90ec, 0x4d093f79, 0xd3d129a5, 0xa856d0d6],
                              "tape_shift", [OperandType.REG])
    pop = InsnMeta([0xee68c600, 0x7280820f, 0xcac47105, 0xa6f7b9b2], "pop",
                   [OperandType.REG])
    mod = InsnMeta([0x5dcc45a4, 0xa1d88221, 0x5dd2c9f3, 0x91685a], "mod",
                   [OperandType.REG])

    invalid = InsnMeta([0x0, 0x0, 0x0, 0x0], "(invalid)", [])


 class Disassembler:
    # Fast lookup
    REG_XOR = [0x10, 0x1f, 0xfb, 0x95]
    # Only for final VM
    PUTCHAR_XOR = [0x1e, 0xbc, 0x01, 0x63, 0xa3]

    def __init__(self, fp, nest_lvl):
        if not 1 <= nest_lvl <= len(self.REG_XOR):
            raise ValueError(
                f'Nesting level must be between 1 and {len(self.REG_XOR)}')

        self._fp = fp
        self._nest_lvl = nest_lvl - 1
        self.opcode_to_meta = {
            insn.value.opcode[nest_lvl - 1]: insn.value
            for insn in Insns
        }

        # Fetch correct bytecode
        for n in range(nest_lvl):
            size = self.__read_u32() * 0x4
            data = fp.read(size)
        self._fp = io.BytesIO(data)

    def __read(self, n):
        data = self._fp.read(n)
        if len(data) != n:
            raise EOFError()
        return data

    def __read_u32(self):
        return struct.unpack('<I', self.__read(4))[0]

    def __read_i32(self):
        return struct.unpack('<i', self.__read(4))[0]

    def __iter_operands(self, meta):
        for op_type in meta.operands:
            if op_type == OperandType.REG:
                value = (self.__read_u32()
                         ^ self.REG_XOR[self._nest_lvl]) & 0x3f
            elif op_type in (OperandType.REL, OperandType.IMM):
                value = self.__read_i32()

            yield Operand(op_type, value)

    def disassemble(self):
        while True:
            addr = self._fp.tell()
            try:
                opcode = self.__read_u32()
            except EOFError:
                return

            meta = self.opcode_to_meta.get(opcode, Insns.invalid.value)
            operands = list(self.__iter_operands(meta))

            yield Insn(meta, addr, operands)


 INSN_MAX_MNEMLEN = max(len(insn.value.mnem) for insn in Insns)


 def print_insn(insn):
    print(f'{insn.addr:-#6x}    ', end='')
    print(insn.meta.mnem.rjust(INSN_MAX_MNEMLEN, ' '), end='')
    if insn.operands:
        operands = ', '.join(map(insn.op_str, insn.operands))
        print(f'  {operands}', end='')
    print()


 def parse_args():
    parser = argparse.ArgumentParser()
    parser.add_argument('-n',
                        '--nest',
                        default=1,
                        type=int,
                        help='Vm nesting level')
    parser.add_argument('bytecode', help='File to disassemble')

    return parser.parse_args()


 def main():
    args = parse_args()
    with open(args.bytecode, 'rb') as fp:
        disas = Disassembler(fp, nest_lvl=args.nest)
        for insn in disas.disassemble():
            print_insn(insn)


 if __name__ == '__main__':
    main()
	#!/usr/bin/env python3

	import argparse
	import functools
	import sys
	import struct
	import enum
	import typing
	import io

	from dataclasses import dataclass


	class OperandType(enum.Enum):
	IMM = enum.auto()
	REG = enum.auto()
	REL = enum.auto()


	@dataclass
	class Operand:
	type: OperandType
	value: int


	@dataclass
	class InsnMeta:
	opcode: int
	mnem: str
	operands: typing.List[OperandType]

	def size(self) -> int:
	return 4 * (1 + len(self.operands))


	@dataclass
	class Insn:
	meta: InsnMeta
	addr: int
	operands: typing.List[Operand]

	@property
	def pc(self):
	return self.addr + self.meta.size()

	def op_str(self, op):
	if self.meta.mnem == 'putchar' and op.type == OperandType.IMM:
	byte = functools.reduce(lambda a, b: a ^ b,
	Disassembler.PUTCHAR_XOR, op.value) & 0xff
	return repr(chr(byte))
	if op.type == OperandType.REG:
	return f'r{op.value}'
	elif op.type == OperandType.IMM:
	return hex(op.value if op.value >= 0 else 2**32 + op.value)
	elif op.type == OperandType.REL:
	return hex(self.pc + op.value * 4)


	class Insns(enum.Enum):
	exit_reg = InsnMeta([0x952db75f, 0x72c7f2f8, 0x2f206b0b, 0xab243ec5],
	"exit", [OperandType.REG])
	dec = InsnMeta([0x140c2cf8, 0x66245e09, 0xb8ea3ec1, 0x437919f9], "dec",
	[OperandType.REG])
	ret = InsnMeta([0x4517cc48, 0x8001e4c7, 0x371ee5a6, 0xd077bb5e], "ret", [])
	fetch_mem = InsnMeta([0xe80c7be2, 0xc0459d50, 0x5277de4d, 0x87d05da9],
	"fetch_mem", [OperandType.REG])
	call = InsnMeta([0x950885b3, 0x4edce4c, 0x1a08a46e, 0x8bf4943f], "call",
	[OperandType.REL])
	putchar_reg = InsnMeta([0xf85712c3, 0x53e8cf12, 0xf82ba570, 0xd365d099],
	"putchar", [OperandType.REG])
	jmp = InsnMeta([0xd708325c, 0x6fe6d225, 0xa7f8d895, 0x4020f282], "jmp",
	[OperandType.REL])
	xor = InsnMeta([0x1688047, 0x497f012f, 0xca7dcd4e, 0x9684106d], "xor", [])
	mul = InsnMeta([0x54d4c1e6, 0x525b9eb7, 0x6de1c5fd, 0x723c8b46], "mul", [])
	and_ = InsnMeta([0xa9475b13, 0x25846339, 0x16be1ae2, 0x6f1bb4d], "and", [])
	inc = InsnMeta([0x29cc50c7, 0xad2d69fe, 0x64f31e5b, 0x7861f11], "inc",
	[OperandType.REG])
	je = InsnMeta([0xbf5e62ba, 0xdfa93118, 0x2f6e151d, 0x59d310e5], "je",
	[OperandType.REL])
	tape_store = InsnMeta([0x81761c59, 0x317b5ad6, 0x6877d9f8, 0x2c998d3c],
	"tape_store", [OperandType.REG])
	add = InsnMeta([0x2445bafc, 0x6ad4019a, 0xff957dd8, 0xd1befc4e], "add", [])
	push_imm = InsnMeta([0x37d5991b, 0xb33f88f0, 0xe0b77ad0, 0xafd8c046],
	"push", [OperandType.IMM])
	rom_fetch = InsnMeta([0xeef14b6e, 0x7c5cdc7d, 0x355fca70, 0x8b29d9a0],
	"rom_fetch", [OperandType.REG])
	push_reg = InsnMeta([0x3bd7549b, 0x8ecfaa1e, 0x6808acc9, 0x84f16f5c],
	"push", [OperandType.REG])
	jne = InsnMeta([0x56ae0803, 0xff95601b, 0x13eb7cf1, 0x94c4b853], "jne",
	[OperandType.REL])
	putchar_imm = InsnMeta([0xb46465f, 0xd2e1893d, 0x6675dc16, 0xf4afe29b],
	"putchar", [OperandType.IMM])
	exit_imm = InsnMeta([0x8032f32e, 0xd2717ddc, 0x1fd474eb, 0xe3e320fb],
	"exit", [OperandType.IMM])
	tape_shift_imm = InsnMeta([0x87ab3b02, 0xe8eb3552, 0x5c03ff97, 0x5a9c2232],
	"tape_shift", [OperandType.IMM])
	tape_shift_reg = InsnMeta([0xfb0a90ec, 0x4d093f79, 0xd3d129a5, 0xa856d0d6],
	"tape_shift", [OperandType.REG])
	pop = InsnMeta([0xee68c600, 0x7280820f, 0xcac47105, 0xa6f7b9b2], "pop",
	[OperandType.REG])
	mod = InsnMeta([0x5dcc45a4, 0xa1d88221, 0x5dd2c9f3, 0x91685a], "mod",
	[OperandType.REG])

	invalid = InsnMeta([0x0, 0x0, 0x0, 0x0], "(invalid)", [])


	class Disassembler:
	# Fast lookup
	REG_XOR = [0x10, 0x1f, 0xfb, 0x95]
	# Only for final VM
	PUTCHAR_XOR = [0x1e, 0xbc, 0x01, 0x63, 0xa3]

	def __init__(self, fp, nest_lvl):
	if not 1 <= nest_lvl <= len(self.REG_XOR):
	raise ValueError(
	f'Nesting level must be between 1 and {len(self.REG_XOR)}')

	self._fp = fp
	self._nest_lvl = nest_lvl - 1
	self.opcode_to_meta = {
	insn.value.opcode[nest_lvl - 1]: insn.value
	for insn in Insns
	}

	# Fetch correct bytecode
	for n in range(nest_lvl):
	size = self.__read_u32() * 0x4
	data = fp.read(size)
	self._fp = io.BytesIO(data)

	def __read(self, n):
	data = self._fp.read(n)
	if len(data) != n:
	raise EOFError()
	return data

	def __read_u32(self):
	return struct.unpack('<I', self.__read(4))[0]

	def __read_i32(self):
	return struct.unpack('<i', self.__read(4))[0]

	def __iter_operands(self, meta):
	for op_type in meta.operands:
	if op_type == OperandType.REG:
	value = (self.__read_u32()
	^ self.REG_XOR[self._nest_lvl]) & 0x3f
	elif op_type in (OperandType.REL, OperandType.IMM):
	value = self.__read_i32()

	yield Operand(op_type, value)

	def disassemble(self):
	while True:
	addr = self._fp.tell()
	try:
	opcode = self.__read_u32()
	except EOFError:
	return

	meta = self.opcode_to_meta.get(opcode, Insns.invalid.value)
	operands = list(self.__iter_operands(meta))

	yield Insn(meta, addr, operands)


	INSN_MAX_MNEMLEN = max(len(insn.value.mnem) for insn in Insns)


	def print_insn(insn):
	print(f'{insn.addr:-#6x} ', end='')
	print(insn.meta.mnem.rjust(INSN_MAX_MNEMLEN, ' '), end='')
	if insn.operands:
	operands = ', '.join(map(insn.op_str, insn.operands))
	print(f' {operands}', end='')
	print()


	def parse_args():
	parser = argparse.ArgumentParser()
	parser.add_argument('-n',
	'--nest',
	default=1,
	type=int,
	help='Vm nesting level')
	parser.add_argument('bytecode', help='File to disassemble')

	return parser.parse_args()


	def main():
	args = parse_args()
	with open(args.bytecode, 'rb') as fp:
	disas = Disassembler(fp, nest_lvl=args.nest)
	for insn in disas.disassemble():
	print_insn(insn)


	if __name__ == '__main__':
	main()
No results found