bchess · April 25, 2024 21:00
diff --git a/serialize_mp.py b/serialize_mp.py
 import torch
 from tensorizer import TensorSerializer
 from transformers import AutoModelForCausalLM
 import torch.multiprocessing as mp

 def do_serialize(uri, model):
    serializer = TensorSerializer(uri)
    serializer.write_module(model)
    serializer.close()

 def main():
    model_ref = "EleutherAI/gpt-j-6B"
    dest = "gpt-j-6B.tensors"

    model = AutoModelForCausalLM.from_pretrained(
        model_ref,
        revision="float16",
        torch_dtype=torch.float16,
        low_cpu_mem_usage=True,
    )
    
    mp.set_start_method('spawn')
    p = mp.Process(target=do_serialize, args=(dest, model))
    p.start()
    p.join()


 if __name__ == '__main__':
    main()
	import torch
	from tensorizer import TensorSerializer
	from transformers import AutoModelForCausalLM
	import torch.multiprocessing as mp

	def do_serialize(uri, model):
	serializer = TensorSerializer(uri)
	serializer.write_module(model)
	serializer.close()

	def main():
	model_ref = "EleutherAI/gpt-j-6B"
	dest = "gpt-j-6B.tensors"

	model = AutoModelForCausalLM.from_pretrained(
	model_ref,
	revision="float16",
	torch_dtype=torch.float16,
	low_cpu_mem_usage=True,
	)

	mp.set_start_method('spawn')
	p = mp.Process(target=do_serialize, args=(dest, model))
	p.start()
	p.join()


	if __name__ == '__main__':
	main()