Pymmdrza · March 4, 2025 08:41
diff --git a/Ollama_FineTuning_Generate.py b/Ollama_FineTuning_Generate.py
 import json
 import requests
 import sys
 from pathlib import Path

 def query_ollama(prompt, model='mistral', context=''):
    url = 'http://localhost:11434/api/generate'
    data = {"model": model, "stream": False, "prompt": context+prompt}
    response = requests.post(url, json=data)
    response.raise_for_status()
    followup_data = {"model": model, "stream": False, "prompt": response.json()['response'].strip() + "What is a likely follow-up question or request? Return just the text of one question or request."}
    followup_response = requests.post(url, json=followup_data)
    followup_response.raise_for_status()
    return response.json()['response'].strip(), followup_response.json()['response'].replace("\"", "").strip()

 def create_validation_file(train_file, valid_file, split_ratio):
    with open(train_file, 'r') as file:
        lines = file.readlines()
    valid_lines = lines[:int(len(lines) * split_ratio)]
    train_lines = lines[int(len(lines) * split_ratio):]
    with open(train_file, 'w') as file:
        file.writelines(train_lines)
    with open(valid_file, 'w') as file:
        file.writelines(valid_lines)

 def main(instructions_file, train_file, valid_file, split_ratio):
    if not Path(instructions_file).is_file():
        sys.exit(f'{instructions_file} not found.')

    with open(instructions_file, 'r') as file:
        instructions = json.load(file)

    for i, instruction in enumerate(instructions, start=1):
        print(f"Processing ({i}/{len(instructions)}): {instruction}")
        answer, followup_question = query_ollama(instruction)
        result = json.dumps({
            'text': f'<s>[INST] {instruction}[/INST] {answer}</s>[INST]{followup_question}[/INST]'
        }) + "\n"
        with open(train_file, 'a') as file:
            file.write(result)
    
    create_validation_file(train_file, valid_file, split_ratio)
    print("Done! Training and validation JSONL files created.")

 if __name__ == "__main__":
    if len(sys.argv) != 5:
        sys.exit("Usage: python script.py <instructions.json> <train.jsonl> <valid.jsonl> <split_ratio>")
    main(sys.argv[1], sys.argv[2], sys.argv[3], float(sys.argv[4]))
	import json
	import requests
	import sys
	from pathlib import Path

	def query_ollama(prompt, model='mistral', context=''):
	url = 'http://localhost:11434/api/generate'
	data = {"model": model, "stream": False, "prompt": context+prompt}
	response = requests.post(url, json=data)
	response.raise_for_status()
	followup_data = {"model": model, "stream": False, "prompt": response.json()['response'].strip() + "What is a likely follow-up question or request? Return just the text of one question or request."}
	followup_response = requests.post(url, json=followup_data)
	followup_response.raise_for_status()
	return response.json()['response'].strip(), followup_response.json()['response'].replace("\"", "").strip()

	def create_validation_file(train_file, valid_file, split_ratio):
	with open(train_file, 'r') as file:
	lines = file.readlines()
	valid_lines = lines[:int(len(lines) * split_ratio)]
	train_lines = lines[int(len(lines) * split_ratio):]
	with open(train_file, 'w') as file:
	file.writelines(train_lines)
	with open(valid_file, 'w') as file:
	file.writelines(valid_lines)

	def main(instructions_file, train_file, valid_file, split_ratio):
	if not Path(instructions_file).is_file():
	sys.exit(f'{instructions_file} not found.')

	with open(instructions_file, 'r') as file:
	instructions = json.load(file)

	for i, instruction in enumerate(instructions, start=1):
	print(f"Processing ({i}/{len(instructions)}): {instruction}")
	answer, followup_question = query_ollama(instruction)
	result = json.dumps({
	'text': f'<s>[INST] {instruction}[/INST] {answer}</s>[INST]{followup_question}[/INST]'
	}) + "\n"
	with open(train_file, 'a') as file:
	file.write(result)

	create_validation_file(train_file, valid_file, split_ratio)
	print("Done! Training and validation JSONL files created.")

	if __name__ == "__main__":
	if len(sys.argv) != 5:
	sys.exit("Usage: python script.py <instructions.json> <train.jsonl> <valid.jsonl> <split_ratio>")
	main(sys.argv[1], sys.argv[2], sys.argv[3], float(sys.argv[4]))