AARP41298 · July 10, 2025 20:02
diff --git a/fix_rb3_spanish_songs.py b/fix_rb3_spanish_songs.py

 import re

 def fix_encoding(input_file, output_file):
    # Leer el archivo en modo binario para trabajar con los bytes directamente
    with open(input_file, 'rb') as f:
        content = f.read()

    # Decodificar el contenido
    try:
        fixed_content = content.decode('utf-8').encode('latin1').decode('utf-8')
    except UnicodeDecodeError:
        fixed_content = content.decode('latin1')

    # Corregir las vocales con acento mal codificadas
    replacements = {
        "Ã¡": "á", "Ã©": "é", "Ã": "í", "Ã³": "ó", "Ãº": "ú",
        "Ã�": "Á", "Ã‰": "É", "Ã�": "Í", "Ã“": "Ó", "Ãš": "Ú",
        "Ã±": "ñ", "Ã‘": "Ñ", "Ã¼": "ü", "Ãœ": "Ü"
    }
    for broken, correct in replacements.items():
        fixed_content = fixed_content.replace(broken, correct)

    # Reemplazar 'encoding' 'latin1' por 'encoding' 'utf8'
    fixed_content = re.sub(r"\('encoding' 'latin1'\)", "('encoding' 'utf8')", fixed_content)

    # Guardar el archivo corregido
    with open(output_file, 'w', encoding='utf-8') as f:
        f.write(fixed_content)

    print(f"Archivo corregido guardado en: {output_file}")

 # Ejemplo de uso
 fix_encoding('songs.dta', 'songs.dta.fix')

	import re

	def fix_encoding(input_file, output_file):
	# Leer el archivo en modo binario para trabajar con los bytes directamente
	with open(input_file, 'rb') as f:
	content = f.read()

	# Decodificar el contenido
	try:
	fixed_content = content.decode('utf-8').encode('latin1').decode('utf-8')
	except UnicodeDecodeError:
	fixed_content = content.decode('latin1')

	# Corregir las vocales con acento mal codificadas
	replacements = {
	"Ã¡": "á", "Ã©": "é", "Ã": "í", "Ã³": "ó", "Ãº": "ú",
	"Ã�": "Á", "Ã‰": "É", "Ã�": "Í", "Ã“": "Ó", "Ãš": "Ú",
	"Ã±": "ñ", "Ã‘": "Ñ", "Ã¼": "ü", "Ãœ": "Ü"
	}
	for broken, correct in replacements.items():
	fixed_content = fixed_content.replace(broken, correct)

	# Reemplazar 'encoding' 'latin1' por 'encoding' 'utf8'
	fixed_content = re.sub(r"\('encoding' 'latin1'\)", "('encoding' 'utf8')", fixed_content)

	# Guardar el archivo corregido
	with open(output_file, 'w', encoding='utf-8') as f:
	f.write(fixed_content)

	print(f"Archivo corregido guardado en: {output_file}")

	# Ejemplo de uso
	fix_encoding('songs.dta', 'songs.dta.fix')