jalbertbowden · February 12, 2021 21:59
diff --git a/bs-scrape-docx.py b/bs-scrape-docx.py
 from bs4 import BeautifulSoup

 docx_form = 'form_example/word/document.xml'

 infile = open(docx_form, 'r')

 contents = infile.read()

 soup = BeautifulSoup(contents, 'xml')

 xps = soup.find_all('wps:txbx')

 for xp in xps:
 	print(xp.get_text())
	from bs4 import BeautifulSoup

	docx_form = 'form_example/word/document.xml'

	infile = open(docx_form, 'r')

	contents = infile.read()

	soup = BeautifulSoup(contents, 'xml')

	xps = soup.find_all('wps:txbx')

	for xp in xps:
	print(xp.get_text())