gaurav5430 · June 15, 2021 15:39 · SilviaIenciu · Jun 15, 2021 · gaurav5430 · Jun 15, 2021
diff --git a/nltk-lemmatize-sentences.py b/nltk-lemmatize-sentences.py
 import nltk
 from nltk.stem import WordNetLemmatizer
 from nltk.corpus import wordnet

 lemmatizer = WordNetLemmatizer()

 # function to convert nltk tag to wordnet tag
 def nltk_tag_to_wordnet_tag(nltk_tag):
    if nltk_tag.startswith('J'):
        return wordnet.ADJ
    elif nltk_tag.startswith('V'):
        return wordnet.VERB
    elif nltk_tag.startswith('N'):
        return wordnet.NOUN
    elif nltk_tag.startswith('R'):
        return wordnet.ADV
    else:          
        return None

 def lemmatize_sentence(sentence):
    #tokenize the sentence and find the POS tag for each token
    nltk_tagged = nltk.pos_tag(nltk.word_tokenize(sentence))  
    #tuple of (token, wordnet_tag)
    wordnet_tagged = map(lambda x: (x[0], nltk_tag_to_wordnet_tag(x[1])), nltk_tagged)
    lemmatized_sentence = []
    for word, tag in wordnet_tagged:
        if tag is None:
            #if there is no available tag, append the token as is
            lemmatized_sentence.append(word)
        else:        
            #else use the tag to lemmatize the token
            lemmatized_sentence.append(lemmatizer.lemmatize(word, tag))
    return " ".join(lemmatized_sentence)

 print(lemmatizer.lemmatize("I am loving it")) #I am loving it
 print(lemmatizer.lemmatize("loving")) #loving
 print(lemmatizer.lemmatize("loving", "v")) #love
 print(lemmatize_sentence("I am loving it")) #I be love it
	import nltk
	from nltk.stem import WordNetLemmatizer
	from nltk.corpus import wordnet

	lemmatizer = WordNetLemmatizer()

	# function to convert nltk tag to wordnet tag
	def nltk_tag_to_wordnet_tag(nltk_tag):
	if nltk_tag.startswith('J'):
	return wordnet.ADJ
	elif nltk_tag.startswith('V'):
	return wordnet.VERB
	elif nltk_tag.startswith('N'):
	return wordnet.NOUN
	elif nltk_tag.startswith('R'):
	return wordnet.ADV
	else:
	return None

	def lemmatize_sentence(sentence):
	#tokenize the sentence and find the POS tag for each token
	nltk_tagged = nltk.pos_tag(nltk.word_tokenize(sentence))
	#tuple of (token, wordnet_tag)
	wordnet_tagged = map(lambda x: (x[0], nltk_tag_to_wordnet_tag(x[1])), nltk_tagged)
	lemmatized_sentence = []
	for word, tag in wordnet_tagged:
	if tag is None:
	#if there is no available tag, append the token as is
	lemmatized_sentence.append(word)
	else:
	#else use the tag to lemmatize the token
	lemmatized_sentence.append(lemmatizer.lemmatize(word, tag))
	return " ".join(lemmatized_sentence)

	print(lemmatizer.lemmatize("I am loving it")) #I am loving it
	print(lemmatizer.lemmatize("loving")) #loving
	print(lemmatizer.lemmatize("loving", "v")) #love
	print(lemmatize_sentence("I am loving it")) #I be love it