Bernard Antwi Adabankah benadaba

Devops/Data Science

mick001 / logistic_regression.R

Last active June 14, 2024 07:59

Logistic regression tutorial code. Full article available at http://datascienceplus.com/perform-logistic-regression-in-r/

	# Load the raw training data and replace missing values with NA
	training.data.raw <- read.csv('train.csv',header=T,na.strings=c(""))

	# Output the number of missing values for each column
	sapply(training.data.raw,function(x) sum(is.na(x)))

	# Quick check for how many different values for each feature
	sapply(training.data.raw, function(x) length(unique(x)))

	# A visual way to check for missing data

TomAugspurger / dplyr_pandas.ipynb

Last active March 17, 2022 18:50

Sorry, something went wrong. Reload?

Sorry, we cannot display this file.

Sorry, this file is invalid so it cannot be displayed.

kljensen / onehot_pandas_scikit.py

Last active May 18, 2020 23:17 — forked from anonymous/onehot_pandas_scikit.py

	# -- coding: utf-8 --
	""" Small script that shows hot to do one hot encoding
	of categorical columns in a pandas DataFrame.

	See:
	http://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.OneHotEncoder.html#sklearn.preprocessing.OneHotEncoder
	http://scikit-learn.org/dev/modules/generated/sklearn.feature_extraction.DictVectorizer.html
	"""
	import pandas
	import random