Um cientista de dados deseja criar um modelo de regressão linear para prever o preço de uma casa com base em seu tamanho (em metros quadrados). Ele coletou os seguintes dados:
Tamanho (m²) | Preço (mil reais) |
---|---|
50 | 200 |
80 | 320 |
100 | 400 |
150 | 600 |
200 | 800 |
Com base nos dados acima, qual das seguintes opções representa corretamente a separação das variáveis X
(entrada) e y
(saída) no Scikit-learn?
a)
X = [50, 80, 100, 150, 200]
y = [200, 320, 400, 600, 800]
b)
X = [[50], [80], [100], [150], [200]]
y = [200, 320, 400, 600, 800]
c)
X = [50, 80, 100, 150, 200]
y = [[200], [320], [400], [600], [800]]
d)
X = [[50, 80, 100, 150, 200]]
y = [200, 320, 400, 600, 800]
Após definir corretamente X e y, o cientista de dados quer criar e treinar o modelo de regressão linear no Scikit-learn.
Qual das seguintes opções completa corretamente o código abaixo?
from sklearn.linear_model import LinearRegression
modelo = LinearRegression()
_____ # Linha que falta aqui
modelo.fit(X, y)
a) modelo.train(X, y)
b) modelo.learn(X, y)
c) modelo.fit(X, y)
d) modelo.prepare(X, y)
O modelo treinado agora pode prever preços de casas com base no tamanho. Se o cientista de dados usar o seguinte código:
preco_previsto = modelo.predict([[120]])
print(preco_previsto)
E sabendo que a relação entre tamanho e preço é linear, qual será o preço previsto para uma casa de 120m²?
a) 500 mil reais
b) 450 mil reais
c) 480 mil reais
d) 420 mil reais