Olá, estou tentando avaliar se a distância do ponto do impacto em um rio (preditor; dist_conf ) explica a variação em um índice de integridade ecológica (resposta; exerg_total).
Após verificar que uma regressão linear não se ajustaria bem aos dados. Resolvi verificar uma regressão com splines, que se ajustou bem melhor. Inclusive, representando graficamente o que eu esperava observar: Antes do zero são pontos dentro do rio que não sofreram o impacto, e que apresentam índices de qualidade com maior valor; o zero é o local de impacto, então logo após o zero eu tenho uma redução do valor do índice de qualidade; e a medida em que se afastar do ponto de impacto (zero) o índice volta a aumentar, o que poderia significar uma melhora da qualidade do rio na medida em que se afasta do impacto.
A minha dúvida é:
-
Se eu posso interpretar esse gráfico de regressão com spline dessa forma que eu descrevi acima.
-
Como eu interpreto os valores obtidos no summary do modelo? Como eu interpreto os valores do intercepto? Com o spline o modelo passa a ter dois pedaços (já que escolhi deg_free = 2) e eu tenho um beta para cada trecho? (não posso colocar os )
receita_exergtotal <- recipe(exerg_total ~ dist_conf, data = exergias)|>
step_ns(dist_conf, deg_free = 2)
# Definir Modelo
lm_modelo <- linear_reg() |>
set_engine("lm") |>
set_mode("regression")
# Workflow
lm_wflow <-
workflow() |>
add_model(modelo) |>
add_recipe(receita_exergtotal)
# Ajustando Modelo
lm_fit <- fit(lm_wflow, exergias)
lm_fit
# Extrair resultados:
# extract_fit_engine()
reg1 <- extract_fit_engine(lm_fit)
summary(reg1) ```
Call:
stats::lm(formula = ..y ~ ., data = data)
Residuals:
Min 1Q Median 3Q Max
-30641.3 -3349.8 259.6 3149.3 22497.4
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 20225.0 7793.0 2.595 0.0234 *
dist_conf_ns_1 385.9 20765.9 0.019 0.9855
dist_conf_ns_2 91445.9 11700.4 7.816 4.77e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 12940 on 12 degrees of freedom
Multiple R-squared: 0.8359, Adjusted R-squared: 0.8086
F-statistic: 30.57 on 2 and 12 DF, p-value: 1.949e-05