class: center, middle, inverse, title-slide # DATA ARE DUMB ### Encontro estatístico CONRE-3 --- class: class: center, middle # Faxineiro de dados <img src="imgs/jtrecenti.png" width="90%" style="display: block; margin: auto;" /> --- ## Novos tempos? - Nos últimos anos os tipos de dados mudaram. - Coisas muito importantes no mercado hoje em dia: <img src="imgs/friends.jpg" width="23%" /><img src="imgs/acordao.png" width="23%" /><img src="imgs/wave.png" width="23%" /> --- ## Deep Learning - Popularidade recente da área de deep learning. - Promete fazer muitas coisas. - Tem um linguajar diferente do que estamos acostumados. <img src="imgs/deepl.png" width="70%" style="display: block; margin: auto;" /> --- ## Problemas - Muita, muita gente usando. -- - Mercado está pedindo. Só se fala nisso. -- - Não aprendemos nada disso na faculdade -- - O que estudamos é ultrapassado? --- class:inverse ## Não entre em pânico! <img src="imgs/panic.jpg" width="70%" style="display: block; margin: auto;" /> --- class: center, middle, inverse # Teoria --- # Judea Pearl <img src="imgs/judeapearl.png" width="100%" style="display: block; margin: auto;" /> --- # Três estruturas básicas -- ### Mediadores A -> B -> C -- ### Confundidores / garfos A <- B -> C -- ### Colisores A -> B <- C --- # Importância em regressão - mediador
```r n <- 1000 x1 <- rnorm(n) x2 <- 1 + x1 + rnorm(n) y <- 1 + x2 + rnorm(n) modelo <- lm(y ~ x1 + x2) coef(modelo) ## (Intercept) x1 x2 ## 1.08872056 0.01828541 0.96271373 ``` -- ```r modelo <- lm(y ~ x2) coef(modelo) ## (Intercept) x2 ## 1.0798605 0.9716253 ``` --- # Importância em regressão - confundidor
```r n <- 1000 x1 <- rnorm(n) x2 <- 1 + 2 * x1 + rnorm(n) y <- 1 + x1 + x2 + rnorm(n) modelo <- lm(y ~ x1) coef(modelo) ## (Intercept) x1 ## 1.915388 2.979533 ``` -- ```r modelo <- lm(y ~ x1 + x2) coef(modelo) ## (Intercept) x1 x2 ## 0.9335670 0.9577917 1.0250971 ``` --- # Importância em regressão - colisor
```r x2 <- rnorm(n) y <- rnorm(n) x1 <- 1 + 2 * x2 + 3 * y + rnorm(n) lm(y[x1 > 1] ~ x2[x1 > 1]) %>% summary() %>% broom::tidy() ## # A tibble: 2 x 5 ## term estimate std.error statistic p.value ## <chr> <dbl> <dbl> <dbl> <dbl> ## 1 (Intercept) 0.809 0.0337 24.0 4.25e-85 ## 2 x2[x1 > 1] -0.366 0.0322 -11.4 9.65e-27 ``` --- # Importância em regressão - colisor ```r lm(y ~ x2) %>% summary() %>% broom::tidy() ## # A tibble: 2 x 5 ## term estimate std.error statistic p.value ## <chr> <dbl> <dbl> <dbl> <dbl> ## 1 (Intercept) 0.0213 0.0312 0.685 0.494 ## 2 x2 -0.0210 0.0304 -0.691 0.490 ``` -- Viés de seleção --- # Wrap-up ### Essas coisas não são ignoradas por estatísticos -- ### Não é possível verificar boa parte desses problemas nos dados -- ### Fazer diagramas causais ajuda a entender o problema -- #### Pearl argumenta que não é só útil como necessário em problemas mais complexos --- class: inverse, middle # Paradoxos --- # Monty Hall <img src="imgs/montyhallproblem.png" width="100%" style="display: block; margin: auto;" /> --- # Colisor!
--- # Paradoxo de Berkson <img src="imgs/berkson.png" width="100%" style="display: block; margin: auto;" /> --- # Colisor!
--- # Paradoxo de Simpson <img src="imgs/simpson1.png" width="100%" style="display: block; margin: auto;" /> --- # Paradoxo de Simpson <img src="imgs/simpson2.png" width="100%" style="display: block; margin: auto;" /> --- # Confundimento!
-- Nesse caso, temos de controlar por Idade e sexo --- # Outro exemplo! <img src="imgs/simpson3.png" width="100%" style="display: block; margin: auto;" /> --- # Confundimento!
-- Nesse caso, não é para controlar por pressão --- # Wrap-up ### Diagramas causais resolvem paradoxos estatísticos facilmente -- ### Nem tudo está nos dados -- ### Reflexão: é possível implementar causalidade em deep learning? --- # Me stalkeia - CONRE-3: [jtrecenti@conre3.org.br](mailto:jtrecenti@conre3.org.br) - Curso-R: [jtrecenti@curso-r.com](mailto:jtrecenti@curso-r.com) - ABJ: [jtrecenti@abj.org.br](mailto:jtrecenti@abj.org.br) ## Páginas: - https://curso-r.com - https://abj.org.br - https://github.com/jtrecenti Apresentação: https://jtrecenti.github.io/slides/encontro-conre3/