class: center, middle, inverse, title-slide # FMU ### São Paulo, 2019-05-07 --- class: class: center, middle # Julio Trecenti <style type="text/css"> td { vertical-align: center; } </style> <small>Faxineiro de dados</small> <table style="border:none;border-color:none;"> <tr> <td><img style="border:none;height:60px" src='imgs/ime.png' /></td> <td>Doutorando em Estatística no IME-USP</td> </tr> <tr> <td><img style="border:none;height:50px" src='imgs/abj.png' /></td> <td>Secretário-geral da Associação Brasileira de Jurimetria</td> </tr> <tr> <td><img style="border:none;height:50px" src='imgs/terranova.png' /></td> <td>Sócio da Terranova Consultoria</td> </tr> <tr> <td><img style="border:none;height:50px" src='imgs/curso-r.png' /></td> <td>Sócio da Curso-R</td> </tr> <tr> <td><img style="border:none;height:50px" src='imgs/conre3.jpg' /></td> <td>Presidente do CONRE-3</td> </tr> </table> --- class: middle, center ### Provocação <img src="abertura_amostra_files/figure-html/unnamed-chunk-1-1.png" width="80%" style="display: block; margin: auto;" /> -- ### R7: Mercado procura por cientistas de dados e promete salários de mais de R$ 20 mil [http://bit.ly/r7-ds](http://bit.ly/r7-ds) --- ## Novos tempos? - Nos últimos anos os tipos de dados mudaram. - Coisas muito importantes no mercado hoje em dia: <img src="imgs/friends.jpg" width="23%" /><img src="imgs/acordao.png" width="23%" /><img src="imgs/wave.png" width="23%" /> --- ## Deep Learning - Popularidade recente da área de deep learning. - Promete fazer muitas coisas. - Tem um linguajar diferente do que estamos acostumados. <img src="imgs/deepl.png" width="70%" style="display: block; margin: auto;" /> --- ## Problemas - Muita, muita gente usando. -- - Mercado está pedindo. Só se fala nisso. -- - Não aprendemos nada disso na faculdade -- - O que estudamos é ultrapassado? --- class: inverse, middle, center # Depressão --- ## Marketing e diagramas de venn <img src="imgs/diff.png" width="90%" style="display: block; margin: auto;" /> --- ## Marketing e diagramas de venn <img src="imgs/dsvenn1.png" width="80%" style="display: block; margin: auto;" /> --- ## Marketing e diagramas de venn <img src="imgs/dsvenn2.png" width="90%" style="display: block; margin: auto;" /> --- ## Marketing e diagramas de venn <img src="imgs/dsvenn3.png" width="80%" style="display: block; margin: auto;" /> --- ## Depressão <img src="imgs/quit.png" width="90%" style="display: block; margin: auto;" /> --- ## Depressão 2 <img src="imgs/dead.png" width="90%" style="display: block; margin: auto;" /> --- class:inverse ## Não entre em pânico! <img src="imgs/panic.jpg" width="70%" style="display: block; margin: auto;" /> --- ## Não entre em pânico! - Mais importante do que **definir** ciência de dados é **fazer** ciência de dados <img src="imgs/data-science.png" width="90%" style="display: block; margin: auto;" /> -- - Existem muitos falsos cognatos. -- - A maioria das coisas que estudamos é útil. -- - Ainda assim, vale à pena estudar os conceitos. -- ## QUESTIONE --- ## Regressão logística <img src="imgs/glm.png" width="90%" style="display: block; margin: auto;" /> --- ## Função Deviance $$ D(y,\hat\mu(x)) = \sum_{i=1}^n 2\left[y_i\log\frac{y_i}{\hat\mu_i(x_i)} + (1-y_i)\log\left(\frac{1-y_i}{1-\hat\mu_i(x_i)}\right)\right] $$ $$ = 2 D_{KL}\left(y||\hat\mu(x)\right), $$ onde `\(D_{KL}(p||q) = \sum_i p_i\log\frac{p_i}{q_i}\)` é a divergência de Kullback-Leibler. --- ## Deep learning <img src="imgs/y1.png" width="100%" style="display: block; margin: auto;" /> - Faz uma combinação linear inputs `\(x\)`, adiciona um viés (*bias*) e depois aplica uma função de ativação não linear. `$$f(x) = \sigma(wx + b)$$` - Coincidência? --- ## Função de custo $$ D_{KL}(p(x)||q(x)) $$ Conclusão: rede neural com uma camada é equivalente à regressão logística. <img src="imgs/thinking.png" width="20%" style="display: block; margin: auto;" /> -- ## Dúvidas - Se é a mesma coisa, por que está ganhando tanta popularidade? - Devo estudar deep learning ou posso continuar fazendo regressão logística? --- class: inverse, center, middle # Qual é o meu papel? --- class: center, middle # Somos os líderes da ciência de dados! --- ## Onde estamos <img src="imgs/img01.png" width="90%" style="display: block; margin: auto;" /> --- ## Ciência de dados <img src="imgs/img02.png" width="90%" style="display: block; margin: auto;" /> --- class: center, middle # O que queremos? --- ## Aumentar registros <img src="imgs/img03.png" width="90%" style="display: block; margin: auto;" /> --- ## Mais formados, menos evasão <img src="imgs/img04.png" width="90%" style="display: block; margin: auto;" /> --- ## Trazer os cientistas de dados <img src="imgs/img05.png" width="90%" style="display: block; margin: auto;" /> --- class: inverse, center, middle # O que devemos fazer? --- # O que você quer? -- ## APRENDER (A) - Saber muitas coisas, escrever artigos, pôr sua curiosidade em prática -- ## RESOLVER (R) - Ganhar dinheiro, fazer sua empresa crescer, construir uma família -- ## PARTILHAR (P) - Divulgar a profissão, ser relevante nas redes, ajudar a comunidade --- # Focos -- ## 1. [APR] Faça parte e monte comunidades -- ## 2. [PAR] Seja relevante na web -- ## 3. [ARP] Estude, aprenda, atualize, use R -- ## 4. [RPA] Aproveite a universidade -- ## 5. [RAP] Apareça na universidade --- class: inverse, middle # E o conselho? --- # O que estamos fazendo? ## Fiscalização - Pesquisas Eleitorais -- ## Comunicação - **Inbound**: Fazer os estatísticos procurarem o CONRE - **Outbound**: Levar o CONRE aos estatísticos -- ## Próximos passos --- # Fiscalização: pesqEle - http://pesqele.conre3.org.br/app/ <img src="imgs/pesqele.png" width="90%" style="display: block; margin: auto;" /> --- # Comunicação: atividades - Coleta de dados de formandos - Funil de comunicação - Visitas nas universidades - Resolução 325 <img src="imgs/carteirinha.jpg" width="50%" style="display: block; margin: auto;" /> --- # Me stalkeia - CONRE-3: [jtrecenti@conre3.org.br](mailto:jtrecenti@conre3.org.br) - Curso-R: [jtrecenti@curso-r.com](mailto:jtrecenti@curso-r.com) - ABJ: [jtrecenti@abj.org.br](mailto:jtrecenti@abj.org.br) - Platipus: [jtrecenti@platipus.com.br](mailto:jtrecenti@platipus.com.br) ## Páginas: - https://curso-r.com - https://abj.org.br - https://github.com/jtrecenti Apresentação: https://jtrecenti.github.com/slides/fmu/