Sobre a Disciplina

Ciência de Dados Aplicada ao Direito 2

Sobre mim

Faxineiro de dados. Doutor em Estatística pelo IME-USP. Professor Auxiliar de Ciência de Dados no Insper. Diretor-Técnico da Associação Brasileira de Jurimetria (ABJ). Trabalho com web scraping, arrumação de dados, inteligência artificial, processamento de linguagem natural, visualização de dados e dashboards.

https://jtrecenti.com/cv

Sobre vocês

Caso: Barragem

Pergunta

Qual é o valor de acordo a ser negociado na parte de danos morais?

Operacionalização

Um valor de acordo razoável é aquele que não é exorbitante nem irrisório em discussões similares no STJ

Súmula 7. A pretensão de simples reexame de prova não enseja recurso especial.

O valor arbitrado pelas instâncias ordinárias a título de danos morais somente pode ser revisado em recurso especial quando irrisório ou exorbitante

Resultado

Metodologia

Para chegar a esse resultado, precisamos:

  • Planejar uma amostra para coletar dados da jurisprudência do STJ
  • Calcular as estatísticas de posição e variabilidade (média, mediana, desvio padrão)
  • Estimar a probabilidade de um valor ser considerado exorbitante ou irrisório
  • Criar visualizações de dados sofisticadas e reprodutíveis
  • Conduzir uma análise de regressão para associar os valores às características dos processos

O foco do nosso curso é desenvolver essas habilidades.

A disciplina

Objetivos de aprendizagem

  • Compreender dados jurídicos sob a ótica estatística
  • Aplicar técnicas de amostragem adequados para análise de processos
  • Aplicar modelos de estatística inferencial em problemas jurídicos
  • Utilizar a linguagem python para elaboração de estudos reprodutíveis
  • Aplicar os conceitos aprendidos para desenvolver uma solução tecnológica para o Direito

Desejo

Queremos que vocês sejam capazes de identificar, ao longo da carreira de vocês, situações onde a utilização da ciência de dados é útil ou necessária.

Uma parte de vocês desenvolverá projetos ou produtos completamente baseados em dados. Outra parte irá utilizar os conceitos para avaliar e criticar projetos e produtos. Outra parte liderará equipes interdisciplinares que envolvem cientistas de dados.

De toda forma, os conceitos trabalhados aqui provavelmente aparecerão em algum momento da carreira de vocês.

Agenda do curso por semana

Aula: 05/02/2024

  • Apresentação da disciplina e discussão sobre o uso de dados no Direito

Aula: 09/02/2024

  • Revisão: Variáveis Categóricas e Numéricas. Variáveis Binárias, Ordinais; Discretas e Contínuas.
  • Revisão: Proporções, porcentagens, razões e taxas, distribuição de frequência, classificações percentis

Feriado: 12/02/2024

Aula: 16/02/2024

  • Exemplo de aplicação, grupos e discussão APS

Aula: 19/02/2024

  • Revisão: média, moda, mediana, desvio padrão. Variação interquartil. Levin & Fox 11a ed pp. 77-91; 97-109.

Desafio 1

Aula: 23/02/2024

  • Revisão: média, moda, mediana, desvio padrão. Variação interquartil, continuação. Levin & Fox 11a ed pp. 77-91; 97-109.

Aula: 26/02/2024

  • Visualizações com a biblioteca seaborn.

Aula: 01/03/2024

  • Visualizações com a biblioteca seaborn.

Desafio 2.

Aula: 04/03/2024

  • Amostras e populações. Levin & Fox 11a ed pp. 154-181.

Aula: 08/03/2024

  • Amostras e populações. Levin & Fox 11a ed pp. 154-181.

Case: Viés de seleção

Aula: 11/03/2024

  • Probabilidade e curva normal. Levin & Fox 11a ed pp. 122-148.

Desafio 3.

Provas Intermediárias: 15/03/2024

Provas Intermediárias: 18/03/2024

Sem aulas: 22/03/2024

Aula: 25/03/2024

  • Probabilidade e curva normal. Levin & Fox 11a ed pp. 122-148.

Feriado: 29/03/2024

Aula: 01/04/2024

  • Teste de diferença/teste de hipótese. Levin & Fox 11a ed pp. 188-221.

Aulas: 02/04/2024, 9h45-11h45 e 04/04/2024, 15h45-17h45

  • Apresentações APS

Aula: 05/04/2024

  • Teste de diferença/teste de hipótese. Levin & Fox 11a ed pp. 188-221.

Desafio 4.

Case: Litigiosidade

Aula: 08/04/2024

  • Correlação. Levin & Fox 11a ed pp. 300-319. Regressão. Levin & Fox 11a ed pp. 325-337.

Aula: 12/04/2024

  • Correlação. Levin & Fox 11a ed pp. 300-319. Regressão. Levin & Fox 11a ed pp. 325-337.

Aula: 15/04/2024

  • Regressão. Levin & Fox 11a ed pp. 325-337.

Desafio 5.

Aula: 19/04/2024

  • Regressão. Levin & Fox 11a ed pp. 325-337.

Aula: 22/04/2024

  • Revisão dos conceitos trabalhados no curso

Desafio 6

Aula do Guilherme: 26/04/2024

Aula do Guilherme: 29/04/2024

Provas finais: 03/05/2024

Provas finais: 06/05/2024

Sem aulas: 10/05/2024

Início das clínicas! 13/05/2024

Desafios

Teremos 6 desafios no total, todos a serem desenvolvidos no Prairie Learn.

A avaliação será automática, da mesma forma que na disciplina anterior.

Acesso ao Prairie Learn:

Notas dos desafios

Serão computadas as 5 melhores notas. A nota máxima é 100%.

Homeworks

  • Temos uma lista de exercícios (homeworks) para cada tópico, baseada no conteúdo da aula.

  • Os exercícios não são obrigatórios O objetivo é gerar dúvidas.

APS

  • Grupos de 5-6 alunos
  • Desenvolver uma proposta de produto de ciência de dados jurídicos para uso por um escritório de advocacia.
  • Preencher uma planilha com os nomes dos integrantes.
  • Entregas:
    • apresentação: pitch de 5 minutos por uma pessoa sorteada
    • relatório com até 1500 palavras com a proposta

A proposta deve conter:

  1. a definição do problema, validada por no mínimo 2 entrevistas com atuantes no mercado,

  2. a definição da solução, validada por no mínimo 2 (outras) entrevistas com pessoas atuantes no mercado

  3. a descrição da sustentabilidade financeira do produto, levando em consideração custos de desenvolvimento e manutenção e possíveis receitas.

  1. documento submetido pelo Blackboard até 15/04, contendo no máximo 1500 palavras. A transcrição das entrevistas deve constar em anexo e não é computada para o limite de palavras.

  2. pitch de 5 minutos feito em aula nos dias 02/04 e 04/04 e as respostas dadas pelo grupo a perguntas, críticas e provocações feitas por uma banca.

Participação

  • Ao longo das aulas, faremos pequenas dinâmicas para participação dos alunos.
  • Os alunos que participarem das dinâmicas ganharão o ponto de participação na média final.
  • Para anotar o nome de vocês, precisarei das plaquinhas, pelo menos nas primeiras aulas.

Avaliação final

  • Prova Intermediária: 20%
  • Prova Final: 30%
  • APS: 20%
  • Desafios: 20%
  • Participação: 10%

Atendimentos

5a feira, das 18h às 19h30

Obs: podemos aproveitar os atendimentos para fazer workshops! O primeiro será sobre o uso da API do GPT-4-Turbo, que ocorrerá no dia 22/02. Agendem!

Referências