courts.tjmg.client.TJMGScraper

courts.tjmg.client.TJMGScraper(sleep_time=1.0)

Scraper for the Court of Justice of Minas Gerais.

The TJMG jurisprudence search uses a 5-digit numeric image captcha that is decoded with txtcaptcha <https://github.com/jtrecenti/txtcaptcha>_. Captcha validation is flagged once per session, so pagination reuses the same HTTP session after the first successful decoding.

Methods

Name Description
cjsg Busca jurisprudencia no TJMG (acordaos com captcha numerico).
cjsg_download Run a TJMG acórdão search and return the raw HTML of each page.
cjsg_parse Transform raw TJMG HTML pages into a DataFrame.
cpopg Stub: first degree case search not implemented for TJMG.
cposg Stub: second degree case search not implemented for TJMG.

cjsg

courts.tjmg.client.TJMGScraper.cjsg(
    pesquisa=None,
    paginas=None,
    pesquisar_por='ementa',
    order_by=2,
    tamanho_pagina=10,
    **kwargs,
)

Busca jurisprudencia no TJMG (acordaos com captcha numerico).

Parameters

Name Type Description Default
pesquisa str Termo de busca livre. None
paginas int | list | range | None Paginas 1-based; None baixa todas. Default None (cap de 400 resultados, limite do TJMG). None
pesquisar_por {'ementa', 'acordao'} Campo onde buscar. "acordao" busca no inteiro teor. Default "ementa". 'ementa'
order_by int | str Ordenacao: 2 data julgamento, 1 data publicacao, 0 precisao. Default 2. 2
tamanho_pagina int Resultados por pagina (10, 20 ou 50). 10
**kwargs Filtros aceitos pelo schema :class:InputCJSGTJMG. Listados abaixo (todos opcionais; None = sem filtro): * data_julgamento_inicio / data_julgamento_fim (str): DD/MM/AAAA. Backend: dataJulgamentoInicial / dataJulgamentoFinal. * data_publicacao_inicio / data_publicacao_fim (str): DD/MM/AAAA. Backend: dataPublicacaoInicial / dataPublicacaoFinal. {}

Aliases deprecados (popados com DeprecationWarning antes do pydantic): * query / termo -> pesquisa * data_inicio / data_fim -> data_julgamento_inicio / _fim * data_julgamento_de / _ate -> data_julgamento_inicio / _fim * data_publicacao_de / _ate -> data_publicacao_inicio / _fim * linhas_por_pagina -> tamanho_pagina

Raises

Name Type Description
TypeError Quando um kwarg desconhecido e passado.
ValidationError Quando um filtro tem formato invalido.

Returns

Name Type Description
pd.DataFrame pd.DataFrame: DataFrame com os acordaos.

See also

— schema pydantic e a fonte da verdade dos filtros aceitos.

cjsg_download

courts.tjmg.client.TJMGScraper.cjsg_download(
    pesquisa=None,
    paginas=None,
    pesquisar_por='ementa',
    order_by=2,
    tamanho_pagina=10,
    data_julgamento_inicio=None,
    data_julgamento_fim=None,
    data_publicacao_inicio=None,
    data_publicacao_fim=None,
    **kwargs,
)

Run a TJMG acórdão search and return the raw HTML of each page.

Aceita os mesmos filtros de :meth:cjsg; veja la a lista completa.

Parameters

pesquisa : str Free-text search term. paginas : int, list, range or None Pages to download (1-based). None downloads every page (capped at 400 results, the TJMG limit). pesquisar_por : str Field to search in: "ementa" or "acordao" (inteiro teor). order_by : int Sort order: 2 data julgamento, 1 data publicação, 0 precisão. tamanho_pagina : int Results per page (10, 20 or 50). Aceita linhas_por_pagina como alias deprecado. data_julgamento_inicio, data_julgamento_fim : str Julgamento date range (dd/mm/yyyy or yyyy-mm-dd). data_publicacao_inicio, data_publicacao_fim : str Publicação date range (dd/mm/yyyy or yyyy-mm-dd).

cjsg_parse

courts.tjmg.client.TJMGScraper.cjsg_parse(raw_pages)

Transform raw TJMG HTML pages into a DataFrame.

cpopg

courts.tjmg.client.TJMGScraper.cpopg(id_cnj)

Stub: first degree case search not implemented for TJMG.

cposg

courts.tjmg.client.TJMGScraper.cposg(id_cnj)

Stub: second degree case search not implemented for TJMG.