courts.tjmg.client.TJMGScraper
courts.tjmg.client.TJMGScraper(sleep_time=1.0)Scraper for the Court of Justice of Minas Gerais.
The TJMG jurisprudence search uses a 5-digit numeric image captcha that is decoded with txtcaptcha <https://github.com/jtrecenti/txtcaptcha>_. Captcha validation is flagged once per session, so pagination reuses the same HTTP session after the first successful decoding.
Methods
| Name | Description |
|---|---|
| cjsg | Busca jurisprudencia no TJMG (acordaos com captcha numerico). |
| cjsg_download | Run a TJMG acórdão search and return the raw HTML of each page. |
| cjsg_parse | Transform raw TJMG HTML pages into a DataFrame. |
| cpopg | Stub: first degree case search not implemented for TJMG. |
| cposg | Stub: second degree case search not implemented for TJMG. |
cjsg
courts.tjmg.client.TJMGScraper.cjsg(
pesquisa=None,
paginas=None,
pesquisar_por='ementa',
order_by=2,
tamanho_pagina=10,
**kwargs,
)Busca jurisprudencia no TJMG (acordaos com captcha numerico).
Parameters
| Name | Type | Description | Default |
|---|---|---|---|
| pesquisa | str | Termo de busca livre. | None |
| paginas | int | list | range | None | Paginas 1-based; None baixa todas. Default None (cap de 400 resultados, limite do TJMG). |
None |
| pesquisar_por | {'ementa', 'acordao'} | Campo onde buscar. "acordao" busca no inteiro teor. Default "ementa". |
'ementa' |
| order_by | int | str | Ordenacao: 2 data julgamento, 1 data publicacao, 0 precisao. Default 2. |
2 |
| tamanho_pagina | int | Resultados por pagina (10, 20 ou 50). | 10 |
| **kwargs | Filtros aceitos pelo schema :class:InputCJSGTJMG. Listados abaixo (todos opcionais; None = sem filtro): * data_julgamento_inicio / data_julgamento_fim (str): DD/MM/AAAA. Backend: dataJulgamentoInicial / dataJulgamentoFinal. * data_publicacao_inicio / data_publicacao_fim (str): DD/MM/AAAA. Backend: dataPublicacaoInicial / dataPublicacaoFinal. |
{} |
Aliases deprecados (popados com DeprecationWarning antes do pydantic): * query / termo -> pesquisa * data_inicio / data_fim -> data_julgamento_inicio / _fim * data_julgamento_de / _ate -> data_julgamento_inicio / _fim * data_publicacao_de / _ate -> data_publicacao_inicio / _fim * linhas_por_pagina -> tamanho_pagina
Raises
| Name | Type | Description |
|---|---|---|
| TypeError | Quando um kwarg desconhecido e passado. | |
| ValidationError | Quando um filtro tem formato invalido. |
Returns
| Name | Type | Description |
|---|---|---|
| pd.DataFrame | pd.DataFrame: DataFrame com os acordaos. |
See also
cjsg_download
courts.tjmg.client.TJMGScraper.cjsg_download(
pesquisa=None,
paginas=None,
pesquisar_por='ementa',
order_by=2,
tamanho_pagina=10,
data_julgamento_inicio=None,
data_julgamento_fim=None,
data_publicacao_inicio=None,
data_publicacao_fim=None,
**kwargs,
)Run a TJMG acórdão search and return the raw HTML of each page.
Aceita os mesmos filtros de :meth:cjsg; veja la a lista completa.
Parameters
pesquisa : str Free-text search term. paginas : int, list, range or None Pages to download (1-based). None downloads every page (capped at 400 results, the TJMG limit). pesquisar_por : str Field to search in: "ementa" or "acordao" (inteiro teor). order_by : int Sort order: 2 data julgamento, 1 data publicação, 0 precisão. tamanho_pagina : int Results per page (10, 20 or 50). Aceita linhas_por_pagina como alias deprecado. data_julgamento_inicio, data_julgamento_fim : str Julgamento date range (dd/mm/yyyy or yyyy-mm-dd). data_publicacao_inicio, data_publicacao_fim : str Publicação date range (dd/mm/yyyy or yyyy-mm-dd).
cjsg_parse
courts.tjmg.client.TJMGScraper.cjsg_parse(raw_pages)Transform raw TJMG HTML pages into a DataFrame.
cpopg
courts.tjmg.client.TJMGScraper.cpopg(id_cnj)Stub: first degree case search not implemented for TJMG.
cposg
courts.tjmg.client.TJMGScraper.cposg(id_cnj)Stub: second degree case search not implemented for TJMG.