courts.tjto.client.TJTOScraper
courts.tjto.client.TJTOScraper(
verbose=0,
download_path=None,
sleep_time=1.0,
**kwargs,
)Scraper for the Tribunal de Justica do Tocantins.
Methods
| Name | Description |
|---|---|
| cjpg | Busca jurisprudencia de 1o grau no TJTO (download + parse). |
| cjpg_download | Download raw HTML pages from the TJTO first-instance jurisprudence search. |
| cjpg_parse | Parse raw HTML pages downloaded by cjpg_download. |
| cjsg | Busca jurisprudencia de 2o grau no TJTO (download + parse). |
| cjsg_download | Download raw HTML pages from the TJTO second-instance jurisprudence search. |
| cjsg_ementa | Fetch the ementa for a specific document by UUID. |
| cjsg_parse | Parse raw HTML pages downloaded by cjsg_download. |
| cpopg | Stub: first instance case consultation not implemented for TJTO. |
| cposg | Stub: second instance case consultation not implemented for TJTO. |
cjpg
courts.tjto.client.TJTOScraper.cjpg(
pesquisa=None,
paginas=None,
tipo_documento='acordaos',
ordenacao='DESC',
numero_processo=None,
data_julgamento_inicio=None,
data_julgamento_fim=None,
soementa=False,
**kwargs,
)Busca jurisprudencia de 1o grau no TJTO (download + parse).
Mesmos parametros de :meth:cjsg — a unica diferenca interna e instancia='1' em vez de '2'. Veja a docstring de :meth:cjsg para a lista completa.
See also
cjpg_download
courts.tjto.client.TJTOScraper.cjpg_download(
pesquisa=None,
paginas=None,
tipo_documento='acordaos',
ordenacao='DESC',
numero_processo=None,
data_julgamento_inicio=None,
data_julgamento_fim=None,
soementa=False,
**kwargs,
)Download raw HTML pages from the TJTO first-instance jurisprudence search.
Shortcut for the download with instancia='1'. Aceita os mesmos filtros de :meth:cjpg; veja la a lista completa.
Returns
| Name | Type | Description |
|---|---|---|
| list | list | Lista de paginas HTML cruas. |
cjpg_parse
courts.tjto.client.TJTOScraper.cjpg_parse(resultados_brutos)Parse raw HTML pages downloaded by cjpg_download.
Parameters
| Name | Type | Description | Default |
|---|---|---|---|
| resultados_brutos | list | List of raw HTML strings. | required |
Returns
| Name | Type | Description |
|---|---|---|
| pd.DataFrame | DataFrame with parsed results. |
cjsg
courts.tjto.client.TJTOScraper.cjsg(
pesquisa=None,
paginas=None,
tipo_documento='acordaos',
ordenacao='DESC',
numero_processo=None,
data_julgamento_inicio=None,
data_julgamento_fim=None,
soementa=False,
**kwargs,
)Busca jurisprudencia de 2o grau no TJTO (download + parse).
Parameters
| Name | Type | Description | Default |
|---|---|---|---|
| pesquisa | str | Termo de busca livre. | None |
| paginas | int | list | range | None | Paginas 1-based; None baixa todas. Default None. |
None |
| tipo_documento | str | "acordaos" (default), "decisoes" ou "sentencas". |
'acordaos' |
| ordenacao | str | "DESC" (mais recentes, default), "ASC" (mais antigos), "RELEV" (mais relevantes). |
'DESC' |
| numero_processo | str | Filtro por numero CNJ do processo. | None |
| data_julgamento_inicio | str | date | datetime | None | Data inicial. Aceita DD/MM/YYYY, DD-MM-YYYY, YYYY-MM-DD, YYYY/MM/DD, date ou datetime. |
None |
| data_julgamento_fim | str | date | datetime | None | Data final (mesmos formatos). | None |
| soementa | bool | Se True, restringe busca ao texto da ementa. |
False |
| **kwargs | Filtros aceitos pelo schema :class:InputCJSGTJTO. |
{} |
Aliases deprecados (popados com DeprecationWarning antes do pydantic): * query / termo -> pesquisa * data_inicio / data_fim -> data_julgamento_inicio / _fim * data_julgamento_de / _ate -> data_julgamento_inicio / _fim
Raises
| Name | Type | Description |
|---|---|---|
| TypeError | Quando um kwarg desconhecido e passado. | |
| ValueError | Quando um canonico e seu alias deprecado sao passados simultaneamente. | |
| ValidationError | Quando um filtro tem formato invalido. |
Returns
| Name | Type | Description |
|---|---|---|
| pd.DataFrame | pd.DataFrame: DataFrame com as decisoes. |
See also
cjsg_download
courts.tjto.client.TJTOScraper.cjsg_download(
pesquisa=None,
paginas=None,
tipo_documento='acordaos',
ordenacao='DESC',
numero_processo=None,
data_julgamento_inicio=None,
data_julgamento_fim=None,
soementa=False,
**kwargs,
)Download raw HTML pages from the TJTO second-instance jurisprudence search.
Aceita os mesmos filtros de :meth:cjsg; veja la a lista completa.
Returns
| Name | Type | Description |
|---|---|---|
| list | list | Lista de paginas HTML cruas. |
cjsg_ementa
courts.tjto.client.TJTOScraper.cjsg_ementa(uuid)Fetch the ementa for a specific document by UUID.
Parameters
| Name | Type | Description | Default |
|---|---|---|---|
| uuid | str | The document UUID (from the ‘uuid’ column in cjsg/cjpg results). | required |
Returns
| Name | Type | Description |
|---|---|---|
| dict | Dict with ementa text and process number. |
cjsg_parse
courts.tjto.client.TJTOScraper.cjsg_parse(resultados_brutos)Parse raw HTML pages downloaded by cjsg_download.
Parameters
| Name | Type | Description | Default |
|---|---|---|---|
| resultados_brutos | list | List of raw HTML strings. | required |
Returns
| Name | Type | Description |
|---|---|---|
| pd.DataFrame | DataFrame with parsed results. |
cpopg
courts.tjto.client.TJTOScraper.cpopg(id_cnj)Stub: first instance case consultation not implemented for TJTO.
cposg
courts.tjto.client.TJTOScraper.cposg(id_cnj)Stub: second instance case consultation not implemented for TJTO.