courts.tjto.client.TJTOScraper

courts.tjto.client.TJTOScraper(
    verbose=0,
    download_path=None,
    sleep_time=1.0,
    **kwargs,
)

Scraper for the Tribunal de Justica do Tocantins.

Methods

Name Description
cjpg Busca jurisprudencia de 1o grau no TJTO (download + parse).
cjpg_download Download raw HTML pages from the TJTO first-instance jurisprudence search.
cjpg_parse Parse raw HTML pages downloaded by cjpg_download.
cjsg Busca jurisprudencia de 2o grau no TJTO (download + parse).
cjsg_download Download raw HTML pages from the TJTO second-instance jurisprudence search.
cjsg_ementa Fetch the ementa for a specific document by UUID.
cjsg_parse Parse raw HTML pages downloaded by cjsg_download.
cpopg Stub: first instance case consultation not implemented for TJTO.
cposg Stub: second instance case consultation not implemented for TJTO.

cjpg

courts.tjto.client.TJTOScraper.cjpg(
    pesquisa=None,
    paginas=None,
    tipo_documento='acordaos',
    ordenacao='DESC',
    numero_processo=None,
    data_julgamento_inicio=None,
    data_julgamento_fim=None,
    soementa=False,
    **kwargs,
)

Busca jurisprudencia de 1o grau no TJTO (download + parse).

Mesmos parametros de :meth:cjsg — a unica diferenca interna e instancia='1' em vez de '2'. Veja a docstring de :meth:cjsg para a lista completa.

See also

— schema pydantic e a fonte da verdade dos filtros aceitos.

cjpg_download

courts.tjto.client.TJTOScraper.cjpg_download(
    pesquisa=None,
    paginas=None,
    tipo_documento='acordaos',
    ordenacao='DESC',
    numero_processo=None,
    data_julgamento_inicio=None,
    data_julgamento_fim=None,
    soementa=False,
    **kwargs,
)

Download raw HTML pages from the TJTO first-instance jurisprudence search.

Shortcut for the download with instancia='1'. Aceita os mesmos filtros de :meth:cjpg; veja la a lista completa.

Returns

Name Type Description
list list Lista de paginas HTML cruas.

cjpg_parse

courts.tjto.client.TJTOScraper.cjpg_parse(resultados_brutos)

Parse raw HTML pages downloaded by cjpg_download.

Parameters

Name Type Description Default
resultados_brutos list List of raw HTML strings. required

Returns

Name Type Description
pd.DataFrame DataFrame with parsed results.

cjsg

courts.tjto.client.TJTOScraper.cjsg(
    pesquisa=None,
    paginas=None,
    tipo_documento='acordaos',
    ordenacao='DESC',
    numero_processo=None,
    data_julgamento_inicio=None,
    data_julgamento_fim=None,
    soementa=False,
    **kwargs,
)

Busca jurisprudencia de 2o grau no TJTO (download + parse).

Parameters

Name Type Description Default
pesquisa str Termo de busca livre. None
paginas int | list | range | None Paginas 1-based; None baixa todas. Default None. None
tipo_documento str "acordaos" (default), "decisoes" ou "sentencas". 'acordaos'
ordenacao str "DESC" (mais recentes, default), "ASC" (mais antigos), "RELEV" (mais relevantes). 'DESC'
numero_processo str Filtro por numero CNJ do processo. None
data_julgamento_inicio str | date | datetime | None Data inicial. Aceita DD/MM/YYYY, DD-MM-YYYY, YYYY-MM-DD, YYYY/MM/DD, date ou datetime. None
data_julgamento_fim str | date | datetime | None Data final (mesmos formatos). None
soementa bool Se True, restringe busca ao texto da ementa. False
**kwargs Filtros aceitos pelo schema :class:InputCJSGTJTO. {}

Aliases deprecados (popados com DeprecationWarning antes do pydantic): * query / termo -> pesquisa * data_inicio / data_fim -> data_julgamento_inicio / _fim * data_julgamento_de / _ate -> data_julgamento_inicio / _fim

Raises

Name Type Description
TypeError Quando um kwarg desconhecido e passado.
ValueError Quando um canonico e seu alias deprecado sao passados simultaneamente.
ValidationError Quando um filtro tem formato invalido.

Returns

Name Type Description
pd.DataFrame pd.DataFrame: DataFrame com as decisoes.

See also

— schema pydantic e a fonte da verdade dos filtros aceitos.

cjsg_download

courts.tjto.client.TJTOScraper.cjsg_download(
    pesquisa=None,
    paginas=None,
    tipo_documento='acordaos',
    ordenacao='DESC',
    numero_processo=None,
    data_julgamento_inicio=None,
    data_julgamento_fim=None,
    soementa=False,
    **kwargs,
)

Download raw HTML pages from the TJTO second-instance jurisprudence search.

Aceita os mesmos filtros de :meth:cjsg; veja la a lista completa.

Returns

Name Type Description
list list Lista de paginas HTML cruas.

cjsg_ementa

courts.tjto.client.TJTOScraper.cjsg_ementa(uuid)

Fetch the ementa for a specific document by UUID.

Parameters

Name Type Description Default
uuid str The document UUID (from the ‘uuid’ column in cjsg/cjpg results). required

Returns

Name Type Description
dict Dict with ementa text and process number.

cjsg_parse

courts.tjto.client.TJTOScraper.cjsg_parse(resultados_brutos)

Parse raw HTML pages downloaded by cjsg_download.

Parameters

Name Type Description Default
resultados_brutos list List of raw HTML strings. required

Returns

Name Type Description
pd.DataFrame DataFrame with parsed results.

cpopg

courts.tjto.client.TJTOScraper.cpopg(id_cnj)

Stub: first instance case consultation not implemented for TJTO.

cposg

courts.tjto.client.TJTOScraper.cposg(id_cnj)

Stub: second instance case consultation not implemented for TJTO.