courts.tjgo.client.TJGOScraper

courts.tjgo.client.TJGOScraper(sleep_time=1.0)

Scraper for the Court of Justice of Goiás.

The TJGO jurisprudence search (Projudi) renders a Cloudflare Turnstile widget, but the backend does not validate the token — the flow works with pure HTTP requests.

Methods

Name Description
cjsg Busca jurisprudencia no TJGO (Projudi).
cjsg_download Run a TJGO search and return the raw HTML of each page.
cjsg_parse Transform raw TJGO HTML pages into a DataFrame.
cpopg Stub: first degree case search not implemented for TJGO.
cposg Stub: second degree case search not implemented for TJGO.

cjsg

courts.tjgo.client.TJGOScraper.cjsg(
    pesquisa=None,
    paginas=None,
    id_instancia=0,
    id_area=0,
    id_serventia_subtipo=0,
    numero_processo=None,
    tamanho_pagina=10,
    **kwargs,
)

Busca jurisprudencia no TJGO (Projudi).

Parameters

Name Type Description Default
pesquisa str Termo de busca livre. None
paginas int | list | range | None Paginas 1-based; None baixa todas. Default None. None
id_instancia int | str 0 todas / 1 1o grau / 2 recursal / 3 tribunal. 0
id_area int | str 0 todas / 1 civel / 2 criminal. 0
id_serventia_subtipo int | str ID do subtipo de serventia (dropdown do site). 0 = todas. 0
numero_processo str Filtrar por numero CNJ especifico. None
tamanho_pagina int Itens por pagina (default 10). 10
**kwargs Filtros aceitos pelo schema :class:InputCJSGTJGO. Listados abaixo (todos opcionais; None = sem filtro): * data_publicacao_inicio / data_publicacao_fim (str): DD/MM/AAAA ou AAAA-MM-DD. Backend Projudi mapeia para DataInicial / DataFinal no form body. {}

Aliases deprecados (popados com DeprecationWarning antes do pydantic): * query / termo -> pesquisa * data_publicacao_de / _ate -> data_publicacao_inicio / _fim * qtde_itens_pagina -> tamanho_pagina

Raises

Name Type Description
TypeError Quando um kwarg desconhecido e passado, incluindo data_julgamento_inicio / data_julgamento_fim — o backend Projudi nao expoe filtro de data de julgamento; use data_publicacao_* (canonico para o TJGO).
ValidationError Quando um filtro tem formato invalido.

Returns

Name Type Description
pd.DataFrame pd.DataFrame: DataFrame com as decisoes (coluna texto carrega
pd.DataFrame o conteudo do documento; ementa nao e preenchido).

See also

— schema pydantic e a fonte da verdade dos filtros aceitos.

cjsg_download

courts.tjgo.client.TJGOScraper.cjsg_download(
    pesquisa=None,
    paginas=None,
    id_instancia=0,
    id_area=0,
    id_serventia_subtipo=0,
    numero_processo=None,
    tamanho_pagina=10,
    data_publicacao_inicio=None,
    data_publicacao_fim=None,
    **kwargs,
)

Run a TJGO search and return the raw HTML of each page.

Aceita os mesmos filtros de :meth:cjsg; veja la a lista completa.

Parameters

pesquisa : str Free-text search term (aliases query / termo accepted). paginas : int, list, range or None Pages to download (1-based). None downloads every page. id_instancia : int or str 0 all / 1 1st degree / 2 recursal / 3 tribunal. id_area : int or str 0 all / 1 civil / 2 criminal. id_serventia_subtipo : int or str Court unit sub-type id (see website dropdown). 0 = all. numero_processo : str Filter by specific CNJ process number. tamanho_pagina : int Items per page (default 10). Aceita qtde_itens_pagina como alias deprecado. data_publicacao_inicio, data_publicacao_fim : str, optional Publication date range in dd/mm/yyyy or yyyy-mm-dd.

cjsg_parse

courts.tjgo.client.TJGOScraper.cjsg_parse(raw_pages)

Transform raw TJGO HTML pages into a DataFrame.

cpopg

courts.tjgo.client.TJGOScraper.cpopg(id_cnj)

Stub: first degree case search not implemented for TJGO.

cposg

courts.tjgo.client.TJGOScraper.cposg(id_cnj)

Stub: second degree case search not implemented for TJGO.