courts.trf5.client.TRF5Scraper

courts.trf5.client.TRF5Scraper(
    verbose=0,
    download_path=None,
    sleep_time=1.0,
    **kwargs,
)

TRF5 PJe consulta pública (1º grau).

Methods

Name Description
cpopg High-level cpopg lookup: download + parse.
cpopg_download Download the detail HTML for each id_cnj.
cpopg_parse Parse a list of detail HTMLs into a one-row-per-process DataFrame.

cpopg

courts.trf5.client.TRF5Scraper.cpopg(id_cnj, **kwargs)

High-level cpopg lookup: download + parse.

Accepts a single CNJ or a list. Returns a DataFrame with one row per process; columns include id_cnj, processo, classe, assunto, data_distribuicao, orgao_julgador, jurisdicao, polo_ativo, polo_passivo, movimentacoes and documentos.

cpopg_download

courts.trf5.client.TRF5Scraper.cpopg_download(id_cnj, **kwargs)

Download the detail HTML for each id_cnj.

Returns a list aligned with the input order. None entries indicate processes the public consultation could not return — typically sigilo, invalid CNJ, ou qualquer erro transiente (rede, payload inesperado do PJe, falha de extração de token). Falhas individuais não interrompem o batch: o CNJ problemático vira None e o loop segue para o próximo, igual ao padrão do TJSP.

cpopg_parse

courts.trf5.client.TRF5Scraper.cpopg_parse(htmls, id_cnj_list)

Parse a list of detail HTMLs into a one-row-per-process DataFrame.

Rows for None entries (process not found) carry id_cnj plus None in every other column, so callers can still distinguish “looked up but missing” from “never tried”. Um HTML que sobreviveu ao download mas falhou no parse vira o mesmo formato (linha só com id_cnj) e o batch continua — assim um erro pontual não derruba a coleta inteira.