courts.trf5.client.TRF5Scraper
courts.trf5.client.TRF5Scraper(
verbose=0,
download_path=None,
sleep_time=1.0,
**kwargs,
)TRF5 PJe consulta pública (1º grau).
Methods
| Name | Description |
|---|---|
| cpopg | High-level cpopg lookup: download + parse. |
| cpopg_download | Download the detail HTML for each id_cnj. |
| cpopg_parse | Parse a list of detail HTMLs into a one-row-per-process DataFrame. |
cpopg
courts.trf5.client.TRF5Scraper.cpopg(id_cnj, **kwargs)High-level cpopg lookup: download + parse.
Accepts a single CNJ or a list. Returns a DataFrame with one row per process; columns include id_cnj, processo, classe, assunto, data_distribuicao, orgao_julgador, jurisdicao, polo_ativo, polo_passivo, movimentacoes and documentos.
cpopg_download
courts.trf5.client.TRF5Scraper.cpopg_download(id_cnj, **kwargs)Download the detail HTML for each id_cnj.
Returns a list aligned with the input order. None entries indicate processes the public consultation could not return — typically sigilo, invalid CNJ, ou qualquer erro transiente (rede, payload inesperado do PJe, falha de extração de token). Falhas individuais não interrompem o batch: o CNJ problemático vira None e o loop segue para o próximo, igual ao padrão do TJSP.
cpopg_parse
courts.trf5.client.TRF5Scraper.cpopg_parse(htmls, id_cnj_list)Parse a list of detail HTMLs into a one-row-per-process DataFrame.
Rows for None entries (process not found) carry id_cnj plus None in every other column, so callers can still distinguish “looked up but missing” from “never tried”. Um HTML que sobreviveu ao download mas falhou no parse vira o mesmo formato (linha só com id_cnj) e o batch continua — assim um erro pontual não derruba a coleta inteira.