Bibliografia Anual de História de Portugal, 1990 (41)

António Tavares Lopes e Guilhermina Mota

Análise de listas nominativas de população assistida por computador: Notas sobre uma experiência

"Boletim da Associação Portuguesa de História e Informática", Coimbra, 2, Out. 1989, p. 31- 36


O estudo de um grupo de listas nominativas da região centro do país referente a 26 paróquias, no início do século XIX, englobando 5 300 fogos e cerca de 22 000 habitantes, conduziu ao desenvolvimento de um sistema de programas de assistência na análise do conteúdo da fonte. O estudo foi julgado impraticável, no tempo disponível para a execução do projecto, sem recurso a meios informáticos, considerado o volume de informação, os vários níveis de análise que se pretendia atingir e a utilização de medidas de cálculo simples mas moroso e com permeabilidade à ocorrência de erros manuais, acentuada quando realizadas em simultâneo.

No trabalho que resultou desse estudo, de autoria de Guilhermina Mota ("Estruturas familiares no mundo rural. Grupos domésticos no bispado de Coimbra em 1801", Revista Portuguesa de História, no 24, 1989) indicam-se as opções historiográficas que nortearam o projecto e definiram os objectivos programáticos. No geral, tais opções baseiam-se, metodologicamente, na fixação proposta pelo "grupo de Cambridge", tendo em conta posteriores alterações e adaptações apresentadas em trabalhos do mesmo grupo (ou próximo dele) ou de autores independentes, bem como, naturalmente, da própria autora. O núcleo principal de análise é o agregado familiar, ou fogo, um grupo doméstico de corresidentes ligados geralmente por laços de parentesco (na sua forma mais corrente é constituído por pais e filhos).

A transcrição do conteúdo da fonte para ficheiro em computador

Na fonte, estes grupos aparecem, quase sempre, nitidamente assinalados seguindo uma norma geral em que, após o cabeça do fogo, são indicados os outros elementos, apresentando cada um a sua relação com o primeiro (para além de outros dados individuais). Pode-se tipificar esta norma recorrendo ao exemplo real de dois fogos (colhido da lista da freguesia de Bobadela -- ver figura 1 A):



   João de Almeida .  .  .  .   60 an.
   Bernarda m.er  .  .  .  .  . 58 an.
   Ma fa .  .  .  .  .  .  .  . 20 an.
   Gauterio fo .  .  .  .  .  . 11 an.
   João fo .  .  .  .  .  .  .  06 an.
   

Maria Borges soltra. . . .60 an.

José fo . . . . . . . 25 an.

Em outras freguesias, diferentes formas de individualização dos fogos foram utilizadas (blocos ligeiramente separados e numerados, ou identificados com um sinal semelhante a " # ").

Estes dados foram passados a um ficheiro de texto, manipulado a partir de um editor, com um formato que se resume desta forma:

a) fogo:

#<número de fogo> <nome do cabeça>

b) para cada elemento:

<sexo> <relação> <ec> <idade> <obs.>

(<relação> é a relação que o membro do fogo tem com o cabeça - vazio, no caso do próprio cabeça - e <ec> o estado civil, quando dado ou inequivocamente deduzido). O nome, que começou por ser introduzido, foi abandonado excepto para o cabeça, de modo a tornar mais rápida a introdução dos dados (que se prolongou, de qualquer forma, por alguns meses). Cada item de informação (identificação do fogo e os seus membros) ocupa uma linha.

Aplicando ao exemplo dado:

#19 Joao de Almeida m c 60a
f mulher c 58a
f filha 20a
m filho 11a
m filho 6a
#20 Maria Borges
f s 60a
m filho 25a

Este formato, no entanto, não cobre um conjunto de fogos que se caracterizam pela existência de pelo menos duas unidades familiares (um grupo restrito de pais e filhos dependentes). Usando de outro exemplo (da freguesia de Lourosa -- figura 1B):



168 Antonio Nunes cazado  ________ 55
Maria Marques mer __________ 50
Joze Nes genro cazado ______ 30
Maria Marques mer __________ 20
Manoel fo __________________ 05
Antonio fo _________________ 03

Este fogo foi transcrito como

#187 Antonio Nunes
m c 55a
f mulher c 50a
[
m genro c 30a
f mulher c 20a
m filho 5a
m filho 3a
]

O símbolo " [ " significa o redireccionamento da relação. O elemento que se lhe segue é o chefe de uma unidade familiar; os membros desta relacionam-se não com o cabeça mas apenas dentro da unidade (e assim, Maria Marques aparece como mulher de José Nunes e não como filha de António Nunes; o mesmo esquema se aplica às duas crianças, que não ficam directamente relacionadas com o cabeça, apesar de serem seus netos).

Uma unidade familiar (excepto a principal) termina quando é encontrado o símbolo " ] " que lhe corresponde. Deve-se notar que uma unidade familiar pode abrir outras unidades, a uma profundidade de nível não pré-determinado.

Este último exemplo serve ainda para poder acrescentar mais alguns pontos. A numeração dos fogos não coincide, necessariamente (e também normalmente), entre o indicado na fonte e a numeração final do ficheiro. Tal facto se deve a saltos que os párocos e curas por vezes faziam na sequência da numeração (aqui, o erro é de 19 fogos). É apresentado também o problema das indicações ambíguas: as duas crianças podem ser filhas de qualquer um dos casais. A qual deles atribuir a paternidade? Quando as indicações etárias eram insuficientes para afectar os filhos às várias unidades familiares presentes (tendo em conta o arredondamento e os próprios recasamentos) procedeu-se à consulta de fontes complementares (os registos paroquiais). Na sua falta, ou na impossibilidade de resolver o problema, seguiu-se sempre a indicação original da fonte (cerca de 10% da totalidade dos fogos foram corrigidos ou completados por este método).

Os ficheiros que correspondiam à lista de cada freguesia eram completados com outras informações, prefixadas, no início da linha respectiva, com o símbolo " $ ". Estas informações cobriam os seguintes casos:

$F:<freguesia>
$L:<local>
$A:<identificação, normal,
de membro ausente>
$C:<texto de comentário>

O objectivo destas linhas de informação é o de ajudar à leitura e compreensão da lista. No que respeita ao programa, eram geralmente ignoradas.

Estes ficheiros, assim estruturados, eram posteriormente lidos e analisados pelos programas, que se dividiam em dois tipos: programas de suporte, destinados à verificação do formato das listas, à produção de relatórios que pudessem auxiliar na consulta de fontes complementares para preenchimento de lacunas e resolução de ambiguidades; e o programa principal, por outro lado, que procedia à análise da lista e elaborava um relatório final sobre os vários elementos estruturais dos grupos domésticos encontrados (dimensão, composição, estrutura segundo o parentesco, etc.) e sobre a população.

Programa de análise das listas nominativas de população

Este programa, de nome AgrFam, foi desenvolvido na linguagem de programação C (Lattice), num microcomputador pessoal (Sinclair QL). Os seus requerimentos em termos de sistema são, neste momento, extremamente diminutos para os padrões actuais. O seu modo de funcionamento não é interactivo: simplesmente se indica, aquando da invocação do programa, o ficheiro que se quer processar e, opcionalmente, o ficheiro de relatório. Por exemplo:

ex agrfam;'-lQuiaios -mQ'

(a notação não é relevante e seria naturalmente diversa em outro sistema operativo; bastará apenas notar que os parâmetros são passados de uma forma "padrão" dos programas em C, sendo as opções " -l " para a lista com , e " -m" para o mapa de resultados da análise, geralmente um ficheiro). Por vezes, ficheiros eram agregados antes de se proceder ao seu processamento (o que ocorria quando se queria conhecer os valores de um grupo de freguesias).

No processamento de cada fogo o programa determina as várias unidades familiares existentes, formando-as a partir das relações que os membros mantêm entre si. A estas relações estão associados dois atributos: uma classificação tipológica e a diferença geracional. A combinação destes atributos determinava inequivocamente, directamente ou por eliminação, a relação que era mantida com o seu referente (o cabeça ou o chefe de unidade familiar).

Os atributos possíveis de tipo de relação são (usando as próprias definições do texto do programa):

a) R_NUCLEAR
b) R_PARENTE
c) R_CRIADO
d) R_IRMAO
e) R_PAI
f) R_AFIN (inidade)
g) R_RECOL (hido)
h) R_IND (eterminada)
Os três tipos de base são b), c) e h): excluem-se mutuamente, por um lado; por outro, é obrigatório que pelo menos um deles seja usado na construção da relação. Exemplificando, " sogro " é uma combinação

R_PARENTE + R_PAI + R_AFIN

de nível geracional -1. Distingue-se de " sogra " pelo campo <sexo>, atribuído a cada membro. O caso de " engeitados " e " expostos " é particular: a combinação que os identifica é

R_CRIADO + R_RECOL

(no caso dos criados e relações indeterminadas o nível geracional é obviamente ignorado). É a idade do respectivo membro do fogo que determinará se se trata de um engeitado ou exposto recolhido em criação ou se é um criado, engeitado em criança e depois inserido (ou mantido) no fogo em troca do seu trabalho.

Estes dados eram completados, por cada membro, com os outros elementos identificadores. Infelizmente, as listas podem omitir a indicação do estado civil. Em parte essa lacuna ficou preenchida com a pesquisa nos livros de registo paroquial (um cuidado especial foi tido para com as mulheres sozinhas com filhos, para se aferir, minimamente, da incidência da ilegitimidade). Para além desta pesquisa, e trabalhando com os dados posteriores, procurou-se então definir regras de dedução a partir da idade, posição no fogo e sexo. Os resultados foram confrontados com resumos de um censo de 1802, em que a distribuição etária e por estado civil estava disponível, através de um teste de igualdade de proporções que indiciou tal conjunto de regras como satisfatório em pelo menos 90% das freguesias testadas. Mesmo assim, uma margem da população permanecia com estado civil desconhecido, o que levou a tomar algumas precauções aquando da produção dos relatórios finais.

O mapa de resultados

A construção modular de AgrFam permitiu um desenvolvimento por etapas, e quase interactivo - uma nova pergunta (da investigadora) podia resultar de uma resposta anterior (do programa). Finalmente, a constituição do relatório atingiu o estado actual que comporta os seguintes itens:

a) População:

- distribuição etária e por sexos.

b) Dimensão dos grupos domésticos:

- fogos e unidades familiares pela sua dimensão;

- estatísticas sobre dimensão (média, mediana, desvio padrão, média e mediana experimentadas - M(E)HS na terminologia de Laslett);

- agregados com membros em idade activa (15-60 anos ou 20-60 anos).

c) Estado civil:

- distribuição da população por sexo e estado civil;

- e por grupos de idades;

- diferenças de idades entre esposos;

- nupcialidade (celibato definitivo e idade média ao primeiro casamento, segundo o método de Hajnal).

d) Cabeças dos agregados:

- estado civil (também segundo tipo de agregado);

- idade (tipo de agregado segundo idade do cabeça).

e) Filhos (excepto chefes de unidades familiares):

- distribuição por idade e sexo;

- grupos de filhos.

f) Parentes residentes:

- distribuição global e segundo tipo de agregado.

g) Criados:

- distribuição por idade e sexo;

- grupos de criados.

h) Amplitude geracional:

- especificando sentidos (ascendentes ou descendentes) e outros casos pontuais.

i) Composição dos agregados:

- número médio e percentagem, por agregado, de membros em determinado tipo de posição perante o cabeça.

j) Estrutura de parentesco:

- distribuição dos fogos por tipos (isolado, não conjugal, familiar simples, alargado, múltiplo ou indeterminado);

- clarificação de agregados complexos (presença de pais isolados, linha de descendência, alargamentos, etc.).

k) Tipos de agregados e ciclo de vida familiar:

- distribuição global de fogos e população pelos tipos de agregado;

- distribuição da população global, dos solteiros, casados e viúvos segundo idade e tipo de fogo.

Para cada freguesia, este relatório representava 8 páginas formatadas de texto. O tempo de processamento variava segundo a dimensão da freguesia (ou grupos de freguesias): o relatório sobre o conjunto de 26 paróquias (um ficheiro de mais de 500kb) foi realizado em cerca de 10 minutos, o que foi considerado como perfeitamente aceitável (QDOS, o sistema operativo do QL, é um sistema multi-tarefa - estes números foram obtidos com AgrFam executado como tarefa de fundo em prioridade moderada).

Perspectivas de desenvolvimento

AgrFam deverá seguir duas orientações de desenvolvimento que neste momento se podem prefigurar. Em primeiro lugar, será preparada a sua integração num sistema de programas que se estão a elaborar, destinados a auxiliar o estudo sobre a população e estruturas familiares na cidade de Coimbra, sobretudo no século XVIII. No conjunto de documentos necessários a este estudo serão incorporadas listas nominativas de população da cidade (entre as quais se contam as efectuadas na mesma altura das que serviram de base ao trabalho citado anteriormente). No entanto, algumas levantam problemas que AgrFam ainda não está preparado para resolver - trata-se, fundamentalmente, de tentar determinar previamente qual o peso que omissões sistemáticas (por exemplo, de menores de 7 anos ou da população feminina) possam ter nos valores estruturais que cada lista apresenta. Trata-se, ainda, de conceber os resultados também do ponto de vista individual (muita da pesquisa que está a ser feita no âmbito deste trabalho centra-se na família, mas procura nunca perder de vista os indivíduos e a sua ligação com o seu meio humano mais directo); lateralmente, esta atitude ajudará ainda no processo de estabelecimento de relações entre indivíduos e na reconstituição de famílias.

Qualquer uma destas preocupações (mais a primeira) terá reflexos na outra orientação que se pretende possa ser tomada pelo projecto: o apoio ao estudo de outras investigações independentes ou inseridas em monografias sobre listas nominativas.n