segunda-feira, 28 de fevereiro de 2011

Sobre dicionários e glossários

Mantendo a linha de "assuntos confusos" vou dedicar esta postagem aos dicionários e glossários.

Acredito que para este caso, darmos uma olhada no que encontramos para estas palavras em três dicionários diferentes será bastante interessante! Usarei M: para o Dicionário Online Michaelis - UOL , D: para o dicionário online de português e P: para o Dicionário Priberam da Língua Portuguesa (DPLP).

Dicionário:
M: sm (lat dictione) Coleção de vocábulos de uma língua, de uma ciência ou arte, dispostos em ordem alfabética, com o seu significado ou equivalente na mesma ou em outra língua. Sin: léxico, vocabulário, glossário.
D: s.m. Coleção dos vocábulos de uma língua, ou dos termos próprios de uma ciência ou arte, com a significação deles, ou com a sua tradução em outra língua, ordenados alfabeticamente. (Do lat. Dictio)
P: (francês dictionnaire) s. m. 1. Colecção!Coleção organizada, geralmente de forma alfabética, de um conjunto de palavras ou outras unidades lexicais de uma língua ou de qualquer ramo do saber humano, seguidas da sua significação, da sua tradução ou de outras informações sobre as unidades lexicais. 2. Colecção!Coleção de palavras usadas habitualmente por uma pessoa, por um grupo social ou profissional, num domínio técnico, etc. = glossário, vocabulário 3. Ling. Conjunto de unidades lexicais identificadas, organizadas e codificadas.

Glossário:
M: glos.sá.rio sm (lat glossariu) 1 Livro ou vocabulário em que se dá a explicação de palavras obscuras ou desusadas. 2 Dicionário de termos técnicos de uma arte ou ciência. 3 Resenha alfabética.
D: .m. 1 Espécie de dicionário, consagrado particularmente à explicação de termos mal conhecidos (arcaicos, peregrinos, dialetais etc.): Glossário Luso-Asiático. 2 Léxico de um autor, que figura geralmente como apêndice a uma edição crítica: o glossário das poesias de Sá de Miranda. (V. DICIONÁRIO e VOCABULÁRIO.). 3 Em informática, utilitário de processadores de texto onde se podem registrar frases e expressões muito usadas, para rápida inserção, se necessário, no texto dos documentos.
P: s. m. 1. Vocabulário que explica termos obscuros por meio de outros conhecidos. 2. Vocabulário dos termos técnicos de uma arte ou ciência.

Conforme esperado por quem leu a minha postagem sobre denotação, há menos explicações e mais conotações. A etimologia das palavras vai nos ajudar a separá-las melhor: glosa existe em português, vem do latim, glossa. Por isso glossário tem dois “s”. M: sf (lat glossa, do gr glossa) 1 Explicação, interpretação ou comentário de um texto obscuro ou difícil de entender. 2 Comentário, anotação. s.f. Anotação que explica o sentido de uma palavra ou de um texto; comentário, interpretação.

Usando o wiktionary , temos que dicionário vem do latim dictionarium, que é uma palavra composta de dictio "Renaissance Latin, from noun of action dictiō (speaking)". E a terminação arium que é "n (genitive -āriī); second declension 1.Used to form nouns denoting an place where things are kept from other nouns. armārium (closet, chest) <>arma (weapons, tools) sōlārium (sundial, house-top)" Apesar da descrição de dicionário em M: ser fraca, a descrição de glosa é bastante clara. O sentido de explicação usado aí é bem próxima da que usei para denotação. Com dicionário é mais direto, podem ver que é uma coleção de palavras, nenhuma referência a explicações. Como citado na postagem sobre conotação, modernamente os sentidos e usos costumam se misturar.

Por conveniência, eu separo ambos nos sentidos mais usados em computação, evitando confusões e aborrecimentos: glossário é para denotações e dicionário para conotações. Reforçando, glossário define sentido (lista de atributos e capacidades) e dicionário define usos (lista de índices para outras palavras).

Esta simples separação nos permite entre outras coisas, entender por que programas como o Watson da IBM parecerem humanos para a maior parte das perguntas, podendo até mesmo competir com humanos em competições de perguntas de auditório, e fracassam mediocremente em responder perguntas que necessitem de compreensão do que está sendo perguntado; eles trabalham com dicionários, são na verdade ferramentas de mineração de textos, ponto.

Para aprenderem mais sobre soluções como o Watson, há no excelente blog do computólogo Tom Stafford "Mind Hacks" a postagem "computationally my dear watson".

Sou particularmente contrário ao hábito de se fazer dicionários em levantamento de requisitos, prefiro glossários, e não quaisquer glossários, quero glossários formais, isto é, com definições formais! Essa simples ação elimina um sem número de conflitos, retrabalhos e dores de cabeça, acelerando e tornando macia a condução do desenvolvimento.

Usar glossários também pesa muito a favor de se ter sucesso num sem número de ações administrativas. Pena que os autores de normativas e textos orientativos escrevam de forma tão conotativa e pobre.

terça-feira, 1 de fevereiro de 2011

Cotexto e contexto

Continuando as considerações sobre notação, vou abordar o cotexto como uma forma "linguística" de se denotar intensivamente. É através dos cotextos que se estabelecem as relações entre os elementos do texto e atribuímos propriedades a esses elementos. Dois exemplos de cotextos:

"A bola que encontrei é azul."
"O dono da bola é o rapaz que é meu vizinho."

Analisando os dois exemplos:
  • Azul é um atributo da bola.
  • A bola e o narrador se relacinam através do "encontro".
  • O rapaz e a bola se relacinam através da "posse" (ser dono).
  • O narrador e o rapaz se relacionam através da "vizinhança".

Assim as relações "maior que", "próximo", "filho", entre outras, criam cotextos. Uma maneira produtiva de se definir a inter-textualidade e intra-textualidade é como resultado dos cotextos.

Segundo Adriano Duarte Rodrigues em "cotexto",
"A noção de cotexto foi proposta por Bar Hillel para dar conta da intervenção das unidades verbais que fixam a significação das outras formas linguísticas presentes num mesmo texto. O cotexto é portanto um dos principais processos de solução das eventuais ambiguidades ou da heterogeneidade de sentido dos enunciados."

O uso dos cotextos pode ou não resolver problemas de ambiguidades.
Por exemplo:

"Meu irmão e seu amigo vieram para minha casa. Ele estava triste."

Quem estava triste, o irmão ou o amigo? Um recurso para se criar confusão ou dúvida é o uso de cotextos vagos, isto é, aqueles onde não conseguimos saber quais elementos devem ser ligados. Isso ocorre na mentira, na criação do suspense ou por mera distração do escritor.

Uma definição produtiva de discurso é como uma construção criada por uma sequência de atribuições de valores e relações. Uma capacidade importante ao meu ver é a atribuição do tempo desses valores e relações, estabelecendo uma dinâmica temporal nos atributos e relações.

Por exemplo:
"A bola que encontrei hoje é azul."
"O dono da bola é o rapaz que se tornou meu vizinho ontém."

Os elementos cotextuais permitem que estabeleçamos uma sequência de eventos diferente da sequência narrativa. Um evento sempre é uma alteração de estado, isto é, valor de atributos ou de relações.

Uma representação comum em computação das relações é como atributos (ponteiros ou índices), o que torna mais simples e homogêneo o tratamento (só temos listas de atributos no elemento).

Sandra Rocha no seu artigo "análise de relações parte-de e tipo-de em uma perspectiva funcionalista" revisita o cotexto (e contexto) dando uma panorâmica interessante do tratamento funcionalista. Apesar do texto ser de linguística, os programadores de plantão ficarão de cabelos em pé pelas liberdades de herança múltipla e veemente negação do polimorfismo dos métodos das classes, e para meu deleite, a constatação que muitas vezes uma classe é uma má escolha, sendo um conjunto de elementos a solução mais adequada.

Para um contraponto, o artigo "Considerações Sobre Sinonímia e Referência" de Solange Coelho VEREZA aborda aspectos cotextuais e contextuais na estruturação do significado nos textos.

A conotação é utilizada para se fazer qualquer tipo de atribuição e relacionamento, e em geral é bastante difícil de se expressar formalmente, pois permite toda uma míriade de ligações. Num modelo de dados é a relação de muitos para muitos. Com algumas poucas conotações mal feitas, ninguém será capaz de entender o texto. Por isso, para um texto rigoroso, é um recurso difícil de ser utilizado.

Ao meu ver, o aspecto intra-textual do cotexto é em geral o mais evidente, mas o seu aspecto inter-textual é que produz o contexto.

A quantidade e diversidade de definições, interpretações e usos do termo "contexto", exige que eu especifique claramente o uso que faço do mesmo, bem como dê ao menos um esboço dos motivos pelos quais abdico de outras definições populares.

A primeira definição que nego é a da extra-textualidade (extra-linguístico para alguns autores). Definir contexto como tudo aquilo que é fora do texto, é para mim torná-lo intratável textualmente.

Assim o primeiro aspecto do contexto que quero realçar é o "com texto" do contexto, isto é, o conjunto de definições, elementos e atributos encontráveis em outros textos.

Muitos autores querem uma distinção lexica entre cotexto e contexto, fazendo um dentro do texto e outro fora do texto. Para mim são assuntos diferentes. Cotexto é uma forma de se atribuir, e contexto é um conjunto de atribuições, não me importando qual seja sua origem.

Uma definição próxima, que na prática produz o mesmo resultado é "com textura" que quer dizer de certa forma: "denso, coeso e significativo". Um artigo incisivo para essa definição é o "Cohesion and texture", o segundo capítulo do "The handbook of discourse analysis" de Deborah Schiffrin, Deborah Tannen, Heidi Ehernberger Hamilton.

Na pragmática apesar do contexto ser quase omnipresente, os autores preferem apenas reconhecer que é uma das coisas mais difíceis de se definir...

Pensando na tratabilidade computacional do problema, me interessa muito o problema da criação dos ponteiros.

Como coloca muito bem Adriano Duarte Rodrigues em "contexto",

"As questões do contexto estão portanto directamente associadas às questões da referencialidade e da indexicalidade."

Onde referencialidade quer dizer explicitamente se ter um ponteiro, e indexicalidade, se ter um índice. Assim contextualizar é criar ponteiros e índices que partem de cada elemento de nosso texto para as definições, atributos e propriedades desse elemento que se encontram em outros textos, Mesmo que tenhamos de criar esses textos especificamente com essa finalidade, para podermos evitarmos a armadilha da extra-textualidade.

Citando novamente Duarte Rodrigues em "contexto":

"Tanto as entidades indexicais que se reportam à situação enunciativa como os elementos que integram a situação referencial de um texto ou de um discurso podem ser encarados como constitutivos de quadros do sentido. Um texto ou um discurso tem sentido, na medida em que está delimitado por um horizonte, à maneira da moldura de uma tela, do palco em que decorre uma representação teatral, da sala do tribunal em que se desenrola uma audiência ou da sala de aula, das capas de um livro, da sala escura do cinema. Podemos considerar o contexto como a delimitação deste horizonte, confinando nos seus limites ou dentro das suas fronteiras um mundo próprio, no âmbito do qual as formas verbais tomam sentido ou aparecem como razoáveis e fora das quais seriam absurdas ou, pelo menos, estranhas."

Em textos literários ou diálogos, pode ser complicado encontrar os ponteiros e referências. De alguma maneira as pessoas conseguem fazer isso, um tanto que intuitivamente, através de marcadores que encontramos nos diálogos e textos literários. Um artigo interessante para quem tiver de enfrentar esse problema é "Discourse Markers:Cotext and Context Sensitivity" de Esther Cohen que trata exatamente dessa marcas de referência e índice.

Por fim, as teorias de scripts e frames da análise de discurso, fornecem valiosos métodos para elucidação das dúvidas e ambiguidades, fico devendo uma pincelada sobre scripts e frames em outra postagem.

Porém a "análise de discurso" é um assunto tão importante, vasto e sua literatura tão ampla, que foi difícil escolher um livro. A minha escolha recaiu sobre o "cognição discurso e interação" de van Dijk, por ele ser incrivelmente conciso e claro, me parecendo um excelente ponto para se começar.

Com estes conceitos estabelecidos, podemos partir para as brincadeiras!