Usabilidoido: Menu Principal

English Website


Classificações na Web

Saiba como uma taxonomia, vocabulário controlado, tesauro, ontologia, folcsonomia e etc podem ajudar o usuário a distinguir informações relevantes e irrelevantes.

Trecho do diretório do CadÊ

O homem não tem condição de lidar com cada entidade que existe no mundo de forma separada, por isso ele agrupa as entidades de acordo com características em comum. Quanto mais grupos ele cria, mais entidades consegue lidar.

Para ter um website com grande quantidade de conteúdo na Web, é preciso ter muitos agrupamentos. A Ciência da Informação desenvolveu ao longo de décadas, diversas formas de classificar entidades.

Estudiosos dessa área trouxeram esse conhecimento para a Web e surgiu a profissão do Arquiteto da Informação. Para descrever suas ferramentas, emprestaram termos que já existiam, mas às vezes aplicaram de forma ligeiramente diferente do sentido original. Explicarei alguns desses termos, como são usados hoje pelos profissionais que escrevem livros e artigos sobre o assunto.

Taxonomia é uma forma de classificação caracterizada por relações hierárquicas. Ela serve como base para formar menus de navegação em websites com várias páginas hierarquizadas, mas não é necessariamente igual a ele.

Um taxonomia pode estar contida dentro de um vocabulário controlado, que é um banco de dados que define os termos mais utilizados num determinado assunto ou porção de conteúdo e suas relações. Sua função é manter a consistência entre o conteúdo e servir como referência para as diferentes entidades que alimentam o banco de dados.

Imagine que num artigo eu escreva Interação Humano-Computador; num outro, Interação Homem-Máquina e no outro Interação Tecnologia-Ser Humano. Qual dos termos é o certo? Todos, mas existe um preferido. Se meu termo preferido fosse Interação Humano-Computador e eu tivesse um vocabulário controlado no meu Gerenciador de Conteúdo, toda vez que escrevesse os outros termos, o sistema me avisaria disso e sugeriria a mudança.

Essa mesma entrada no vocabulário poderia conter versões do termo preferido escritas com erros de ortografia, para que ao digitar errado na busca, você ainda assim chegasse ao destino. O Google faz isso de forma maravilhosa, através de algoritmos automáticos.

Um vocabulário controlado também pode conter um tesauro, ou seja, um dicionário de sinônimos. Quando você digitasse Interação Homem-Computador na busca, isso iria retornar o sinônimo Interação Humano-Computador.

Se cada termo tiver uma descrição do que significa o termo, então o vocabulário estará contendo um glossário. A utilidade maior é em ferramentas de ajuda e ensino. Pense numa tooltip que explica o que significa uma palavra que você não entendeu na página.

Se um mesmo vocabulário cuida de várias aplicações como essas, é abrangente o suficiente para abarcar qualquer novo termo, possui regras rígidas para a inclusão e gerência dos termos, então ele pode ser chamado de uma ontologia. Um exemplo é o diretório do Cadê (*nostalgia*).

Diretório do Cadê contém tudo

Caso não haja absolutamente regra alguma para a inclusão de novos termos e existam diversas pessoas incluindo termos ao mesmo tempo, então você tem uma folcsonomia. Segundo o brilhante artigo de Clay Shirky, as ontologias estão com os dias contados na Web, enquanto que as folcsonomias estão crescendo.

Provavelmente, surgirão outras ferramentas de classificação populares, diferentes da folcsonomia, que é extremamente caótica. O próprio delicious agora faz sugestão de tags, mas ainda não pode ser considerada uma classificação realmente colaborativa.

Já existem softwares de análise de conteúdo que geram classificações automaticamente. O Weka é um exemplo, mas seu principal uso é na Mineração de Dados e não na Arquitetura da Informação. Certamente no futuro, teremos softwares que farão parte do trabalho do arquiteto da informação. É essencial que surjam tais ferramentas, pois a quantidade de informação que lidamos aumenta cada vez mais.

Penso que cada usuário terá um desses ao seu lado, como se fosse um cãozinho esperto que busca o jornal e não um osso. Sim, um agente inteligente que encontraria e classificaria conteúdo na Web relevante para esse usuário, de acordo com suas preferências e, principalmente, comportamento. Se ele passa mais tempo lendo um determinado artigo, então deve gostar do assunto. A tecnologia pra isso já existe: perfil do orkut, agregador do Bloglines, personalizaçao da Amazon e etc. Já ouviu falar da Googlezon?


Dicas

Siga-me no Twitter, Facebook, LinkedIn ou iTunes.

Autor

Frederick van Amstel - Quem? / Contato - 23/06/2005

Palavras-chave

classificação    taxonomia    vocabulário    controlado    ontologia    tesauro    glossário    nostradamus    

Opções



Comentários

Discussão
Márcia O. Carmo
23/06/05 às 15:46

Oi Fred!
Eu quase não comento aqui.. acho que por falta de tempo.. tou no meio de uma batalha com meus códigos.. criei vergonha na kra e estou usando XHTML...
(poiseh.. sohh agora)
Mas eu sempre tou visitando e me encantando a cada post que leio..

Adoro isso aki =)
Principalmente os audio-blogs =)

teh +!


Discussão
michel
24/06/05 às 22:55

A folcsonomia tal como ela existe hoje não dá conta de algumas questões lingüísticas, coisas muito diferentes acabam sendo abarcadas na mesma categoria, criando distorções. Por exemplo:
1)Polissemia
Abra um dicionário (qualquer um, pode ser até um mini) e verifique quantas acepções a palavra ponto tem. Uma tag ponto se refere ao quê?
2)Variação dialetal geográfica
Uma tag balada pode ser interpretada de maneira diferente por cariocas (tipo de música) e paulistas (diversão noturna). Isso é só um exemplo bobo, entre Brasil e Portugal então as diferenças seriam gritantes.
Só para dar uma idéia uma "passadeira de peões" não é uma mulher que passa roupas para operários da construção civil em Portugal, mas a faixa de pedestres.
3)Variação dialetal temporal
Caso dure o suficiente, gírias e modismos(que já são um problema em relação a variação geográfica e a polissemia) podem cair em desuso e tag perderia o sentido.


Discussão
Fred
25/06/05 às 00:03

Esse problema não é só da Folcsonomia, é de todo tipo de classificação. Palavras tem muitos sentidos mas, como você exemplificou, o sentido está atrelado ao contexto. Se sabemos o contexto em que foi usada a palavra, então podemos inferir melhor qual foi o sentido tencionado pelo seu emissor.

O problema da folcsonomia é que quase não há pistas de contexto para uma tag. É muito pouca informação, não duas palavras, mas apenas uma. Ao invés de usar 'arquitetura da informação', você é obrigado a usar 'ai' ou 'arquitetura_da_info' ou 'arqinfo'.

Se você vê a tag 'ai' numa listagem de tags você pensa que é o quê? Artificial Intelligence? Se as outras tags são assim herméticas, não há contexto. Claro que se você conhecer a pessoa que aplicou aquela tag, fica mais fácil, mas não dá pra ter certeza.

Se você ouvisse um baiano falar 'ai' com aquele sotaque calmo deles, teria certeza absoluta do significado. É muito mais contexto.

Uma taxonomia organizada por um Arquiteto da Informação tarimbado pode oferecer muito mais contexto do que uma folcsonomia. Ele escolhe com cuidado termos que são relacionados, agrupa de acordo com características semânticas e sintáticas. Estabelece hierarquias.


Discussão
Junior
01/07/05 às 16:01

Oi, Fred!

Meu nome é Junior, moro em Brasília e acabei de me forma em jornalismo. Acabei de entrar numa empresa que trabalha com produção de site e atuo nela como redator de internet.
Minha súplica!!!!
Pelo amor de Deus onde posso me informar mais sobre arquitetura da informação, usabilidade...Pois sou novato nesta área e por onde eu posso começar a fazer cursos na àrea. Pelo que andei lendo é uma especialidade nova, mas por onde começo a me interar sobre o assunto.
abraços


Discussão
Fred
01/07/05 às 16:29

Junior, também estou me formando em Jornalismo, mas o que sei sobre Arquitetura da Informação foi por estudo próprio. Os cursos que existem no Brasil sobre o assunto são meros workshops de 1 ou 2 dias.

Pretendo montar um curso online futuramente, mas até lá você pode aprender muito lendo esse livro:

http://www.usabilidoido.com.br/information_architecture_for_the_world_wide_web.html


Discussão
Juliana Gehlen
02/08/05 às 02:20

Parabéns!!!!!
Achei interessante demais.
Talvez não sejam palavras sábias, mas é o que penso.
Já anotei o endereço para outras buscas.
A questão da linguagem é cada vez mais importante para a busca e recuperação nesse mar de informações. Se não soubermos nadar, nos afogaremos.


Discussão
paula hichtokin
14/02/06 às 15:42

achei muito interessante....é uma pena que eu não encontrei o que eu estava procurando..


Discussão
Roosewelt
16/03/06 às 17:48

Bem sou formado em Biblioteconomia e durante anos esta área do conhecimento vem trabalhando no intuito de melhor representar conteúdos tanto em dispositivos físicos (livros e revistas) quanto eletrônicos através de linguagens documentárias com CDU e CDD e claro os Tesauros. A classicação é um atividade subjetiva e de grande complexidade, pois cada um tem sua própria forma de categorizar e hierarquizar conceitos. o Interessante que atualmente todos esses pressupostos vem sendo empregados no ambiente web, contudo a Inteligencia Artificial tb através da Representação do Conhecimento faz uso tb da classificação pra melhor propor esquemas taxonomicos em domínios particulares, a muitos anos que temos as Redes Semânticas e Frames e agora a moda do momento: Ontologias.
Parabéns pelo seu artigo, são poucos os profissionais da web que possuem visão científica destes pressupostos.


Discussão
Baurilene Santos
16/08/06 às 23:20

oi, sou Baurilene e estou me formando em biblioteconomia, achei interessante suas visões sobre as classificações na era tecnologica.
estou elaborando meu tcc nessa área, na qual busco identificar o que se tem produzido de novo para adequar os sistemas de classificação as demandas das novas tecnologias.
Se puder peço que me ajude enviando algum artigo que tenha. Obrigada.


Discussão
Tereza
23/02/07 às 16:13

Para quem deseja aprender a fazer vocabulário controlado recomendo fazer o curso de biblioteconomia ou ciência da informação. Não tem o que discutir.
Tabelas CDD ou CDU, normas, e bom trabalho para todos!!!
TEKA


Discussão
Luana
17/07/07 às 14:49

Pessoal,

Acho que há uma confusão nos conceitos aqui apresentados e como especialista em Elaboração de Vocabulários Controlados e Taxonomias, achei legal, vir aqui esclarecer!!!

1)"Um vocabulário controlado também pode conter um tesauro, ou seja, um dicionário de sinônimos."
Não é que o vocabulário controlado contenha um tesauro. O tesauro´que é um tipo de Vocabulário controlado, asim como o cabeçalho de assunto, que apesar de não ser adequado aos novos meio de recuperação de informação, padronizava os assunto que eram representados por vocábulos padronizados.

2) "Se cada termo tiver uma descrição do que significa o termo, então o vocabulário estará contendo um glossário"
Um glossário é uma lista de termos com definições sobre um determinado assunto, que tem por objetivo esclarecer pessoas que não são da área sobre o significadop de detrminados termos. Geralmente aparecem no final de livros, teses e, atualmente, em alguns websites, mas não influenciam diretamente na recuperação da informação.

3)"Se um mesmo vocabulário cuida de várias aplicações como essas, é abrangente o suficiente para abarcar qualquer novo termo, possui regras rígidas para a inclusão e gerência dos termos, então ele pode ser chamado de uma ontologia. Um exemplo é o diretório do Cadê (*nostalgia*)."
Uma Ontologia também é um tipo de Vocabulário controlado, assim como os Tesauros, sendo que além dos temos, das definições e das relações expressas em linguagem humana, este vocabulário possui suas definições expressas através de axiomas lógicos em uma linguagem própria para compreensão das máquinas.

Aproveito para parabenizar por esta iniciativa de estudo e me colocar à disposição para troca de figurinhas!!!


Discussão
Frederick van Amstel
17/07/07 às 19:57

Obrigado Luana! Pelo que entendi, eu usava Vocabulário Controlado como um contenedor de estratégias de classificação e, na verdade, trata-se de um grupo de tipos de estratégias de classificação.

A propósito, gostaria de exemplos de Ontologias em sistemas de informação para entender melhor esse conceito.


Discussão
Sousa Junior
18/12/09 às 14:13

Parabéns, Fred!

Como sempre, mandando bem.

Sou aluno do curso de Biblioteconomia e tenho interesse nessa área de AI. Por enquanto, estou que nem o Junior, procurando material sobre o assunto.

Obrigado pela dica!




Comente.






(aguarde que é demorado mesmo...)


Você merece.

Assine nosso conteúdo e receba novidades sem sair de casa!

Atualizado com o Movable Type.

Alguns direitos reservados por Frederick van Amstel.

Apresentação do autor | Consultoria | Portifólio | Política de Privacidade | Contato