Web Semântica

Da Wikipédia, a enciclopédia livre
Ir para navegação Pular para pesquisar

A Web Semântica (também conhecida como Web 3.0 ) é uma extensão da World Wide Web por meio de padrões definidos pelo World Wide Web Consortium (W3C). [1] O objetivo da Web Semântica é tornar os dados da Internet legíveis por máquina.

Para possibilitar a codificação da semântica com os dados, tecnologias como Resource Description Framework (RDF) [2] e Web Ontology Language (OWL) [3] são utilizadas. Essas tecnologias são usadas para representar formalmente os metadados . Por exemplo, a ontologia pode descrever conceitos , relacionamentos entre entidades e categorias de coisas. Essas semânticas integradas oferecem vantagens significativas, como raciocínio sobre os dados e operação com fontes de dados heterogêneas. [4]

Esses padrões promovem formatos de dados comuns e protocolos de troca na Web, fundamentalmente o RDF. De acordo com o W3C, "The Semantic Web fornece uma estrutura comum que permite que os dados sejam compartilhados e reutilizados entre aplicativos, empresas e limites da comunidade." [5] A Web Semântica é, portanto, considerada como um integrador de diferentes conteúdos e aplicativos e sistemas de informação.

O termo foi cunhado por Tim Berners-Lee para uma teia de dados (ou web de dados ) [6] que pode ser processada por máquinas [7] - isto é, aquela em que muito do significado é legível por máquina . Embora seus críticos questionem sua viabilidade, os proponentes argumentam que as aplicações em biblioteconomia e ciência da informação , indústria, biologia e pesquisa em ciências humanas já provaram a validade do conceito original. [8]

Berners-Lee expressou originalmente sua visão da Web Semântica em 1999 da seguinte forma:

Tenho um sonho para a Web [em que os computadores] se tornem capazes de analisar todos os dados da Web - o conteúdo, links e transações entre pessoas e computadores. Uma "Web Semântica" que torne isso possível ainda não surgiu, mas, quando isso acontecer, os mecanismos do dia-a-dia do comércio, da burocracia e do nosso dia-a-dia serão controlados por máquinas conversando com máquinas. Os " agentes inteligentes " que as pessoas têm alardeado há séculos finalmente se materializarão. [9]

O artigo de 2001 da Scientific American escrito por Berners-Lee, Hendler e Lassila descreveu uma evolução esperada da Web existente para uma Web Semântica. [10] Em 2006, Berners-Lee e colegas afirmaram que: "Esta ideia simples ... permanece em grande parte não realizada". [11] Em 2013, mais de quatro milhões de domínios da Web (de cerca de 250 milhões no total) continham marcação da Web Semântica. [12]

Exemplo

No exemplo a seguir, o texto "Paul Schuster nasceu em Dresden" em um site será anotado, conectando uma pessoa com seu local de nascimento. O fragmento de HTML a seguir mostra como um pequeno gráfico está sendo descrito, em RDFa -syntax usando um vocabulário schema.org e um ID de Wikidata :

< div  vocab = "https://schema.org/"  typeof = "Person" > 
  < span  property = "name" > Paul Schuster </ span > nasceu em
   < span  property = "birthPlace"  typeof = "Place"  href = "https://www.wikidata.org/entity/Q1731" > 
    < span  property = "name" > Dresden </ span > .
   </ span > 
</div >
Gráfico resultante do exemplo RDFa

O exemplo define os cinco triplos a seguir (mostrados na sintaxe da tartaruga ). Cada triplo representa uma aresta no gráfico resultante: o primeiro elemento do triplo (o sujeito ) é o nome do nó onde a aresta começa, o segundo elemento (o predicado ) o tipo da aresta e o último e terceiro elemento (o objeto ) ou o nome do nó onde termina a aresta ou um valor literal (por exemplo, um texto, um número, etc.).

Os triplos resultam no gráfico mostrado na figura fornecida .

Gráfico resultante do exemplo RDFa, enriquecido com mais dados da Web

Uma das vantagens de usar Uniform Resource Identifiers (URIs) é que eles podem ser desreferenciados usando o protocolo HTTP . De acordo com os chamados princípios de dados abertos vinculados , esse URI não referenciado deve resultar em um documento que oferece mais dados sobre o URI fornecido. Neste exemplo, todos os URIs, tanto para as arestas e os nós (por exemplo http://schema.org/Person, http://schema.org/birthPlace, http://www.wikidata.org/entity/Q1731) pode ser desreferenciado e vai resultar em mais gráficos RDF, descrevendo o URI, por exemplo, que Dresden é uma cidade, na Alemanha, ou que uma pessoa, no sentido de esse URI, pode ser fictício.

O segundo gráfico mostra o exemplo anterior, mas agora enriquecido com alguns dos triplos dos documentos que resultam da desreferenciação https://schema.org/Person(borda verde) e https://www.wikidata.org/entity/Q1731(bordas azuis).

Além das arestas fornecidas explicitamente nos documentos envolvidos, as arestas podem ser inferidas automaticamente: o triplo

do fragmento RDFa original e o triplo

do documento em https://schema.org/Person(borda verde na figura) permite inferir o seguinte triplo, dada a semântica OWL (linha tracejada vermelha na segunda figura):

Fundo

O conceito de modelo de rede semântica foi formado no início dos anos 1960 por pesquisadores como o cientista cognitivo Allan M. Collins , o lingüista M. Ross Quillian e a psicóloga Elizabeth F. Loftus como uma forma de representar o conhecimento semanticamente estruturado. Quando aplicado no contexto da Internet moderna, ele estende a rede de páginas da web legíveis por hiperlinks , inserindo metadados legíveis por máquina sobre as páginas e como elas se relacionam entre si. Isso permite que agentes automatizados acessem a Web de maneira mais inteligente e realizem mais tarefas em nome dos usuários. O termo "Web Semântica" foi cunhado por Tim Berners-Lee, [7] o inventor da World Wide Web e diretor do World Wide Web Consortium (" W3C "), que supervisiona o desenvolvimento dos padrões da Web Semântica propostos. Ele define a Web Semântica como "uma rede de dados que pode ser processada direta e indiretamente por máquinas".

Muitas das tecnologias propostas pelo W3C já existiam antes de serem posicionadas sob o guarda-chuva do W3C. Estes são usados ​​em vários contextos, particularmente aqueles que lidam com informações que abrangem um domínio limitado e definido, e onde o compartilhamento de dados é uma necessidade comum, como pesquisa científica ou troca de dados entre empresas. Além disso, outras tecnologias com objetivos semelhantes surgiram, como microformatos .

Limitações de HTML

Muitos arquivos em um computador típico também podem ser divididos livremente em documentos legíveis por humanos e dados legíveis por máquina. Documentos como mensagens de correio, relatórios e brochuras são lidos por humanos. Dados, como calendários, catálogos de endereços, listas de reprodução e planilhas são apresentados usando um programa aplicativo que permite que eles sejam exibidos, pesquisados ​​e combinados.

Atualmente, a World Wide Web é baseada principalmente em documentos escritos em Hypertext Markup Language (HTML), uma convenção de marcação que é usada para codificar um corpo de texto intercalado com objetos multimídia, como imagens e formulários interativos. As tags de metadados fornecem um método pelo qual os computadores podem categorizar o conteúdo das páginas da web. Nos exemplos abaixo, os nomes de campo "palavras-chave", "descrição" e "autor" são atribuídos a valores como "computação" e "widgets baratos para venda" e "João da Silva".

< meta  name = "keywords"  content = "computing, computer studies, computer"  /> 
< meta  name = "description"  content = "Widgets baratos para venda"  /> 
< meta  name = "author"  content = "John Doe"  / >

Por causa dessa marcação e categorização de metadados, outros sistemas de computador que desejam acessar e compartilhar esses dados podem identificar facilmente os valores relevantes.

Com HTML e uma ferramenta para renderizá-lo (talvez um software de navegador da web , talvez outro agente de usuário ), pode-se criar e apresentar uma página que lista os itens à venda. O HTML desta página do catálogo pode fazer afirmações simples no nível do documento, como "o título deste documento é 'Superstore Widget '", mas não há capacidade dentro do próprio HTML para afirmar inequivocamente que, por exemplo, o item número X586172 é um Acme Gizmo com um preço de varejo de € 199, ou que é um produto de consumo. Em vez disso, o HTML só pode dizer que o extensão do texto "X586172" é algo que deve ser posicionado próximo a "Acme Gizmo" e "€ 199", etc. Não há como dizer "isto é um catálogo" ou mesmo estabelecer que "Acme Gizmo" é uma espécie de título ou que "€ 199" é um preço. Também não há como expressar que essas informações estão agrupadas na descrição de um item discreto, distinto de outros itens talvez listados na página.

HTML semântico refere-se à prática tradicional de HTML de marcação seguindo a intenção, em vez de especificar os detalhes do layout diretamente. Por exemplo, o uso de <em>denotar "ênfase" em vez de <i>, que especifica itálico . Os detalhes do layout são deixados para o navegador, em combinação com as folhas de estilo em cascata . Mas essa prática fica aquém de especificar a semântica de objetos como itens à venda ou preços.

Os microformatos estendem a sintaxe HTML para criar marcação semântica legível por máquina sobre objetos, incluindo pessoas, organizações, eventos e produtos. [13] Iniciativas semelhantes incluem RDFa , microdados e Schema.org .

Soluções de Web Semântica

A Web Semântica leva a solução mais longe. Envolve a publicação em linguagens projetadas especificamente para dados: Resource Description Framework (RDF), Web Ontology Language (OWL) e Extensible Markup Language ( XML ). HTML descreve documentos e os links entre eles. RDF, OWL e XML, por outro lado, podem descrever coisas arbitrárias como pessoas, reuniões ou partes de aviões.

Essas tecnologias são combinadas para fornecer descrições que complementam ou substituem o conteúdo dos documentos da web. Assim, o conteúdo pode se manifestar como dados descritivos armazenados em bancos de dados acessíveis na Web , [14] ou como marcação em documentos (particularmente, em HTML extensível ( XHTML ) intercalado com XML, ou, mais frequentemente, puramente em XML, com layout ou renderização dicas armazenadas separadamente). As descrições legíveis por máquina permitem que os gerenciadores de conteúdo adicionem significado ao conteúdo, ou seja, descrevam a estrutura do conhecimento que temos sobre aquele conteúdo. Desta forma, uma máquina pode processar o próprio conhecimento, em vez de texto, usando processos semelhantes ao raciocínio dedutivo humano e inferência, obtendo assim resultados mais significativos e ajudando os computadores a realizar a coleta e pesquisa automatizada de informações.

Um exemplo de tag que seria usada em uma página da web não semântica:

<item> blog </item>

A codificação de informações semelhantes em uma página da web semântica pode ter a seguinte aparência:

<item  rdf: about = "https://example.org/semantic-web/" > Web Semântica </item>

Tim Berners-Lee chama a rede resultante da Linked Data do gigante mundial Graph , em contraste com a baseada em HTML World Wide Web. Berners-Lee postula que se o passado era compartilhamento de documentos, o futuro é compartilhamento de dados . Sua resposta à pergunta "como" fornece três pontos de instrução. Um, um URL deve apontar para os dados. Dois, qualquer pessoa que acesse a URL deve receber os dados de volta. Três, os relacionamentos nos dados devem apontar para URLs adicionais com dados.

Web 3.0

Semantic Web

Tim Berners-Lee descreveu a Web Semântica como um componente da Web 3.0. [15]

As pessoas ficam perguntando o que é Web 3.0. Eu acho que talvez quando você tiver uma sobreposição de gráficos vetoriais escaláveis - tudo ondulando e dobrando e parecendo nebuloso - na Web 2.0 e acesso a uma Web semântica integrada em um grande espaço de dados, você terá acesso a um recurso de dados inacreditável …

-  Tim Berners-Lee, 2006

"Web Semântica" às vezes é usada como sinônimo de "Web 3.0", [16] embora a definição de cada termo varie.

Desafios

Alguns dos desafios da Web Semântica incluem vastidão, imprecisão, incerteza, inconsistência e engano. Os sistemas de raciocínio automatizados terão que lidar com todas essas questões para cumprir a promessa da Web Semântica.

  • Vastidão: A World Wide Web contém muitos bilhões de páginas. A ontologia de terminologia médica SNOMED CT sozinha contém 370.000 nomes de classes , e a tecnologia existente ainda não foi capaz de eliminar todos os termos semanticamente duplicados. Qualquer sistema de raciocínio automatizado terá que lidar com entradas realmente enormes.
  • Imprecisão: são conceitos imprecisos como "jovem" ou "alto". Isso surge da imprecisão das consultas do usuário, dos conceitos representados pelos provedores de conteúdo, da correspondência dos termos da consulta aos termos do provedor e da tentativa de combinar diferentes bases de conhecimento com conceitos sobrepostos, mas sutilmente diferentes. A lógica difusa é a técnica mais comum para lidar com a imprecisão.
  • Incerteza: são conceitos precisos com valores incertos. Por exemplo, um paciente pode apresentar um conjunto de sintomas que correspondem a vários diagnósticos distintos, cada um com uma probabilidade diferente. As técnicas de raciocínio probabilístico são geralmente empregadas para lidar com a incerteza.
  • Inconsistência: são contradições lógicas que surgirão inevitavelmente durante o desenvolvimento de grandes ontologias e quando ontologias de fontes separadas são combinadas. O raciocínio dedutivo falha catastroficamente quando confrontado com a inconsistência, porque "tudo resulta de uma contradição" . O raciocínio derrotável e o raciocínio paraconsistente são duas técnicas que podem ser empregadas para lidar com a inconsistência.
  • Engano: ocorre quando o produtor da informação está intencionalmente enganando o consumidor da informação. Técnicas de criptografia são utilizadas atualmente para aliviar essa ameaça. Ao fornecer um meio para determinar a integridade da informação, incluindo aquela que se relaciona com a identidade da entidade que produziu ou publicou a informação, no entanto, as questões de credibilidade ainda precisam ser tratadas em casos de fraude potencial.

Esta lista de desafios é ilustrativa, em vez de exaustiva, e enfoca os desafios da "lógica unificadora" e das camadas de "prova" da Web Semântica. O relatório final do Grupo Incubador do World Wide Web Consortium (W3C) para o Raciocínio da Incerteza para a World Wide Web [17] (URW3-XG) agrupa esses problemas sob o título único de "incerteza". [18] Muitas das técnicas mencionadas aqui irão requerer extensões para Web Ontology Language (OWL), por exemplo, para anotar probabilidades condicionais. Esta é uma área de pesquisa ativa. [19]

Padrões

A padronização para a Web Semântica no contexto da Web 3.0 está sob os cuidados do W3C. [20]

Componentes

O termo "Web Semântica" é frequentemente usado mais especificamente para se referir aos formatos e tecnologias que o permitem. [5] A coleta, estruturação e recuperação de dados vinculados são habilitadas por tecnologias que fornecem uma descrição formal de conceitos, termos e relacionamentos dentro de um determinado domínio de conhecimento . Essas tecnologias são especificadas como padrões W3C e incluem:

The Semantic Web Stack ilustra a arquitetura da Web Semântica. As funções e relacionamentos dos componentes podem ser resumidos da seguinte forma: [21]

  • O XML fornece uma sintaxe elementar para a estrutura do conteúdo nos documentos, mas não associa nenhuma semântica ao significado do conteúdo contido neles. XML não é atualmente um componente necessário das tecnologias da Web Semântica na maioria dos casos, pois existem sintaxes alternativas, como Turtle . O Turtle é um padrão de fato, mas não passou por um processo de padronização formal.
  • Esquema XML é uma linguagem para fornecer e restringir a estrutura e o conteúdo de elementos contidos em documentos XML.
  • RDF é uma linguagem simples para expressar modelos de dados , que se referem a objetos (" recursos da web ") e seus relacionamentos. Um modelo baseado em RDF pode ser representado em uma variedade de sintaxes, por exemplo, RDF / XML , N3, Turtle e RDFa. RDF é um padrão fundamental da Web Semântica. [22] [23]
  • RDF Schema estende RDF e é um vocabulário para descrever propriedades e classes de recursos baseados em RDF, com semântica para hierarquias generalizadas de tais propriedades e classes.
  • OWL adiciona mais vocabulário para descrever propriedades e classes: entre outros, relações entre classes (por exemplo, disjunção), cardinalidade (por exemplo, "exatamente um"), igualdade, tipificação mais rica de propriedades, características de propriedades (por exemplo, simetria) e classes enumeradas.
  • SPARQL é um protocolo e linguagem de consulta para fontes de dados da web semântica.
  • RIF é o formato de intercâmbio de regra W3C. É uma linguagem XML para expressar regras da Web que os computadores podem executar. O RIF fornece várias versões, chamadas dialetos. Inclui um dialeto lógico básico RIF (RIF-BLD) e um dialeto de regras de produção RIF (RIF PRD).

Estado atual de padronização

Padrões bem estabelecidos:

Ainda não totalmente realizado:

Aplicações

A intenção é aprimorar a usabilidade e utilidade da Web e de seus recursos interconectados criando serviços da Web semântica , como:

  • Servidores que expõem sistemas de dados existentes usando os padrões RDF e SPARQL. Muitos conversores para RDF existem em diferentes aplicativos. [24] Bancos de dados relacionais são uma fonte importante. O servidor da web semântica se conecta ao sistema existente sem afetar sua operação.
  • Documentos "marcados" com informações semânticas (uma extensão das <meta> tags HTML usadas nas páginas da Web de hoje para fornecer informações aos mecanismos de pesquisa da Web que usam rastreadores da Web ). Isso pode ser uma informação compreensível por máquina sobre o conteúdo compreensível por humanos do documento (como o criador, título, descrição, etc.) ou pode ser puramente metadados representando um conjunto de fatos (como recursos e serviços em outro lugar no site ) Observe que tudo o que pode ser identificado com um Identificador Uniforme de Recursos(URI) pode ser descrito, para que a web semântica possa raciocinar sobre animais, pessoas, lugares, ideias, etc. Existem quatro formatos de anotação semântica que podem ser usados ​​em documentos HTML; Microformato, RDFa, Microdata e JSON-LD . [25] A marcação semântica geralmente é gerada automaticamente, ao invés de manualmente.
  • Vocabulários de metadados comuns ( ontologias ) e mapas entre vocabulários que permitem aos criadores de documentos saber como marcar seus documentos para que os agentes possam usar as informações nos metadados fornecidos (de modo que o Autor no sentido de 'o Autor da página' ganhe ' pode ser confundido com Autor no sentido de um livro que é assunto de uma crítica literária).
  • Agentes automatizados para executar tarefas para usuários da web semântica usando esses dados.
  • Serviços baseados na Web (geralmente com seus próprios agentes) para fornecer informações especificamente aos agentes, por exemplo, um serviço de confiança que um agente pode perguntar se alguma loja online tiver um histórico de serviço ruim ou spam .

Esses serviços podem ser úteis para mecanismos de pesquisa públicos ou podem ser usados ​​para a gestão do conhecimento dentro de uma organização. Os aplicativos de negócios incluem:

  • Facilitando a integração de informações de fontes mistas
  • Dissolvendo ambigüidades na terminologia corporativa
  • Melhorar a recuperação de informações , reduzindo assim a sobrecarga de informações e aumentando o refinamento e a precisão dos dados recuperados [26] [27] [28] [29]
  • Identificar informações relevantes com respeito a um determinado domínio [30]
  • Fornecendo suporte para tomada de decisão

Em uma corporação, existe um grupo fechado de usuários e a gestão é capaz de fazer cumprir as diretrizes da empresa, como a adoção de ontologias específicas e o uso de anotações semânticas . Em comparação com a Web Semântica pública, existem menos requisitos de escalabilidade e as informações que circulam dentro de uma empresa podem ser mais confiáveis ​​em geral; privacidade é um problema menor fora do manuseio de dados do cliente.

Reações céticas

Viabilidade prática

Os críticos questionam a viabilidade básica de um cumprimento total ou mesmo parcial da Web Semântica, apontando tanto as dificuldades em sua montagem quanto a falta de utilidade geral que impede que o esforço necessário seja investido. Em um artigo de 2003, Marshall e Shipman apontam a sobrecarga cognitiva inerente à formalização do conhecimento, em comparação com a autoria do hipertexto tradicional da web : [31]

Embora aprender o básico de HTML seja relativamente direto, aprender uma linguagem ou ferramenta de representação de conhecimento requer que o autor aprenda sobre os métodos de abstração da representação e seus efeitos no raciocínio. Por exemplo, entender o relacionamento classe-instância, ou o relacionamento superclasse-subclasse, é mais do que entender que um conceito é um “tipo de” outro conceito. [...] Essas abstrações são ensinadas aos cientistas da computação em geral e aos engenheiros do conhecimento especificamente, mas não correspondem ao significado de linguagem natural semelhante de ser um "tipo de" algo. O uso eficaz de tal representação formal requer que o autor se torne um engenheiro de conhecimento qualificado, além de quaisquer outras habilidades exigidas pelo domínio. [...] Uma vez que se tenha aprendido uma linguagem de representação formal,muitas vezes, ainda é muito mais esforço expressar ideias nessa representação do que em uma representação menos formal [...]. Na verdade, esta é uma forma de programação baseada na declaração de dados semânticos e requer uma compreensão de como os algoritmos de raciocínio interpretarão as estruturas criadas.

De acordo com Marshall e Shipman, a natureza tácita e mutável de muito conhecimento aumenta o problema da engenharia do conhecimento e limita a aplicabilidade da Web Semântica a domínios específicos. Outra questão que eles apontam são as formas específicas do domínio ou da organização para expressar conhecimento, que devem ser resolvidas por meio de um acordo da comunidade, e não apenas por meios técnicos. [31] Como se constatou, comunidades especializadas e organizações para projetos intra-empresa tendem a adotar tecnologias de web semântica maiores do que comunidades periféricas e menos especializadas. [32] As restrições práticas para a adoção pareceram menos desafiadoras onde o domínio e o escopo são mais limitados do que o público em geral e a rede mundial de computadores.[32]

Finalmente, Marshall e Shipman veem problemas pragmáticos na ideia de agentes inteligentes (do estilo do Knowledge Navigator ) trabalhando na Web Semântica, em grande parte com curadoria manual: [31]

Em situações em que as necessidades do usuário são conhecidas e os recursos de informação distribuídos são bem descritos, essa abordagem pode ser altamente eficaz; em situações não previstas e que reúnem um conjunto imprevisto de recursos de informação, a abordagem do Google é mais robusta. Além disso, a Web Semântica depende de cadeias de inferência que são mais frágeis; um elemento ausente da cadeia resulta em uma falha em realizar a ação desejada, enquanto o humano pode fornecer as peças que faltam em uma abordagem mais parecida com o Google. [...] as compensações de custo-benefício podem funcionar em favor de metadados da Web Semântica especialmente criados, direcionados a entrelaçar recursos de informação específicos de domínio bem estruturados e sensíveis; atenção especial às necessidades do usuário / cliente conduzirá essas federações para que tenham sucesso.

A crítica de Cory Doctorow (" metacrap ") é da perspectiva do comportamento humano e das preferências pessoais. Por exemplo, as pessoas podem incluir metadados espúrios em páginas da Web na tentativa de enganar os mecanismos da Web Semântica que ingenuamente assumem a veracidade dos metadados. Esse fenômeno era bem conhecido com metatags que enganaram o algoritmo de classificação Altavista para elevar a classificação de certas páginas da Web: o mecanismo de indexação do Google procura especificamente por tais tentativas de manipulação. Peter Gärdenfors e Timo Honkela apontam que as tecnologias da web semântica baseadas em lógica cobrem apenas uma fração dos fenômenos relevantes relacionados à semântica. [33] [34]

Censura e privacidade

O entusiasmo com a web semântica pode ser temperado por preocupações com censura e privacidade . Por exemplo, as técnicas de análise de texto agora podem ser facilmente contornadas usando outras palavras, metáforas, por exemplo, ou usando imagens no lugar de palavras. Uma implementação avançada da web semântica tornaria muito mais fácil para os governos controlar a visualização e a criação de informações online, já que essas informações seriam muito mais fáceis de serem entendidas por uma máquina de bloqueio de conteúdo automatizado. Além disso, também foi levantada a questão de que, com o uso de arquivos FOAF e metadados de geolocalização, haveria muito pouco anonimato associado à autoria de artigos sobre coisas como um blog pessoal. Algumas dessas preocupações foram abordadas no projeto "Policy Aware Web" [35] e é um tópico ativo de pesquisa e desenvolvimento.

Duplicação formatos de saída

Outra crítica à web semântica é que seria muito mais demorado criar e publicar conteúdo porque seriam necessários dois formatos para um dado: um para visualização humana e outro para máquinas. No entanto, muitos aplicativos da web em desenvolvimento estão abordando esse problema criando um formato legível por máquina após a publicação de dados ou a solicitação de uma máquina para esses dados. O desenvolvimento de microformatos foi uma reação a esse tipo de crítica. Outro argumento em defesa da viabilidade da web semântica é a provável queda do preço das tarefas de inteligência humana em mercados de trabalho digitais, como o Mechanical Turk da Amazon . [ citação necessária ]

Especificações como eRDF e RDFa permitem que dados RDF arbitrários sejam incorporados em páginas HTML. O mecanismo GRDDL ( Recolher Descrições de Recursos de Dialetos da Linguagem) permite que o material existente (incluindo microformatos) seja interpretado automaticamente como RDF, de modo que os editores só precisam usar um único formato, como HTML.

As actividades de investigação sobre aplicativos corporativos

O primeiro grupo de pesquisa com foco explícito na Web Semântica Corporativa foi a equipe ACACIA da INRIA-Sophia-Antipolis , fundada em 2002. Os resultados de seu trabalho incluem o mecanismo de busca Corese [36] baseado em RDF (S) e a aplicação da web semântica tecnologia no domínio da inteligência artificial distribuída para gestão do conhecimento (por exemplo, ontologias e sistemas multiagentes para Web semântica corporativa) [37] e e-learning . [38]

Desde 2008, o grupo de pesquisa da Web Semântica Corporativa, localizado na Universidade Livre de Berlim , concentra-se nos blocos de construção: Pesquisa Semântica Corporativa, Colaboração Semântica Corporativa e Engenharia de Ontologia Corporativa. [39]

A pesquisa em engenharia de ontologia inclui a questão de como envolver usuários não especialistas na criação de ontologias e conteúdo semanticamente anotado [40] e para extrair conhecimento explícito da interação de usuários dentro das empresas.

Futuro das aplicações

Tim O'Reilly , que cunhou o termo Web 2.0, propôs uma visão de longo prazo da Web Semântica como uma rede de dados, onde aplicativos sofisticados manipulam a rede de dados. [41] A web de dados transforma a World Wide Web de um sistema de arquivos distribuído em um sistema de banco de dados distribuído. [42]

Veja também

Referências

  1. ^ "Linha do tempo dos padrões W3C do XML e da Web semântica" (PDF) . 04/02/2012.
  2. ^ "World Wide Web Consortium (W3C)," RDF / XML Syntax Specification (Revised) ", 10 Fev. 2004" .
  3. ^ "World Wide Web Consortium (W3C)," OWL Web Ontology Language Overview ", W3C Recommendation, 10 Fev. 2004" .
  4. ^ Chung, Seung-Hwa (2018). "A abordagem do MOUSE: mapeamento de ontologias usando UML para engenheiros de sistema" . Computer Reviews Journal : 8–29. ISSN 2581-6640 . 
  5. ^ a b "Atividade da Web semântica de W3C" . Consórcio da World Wide Web (W3C). 7 de novembro de 2011 . Recuperado em 26 de novembro de 2011 .
  6. ^ "Perguntas e Respostas com Tim Berners-Lee, Relatório Especial" . businessweek.com . Obtido em 14 de abril de 2018 .
  7. ^ a b Berners-Lee, Tim; James Hendler; Ora Lassila (17 de maio de 2001). “A Web Semântica” . Scientific American . Recuperado em 2 de julho de 2019 .
  8. ^ Lee Feigenbaum (1º de maio de 2007). “A Web Semântica em Ação” . Scientific American . Recuperado em 24 de fevereiro de 2010 .
  9. ^ Berners-Lee, Tim ; Fischetti, Mark (1999). Tecendo a Web . HarperSanFrancisco . capítulo 12 . ISBN 978-0-06-251587-2.
  10. ^ Berners-Lee, Tim (17 de maio de 2001). "The Semantic Web" (PDF) . Scientific American . S2CID 32015696 . Arquivado do original (PDF) em 10 de outubro de 2017 . Recuperado em 13 de março de 2008 .  
  11. ^ Nigel Shadbolt; Wendy Hall; Tim Berners-Lee (2006). "The Semantic Web Revisited" (PDF) . Sistemas Inteligentes IEEE . Recuperado em 13 de abril de 2007 .
  12. ^ Ramanathan V. Guha (2013). "Luz no Fim do Túnel" . Apresentação da Conferência Internacional da Web Semântica de 2013 . Recuperado em 8 de março de 2015 .
  13. ^ Allsopp, John (março de 2007). Microformatos: capacitando sua marcação para a Web 2.0 . Amigos de ED . p. 368 . ISBN 978-1-59059-814-6.
  14. ^ Artem Chebotko e Shiyong Lu, "Querying the Semantic Web: An Efficient Approach Using Relational Databases", LAP Lambert Academic Publishing , ISBN 978-3-8383-0264-5 , 2009. 
  15. ^ Shannon, Victoria (23 de maio de 2006). “Uma Web 'mais revolucionária'” . International Herald Tribune . Página visitada em 26 de junho de 2006 .
  16. ^ Sharma, Akhilesh. "Apresentando o conceito de Web 3.0" . Ajuste e truque . Retirado em 10 de janeiro de 2017 .
  17. ^ "Raciocínio da incerteza do W3C para a World Wide Web" . www.w3.org . Página visitada em 2021-05-14 .
  18. ^ "Raciocínio da incerteza para a World Wide Web" . W3.org . Página visitada em 20 de dezembro de 2018 .
  19. ^ Lukasiewicz, Thomas; Umberto Straccia (2008). "Gerenciando incertezas e imprecisões em lógicas de descrição para a Web Semântica" (PDF) . Web Semantics: Science, Services and Agents on the World Wide Web . 6 (4): 291–308. doi : 10.1016 / j.websem.2008.04.001 .
  20. ^ "Padrões da Web Semântica" . W3.org . Obtido em 14 de abril de 2018 .
  21. ^ "Visão geral da linguagem OWL Web Ontology" . Consórcio da World Wide Web (W3C). 10 de fevereiro de 2004 . Recuperado em 26 de novembro de 2011 .
  22. ^ "Estrutura de descrição de recursos (RDF)" . Consórcio da World Wide Web .
  23. ^ Allemang, Dean; Hendler, James; Gandon, Fabien (3 de agosto de 2020). Semantic Web for the Working Ontologist: Effective Modeling for Linked Data, RDFS, and OWL (Third ed.). [New York, NY, USA]: ACM Books; 3ª edição. ISBN 978-1450376143.
  24. ^ "ConverterToRdf - W3C Wiki" . W3.org . Página visitada em 20 de dezembro de 2018 .
  25. ^ Sikos, Leslie F. (2015). Dominando Dados Estruturados na Web Semântica: De Microdados HTML5 a Dados Abertos Vinculados . Apress. p. 23. ISBN 978-1-4842-1049-9.
  26. ^ Omar Alonso e Hugo Zaragoza. 2008. Explorando anotações semânticas na recuperação de informação: ESAIR '08. SIGIR Forum 42, 1 (junho de 2008), 55–58. doi : 10.1145 / 1394251.1394262
  27. ^ Jaap Kamps, Jussi Karlgren e Ralf Schenkel. 2011. Relatório sobre o terceiro workshop sobre a exploração de anotações semânticas na recuperação de informação (ESAIR). SIGIR Forum 45, 1 (maio de 2011), 33–41. doi : 10.1145 / 1988852.1988858
  28. ^ Jaap Kamps, Jussi Karlgren , Peter Mika e Vanessa Murdock. 2012. Quinto workshop sobre a exploração de anotações semânticas na recuperação de informação: ESAIR '12). In Proceedings of the 21th ACM International Conference on Information and Knowledge Management (CIKM '12). ACM, New York, NY, USA, 2772–2773. doi : 10.1145 / 2396761.2398761
  29. ^ Omar Alonso, Jaap Kamps e Jussi Karlgren . 2015. Relatório sobre o Sétimo Workshop de Exploração de Anotações Semânticas na Recuperação de Informação (ESAIR '14). SIGIR Forum 49, 1 (junho de 2015), 27–34. doi : 10.1145 / 2795403.2795412
  30. ^ Kuriakose, John (setembro de 2009). "Compreendendo e adotando a tecnologia da Web Semântica" . Cutter IT Journal . CUTTER INFORMATION CORP. 22 (9): 10–18.
  31. ^ a b c Marshall, Catherine C .; Shipman, Frank M. (2003). Qual web semântica? (PDF) . Proc. ACM Conf. em hipertexto e hipermídia. pp. 57–66.
  32. ^ a b Ivan Herman (2007). Estado da Web Semântica (PDF) . Dias semânticos de 2007 . Recuperado em 26 de julho de 2007 .
  33. ^ Gärdenfors, Peter (2004). Como tornar a Web Semântica mais semântica . Ontologia Formal em Sistemas de Informação: anais da terceira conferência internacional (FOIS-2004) . IOS Press. pp. 17–34.
  34. ^ Honkela, Timo; Könönen, Ville; Lindh-Knuutila, Tiina; Paukkeri, Mari-Sanna (2008). “Simular processos de formação e comunicação de conceitos”. Journal of Economic Methodology . 15 (3): 245–259. doi : 10.1080 / 13501780802321350 . S2CID 16994027 . 
  35. ^ "Projeto da Web com reconhecimento de políticas" . Policyawareweb.org . Retirado 2013-06-14 .
  36. ^ Corby, Olivier; Dieng-Kuntz, Rose; Zucker, Catherine Faron; Gandon, Fabien (2006). "Searching the Semantic Web: Approximate Query Processing with Ontologies" . Sistemas Inteligentes IEEE . 21 : 20–27. doi : 10.1109 / MIS.2006.16 . S2CID 11488848 . 
  37. ^ Gandon, Fabien (7 de novembro de 2002). "Inteligência Artificial Distribuída e Gestão do Conhecimento: Ontologias e Sistemas Multiagentes para uma Web Semântica Corporativa" . Université Nice Sophia Antipolis.
  38. ^ Buffa, Michel; Dehors, Sylvain; Faron-Zucker, Catherine; Sander, Peter (2005). "Rumo a uma Abordagem Corporativa da Web Semântica no Projeto de Sistemas de Aprendizagem: Revisão do Projeto de Soluções de Teste" (PDF) . Workshop Internacional sobre Aplicações de Tecnologias da Web Semântica para E-Learning . Amsterdã, Holanda. pp. 73–76.
  39. ^ "Corporate Semantic Web - Home" . Corporate-semantic-web.de . Obtido em 14 de abril de 2018 .
  40. ^ Hinze, Annika; Heese, Ralf; Luczak-Rösch, Markus; Paschke, Adrian (2012). "Enriquecimento semântico por não especialistas: usabilidade de ferramentas de anotação manual" (PDF) . ISWC'12 - Proceedings of the 11th international conference on The Semantic Web . Boston, EUA. pp. 165–181.
  41. ^ Mathieson, SA (6 de abril de 2006). "Espalhe a palavra e junte-se a ela" . The Guardian . Obtido em 14 de abril de 2018 .
  42. ^ Spivack, Nova (18 de setembro de 2007). “A Web Semântica, Inteligência Coletiva e Hiperdados” . novaspivack.typepad.com/nova_spivacks_weblog [Este blog foi movido para NovaSpivack.com] . Obtido em 14 de abril de 2018 .

Leitura adicional

Ligações externas

0.12024307250977