Semantic Web

 In Web Analytics

Il linguaggio base di ogni pagina web è l’HTML, per ottenere effetti grafici e contenuti dinamici, si sono sviluppati nel tempo moltissimi altri linguaggi come Javascript, Flash ecc… ma non ci si è fermati solamente a questo, esiste anche un’altra categoria di linguaggi che è possibile integrare in un contesto web, cioè i linguaggi semantici.

La semantica ha il compito di descrivere la realtà; nel contesto di una pagina web grazie a questi linguaggi è possibile inserire nuove informazioni semantiche, sotto forma di metadati.

Ma qual è l’utilità nell’aggiungere metadati?

Una pagina html per un calcolatore è solamente un elenco di parole, quindi per effettuare una ricerca l’unico metodo possibile è cercare letteralmente una stringa.

Avendo a disposizione invece metadati aggiuntivi le ricerche possono seguire una certa logica, come farebbe la mente umana che ispeziona un documento, questo rende i documenti “machine-readable”.

Grazie ai metadati semantici, nasce il concetto di “risorsa”, si tratta di qualunque entità identificabile in un documento. Può essere una persona, un gruppo di persone, un documento, una pagina web, un libro, una e¬mail, ecc.

Le risorse identificabili univocamente sul web hanno idealmente un URI univoco associato, in modo da mantenere il collegamento tra pagine web che trattano lo stesso argomento.

Il passo logico successivo all’identificazione delle risorse è creare collegamenti tra loro, creando relazioni.

Ma quali sono realmente i linguaggi che si possono utilizzare in una pagina web?

I linguaggi su cui si basa il Semantic Web sono RDF e OWL, sono nati però linguaggi più leggeri e semplici che è possibile integrare direttamente nelle pagine HTML o XHTML:

  • RDFa
  • Microformats

Questi due linguaggi forniscono un insieme di attributi XHTML per rappresentare in formato machine-readable dei dati human-readable come le pagine web, senza che sia necessario riscrivere e creare nuovi contenuti, ma semplicemente aggiungendo informazioni a quelli già esistenti.

RDFa introduce dei nuovi attributi XHTML che accettano valori appartenenti ad un vocabolario specifico.
Il vocabolario di riferimento (Dublin Core, FOAF, etc..) viene importato specificando una XML Namespace declaration che associa il prefisso alla URIref, ad esempio per il prefisso dc:

xmlns:dc=”http://purl.org/dc/elements/1.1/”

In questo modo è possibile utilizzare gli elementi raccolti nel vocabolario (ad esempio dc:title) come valori per gli attributi XHTML di RDFa.

Le informazioni aggiuntive inserite agli elementi della pagina XHTML tramite RDFa, costruiscono delle relazioni tra gli elementi stessi e sono rappresentabili tramite grafi basati sulle triple RDF soggetto-predicato-oggetto, questo fatto chiarisce che RDFa non è altro che un’applicazione dell’idea di RDF applicata alle pagine XHTML.

I microformats seguono lo stesso principio, ma invece che utilizzare nuovi attributi negli elementi XHTML, utilizzano l’attributo “class” già esistente.

I Microformats a disposizione sono:

  • vcard (identifica l’inizio di una hCard, è l’elemento root)
  • fn (formatted name)
  • n
  • nickname, sort-string
  • url, email, tel
  • adr, label
  • geo (latitude, longitude), tz
  • photo, logo, sound, bday
  • title, role, org
  • category, note
  • class, key, mailer, uid, rev

Come si è visto, i mezzi per aggiungere contenuto semantico non mancano, è ora utile capire quanto questi linguaggi siano utilizzati e supportati.

Un passo importante in questa direzione è stato fatto da Google nella prima metà del 2009 dichiarando di supportare entrambi i formati.

Verso questa direzione ci sono tanti progetti di rilievo, come Linked Data. Lo scopo di questo progetto è quello di creare un immenso vocabolario semantico che contiene tutti i dati di Wikipedia.

Articoli consigliati

Leave a Comment