Anda di halaman 1dari 16

COME FARE

WEB SEMANTICO

Questo nuovo modo di gestire le mente chiamate “semantiche”, os-


informazioni sta provocando una sia in grado di estrarre significati
trasformazione del Web, facendolo da informazioni. Il Web non è l’uni-
evolvere, a vent’anni dalla sua na- co settore in cui vengono applicate:
scita, in qualcosa di molto più sono infatti già utilizzate in infra-
avanzato rispetto a quello che sia- strutture aziendali, istituzioni e al-
mo abituati a navigare ogni giorno. tre realtà che hanno bisogno di ca-
Sul nome non c’è accordo: c’è chi talogare e gestire grandi quantità
lo chiama Web semantico, chi il di informazioni.
Web dei dati o chi, con un termine Nelle prossime pagine, dopo una
da molti considerato semplicistico, panoramica su queste tecnologie,
il Web 3.0. Quest’ultimo può risul- vi presenteremo alcuni servizi se-
tare troppo vago per definire la mantici, scelti tra quelli che hanno
mutazione in atto, al punto che la il Web come contesto di utilizzo e
versione inglese di Wikipedia dopo che ci sono sembrati più utili e si-
un lungo dibattito ne ha cancellato gnificativi. Il settore è giovane e
la voce corrispondente, ma aiuta a molto ampio, inoltre molte delle so-
semplificare il quadro in cui il luzioni semantiche sono adottate in
“Web del futuro” si inserisce. ambiti di nicchia (in particolare
nell’ambito di intranet aziendali),
Nel l a pri ma dec ade del la s ua vi ta il quindi in questo articolo non trove-
Web è stato un medium di sola let- rete probabilmente una “killer ap-
tura: una grande libreria dalla qua- plication” del Web 3.0. Troverete
le ricevere informazioni. La secon- però tanti esempi di come il Web
da decade ha visto invece la diffu- semantico possa semplificare e ren-

Alla scoperta di...


sione di servizi che lo hanno tra- dere più utile la raccolta, la gestio-
sformato in un medium di scrittura. ne e il riutilizzo delle informazioni,
Attraverso blog e social network i rendendo Internet ancora più utile.
navigatori si sono convertiti da
spettatori in attori, iniziando a pub- Rdf, vocabolari

...il Web
in grado non solo di verificare il blicare informazioni e opinioni: è il e ontologie
prezzo di una stanza doppia di un cosiddetto Web 2.0, il Web della
hotel 3 stelle situato in una certa lo- partecipazione. Nella terza decade, Come abbiamo appena accennato,
calità, ma anche di prenotare auto- iniziata da poco, le informazioni di- le tecnologie semantiche rappre-
maticamente quello più economico sponibili on-line stanno diventando sentano delle informazioni (non ne-
e più vicino ai luoghi che si deside- comprensibili anche ai calcolatori, cessariamente testuali) e vi associa-
rano visitare. in modo da poter essere collegate no significati comprensibili dalle
Non si tratta di possibilità solo teo- tra loro e riutilizzate sotto altre for- macchine. Il progetto pubblico più

semantico
riche: nell’ultimo anno sono co- me (e dando vita a nuove informa- strutturato per raggiungere questo
minciate a comparire applicazioni zioni) tramite strumenti automatici. obiettivo all’interno dell’intero Web
Web intelligenti in grado di com- Questo passaggio è reso possibile è quello che va sotto il nome di Web
prendere i dati pubblicati on-line. da svariate tecnologie comune- semantico ( www.w3.org/2001/

L’evoluzione del Web


I
computer oggi conservano i cavandoli dal contesto della pagi-
documenti senza comprender- na, utilizzare sinonimi per espan- WebOS Web 4.0
Il “Web del futuro”, che

SEMANTICA DELLE CONNESSIONI TRA INFORMAZIONI


ne il significato, che invece di dere le ricerche, ma in ultima ana- 2020-2030
Web Semantico
sfrutta le tecnologie se- solito è chiaro a prima vista per un lisi il suo archivio è un elenco, cer-
Swrl Web 3.0
Agenti personali intelligenti
lettore umano. Quando un motore tamente molto ben organizzato, di Owl Ricerca distribuita
2010-2020
mantiche per rendere di ricerca come Google salva nella parole chiave. Se invece fosse in P2P
OpenID Ajax Sparql
Ricerca semantica
Database semantici
Rss Atom Widget
comprensibili ai calco- sua cache le pagine Web, non di- grado di comprendere il significato JavaScript Rdf Office 2.0 Mashup

Fonte: Radar Network & Nova Spivack


stingue se la parola espresso si ri- dei contenuti di una pagina, po- World Wide Web Soap Xml Flash Web 2.0 Blog Social media sharing
2000-2010
latori il significato dei ferisca a un treno o a un tipo di trebbe accettare domande come Html HttpJava Wiki SaaS Social networking
Vr
Bbs Ricerca per keyword
contenuti delle pagine caffè, oppure se verdi sia un colore “qual è il più piccolo hotel per fa- Gopher Web 1.0 Siti Web
Collaborazione “leggera”
MacOS Sql 1990-2000
o il nome di un compositore (lo miglie a Roma che costa meno di Desktop
Web, sta diventando Sgml Groupware
stesso vale, a maggior ragione, per 150 euro” e fornire un’unica rispo- Windows
Email Database
una realtà. i contenuti non testuali come le sta, quella giusta. Una tale capa- Ftp Irc PC File server
1980-1990
immagini o gli elementi multime- cità permetterebbe poi di creare Usenet
Di Francesco Caccavella diali). Un motore di ricerca può una nuova generazione di applica- Pc
File System
tentare di percepire i significati ri- zioni Web. Ad esempio, un servizio SEMANTICA DELLE CONNESSIONI SOCIALI

100 101
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE
WEB SEMANTICO

Questo nuovo modo di gestire le mente chiamate “semantiche”, os-


informazioni sta provocando una sia in grado di estrarre significati
trasformazione del Web, facendolo da informazioni. Il Web non è l’uni-
evolvere, a vent’anni dalla sua na- co settore in cui vengono applicate:
scita, in qualcosa di molto più sono infatti già utilizzate in infra-
avanzato rispetto a quello che sia- strutture aziendali, istituzioni e al-
mo abituati a navigare ogni giorno. tre realtà che hanno bisogno di ca-
Sul nome non c’è accordo: c’è chi talogare e gestire grandi quantità
lo chiama Web semantico, chi il di informazioni.
Web dei dati o chi, con un termine Nelle prossime pagine, dopo una
da molti considerato semplicistico, panoramica su queste tecnologie,
il Web 3.0. Quest’ultimo può risul- vi presenteremo alcuni servizi se-
tare troppo vago per definire la mantici, scelti tra quelli che hanno
mutazione in atto, al punto che la il Web come contesto di utilizzo e
versione inglese di Wikipedia dopo che ci sono sembrati più utili e si-
un lungo dibattito ne ha cancellato gnificativi. Il settore è giovane e
la voce corrispondente, ma aiuta a molto ampio, inoltre molte delle so-
semplificare il quadro in cui il luzioni semantiche sono adottate in
“Web del futuro” si inserisce. ambiti di nicchia (in particolare
nell’ambito di intranet aziendali),
Nel l a pri ma dec ade del la s ua vi ta il quindi in questo articolo non trove-
Web è stato un medium di sola let- rete probabilmente una “killer ap-
tura: una grande libreria dalla qua- plication” del Web 3.0. Troverete
le ricevere informazioni. La secon- però tanti esempi di come il Web
da decade ha visto invece la diffu- semantico possa semplificare e ren-

Alla scoperta di...


sione di servizi che lo hanno tra- dere più utile la raccolta, la gestio-
sformato in un medium di scrittura. ne e il riutilizzo delle informazioni,
Attraverso blog e social network i rendendo Internet ancora più utile.
navigatori si sono convertiti da
spettatori in attori, iniziando a pub- Rdf, vocabolari

...il Web
in grado non solo di verificare il blicare informazioni e opinioni: è il e ontologie
prezzo di una stanza doppia di un cosiddetto Web 2.0, il Web della
hotel 3 stelle situato in una certa lo- partecipazione. Nella terza decade, Come abbiamo appena accennato,
calità, ma anche di prenotare auto- iniziata da poco, le informazioni di- le tecnologie semantiche rappre-
maticamente quello più economico sponibili on-line stanno diventando sentano delle informazioni (non ne-
e più vicino ai luoghi che si deside- comprensibili anche ai calcolatori, cessariamente testuali) e vi associa-
rano visitare. in modo da poter essere collegate no significati comprensibili dalle
Non si tratta di possibilità solo teo- tra loro e riutilizzate sotto altre for- macchine. Il progetto pubblico più

semantico
riche: nell’ultimo anno sono co- me (e dando vita a nuove informa- strutturato per raggiungere questo
minciate a comparire applicazioni zioni) tramite strumenti automatici. obiettivo all’interno dell’intero Web
Web intelligenti in grado di com- Questo passaggio è reso possibile è quello che va sotto il nome di Web
prendere i dati pubblicati on-line. da svariate tecnologie comune- semantico ( www.w3.org/2001/

L’evoluzione del Web


I
computer oggi conservano i cavandoli dal contesto della pagi-
documenti senza comprender- na, utilizzare sinonimi per espan- WebOS Web 4.0
Il “Web del futuro”, che

SEMANTICA DELLE CONNESSIONI TRA INFORMAZIONI


ne il significato, che invece di dere le ricerche, ma in ultima ana- 2020-2030
Web Semantico
sfrutta le tecnologie se- solito è chiaro a prima vista per un lisi il suo archivio è un elenco, cer-
Swrl Web 3.0
Agenti personali intelligenti
lettore umano. Quando un motore tamente molto ben organizzato, di Owl Ricerca distribuita
2010-2020
mantiche per rendere di ricerca come Google salva nella parole chiave. Se invece fosse in P2P
OpenID Ajax Sparql
Ricerca semantica
Database semantici
Rss Atom Widget
comprensibili ai calco- sua cache le pagine Web, non di- grado di comprendere il significato JavaScript Rdf Office 2.0 Mashup

Fonte: Radar Network & Nova Spivack


stingue se la parola espresso si ri- dei contenuti di una pagina, po- World Wide Web Soap Xml Flash Web 2.0 Blog Social media sharing
2000-2010
latori il significato dei ferisca a un treno o a un tipo di trebbe accettare domande come Html HttpJava Wiki SaaS Social networking
Vr
Bbs Ricerca per keyword
contenuti delle pagine caffè, oppure se verdi sia un colore “qual è il più piccolo hotel per fa- Gopher Web 1.0 Siti Web
Collaborazione “leggera”
MacOS Sql 1990-2000
o il nome di un compositore (lo miglie a Roma che costa meno di Desktop
Web, sta diventando Sgml Groupware
stesso vale, a maggior ragione, per 150 euro” e fornire un’unica rispo- Windows
Email Database
una realtà. i contenuti non testuali come le sta, quella giusta. Una tale capa- Ftp Irc PC File server
1980-1990
immagini o gli elementi multime- cità permetterebbe poi di creare Usenet
Di Francesco Caccavella diali). Un motore di ricerca può una nuova generazione di applica- Pc
File System
tentare di percepire i significati ri- zioni Web. Ad esempio, un servizio SEMANTICA DELLE CONNESSIONI SOCIALI

100 101
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

sw) ed è promosso dal W3C, che vi lori. Proprio come nel ragionamento prietà della relazio- cui parleremo a breve, di definire
lavora da oltre 10 anni. Il W3C ha da quotidiano per dare significato a ne. In Rdf questo W3C un vocabolario esteso e condiviso
tempo formalizzato diversi linguaggi
e procedure standard per la condivi-
qualcosa diciamo, ad esempio, La
Fiat Panda è un tipo di utilitaria, e
procedimento
chiama, con un ter-
si
Il W3C (World Wide Web
di termini, di dedurre nuove pro-
prietà dai concetti spiegati oppure
Il progetto Linked Data
Consortium) è l’ente inter-
sione in forma semantica delle infor-
mazioni e per il loro riutilizzo in altre
applicazioni. Alla base del Web se-
associamo il valore utilitaria a Fiat
Panda, così con Rdf possiamo colle-
gare una risorsa Web a un’altra e
mine mutuato dalla
logica, dichiarazione
( statement ) e serve
nazionale che si occupa di
standardizzare le tecnolo-
di stabilire delle “regole” per la de-
finizione delle risorse. A questo
pensano i vocabolari e le ontologie.
S upportato dal W3C, Linked Data (www.linkeddata.org)si propone di collegare tra di loro i ser-
vizi che pubblicano dati sul Web. Se il progetto del Web semantico ha l’obiettivo di definire il
modo di pubblicare informazioni in forma semantica e rendere queste informazioni dei dati, così il
gie utilizzate nel Web. È
mantico vi è un linguaggio o, me- specificare che tipo di relazione ad identificare dei diretto da Tim Berners- I primi stabiliscono un elenco di progetto Linked Data, esso stesso parte del Web semantico, vuole invece definire il modo di connet-
glio, un modello per la strutturazio- hanno. L’esempio appena fatto po- “fatti” combinando Lee, lo scienziato inglese termini con cui definire gli elemen- tere tra loro questi dati attraverso l’uso di link.
ne dei dati chiamato Rdf (Resource trebbe essere rappresentato pubbli- tre elementi (triple o che nel marzo 1989 ideò il ti all’interno di un campo di cono-
Description Framework), che è per i cando un file in formato Rdf in cui la triplette): soggetto concetto di uno spazio scenze: nel campo delle automobili Il Web immaginato dal progetto Linked Data è un Web fatto non di pagine come siamo abituati a
dati quello che l’Html è per le pagi- pagina ufficiale della Fiat Panda e la ( Fiat Panda ), predi- ipertestuale interconnesso un vocabolario potrebbe stabilire vederle oggi, ma di dati navigabili con i cosiddetti Linked Data browsers. In questo “Web dei dati” i
ne Web che leggiamo tutti i giorni. pagina della categoria utilitarie di cato ( è un tipo di ) e per lo scambio di informa- che, ad esempio, per identificare il collegamenti non avvengono quindi tra pagine ma tra diverse fonti di dati: la pagina personale di un
Rdf fa una cosa semplice: rappresen- Wikipedia vengono collegate usan- oggetto ( utilitaria ). zioni chiamato poi modello di una macchina si dovrà utente mostrerà, ad esempio, un link verso una fonte di dati geografica per indicare il luogo in cui
ta significati associando alcune risor- do un terzo elemento, sempre sotto La relazione viene World Wide Web. usare il nome modello, per identifi- risiede, un link verso una fonte di dati aziendale per indicare che lavoro fa e un link verso una fonte
se identificabili sul Web con dei va- forma di link, per specificare la pro- espressa visualmen- care la serie il nome famiglia e così di dati di un social network per visualizzare le amicizie che ha. Alla base del progetto Linked Data ci
te sotto forma di via. Anche le ontologie descrivono sono naturalmente tutti gli schemi sviluppati dal W3C per il Web semantico (Rdf e Ontologie in pri-
grafo in cui sogget- in modo formalizzato i termini ma, mo luogo) ma anche nuove specifiche per la scelta degli indirizzi Web e per la pubblicazione dei
La struttura del Web semantico to e oggetto sono i
Grafo a differenza dei vocabolari, stabili- contenuti on-line. Linked Data è un progetto già attivo: a marzo 2009 erano quasi 100 i servizi che
nodi mentre gli archi Per grafo si intende una scono anche le relazioni fra di essi: offrivano dati in questa forma, per un totale di oltre 5 milioni di link.
rappresentano le rappresentazione di un in- sono, in altre parole, un vocabola-
INTERFACCIA UTENTE E APPLICAZIONI sieme di elementi (nodi)
proprietà. rio di termini arricchito da un livel-
Le relazioni si posso- tra i quali sussiste una de- lo semantico.
FIDUCIA no creare non solo terminata relazione. I grafi di una rete. Per le ontologie il lin- L’approccio bottom up
sono utilizzati in matemati-
tra pagine Web, ma A t tr a v e r s o u n’ o n to l o gi a s i p uò , ad guaggio di riferimento è Owl (Web
PROVA ca e in altri campi della
tra singole parti di esempio, specificare che affermare la Ontology Language) e una delle on- Le pagine con lo “strato” semantico
scienza per studiare e for-
esse, tra elementi Fiat Panda è un tipo di utilitaria signi- tologie più utilizzate è quella di DB- sono tuttavia una minima percen-
LOGICA malizzare le relazioni tra
(come gli indirizzi e- fica anche dire che la Fiat Panda è un Pedia (http://wiki.dbpedia.org/Onto- tuale se paragonate a quelle pub-
elementi della stes-
mail), tra una pagina sa rete. automobile e che dunque ha un mo- logy) costruita utilizzando concetti e blicate in modo tradizionale. Anche
CRITTOGRAFIA

ONTOLOGIA: OWL e un’entità numerica tore, un prezzo e così via. Un’ontolo- relazioni trovati all’interno di Wikipe- se i linguaggi, le ontologie, i voca-
QUERY: REGOLE:
SPARQL RIF (ad esempio una da- gia, tra le altre cose, limita i concetti dia. Da questa descrizione appare bolari sono pronti da anni, le appli-
RDFS ta), tra dati non raggiungibili diretta- che possono essere espressi (una chiaro come il Web semantico sia cazioni semantiche tardano ad usci-
mente dal Web (numeri di telefono o macchina può essere un’utilitaria o un’evoluzione che né sostituisce né re dai settori di nicchia in cui sono
SCAMBIO DATI: RDF codici ISBN di un libro) e anche tra una berlina ma non tutte e due le co- entra in concorrenza con il Web at- al momento confinate: per la com-
concetti astratti. Tutte le relazioni se) e consente di condividere concet- tuale; lo si può immaginare come una plessità intrinseca del sistema, per-
XML formano una rete di significati pres- ti e relazioni con altre ontologie (la sorta di strato applicato alle informa- ché non c’è una percezione ade-
soché infinita, che può essere estrat- Fiat potrebbe chiamare utilitaria ciò zioni pubblicate on-line e che ne con- guata dei vantaggi che un sistema
URI / IRI ta da un software e rielaborata. Tutto che la Renault chiama city car). I vo- sente la comprensione anche da par- semantico interconnesso possa da-
ciò è già, parzialmente, una realtà: cabolari possono essere definiti attra- te di un’applicazione software. Un re, perché molte aziende preferisco-
Linked Data, il progetto più ampio di verso un’estensione del linguaggio elemento pubblicato on-line (una pa- no tenere i propri dati chiusi nei lo-

L’ architettura del Web semantico viene rappresentata dal W3C anche sotto forma di una
pila di livelli indipendenti, visibilE in figura. La pila mostra l’ordine di sviluppo e le re-
lazioni fra i diversi pezzi che la formano. Ogni livello è indipendente ma connesso a quello
dati condivisi presente sul Web, a
marzo 2009 conteneva già oltre 4 mi-
liardi e mezzo di dichiarazioni (tri-
Rdf chiamata Rdf Schema: un esem-
pio di vocabolario è il noto Dublin
Core usato per descrivere le proprietà
gina, un video, un’immagine) se-
guendo gli standard del Web seman-
tico potrebbe avere così due facce:
ro database (pensiamo a social
network come Facebook), perché è
difficile che gli utenti da soli possa-
precedente e a quello successivo: sistemi compatibili con la tecnologia di un livello lo saran- plette) connesse attraverso 180 mi- di libri, articoli o documenti in gene- una tradizionale da visualizzare nor- no procedere a pubblicare dati se-
no anche con quella del livello più in basso. Alla base della pila – ossia alla base del Web se- lioni di voci Rdf rale (individuando elementi come ti- malmente sul nostro browser, e una mantici ben strutturati.
mantico – vi sono le risorse Web, raggiungibili con indirizzi in caratteri occidentali (Uri, tolo, autore, data di pubblicazione e nuova, in Rdf e Owl o in altri lin- Per estendere questo strato si può
Uniform Resource Identifier) o in caratteri internazionali (Iri, Internationalized Resource Iden- U n f i l e R d f p u ò , d a s o l o , stabilire così via) o Foaf (Friend of a Friend), guaggi, che sarà però letta e inter- agire in due modi: pubblicando
tifier). Rdf, RdfS (RDF Schema) e Owl sono i linguaggi, in vario modo basati su Xml, che per- relazioni fra risorse ma non consen- usato per descrivere le attività di una pretata da programmi (o agenti) in- nuove informazioni che hanno già
mettono di rappresentare le risorse Web sotto forma di dati e di renderle disponibili ai livelli te, se non tramite RDF Schema di persona e le sue relazioni all’interno telligenti. al loro interno delle notificazioni se-
successivi. A supporto di questi linguaggi vi è Sparql (Simple Protocol And RDF Query Lan-
guage), con cui si interrogano le basi di dati create con Rdf e Owl attraverso una sintassi si- TIPS TIPS
mile a quella dell’Sql, e Rif (Rule Interchange Format), la tecnologia per condividere regole
fra sistemi semantici differenti. I livelli di base, a parte Rif che è in via di definizione, sono già
pronti e pubblicati come raccomandazioni ufficiali; non lo sono invece le tecnologie dei livel-
Le ontologie in Word Un browser per il Web semantico I più noti vocabolari del Web semantico
li alti. Il livello della logica dovrebbe consentire alle macchine di acquisire nuove conoscenze
a partire da quelle già rappresentate, per esempio, con Rdf e Owl. Il livello della prova (Proof)
sarà utilizzato per verificare che le nuove conoscenze acquisite con il livello logico siano di-
M icrosoft ha pubblicato di recente un’add-on
che consente di integrare ontologie nei testi
scritti con Word 2007. Scaricabile all’indirizzo
L e risorse web in formato Rdf sono destinate ad essere consumate
da software automatici e non da comuni browser. Un progetto che
permette di visualizzarle anche in un comune navigatore è il SIOC
I l Web semantico può contare su un gran numero di vocabolari, ossia di
elenchi di termini o frasi che rendono standard l’espressione di alcuni
concetti. Alcuni di essi sono utilizzati per descrivere le informazioni relative
mostrabili, mentre Il livello della fiducia (Trust) permetterà di accertarsi, con l’uso ad esem- http://ucsdbiolit.codeplex.com, salva in locale al- Browser reperibile all’indirizzo http://sioc-project.org/browser. Sebbe- alle persone (Foaf, hCard), informazioni sulla collocazione geografica di un
pio di firme digitali, che l’intero processo sia basato su connessioni affidabili. Il livello della cune ontologie scelte da Microsoft e permette di ne sia indicato per risorse Sioc, un’ontologia per la rappresentazione luogo (Geonames), sugli eventi (RDFCalendar), sui social network (Sioc),
fiducia, l’ultimo tassello del Web semantico, è centrale poiché assicura che l’intero processo annotare i testi che si sta scrivendo con i termini in semantica delle relazioni e delle informazioni generate da community sui prodotti pubblicati in un sito di commercio elettronico (GoodRelations).
di rappresentazione, elaborazione e produzione di nuove informazioni sia affidabile e possa esse contenuti. Al momento sono disponibili on- on-line, funziona anche con altre tipologie di file Rdf e ne consente la Un elenco di vocabolari, completo di descrizioni, è disponibile all’indirizzo
essere utilizzato con sicurezza in applicazioni o in servizi Web. tologie nei campi della medicina e delle scienze. navigazione da link a link. http://semanticweb.org/wiki

102 103
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

sw) ed è promosso dal W3C, che vi lori. Proprio come nel ragionamento prietà della relazio- cui parleremo a breve, di definire
lavora da oltre 10 anni. Il W3C ha da quotidiano per dare significato a ne. In Rdf questo W3C un vocabolario esteso e condiviso
tempo formalizzato diversi linguaggi
e procedure standard per la condivi-
qualcosa diciamo, ad esempio, La
Fiat Panda è un tipo di utilitaria, e
procedimento
chiama, con un ter-
si
Il W3C (World Wide Web
di termini, di dedurre nuove pro-
prietà dai concetti spiegati oppure
Il progetto Linked Data
Consortium) è l’ente inter-
sione in forma semantica delle infor-
mazioni e per il loro riutilizzo in altre
applicazioni. Alla base del Web se-
associamo il valore utilitaria a Fiat
Panda, così con Rdf possiamo colle-
gare una risorsa Web a un’altra e
mine mutuato dalla
logica, dichiarazione
( statement ) e serve
nazionale che si occupa di
standardizzare le tecnolo-
di stabilire delle “regole” per la de-
finizione delle risorse. A questo
pensano i vocabolari e le ontologie.
S upportato dal W3C, Linked Data (www.linkeddata.org)si propone di collegare tra di loro i ser-
vizi che pubblicano dati sul Web. Se il progetto del Web semantico ha l’obiettivo di definire il
modo di pubblicare informazioni in forma semantica e rendere queste informazioni dei dati, così il
gie utilizzate nel Web. È
mantico vi è un linguaggio o, me- specificare che tipo di relazione ad identificare dei diretto da Tim Berners- I primi stabiliscono un elenco di progetto Linked Data, esso stesso parte del Web semantico, vuole invece definire il modo di connet-
glio, un modello per la strutturazio- hanno. L’esempio appena fatto po- “fatti” combinando Lee, lo scienziato inglese termini con cui definire gli elemen- tere tra loro questi dati attraverso l’uso di link.
ne dei dati chiamato Rdf (Resource trebbe essere rappresentato pubbli- tre elementi (triple o che nel marzo 1989 ideò il ti all’interno di un campo di cono-
Description Framework), che è per i cando un file in formato Rdf in cui la triplette): soggetto concetto di uno spazio scenze: nel campo delle automobili Il Web immaginato dal progetto Linked Data è un Web fatto non di pagine come siamo abituati a
dati quello che l’Html è per le pagi- pagina ufficiale della Fiat Panda e la ( Fiat Panda ), predi- ipertestuale interconnesso un vocabolario potrebbe stabilire vederle oggi, ma di dati navigabili con i cosiddetti Linked Data browsers. In questo “Web dei dati” i
ne Web che leggiamo tutti i giorni. pagina della categoria utilitarie di cato ( è un tipo di ) e per lo scambio di informa- che, ad esempio, per identificare il collegamenti non avvengono quindi tra pagine ma tra diverse fonti di dati: la pagina personale di un
Rdf fa una cosa semplice: rappresen- Wikipedia vengono collegate usan- oggetto ( utilitaria ). zioni chiamato poi modello di una macchina si dovrà utente mostrerà, ad esempio, un link verso una fonte di dati geografica per indicare il luogo in cui
ta significati associando alcune risor- do un terzo elemento, sempre sotto La relazione viene World Wide Web. usare il nome modello, per identifi- risiede, un link verso una fonte di dati aziendale per indicare che lavoro fa e un link verso una fonte
se identificabili sul Web con dei va- forma di link, per specificare la pro- espressa visualmen- care la serie il nome famiglia e così di dati di un social network per visualizzare le amicizie che ha. Alla base del progetto Linked Data ci
te sotto forma di via. Anche le ontologie descrivono sono naturalmente tutti gli schemi sviluppati dal W3C per il Web semantico (Rdf e Ontologie in pri-
grafo in cui sogget- in modo formalizzato i termini ma, mo luogo) ma anche nuove specifiche per la scelta degli indirizzi Web e per la pubblicazione dei
La struttura del Web semantico to e oggetto sono i
Grafo a differenza dei vocabolari, stabili- contenuti on-line. Linked Data è un progetto già attivo: a marzo 2009 erano quasi 100 i servizi che
nodi mentre gli archi Per grafo si intende una scono anche le relazioni fra di essi: offrivano dati in questa forma, per un totale di oltre 5 milioni di link.
rappresentano le rappresentazione di un in- sono, in altre parole, un vocabola-
INTERFACCIA UTENTE E APPLICAZIONI sieme di elementi (nodi)
proprietà. rio di termini arricchito da un livel-
Le relazioni si posso- tra i quali sussiste una de- lo semantico.
FIDUCIA no creare non solo terminata relazione. I grafi di una rete. Per le ontologie il lin- L’approccio bottom up
sono utilizzati in matemati-
tra pagine Web, ma A t tr a v e r s o u n’ o n to l o gi a s i p uò , ad guaggio di riferimento è Owl (Web
PROVA ca e in altri campi della
tra singole parti di esempio, specificare che affermare la Ontology Language) e una delle on- Le pagine con lo “strato” semantico
scienza per studiare e for-
esse, tra elementi Fiat Panda è un tipo di utilitaria signi- tologie più utilizzate è quella di DB- sono tuttavia una minima percen-
LOGICA malizzare le relazioni tra
(come gli indirizzi e- fica anche dire che la Fiat Panda è un Pedia (http://wiki.dbpedia.org/Onto- tuale se paragonate a quelle pub-
elementi della stes-
mail), tra una pagina sa rete. automobile e che dunque ha un mo- logy) costruita utilizzando concetti e blicate in modo tradizionale. Anche
CRITTOGRAFIA

ONTOLOGIA: OWL e un’entità numerica tore, un prezzo e così via. Un’ontolo- relazioni trovati all’interno di Wikipe- se i linguaggi, le ontologie, i voca-
QUERY: REGOLE:
SPARQL RIF (ad esempio una da- gia, tra le altre cose, limita i concetti dia. Da questa descrizione appare bolari sono pronti da anni, le appli-
RDFS ta), tra dati non raggiungibili diretta- che possono essere espressi (una chiaro come il Web semantico sia cazioni semantiche tardano ad usci-
mente dal Web (numeri di telefono o macchina può essere un’utilitaria o un’evoluzione che né sostituisce né re dai settori di nicchia in cui sono
SCAMBIO DATI: RDF codici ISBN di un libro) e anche tra una berlina ma non tutte e due le co- entra in concorrenza con il Web at- al momento confinate: per la com-
concetti astratti. Tutte le relazioni se) e consente di condividere concet- tuale; lo si può immaginare come una plessità intrinseca del sistema, per-
XML formano una rete di significati pres- ti e relazioni con altre ontologie (la sorta di strato applicato alle informa- ché non c’è una percezione ade-
soché infinita, che può essere estrat- Fiat potrebbe chiamare utilitaria ciò zioni pubblicate on-line e che ne con- guata dei vantaggi che un sistema
URI / IRI ta da un software e rielaborata. Tutto che la Renault chiama city car). I vo- sente la comprensione anche da par- semantico interconnesso possa da-
ciò è già, parzialmente, una realtà: cabolari possono essere definiti attra- te di un’applicazione software. Un re, perché molte aziende preferisco-
Linked Data, il progetto più ampio di verso un’estensione del linguaggio elemento pubblicato on-line (una pa- no tenere i propri dati chiusi nei lo-

L’ architettura del Web semantico viene rappresentata dal W3C anche sotto forma di una
pila di livelli indipendenti, visibilE in figura. La pila mostra l’ordine di sviluppo e le re-
lazioni fra i diversi pezzi che la formano. Ogni livello è indipendente ma connesso a quello
dati condivisi presente sul Web, a
marzo 2009 conteneva già oltre 4 mi-
liardi e mezzo di dichiarazioni (tri-
Rdf chiamata Rdf Schema: un esem-
pio di vocabolario è il noto Dublin
Core usato per descrivere le proprietà
gina, un video, un’immagine) se-
guendo gli standard del Web seman-
tico potrebbe avere così due facce:
ro database (pensiamo a social
network come Facebook), perché è
difficile che gli utenti da soli possa-
precedente e a quello successivo: sistemi compatibili con la tecnologia di un livello lo saran- plette) connesse attraverso 180 mi- di libri, articoli o documenti in gene- una tradizionale da visualizzare nor- no procedere a pubblicare dati se-
no anche con quella del livello più in basso. Alla base della pila – ossia alla base del Web se- lioni di voci Rdf rale (individuando elementi come ti- malmente sul nostro browser, e una mantici ben strutturati.
mantico – vi sono le risorse Web, raggiungibili con indirizzi in caratteri occidentali (Uri, tolo, autore, data di pubblicazione e nuova, in Rdf e Owl o in altri lin- Per estendere questo strato si può
Uniform Resource Identifier) o in caratteri internazionali (Iri, Internationalized Resource Iden- U n f i l e R d f p u ò , d a s o l o , stabilire così via) o Foaf (Friend of a Friend), guaggi, che sarà però letta e inter- agire in due modi: pubblicando
tifier). Rdf, RdfS (RDF Schema) e Owl sono i linguaggi, in vario modo basati su Xml, che per- relazioni fra risorse ma non consen- usato per descrivere le attività di una pretata da programmi (o agenti) in- nuove informazioni che hanno già
mettono di rappresentare le risorse Web sotto forma di dati e di renderle disponibili ai livelli te, se non tramite RDF Schema di persona e le sue relazioni all’interno telligenti. al loro interno delle notificazioni se-
successivi. A supporto di questi linguaggi vi è Sparql (Simple Protocol And RDF Query Lan-
guage), con cui si interrogano le basi di dati create con Rdf e Owl attraverso una sintassi si- TIPS TIPS
mile a quella dell’Sql, e Rif (Rule Interchange Format), la tecnologia per condividere regole
fra sistemi semantici differenti. I livelli di base, a parte Rif che è in via di definizione, sono già
pronti e pubblicati come raccomandazioni ufficiali; non lo sono invece le tecnologie dei livel-
Le ontologie in Word Un browser per il Web semantico I più noti vocabolari del Web semantico
li alti. Il livello della logica dovrebbe consentire alle macchine di acquisire nuove conoscenze
a partire da quelle già rappresentate, per esempio, con Rdf e Owl. Il livello della prova (Proof)
sarà utilizzato per verificare che le nuove conoscenze acquisite con il livello logico siano di-
M icrosoft ha pubblicato di recente un’add-on
che consente di integrare ontologie nei testi
scritti con Word 2007. Scaricabile all’indirizzo
L e risorse web in formato Rdf sono destinate ad essere consumate
da software automatici e non da comuni browser. Un progetto che
permette di visualizzarle anche in un comune navigatore è il SIOC
I l Web semantico può contare su un gran numero di vocabolari, ossia di
elenchi di termini o frasi che rendono standard l’espressione di alcuni
concetti. Alcuni di essi sono utilizzati per descrivere le informazioni relative
mostrabili, mentre Il livello della fiducia (Trust) permetterà di accertarsi, con l’uso ad esem- http://ucsdbiolit.codeplex.com, salva in locale al- Browser reperibile all’indirizzo http://sioc-project.org/browser. Sebbe- alle persone (Foaf, hCard), informazioni sulla collocazione geografica di un
pio di firme digitali, che l’intero processo sia basato su connessioni affidabili. Il livello della cune ontologie scelte da Microsoft e permette di ne sia indicato per risorse Sioc, un’ontologia per la rappresentazione luogo (Geonames), sugli eventi (RDFCalendar), sui social network (Sioc),
fiducia, l’ultimo tassello del Web semantico, è centrale poiché assicura che l’intero processo annotare i testi che si sta scrivendo con i termini in semantica delle relazioni e delle informazioni generate da community sui prodotti pubblicati in un sito di commercio elettronico (GoodRelations).
di rappresentazione, elaborazione e produzione di nuove informazioni sia affidabile e possa esse contenuti. Al momento sono disponibili on- on-line, funziona anche con altre tipologie di file Rdf e ne consente la Un elenco di vocabolari, completo di descrizioni, è disponibile all’indirizzo
essere utilizzato con sicurezza in applicazioni o in servizi Web. tologie nei campi della medicina e delle scienze. navigazione da link a link. http://semanticweb.org/wiki

102 103
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

applicato virtualmente all’intero


corpus di documenti pubblicati su
Internet, non si basa su rigide strut-
I siti del Web semantico
ture precostituite ma riconduce a
logiche formali la complessità del Dopo aver discusso le tecnologie del Web
linguaggio di tutti i giorni, quello
effettivamente usato dalle persone semantico è arrivato il momento di passare alla
quando scrivono. Utilizzato soprat- pratica. I siti descritti di seguito vi permetteranno
tutto in applicazioni commerciali
come motori di ricerca di Intranet, di prendere contatto con il “Web 3.0”.
sistemi di gestione delle informa-
zioni o CRM aziendali, entra a far
parte del Web 3.0 quando i dati
elaborati vengono esposti anche
on-line o quando diventa lo stru-
mento per creare applicazioni web
innovative. Calais è un progetto di
OntoWiki utilizza il linguaggio Rdf e diversi vocabolari Semantify, un tool basato su Php, consente di “taggare” Thomson Reuters, la società pro-
per pubblicare informazioni in forma strutturata. porzioni delle proprie pagine Web con dati semantici. prietaria della nota agenzia di
stampa Reuters, che attraverso il
progetto Open Calais (www.open-
calais.com) offre liberamente l’uso
mantiche oppure aggiungere un li- questo campo è On to Wik i ( http:// se di un Cms, ne estrae la struttura di un’applicazione semantica di
vello semantico, secondo gli stan- ontowiki.net), un Wiki che utilizza il semantica interpretando la struttura questo tipo. Basta indicare a Calais
dard del W3C o no, a informazioni linguaggio Rdf e diversi vocabolari di tabelle, righe e colonne e la rende una pagina Web o un testo (in in-
già pubblicate. Il primo è un ap- per pubblicare in forma strutturata disponibile in formato Rdf. Triplify, glese o francese) da analizzare per
proccio bottom up (dal basso verso informazioni. C’è poi molta attesa scritto in Php, può essere adattato ricevere subito una rappresentazio-
l’alto), il secondo è un approccio top per la versione 7 del popolare Cms con un minimo di configurazione a ne semantica del testo e, eventual-
down (dall’alto verso basso). L’ap- Drupal (http://drupal.org/), che inte- qualsiasi applicazione Web, ad mente, l’annotazione automatica in
proccio bottom up può essere af- grerà diversi livelli dell’infrastruttu- esempio il Cms Joomla, il sistema di Rdf di persone, luoghi, aziende,
frontato adottando o progettando ra semantica del W3C. pubblicazione di blog Wordpress o il fatti e eventi significativi trovati.
all’interno della propria organizza- forum phpBB. Semantify (www.dap- Calais è un sistema aperto; ciò si-
Uptake
zione dei sistemi di pubblicazione A metà strada fra l’approccio dall’al- per.net/semantify) è invece uno stru- gnifica che chiunque può utilizzar-
dei contenuti (Cms, Content Mana- to e quello dal basso vi sono stru- mento, ancora in versione di sviluppo, lo e integrarlo nel proprio sito o
gement System) in grado di aggiun- menti come Triplify e Semantify. Il che consente di “taggare” alcune por- blog attraverso delle interfacce di Un aiuto zioni contenute nei siti analizzati, Up-
gere, più o meno automaticamente, primo (http://triplify.org) è un picco- zioni delle proprie pagine con dati se- programmazione (Api). per i consumatori take riesce ad aggregare i luoghi in
delle annotazioni ai documenti pub- lo software che, analizzando le mantici per presentarle così modifica- categorie comuni. È possibile cercare,
blicati. Uno dei progetti più noti in informazioni conservate nel databa- te ai software che ne supportano l’in- L’Italia in questo settore è all’avan- Come detto, un approccio top down digitando semplicemente una frase in
dividuazione. Al momento il servizio, guardia, poiché uno dei motori se- consente di analizzare i testi pubbli- linguaggio naturale, un hotel roman-
anch’esso basato su Php, è progettato mantici top down più noti ed ap- cati sul Web ed estrarne concetti. tico ma economico, il miglior museo
per servire pagine semantiche a prezzati, Cogito, è stato creato dall’i- Molti siti già utilizzano tecnologie in una specifica zona, un ristorante di
Slurp, il robot di scansione di Yahoo, e taliana Expert System (www.expert- semantiche, in modo più o meno lusso che serve cibo giapponese e co-
accetta come formato solo Rdfa, un set system.net). Cogito, a cui abbiamo completo, per aiutare l’utente a cer- sì via. Se si scrive, in inglese, Viaggio
di istruzioni per includere proprietà dedicato un riquadro separato, può care il prodotto, la vacanza o il risto- con i miei bambini e vorrei un hotel
Rdf in normali pagine Web. essere adattato a diversi ambiti: dal- rante migliore basandosi sulle opi- economico, il servizio mostra in testa
la gestione di motori di ricerca alla nioni o sulle caratteristiche espresse alla classifica gli hotel con stanze
L’approccio top down distribuzione di inserzioni pubblici- da altri utenti. In questa rassegna vi adatte ad una famiglia e con un prez-
tarie, dall’analisi presentiamo quelli che abbiamo tro- zo che non supera i 100 dollari. I ri-
L’approccio top down risiede quasi delle opinioni vato più utili; purtroppo sono quasi sultati vengono classificati su una
interamente sulla capacità di un’ap- NLP espresse in comu- tutti in lingua inglese. scala da 1 a 5 in base alle medie rice-
plicazione di “capire” il significato NLP (Natural Language nità on-line alla vute dagli altri siti e sono completate
di un testo che gli viene sommini- Processing, elaborazione gestione di servizi Uptake (www.uptake.com), chiama- dalle informazioni sugli orari di aper-
strato e di formalizzarne i concetti del linguaggio naturale) è di customer care. to in precedenza Kangoo, è un servi- tura, indirizzi, mappe, numeri telefo-
in modo da renderli poi riutilizzabi- un campo della scienza Cogito viene uti- zio che consente di cercare la vacan- nici e così via.
li da software in diversi contesti . che studia processi infor- lizzato inoltre nel- za ideale in base ai propri stili di
È l’approccio più complesso, e ri- matici in grado di analizza- l’applicazione se- viaggio, alle proprie necessità o al Swotti (www.swotti.com), è una del-
chiede grande potenza di calcolo re il linguaggio umano. Il mantica Twine, di proprio budget. È una sorta di motore le applicazioni che rendono meglio
nonché e raffinati strumenti di ela- linguaggio naturale com- cui parleremo più comparativo che analizza, come di- l’idea di come la semantica possa
borazione del linguaggio naturale prende le lingue parlate avanti, e nell’ag- chiara il produttore, circa 5.000 siti migliorare e rendere più semplici la
(NLP) e di apprendimento automa- dall’essere umano ed è gregatore di blog dedicati ai viaggi e 20 milioni di opi- raccolta di informazioni su telefoni-
tico. È anche l’approccio più frut- l’opposto di linguag- Liquida (www. nioni espresse dai navigatori. Grazie ni, libri, automobili e tutto ciò di cui
Basta indicare a Calais una pagina Web o un testo (in inglese o francese) gio formale.
da analizzare per riceverne subito una rappresentazione semantica. tuoso, perché, oltre a poter essere liquida.it). all’analisi semantica delle informa- si parla sul Web. Si tratta di un mo-

104 105
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

applicato virtualmente all’intero


corpus di documenti pubblicati su
Internet, non si basa su rigide strut-
I siti del Web semantico
ture precostituite ma riconduce a
logiche formali la complessità del Dopo aver discusso le tecnologie del Web
linguaggio di tutti i giorni, quello
effettivamente usato dalle persone semantico è arrivato il momento di passare alla
quando scrivono. Utilizzato soprat- pratica. I siti descritti di seguito vi permetteranno
tutto in applicazioni commerciali
come motori di ricerca di Intranet, di prendere contatto con il “Web 3.0”.
sistemi di gestione delle informa-
zioni o CRM aziendali, entra a far
parte del Web 3.0 quando i dati
elaborati vengono esposti anche
on-line o quando diventa lo stru-
mento per creare applicazioni web
innovative. Calais è un progetto di
OntoWiki utilizza il linguaggio Rdf e diversi vocabolari Semantify, un tool basato su Php, consente di “taggare” Thomson Reuters, la società pro-
per pubblicare informazioni in forma strutturata. porzioni delle proprie pagine Web con dati semantici. prietaria della nota agenzia di
stampa Reuters, che attraverso il
progetto Open Calais (www.open-
calais.com) offre liberamente l’uso
mantiche oppure aggiungere un li- questo campo è On to Wik i ( http:// se di un Cms, ne estrae la struttura di un’applicazione semantica di
vello semantico, secondo gli stan- ontowiki.net), un Wiki che utilizza il semantica interpretando la struttura questo tipo. Basta indicare a Calais
dard del W3C o no, a informazioni linguaggio Rdf e diversi vocabolari di tabelle, righe e colonne e la rende una pagina Web o un testo (in in-
già pubblicate. Il primo è un ap- per pubblicare in forma strutturata disponibile in formato Rdf. Triplify, glese o francese) da analizzare per
proccio bottom up (dal basso verso informazioni. C’è poi molta attesa scritto in Php, può essere adattato ricevere subito una rappresentazio-
l’alto), il secondo è un approccio top per la versione 7 del popolare Cms con un minimo di configurazione a ne semantica del testo e, eventual-
down (dall’alto verso basso). L’ap- Drupal (http://drupal.org/), che inte- qualsiasi applicazione Web, ad mente, l’annotazione automatica in
proccio bottom up può essere af- grerà diversi livelli dell’infrastruttu- esempio il Cms Joomla, il sistema di Rdf di persone, luoghi, aziende,
frontato adottando o progettando ra semantica del W3C. pubblicazione di blog Wordpress o il fatti e eventi significativi trovati.
all’interno della propria organizza- forum phpBB. Semantify (www.dap- Calais è un sistema aperto; ciò si-
Uptake
zione dei sistemi di pubblicazione A metà strada fra l’approccio dall’al- per.net/semantify) è invece uno stru- gnifica che chiunque può utilizzar-
dei contenuti (Cms, Content Mana- to e quello dal basso vi sono stru- mento, ancora in versione di sviluppo, lo e integrarlo nel proprio sito o
gement System) in grado di aggiun- menti come Triplify e Semantify. Il che consente di “taggare” alcune por- blog attraverso delle interfacce di Un aiuto zioni contenute nei siti analizzati, Up-
gere, più o meno automaticamente, primo (http://triplify.org) è un picco- zioni delle proprie pagine con dati se- programmazione (Api). per i consumatori take riesce ad aggregare i luoghi in
delle annotazioni ai documenti pub- lo software che, analizzando le mantici per presentarle così modifica- categorie comuni. È possibile cercare,
blicati. Uno dei progetti più noti in informazioni conservate nel databa- te ai software che ne supportano l’in- L’Italia in questo settore è all’avan- Come detto, un approccio top down digitando semplicemente una frase in
dividuazione. Al momento il servizio, guardia, poiché uno dei motori se- consente di analizzare i testi pubbli- linguaggio naturale, un hotel roman-
anch’esso basato su Php, è progettato mantici top down più noti ed ap- cati sul Web ed estrarne concetti. tico ma economico, il miglior museo
per servire pagine semantiche a prezzati, Cogito, è stato creato dall’i- Molti siti già utilizzano tecnologie in una specifica zona, un ristorante di
Slurp, il robot di scansione di Yahoo, e taliana Expert System (www.expert- semantiche, in modo più o meno lusso che serve cibo giapponese e co-
accetta come formato solo Rdfa, un set system.net). Cogito, a cui abbiamo completo, per aiutare l’utente a cer- sì via. Se si scrive, in inglese, Viaggio
di istruzioni per includere proprietà dedicato un riquadro separato, può care il prodotto, la vacanza o il risto- con i miei bambini e vorrei un hotel
Rdf in normali pagine Web. essere adattato a diversi ambiti: dal- rante migliore basandosi sulle opi- economico, il servizio mostra in testa
la gestione di motori di ricerca alla nioni o sulle caratteristiche espresse alla classifica gli hotel con stanze
L’approccio top down distribuzione di inserzioni pubblici- da altri utenti. In questa rassegna vi adatte ad una famiglia e con un prez-
tarie, dall’analisi presentiamo quelli che abbiamo tro- zo che non supera i 100 dollari. I ri-
L’approccio top down risiede quasi delle opinioni vato più utili; purtroppo sono quasi sultati vengono classificati su una
interamente sulla capacità di un’ap- NLP espresse in comu- tutti in lingua inglese. scala da 1 a 5 in base alle medie rice-
plicazione di “capire” il significato NLP (Natural Language nità on-line alla vute dagli altri siti e sono completate
di un testo che gli viene sommini- Processing, elaborazione gestione di servizi Uptake (www.uptake.com), chiama- dalle informazioni sugli orari di aper-
strato e di formalizzarne i concetti del linguaggio naturale) è di customer care. to in precedenza Kangoo, è un servi- tura, indirizzi, mappe, numeri telefo-
in modo da renderli poi riutilizzabi- un campo della scienza Cogito viene uti- zio che consente di cercare la vacan- nici e così via.
li da software in diversi contesti . che studia processi infor- lizzato inoltre nel- za ideale in base ai propri stili di
È l’approccio più complesso, e ri- matici in grado di analizza- l’applicazione se- viaggio, alle proprie necessità o al Swotti (www.swotti.com), è una del-
chiede grande potenza di calcolo re il linguaggio umano. Il mantica Twine, di proprio budget. È una sorta di motore le applicazioni che rendono meglio
nonché e raffinati strumenti di ela- linguaggio naturale com- cui parleremo più comparativo che analizza, come di- l’idea di come la semantica possa
borazione del linguaggio naturale prende le lingue parlate avanti, e nell’ag- chiara il produttore, circa 5.000 siti migliorare e rendere più semplici la
(NLP) e di apprendimento automa- dall’essere umano ed è gregatore di blog dedicati ai viaggi e 20 milioni di opi- raccolta di informazioni su telefoni-
tico. È anche l’approccio più frut- l’opposto di linguag- Liquida (www. nioni espresse dai navigatori. Grazie ni, libri, automobili e tutto ciò di cui
Basta indicare a Calais una pagina Web o un testo (in inglese o francese) gio formale.
da analizzare per riceverne subito una rappresentazione semantica. tuoso, perché, oltre a poter essere liquida.it). all’analisi semantica delle informa- si parla sul Web. Si tratta di un mo-

104 105
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

le opinioni raccolte sul prenotazione) ed estrae dei bookmark condivisi il semantic


servizio, sul cibo e sul- Xnf le informazioni più rile- tagging o, in italiano, il sistema di
l’ambiente oltre che Xfn (Xhtml Friends Net- vanti per costruire l’iti- etichettatura semantico. Il servizio
dati logistici e l’elenco work) è un microformato nerario: le date del volo, consente di salvare i link a pagine
delle recensioni dei siti che consente di rappre- le date di permanenza, i Web e di catalogarli usando un set di
esterni. Il servizio al sentare relazioni fra per- luoghi in cui ci si sposta tag predefiniti estrapolati dai con-
momento è attivo solo sone attraverso link inclu- e così via. Tecnologie cetti presenti in Wikipedia. I tag
per una manciata di si in pagine Html. Con Xfn semantiche sono inoltre vengono suggeriti automaticamente
città degli Stati Uniti. è possibile, ad esempio, utilizzate anche nei in base all’analisi della pagina o ag-
inserire nella propria pa- contenuti presenti sul giunti a mano dall’utente, ma in en-
Tripit (w
www.tripit.com) gina Web un collegamen- sito: i viaggi e le pagine trambi i casi devono essere presenti
è un servizio on-line che to alla pagina di un colle- personali degli utenti come pagine di Wikipedia. I link sal-
aiuta le persone ad or- ga, di un conoscente o di sono presentati utiliz- vati possono poi essere ricercati per
ganizzare i propri viag- un amico specificando il zando i microformati parole chiave o esplorati navigando
tipo di relazione con un
gi. Il funzionamento è per le date dei viaggi, tra le categorie ( topic ), anch’esse
semplice attributo
Swotti Boorah semplice: si prenota un
(l’attributo rel).
per i luoghi e per le per- speculari a quelle di Wikipedia. Il ri-
viaggio o un pacchetto sone aggiunte all’itine- sultato è un catalogo ordinato e coe-
completo presso uno o rario mentre la pagina rente di link che favorisce la ricerca
tore di ricerca che cataloga decine se positive. I link possono essere Boorah (www.boorah.com) è un’ap- più degli oltre 350 siti supportati (tra personale di ogni iscritto è associata
di prodotti diversi e analizza sia le anche filtrati in base alle funziona- plicazione simile a Swotti ma dedi- cui Expedia, Lastminute e con dati Xfn usati per rappresentare
recensioni comparse su siti specia- lità: facendo clic ad esempio sulla cata all’analisi delle recensioni di ri- Venere.com) e si inviano tutti i mes- relazioni all’interno della Rete.
lizzati, sia le opinioni che su questi voce Battery presentata nel piccolo storanti. Il servizio analizza le opi- saggi di conferma ricevuti all’indiriz-
prodotti hanno espresso i navigatori box riassuntivo verranno mostrati nioni espresse da comuni navigatori zo plans@tripit.com; in risposta si rice- Gestione Microformati e Rdfa
attraverso siti, blog o commenti. Le solamente i contenuti che parlano o da recensori professionisti su risto- ve indietro una pianificazione detta- della conoscenza
fonti del motore sono filtrate per
escludere quelle meno significative,
sono analizzate semanticamente,
(bene o male) della batteria del-
l’iPhone. Swotti non si limita alla
ricerca di prodotti, ma permette di
ranti, pizzerie e altri luoghi di risto-
razione e le interpreta per aiutare
l’utente nella scelta del posto dove
gliata del viaggio. Tripit agisce come
una sorta di operatore automatico: il
sistema aggrega automaticamente le
Una delle prime metodologie sema-
tiche ad aver raggiunto il grande
R df è certamente il miglior linguaggio per
strutturare semanticamente i dati pubbli-
cati on-line, ma ha il difetto di essere poco
aggregate in contenuti o tag rile- trovare opinioni anche su film, città mangiare. La ricerca è molto sempli- indicazioni del viaggio ricevute dal- pubblico è stata quella dei tag. Indi- comprensibile da un pubblico di non esperti.
vanti e poi presentate in una forma da visitare, personalità dello spet- ce: basta inserire il tipo di ristorante l’utente con le informazioni sul tempo cando per ogni elemento – una pa- Esistono tuttavia altri sistemi per aggiungere
grafica di facile comprensione. tacolo, adattando i concetti rilevan- o il tipo di cucina che interessa (piz- che troverà, sui luoghi che potrebbe gina creata, una foto scattata o un un minimo livello di significati ai contenuti on-
Se, ad esempio, cerchiamo sul sito ti per ognuna di queste categorie: zeria, ristorante italiano, sushi e così visitare, gli eventi del periodo e così link condiviso – un’etichetta in gra- line. I cosiddetti microformati (http://microfor-
la voce iPhone, la pagina del risul- sceneggiatura per i film, qualità via) e il luogo in cui si intende man- via. Vengono mostrate anche mappe do di aggiungervi significati o cate- mats.org) sono piccole porzioni di codice che
tato mostrerà oltre alle specifiche del cibo per i viaggi, simpatia per giare per ricevere una lista di risto- dettagliate della zona del viaggio e gorie, si contribuisce a creare una etichettano una frase, una parola, un numero in
tecniche del dispositivo anche le le persone e così via. Attualmente ranti ordinata in base ai commenti fotografie, tutti contenuti ricavati au- rete personale di significati. Chiun- una pagina Web e rendono comprensibile il si-
sue principali funzionalità, accom- il motore è disponibile solo in in- positivi ricevuti mostrati in percen- tomaticamente da altri siti Web: Wiki- que abbia usato i tag, sul Web o in gnificato del contenuto anche a software o altri
pagnate dalla valutazione che ha glese o spagnolo, ma nel corso del- tuale sotto la voce Rah’d (nella ter- pedia per le informazioni turistiche, altri ambiti, tuttavia, sa bene come strumenti automatici. Poiché vengono inclusi
ricevuto nei contenuti monitorati l’anno dovrebbe essere aggiunto il minologia del servizio Boo indica i Eventful per gli eventi, Flickr per le sia difficile conservare la coerenza direttamente in comuni pagine Web scritte in
da Swotti: per lo smartphone di Ap- supporto di altre lingue. Purtroppo giudizi negativi, mentre Rah quelli foto e così via. Come tutti i servizi visti delle definizioni nel tempo. Html, sono molto semplici da assimilare e uti-
ple al momento sono positive le va- si sa ben poco della tecnologia se- positivi). A differenza di Swotti, il si- sinora, anche Tripit esegue un’analisi Faviki (www.faviki.com) è un’appli- lizzare. Esistono microformati per indicare i da-
lutazioni sulla qualità del suono e mantica che utilizza e su dove e co- stema estrae un set minore di dati: semantica su un set di dati (le e-mail cazione che cerca di risolvere questo ti di una persona (numero di telefono, indiriz-
sull’usabilità e sul design, negative me raccoglie le informazioni. per ogni ristorante vengono fornite di conferma ricevute dai servizi di problema introducendo nel campo zo, e-mail ecc.), le date di un evento, gli argo-
quelle sul peso, sulla qualità di ri- menti di un articoli, le amicizie in un social
cezione e sulla funzionalità della network e così via. Promossi da una comunità
videocamera e della tastiera. In di sviluppatori indipendenti, sono adottati da
fondo alla pagina sono inoltre indi- molti siti del network di Yahoo!, da Google Ma-
cati i link alle pagine analizzate e ps, da Twitter, da Facebook, da Linkedin e da
gli estratti dei contenuti, con evi- decine di altri servizi e applicazioni Web. In
denziate tutte le parole che hanno questo articolo abbiamo indicato un’estensio-
contribuito alla strutturazione del- ne per Firefox che permette ai browser di leg-
l’indice: rosse se negative e verdi gere i microformati. In seno al progetto Web
semantico del W3C esiste anche un altro lin-



Swotti per ora è disponibile
solo in inglese e spagnolo,
ma entro l’anno supporterà
guaggio che fa più o meno la stessa cosa dei
microformati, ovvero include in normali pagine
Web annotazioni semantiche. Si chiama Rdfa
(www.w3.org/TR/xhtml-Rdfa-primer) ed è ba-
sato su Rdf: utilizza triplette per definire le rela-
zioni fra elementi e può adattarsi a molti domi-
ni di conoscenza ed entità utilizzando diversi
vocabolari. Sia i microformati, sia Rdfa posso-
anche altre lingue. no essere facilmente trasformati in Rdf attra-
verso l’uso di un altro linguaggio sviluppato dal
Tripit Faviki W3C chiamato Grddl.

106 107
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

le opinioni raccolte sul prenotazione) ed estrae dei bookmark condivisi il semantic


servizio, sul cibo e sul- Xnf le informazioni più rile- tagging o, in italiano, il sistema di
l’ambiente oltre che Xfn (Xhtml Friends Net- vanti per costruire l’iti- etichettatura semantico. Il servizio
dati logistici e l’elenco work) è un microformato nerario: le date del volo, consente di salvare i link a pagine
delle recensioni dei siti che consente di rappre- le date di permanenza, i Web e di catalogarli usando un set di
esterni. Il servizio al sentare relazioni fra per- luoghi in cui ci si sposta tag predefiniti estrapolati dai con-
momento è attivo solo sone attraverso link inclu- e così via. Tecnologie cetti presenti in Wikipedia. I tag
per una manciata di si in pagine Html. Con Xfn semantiche sono inoltre vengono suggeriti automaticamente
città degli Stati Uniti. è possibile, ad esempio, utilizzate anche nei in base all’analisi della pagina o ag-
inserire nella propria pa- contenuti presenti sul giunti a mano dall’utente, ma in en-
Tripit (w
www.tripit.com) gina Web un collegamen- sito: i viaggi e le pagine trambi i casi devono essere presenti
è un servizio on-line che to alla pagina di un colle- personali degli utenti come pagine di Wikipedia. I link sal-
aiuta le persone ad or- ga, di un conoscente o di sono presentati utiliz- vati possono poi essere ricercati per
ganizzare i propri viag- un amico specificando il zando i microformati parole chiave o esplorati navigando
tipo di relazione con un
gi. Il funzionamento è per le date dei viaggi, tra le categorie ( topic ), anch’esse
semplice attributo
Swotti Boorah semplice: si prenota un
(l’attributo rel).
per i luoghi e per le per- speculari a quelle di Wikipedia. Il ri-
viaggio o un pacchetto sone aggiunte all’itine- sultato è un catalogo ordinato e coe-
completo presso uno o rario mentre la pagina rente di link che favorisce la ricerca
tore di ricerca che cataloga decine se positive. I link possono essere Boorah (www.boorah.com) è un’ap- più degli oltre 350 siti supportati (tra personale di ogni iscritto è associata
di prodotti diversi e analizza sia le anche filtrati in base alle funziona- plicazione simile a Swotti ma dedi- cui Expedia, Lastminute e con dati Xfn usati per rappresentare
recensioni comparse su siti specia- lità: facendo clic ad esempio sulla cata all’analisi delle recensioni di ri- Venere.com) e si inviano tutti i mes- relazioni all’interno della Rete.
lizzati, sia le opinioni che su questi voce Battery presentata nel piccolo storanti. Il servizio analizza le opi- saggi di conferma ricevuti all’indiriz-
prodotti hanno espresso i navigatori box riassuntivo verranno mostrati nioni espresse da comuni navigatori zo plans@tripit.com; in risposta si rice- Gestione Microformati e Rdfa
attraverso siti, blog o commenti. Le solamente i contenuti che parlano o da recensori professionisti su risto- ve indietro una pianificazione detta- della conoscenza
fonti del motore sono filtrate per
escludere quelle meno significative,
sono analizzate semanticamente,
(bene o male) della batteria del-
l’iPhone. Swotti non si limita alla
ricerca di prodotti, ma permette di
ranti, pizzerie e altri luoghi di risto-
razione e le interpreta per aiutare
l’utente nella scelta del posto dove
gliata del viaggio. Tripit agisce come
una sorta di operatore automatico: il
sistema aggrega automaticamente le
Una delle prime metodologie sema-
tiche ad aver raggiunto il grande
R df è certamente il miglior linguaggio per
strutturare semanticamente i dati pubbli-
cati on-line, ma ha il difetto di essere poco
aggregate in contenuti o tag rile- trovare opinioni anche su film, città mangiare. La ricerca è molto sempli- indicazioni del viaggio ricevute dal- pubblico è stata quella dei tag. Indi- comprensibile da un pubblico di non esperti.
vanti e poi presentate in una forma da visitare, personalità dello spet- ce: basta inserire il tipo di ristorante l’utente con le informazioni sul tempo cando per ogni elemento – una pa- Esistono tuttavia altri sistemi per aggiungere
grafica di facile comprensione. tacolo, adattando i concetti rilevan- o il tipo di cucina che interessa (piz- che troverà, sui luoghi che potrebbe gina creata, una foto scattata o un un minimo livello di significati ai contenuti on-
Se, ad esempio, cerchiamo sul sito ti per ognuna di queste categorie: zeria, ristorante italiano, sushi e così visitare, gli eventi del periodo e così link condiviso – un’etichetta in gra- line. I cosiddetti microformati (http://microfor-
la voce iPhone, la pagina del risul- sceneggiatura per i film, qualità via) e il luogo in cui si intende man- via. Vengono mostrate anche mappe do di aggiungervi significati o cate- mats.org) sono piccole porzioni di codice che
tato mostrerà oltre alle specifiche del cibo per i viaggi, simpatia per giare per ricevere una lista di risto- dettagliate della zona del viaggio e gorie, si contribuisce a creare una etichettano una frase, una parola, un numero in
tecniche del dispositivo anche le le persone e così via. Attualmente ranti ordinata in base ai commenti fotografie, tutti contenuti ricavati au- rete personale di significati. Chiun- una pagina Web e rendono comprensibile il si-
sue principali funzionalità, accom- il motore è disponibile solo in in- positivi ricevuti mostrati in percen- tomaticamente da altri siti Web: Wiki- que abbia usato i tag, sul Web o in gnificato del contenuto anche a software o altri
pagnate dalla valutazione che ha glese o spagnolo, ma nel corso del- tuale sotto la voce Rah’d (nella ter- pedia per le informazioni turistiche, altri ambiti, tuttavia, sa bene come strumenti automatici. Poiché vengono inclusi
ricevuto nei contenuti monitorati l’anno dovrebbe essere aggiunto il minologia del servizio Boo indica i Eventful per gli eventi, Flickr per le sia difficile conservare la coerenza direttamente in comuni pagine Web scritte in
da Swotti: per lo smartphone di Ap- supporto di altre lingue. Purtroppo giudizi negativi, mentre Rah quelli foto e così via. Come tutti i servizi visti delle definizioni nel tempo. Html, sono molto semplici da assimilare e uti-
ple al momento sono positive le va- si sa ben poco della tecnologia se- positivi). A differenza di Swotti, il si- sinora, anche Tripit esegue un’analisi Faviki (www.faviki.com) è un’appli- lizzare. Esistono microformati per indicare i da-
lutazioni sulla qualità del suono e mantica che utilizza e su dove e co- stema estrae un set minore di dati: semantica su un set di dati (le e-mail cazione che cerca di risolvere questo ti di una persona (numero di telefono, indiriz-
sull’usabilità e sul design, negative me raccoglie le informazioni. per ogni ristorante vengono fornite di conferma ricevute dai servizi di problema introducendo nel campo zo, e-mail ecc.), le date di un evento, gli argo-
quelle sul peso, sulla qualità di ri- menti di un articoli, le amicizie in un social
cezione e sulla funzionalità della network e così via. Promossi da una comunità
videocamera e della tastiera. In di sviluppatori indipendenti, sono adottati da
fondo alla pagina sono inoltre indi- molti siti del network di Yahoo!, da Google Ma-
cati i link alle pagine analizzate e ps, da Twitter, da Facebook, da Linkedin e da
gli estratti dei contenuti, con evi- decine di altri servizi e applicazioni Web. In
denziate tutte le parole che hanno questo articolo abbiamo indicato un’estensio-
contribuito alla strutturazione del- ne per Firefox che permette ai browser di leg-
l’indice: rosse se negative e verdi gere i microformati. In seno al progetto Web
semantico del W3C esiste anche un altro lin-



Swotti per ora è disponibile
solo in inglese e spagnolo,
ma entro l’anno supporterà
guaggio che fa più o meno la stessa cosa dei
microformati, ovvero include in normali pagine
Web annotazioni semantiche. Si chiama Rdfa
(www.w3.org/TR/xhtml-Rdfa-primer) ed è ba-
sato su Rdf: utilizza triplette per definire le rela-
zioni fra elementi e può adattarsi a molti domi-
ni di conoscenza ed entità utilizzando diversi
vocabolari. Sia i microformati, sia Rdfa posso-
anche altre lingue. no essere facilmente trasformati in Rdf attra-
verso l’uso di un altro linguaggio sviluppato dal
Tripit Faviki W3C chiamato Grddl.

106 107
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE
WEB SEMANTICO

di nuovi contenuti. Faviki non è di- Unendo capacità di social network e


sponibile solo in inglese: grazie agli di analisi semantica dei contenuti,
strumenti di Google per la traduzio- Twine costruisce una rete di riferi-
ne, il servizio è in grado di interpre- menti e informazioni attorno agli in-
tare, anche se in modo non sempre teressi degli utenti, facilitandone l’e-
preciso, pagine Web in 11 lingue di- splorazione e suggerendo nuovi in-
verse (tra cui l’italiano). teressi possibili. Il cuore dell’appli-
cazione sono gli items (elementi):
Freebase (w w ww .free bas e.co m ), un pagine Web, video, documenti, e-
sito nato nel marzo 2007, è stato una mail, brevi note salvate dall’utente
delle prime applicazioni semantiche direttamente nell’applicazione o ag-
ad aver avuto vasta eco anche al di giunte in automatico dal browser at-
fuori del settore più propriamente traverso un pulsante (di fatto book-
tecnologico e ha avuto senza dubbio marlet) compatibile con Firefox, Ex-
il merito di diffondere presso un plorer e Safari. Quando si inserisce
pubblico di appassionati il concetto un nuovo elemento, Twine lo analiz-
di Web semantico. È una sorta di en- za semanticamente, ne estrae i si-
ciclopedia partecipata simile a Wiki- gnificati più rilevanti e vi associa
pedia ma contenente già in partenza delle categorie o tag. Si può cercare
dati strutturati semanticamente: non Freebase Twine all’interno degli elementi salvati op-
a caso i creatori di Freebase preferi- pure in quelli aggiunti dagli altri
scono parlare del proprio servizio co- utenti con metodi impossibili da im-
me di un “database aperto di infor- espositivi, ma con informazioni (ty- precostituite, come la stessa Wikipe- dall’altro i dati sono sempre coerenti relativi agli architetti e alle opere da maginare senza un’applicazione se-
mazioni”. La struttura è apparente- pes ) incluse in campi predefiniti dia, l’enciclopedia musicale Music- con la categoria cui appartengono e loro create possono essere confron- mantica: chi, ad esempio, è interes-
mente simile a quella di una enciclo- (properties): un film avrà il campo Brainz o i database pubblici della diventano così confrontabili. Le tati e visualizzati su una mappa di sato ai dati finanziari di un’azienda
pedia: le informazioni sono ordinate per la sceneggiatura, una persona CIA. L’uso di dati strutturati ha due informazioni così strutturate possono Google Maps. non deve fare altro che selezionare
per voci (topic) e ogni voce può far avrà il campo per la data di nascita e diverse implicazioni: da un lato essere usate in altre applicazioni: al- la categoria finance e poi il nome
parte di categorie più ampie chiama- così via. I dati provengono sia da ar- Freebase è un servizio che mostra la pagina Web http://dev.mqlx.com Twine (w
www.twine.com) è probabil- dell’azienda. È possibile filtrare le ri-
ti bases e commons. Una voce non ticoli aggiunti liberamente dai navi- dati e fatti più che articoli espositivi /~zak/arch/ è possibile visualizzare mente la più diffusa applicazione cerche in base ad tipi specifici di ele-
viene però riempita con paragrafi gatori sia da alcune basi dati già come una tradizionale enciclopedia; un esempio creativo di come i dati basata su tecnologie semantiche. menti oppure selezionare quelli che

PASSO PER PASSO

Cogito: un software semantico all’opera

P er software se-
mantico (o an-
che motore semanti-
dua le tre frasi più
importanti del te-
sto, estrae (figura
co) si intende comu- 3) le entità più rile-
nemente un softwa- vanti (personaggi,
re, o una serie di città, luoghi, azien-
software tra loro col- de, date, indirizzi)
legati, che analizza e costruisce fra di
testi digitali e ne esse una rete di ri-
estrapola concetti e ferimenti utilizzan-
relazioni rilevanti. Si do delle azioni co-
tratta, in altre parole, me collegamento:
di un programma in un testo biogra-
che capisce i signifi-
cati di un testo e li 1 2 3 4 fico, ad esempio, la
relazione potrebbe
mette a disposizione essere Francesco
di altre applicazioni. Uno dei migliori software semantici si chiama Co- compie Cogito quando riceve un testo da analizzare è l’analisi gramma- (un’ontologia) chiamata Sensigrafo e composta da più di un milione di nato 27 settembre 1973 oppure Francesco nato Pescara. Tutte le rela-
gito ed è sviluppato modenese Expert System, l’azienda che ha svilup- ticale, logica e lessicale del testo (figura 1). Questa analisi consente nodi in quattro lingue (italiano, inglese, arabo e tedesco), il motore di- zioni individuate possono essere visualizzate in un grafo in cui ai nodi
pato anni fa il correttore ortografico italiano incluso nelle edizioni di Mi- non solo di individuare il significato di singole parole o di sintagmi spe- sambigua le parole che hanno più di un significato (figura 2): per la pa- corrispondono le entità e agli archi le azioni (figura 4). Un testo così
crosoft Office. Il motore di Expert System, utilizzato come white label – cifici, come ad esempio area euro a indicare l’area economica che adot- rola persona, ad esempio, il motore di Cogito registra nove significati strutturato, in cui ogni entità è messa in relazione ad un’altra in base a
ossia come prodotto non ufficialmente attribuibile all’azienda che lo ha ta la moneta unica, ma organizza il testo in unità minime di significato differenti e, in base al contesto della frase, seleziona quello più perti- dei significati, è un testo compreso completamente da una macchina:
sviluppato – in servizi Web, telefonini e altre applicazioni, è quello che sotto forma di triplette “soggetto verbo complemento oggetto” e indivi- nente. Sensigrafo è una rete semantica che, inizialmente costruita a se attraverso un’interfaccia di ricerca chiedessi “quando è nato France-
gestisce il processo di analisi di Twine, una delle più promettenti appli- dua gli argomenti principali del testo sotto forma di temi (economia, mano, può oggi apprendere automaticamente nuovi concetti per espan- sco?” il sistema mi darebbe subito un’unica risposta “il 27 settembre
cazioni Web a far uso di tecnologie semantiche. Il primo passo che statistica, lavoro). Durante l’analisi, attraverso una rete semantica dere i domini di conoscenza. In un passaggio successivo Cogito indivi- 1973 a Pescara”.

108 109
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE
WEB SEMANTICO

di nuovi contenuti. Faviki non è di- Unendo capacità di social network e


sponibile solo in inglese: grazie agli di analisi semantica dei contenuti,
strumenti di Google per la traduzio- Twine costruisce una rete di riferi-
ne, il servizio è in grado di interpre- menti e informazioni attorno agli in-
tare, anche se in modo non sempre teressi degli utenti, facilitandone l’e-
preciso, pagine Web in 11 lingue di- splorazione e suggerendo nuovi in-
verse (tra cui l’italiano). teressi possibili. Il cuore dell’appli-
cazione sono gli items (elementi):
Freebase (w w ww .free bas e.co m ), un pagine Web, video, documenti, e-
sito nato nel marzo 2007, è stato una mail, brevi note salvate dall’utente
delle prime applicazioni semantiche direttamente nell’applicazione o ag-
ad aver avuto vasta eco anche al di giunte in automatico dal browser at-
fuori del settore più propriamente traverso un pulsante (di fatto book-
tecnologico e ha avuto senza dubbio marlet) compatibile con Firefox, Ex-
il merito di diffondere presso un plorer e Safari. Quando si inserisce
pubblico di appassionati il concetto un nuovo elemento, Twine lo analiz-
di Web semantico. È una sorta di en- za semanticamente, ne estrae i si-
ciclopedia partecipata simile a Wiki- gnificati più rilevanti e vi associa
pedia ma contenente già in partenza delle categorie o tag. Si può cercare
dati strutturati semanticamente: non Freebase Twine all’interno degli elementi salvati op-
a caso i creatori di Freebase preferi- pure in quelli aggiunti dagli altri
scono parlare del proprio servizio co- utenti con metodi impossibili da im-
me di un “database aperto di infor- espositivi, ma con informazioni (ty- precostituite, come la stessa Wikipe- dall’altro i dati sono sempre coerenti relativi agli architetti e alle opere da maginare senza un’applicazione se-
mazioni”. La struttura è apparente- pes ) incluse in campi predefiniti dia, l’enciclopedia musicale Music- con la categoria cui appartengono e loro create possono essere confron- mantica: chi, ad esempio, è interes-
mente simile a quella di una enciclo- (properties): un film avrà il campo Brainz o i database pubblici della diventano così confrontabili. Le tati e visualizzati su una mappa di sato ai dati finanziari di un’azienda
pedia: le informazioni sono ordinate per la sceneggiatura, una persona CIA. L’uso di dati strutturati ha due informazioni così strutturate possono Google Maps. non deve fare altro che selezionare
per voci (topic) e ogni voce può far avrà il campo per la data di nascita e diverse implicazioni: da un lato essere usate in altre applicazioni: al- la categoria finance e poi il nome
parte di categorie più ampie chiama- così via. I dati provengono sia da ar- Freebase è un servizio che mostra la pagina Web http://dev.mqlx.com Twine (w
www.twine.com) è probabil- dell’azienda. È possibile filtrare le ri-
ti bases e commons. Una voce non ticoli aggiunti liberamente dai navi- dati e fatti più che articoli espositivi /~zak/arch/ è possibile visualizzare mente la più diffusa applicazione cerche in base ad tipi specifici di ele-
viene però riempita con paragrafi gatori sia da alcune basi dati già come una tradizionale enciclopedia; un esempio creativo di come i dati basata su tecnologie semantiche. menti oppure selezionare quelli che

PASSO PER PASSO

Cogito: un software semantico all’opera

P er software se-
mantico (o an-
che motore semanti-
dua le tre frasi più
importanti del te-
sto, estrae (figura
co) si intende comu- 3) le entità più rile-
nemente un softwa- vanti (personaggi,
re, o una serie di città, luoghi, azien-
software tra loro col- de, date, indirizzi)
legati, che analizza e costruisce fra di
testi digitali e ne esse una rete di ri-
estrapola concetti e ferimenti utilizzan-
relazioni rilevanti. Si do delle azioni co-
tratta, in altre parole, me collegamento:
di un programma in un testo biogra-
che capisce i signifi-
cati di un testo e li 1 2 3 4 fico, ad esempio, la
relazione potrebbe
mette a disposizione essere Francesco
di altre applicazioni. Uno dei migliori software semantici si chiama Co- compie Cogito quando riceve un testo da analizzare è l’analisi gramma- (un’ontologia) chiamata Sensigrafo e composta da più di un milione di nato 27 settembre 1973 oppure Francesco nato Pescara. Tutte le rela-
gito ed è sviluppato modenese Expert System, l’azienda che ha svilup- ticale, logica e lessicale del testo (figura 1). Questa analisi consente nodi in quattro lingue (italiano, inglese, arabo e tedesco), il motore di- zioni individuate possono essere visualizzate in un grafo in cui ai nodi
pato anni fa il correttore ortografico italiano incluso nelle edizioni di Mi- non solo di individuare il significato di singole parole o di sintagmi spe- sambigua le parole che hanno più di un significato (figura 2): per la pa- corrispondono le entità e agli archi le azioni (figura 4). Un testo così
crosoft Office. Il motore di Expert System, utilizzato come white label – cifici, come ad esempio area euro a indicare l’area economica che adot- rola persona, ad esempio, il motore di Cogito registra nove significati strutturato, in cui ogni entità è messa in relazione ad un’altra in base a
ossia come prodotto non ufficialmente attribuibile all’azienda che lo ha ta la moneta unica, ma organizza il testo in unità minime di significato differenti e, in base al contesto della frase, seleziona quello più perti- dei significati, è un testo compreso completamente da una macchina:
sviluppato – in servizi Web, telefonini e altre applicazioni, è quello che sotto forma di triplette “soggetto verbo complemento oggetto” e indivi- nente. Sensigrafo è una rete semantica che, inizialmente costruita a se attraverso un’interfaccia di ricerca chiedessi “quando è nato France-
gestisce il processo di analisi di Twine, una delle più promettenti appli- dua gli argomenti principali del testo sotto forma di temi (economia, mano, può oggi apprendere automaticamente nuovi concetti per espan- sco?” il sistema mi darebbe subito un’unica risposta “il 27 settembre
cazioni Web a far uso di tecnologie semantiche. Il primo passo che statistica, lavoro). Durante l’analisi, attraverso una rete semantica dere i domini di conoscenza. In un passaggio successivo Cogito indivi- 1973 a Pescara”.

108 109
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE
WEB SEMANTICO

riguardano una determinata persona Motori di ricerca proprio perché basati su significati, i re dalla base dati delle categorie: se
o un determinato posto. Ci sono infi- motori di ricerca semantici offrono i cerchiamo chi ha scalato l’Everest
ne altri due elementi che rendono Le applicazioni semantiche, per la migliori risultati quando sono inter- (who climbed mount Everest?) pos-
Twine un’applicazione più “intelli- loro stessa natura, sono utilizzate in rogati attraverso un linguaggio co- siamo ad esempio filtrare i nomi in
gente” delle altre. In primo luogo il applicazioni che organizzano e per- mune: per avere informazioni sulle base al genere (maschio/femmina),
sistema di raccomandazione: gli ele- mettono la ricerca di informazioni. Il farmacie di Roma ci si deve aspetta- alla nazionalità o in base ad altre ca-
menti che aggiungiamo contribui- campo più indicato per la loro appli- re interrogazioni del tipo dove sono tegorie rilevanti. I risultati non sem-
scono a costruire un nostro profilo di cazione dovrebbe essere dunque le farmacie a Roma? oppure quali pre sono all’altezza delle aspettative:
interessi che, confrontato con quelli quello della ricerca globale delle pa- sono le farmacie di turno a Roma il per fare un esempio, tra gli scalatori
aggiunti da altri utenti, viene usato gine pubblicate sul Web – alla Goo- mercoledì? e non, come siamo abi- dell’Everest abbiamo trovato nelle
dall’applicazione per suggerire per- gle – mentre le applicazioni che for- tuati a fare oggi, farmacie Roma. Ciò prime posizioni Oscar Pistorius, che
sone con cui entrare in contatto o niscono le funzioni più utili sono comporta problemi difficilmente ag- è un corridore e non uno scalatore, e
nuove informazioni da leggere. È un quelle che eseguono ricerche in pic- girabili quando la sfera dei concetti a volte basta cambiare un termine
po’ come il suggerimento di nuove cole nicchie di settore (come Uptake è virtualmente illimitata. con un sinonimo per ricevere infor-
amicizie in Facebook, ma in questo o Boorah) o su basi semantiche già Ciò non implica che non esistano mazioni non rilevanti.
caso le relazioni sono guidate dalle costituite (Freebase e Twine). Nella motori di ricerca semantici: un rap-
informazioni che condividiamo e ricerca tradizionale non c’è nulla presentante della categoria è ad Un altro noto motore di ricerca se-
non dalle vicinanze sociali. In secon- che possa essere paragonato, per ca- esempio, Powerset (www.powerset. mantico è Hakia (www.hakia.com).
do luogo, ogni elemento aggiunto a pacità e precisione, al motore di com) , un servizio acquisito da Mi Anch’esso comprende frasi scritte
Twine viene salvato all’interno del- Mountain View. È un problema di crosoft lo scorso anno. Questo moto- Powerset in linguaggio naturale ma, a diffe-
l’applicazione secondo gli standard tecnologia e di potenza di calcolo: le re dal maggio 2008 permette di in- renza di Powerset, costruisce la sua
del Web semantico: ogni pagina analisi semantiche di documenti o terrogare l’archivio inglese di Wiki- base di dati su una porzione molto
pubblicata viene formattata secondo pagine Web non strutturate richie- pedia attraverso frasi espresse in lin- esatta della montagna nepalese. I ri- espresse nella forma di tripletta sog- più vasta del Web sia indicizzando
le specifiche Rdf per poter essere co- dono una enorme potenza computa- guaggio naturale: per cercare, ad sultati provengono anche dall’archi- getto/predicato/oggetto che abbia- le pagine con un proprio software
sì utilizzata all’interno delle applica- zionale e funzionano meglio se tara- esempio, quanto è alto l’Everest ba- vio di Freebase e possono essere or- mo già analizzato nell’introduzione sia integrando, anche se filtrato,
zioni capaci di farne uso, come mo- te su informazioni appartenenti allo sta scrivere how high is Everest?. Il ganizzati, quando la ricerca e i dati parlando del formato Rdf. Per alcu- l’indice di ricerca creato da Yahoo.
tori di ricerca o altri servizi. stesso ambito. A ciò si aggiunga che, primo risultato è proprio l’altitudine lo permettono, in quelli che il motore ne ricerche, attraverso la funzione Hakia fa due cose: da un lato co-
chiama Factz : frasi dichiarative Factz, il motore è in grado di estrar- struisce un indice del Web utiliz-

PASSO PER PASSO

Entrare nel Web semantico con Foaf


P er contribuire alla crescita del Web semantico potete pubblicare sul
Web il vostro profilo e la vostra rete sociale in formato Foaf (Friend of a
Friend). Vediamo come farlo utilizzando uno strumento chiamato FoafGen
.com/foaf/foaf-a-matic), in italiano, oppure Foaf Builder (http://
foafbuilder.qdos.com), in inglese ma con un’interfaccia più elegante. La pri-
ma cosa da fare è esportare i propri contatti in formato Vcf dal programma
in questo caso scegliete il Formato vCard. Completata l’esportazione porta-
tevi alla pagina http://toxi.co.uk/foafgen e scorretela fino a quando non tro-
vate l’elenco dei campi da compilare. Nel riquadro Contacts fate clic su Sfo-
profilo Foaf, fate clic su Select All. Potete eventualmente modificare il rap-
porto che avete con ognuno di essi agendo sul menu Relationship oppure
aggiungere per ognuno di loro dei dettagli aggiunti facendo clic sul link de-
(http://toxi.co.uk/foafgen). Abbiamo scelto questa applicazione Web perché in cui sono conservati. La procedura purtroppo è molto scomoda con Ou- glia e caricate il file in formato VCard salvato al passo precedente. Compila- tails. Al termine della modifica scorrete la pagina e, in fondo, accertatevi che
è l’unica, a quanto abbiamo potuto constatare, che permette di importare tlook, che non permette di esportarli in un unico file ma solo contatto per te poi gli altri campi, facilmente comprensibili anche da chi non mastica l’in- sia spuntata la voce encrypt all e-mail addresses per evitare di pubblicare gli
anche l’elenco dei conoscenti in formato Vcard (Vcf), creando così una rete contatto. Su Linkedin basta invece raggiungere, dopo avere eseguito il lo- glese. Se avete già un account su Delicious inseritelo nel campo del.icio.us indirizzi e-mail in formato pubblico, spuntate la voce output as Rdf/XML file
sociale a partire dai contatti di Linkedin, di Gmail o di qualunque altro servi- gin, la pagina www.linkedin.com/addressBookExport, scegliere dal campo user name e l’applicazione aggiungere come interessi i primi 10 tag del vo- per scaricare il file e fate clic su Submit: comparirà una nuova pagina con il
zio sia in grado di esportare in Vcf (Facebook purtroppo non lo permette). Export to la voce vCard e poi fare clic sul pulsante Export (figura 1). Per stro profilo (figura 2). Completata la compilazione fate clic su Continue. Se file Rdf e, dopo alcuni secondi, la finestra del browser che vi inviterà a sca-
Chi non fosse interessato ad aggiungere automaticamente al file Foaf anche esportarli da Gmail è sufficiente fare clic sul link Contatti a sinistra dell’inter- avete aggiunto un file in formato VCard, la pagina successiva sarà popolata ricarlo (figura 4). Il file andrà poi salvato nel proprio sito Web oppure invia-
i propri conoscenti può usare Foaf-a-matic (http://www.ldodds faccia e poi sul link Esporta presente a destra, sulla barra dei contatti; anche dall’elenco dei contatti in esso contenuti (figura 3). Per aggiungerli tutti al to ad un servizio che ospita profili Rdf come http://foaf.me.

1 2 3 4
110 111
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE
WEB SEMANTICO

riguardano una determinata persona Motori di ricerca proprio perché basati su significati, i re dalla base dati delle categorie: se
o un determinato posto. Ci sono infi- motori di ricerca semantici offrono i cerchiamo chi ha scalato l’Everest
ne altri due elementi che rendono Le applicazioni semantiche, per la migliori risultati quando sono inter- (who climbed mount Everest?) pos-
Twine un’applicazione più “intelli- loro stessa natura, sono utilizzate in rogati attraverso un linguaggio co- siamo ad esempio filtrare i nomi in
gente” delle altre. In primo luogo il applicazioni che organizzano e per- mune: per avere informazioni sulle base al genere (maschio/femmina),
sistema di raccomandazione: gli ele- mettono la ricerca di informazioni. Il farmacie di Roma ci si deve aspetta- alla nazionalità o in base ad altre ca-
menti che aggiungiamo contribui- campo più indicato per la loro appli- re interrogazioni del tipo dove sono tegorie rilevanti. I risultati non sem-
scono a costruire un nostro profilo di cazione dovrebbe essere dunque le farmacie a Roma? oppure quali pre sono all’altezza delle aspettative:
interessi che, confrontato con quelli quello della ricerca globale delle pa- sono le farmacie di turno a Roma il per fare un esempio, tra gli scalatori
aggiunti da altri utenti, viene usato gine pubblicate sul Web – alla Goo- mercoledì? e non, come siamo abi- dell’Everest abbiamo trovato nelle
dall’applicazione per suggerire per- gle – mentre le applicazioni che for- tuati a fare oggi, farmacie Roma. Ciò prime posizioni Oscar Pistorius, che
sone con cui entrare in contatto o niscono le funzioni più utili sono comporta problemi difficilmente ag- è un corridore e non uno scalatore, e
nuove informazioni da leggere. È un quelle che eseguono ricerche in pic- girabili quando la sfera dei concetti a volte basta cambiare un termine
po’ come il suggerimento di nuove cole nicchie di settore (come Uptake è virtualmente illimitata. con un sinonimo per ricevere infor-
amicizie in Facebook, ma in questo o Boorah) o su basi semantiche già Ciò non implica che non esistano mazioni non rilevanti.
caso le relazioni sono guidate dalle costituite (Freebase e Twine). Nella motori di ricerca semantici: un rap-
informazioni che condividiamo e ricerca tradizionale non c’è nulla presentante della categoria è ad Un altro noto motore di ricerca se-
non dalle vicinanze sociali. In secon- che possa essere paragonato, per ca- esempio, Powerset (www.powerset. mantico è Hakia (www.hakia.com).
do luogo, ogni elemento aggiunto a pacità e precisione, al motore di com) , un servizio acquisito da Mi Anch’esso comprende frasi scritte
Twine viene salvato all’interno del- Mountain View. È un problema di crosoft lo scorso anno. Questo moto- Powerset in linguaggio naturale ma, a diffe-
l’applicazione secondo gli standard tecnologia e di potenza di calcolo: le re dal maggio 2008 permette di in- renza di Powerset, costruisce la sua
del Web semantico: ogni pagina analisi semantiche di documenti o terrogare l’archivio inglese di Wiki- base di dati su una porzione molto
pubblicata viene formattata secondo pagine Web non strutturate richie- pedia attraverso frasi espresse in lin- esatta della montagna nepalese. I ri- espresse nella forma di tripletta sog- più vasta del Web sia indicizzando
le specifiche Rdf per poter essere co- dono una enorme potenza computa- guaggio naturale: per cercare, ad sultati provengono anche dall’archi- getto/predicato/oggetto che abbia- le pagine con un proprio software
sì utilizzata all’interno delle applica- zionale e funzionano meglio se tara- esempio, quanto è alto l’Everest ba- vio di Freebase e possono essere or- mo già analizzato nell’introduzione sia integrando, anche se filtrato,
zioni capaci di farne uso, come mo- te su informazioni appartenenti allo sta scrivere how high is Everest?. Il ganizzati, quando la ricerca e i dati parlando del formato Rdf. Per alcu- l’indice di ricerca creato da Yahoo.
tori di ricerca o altri servizi. stesso ambito. A ciò si aggiunga che, primo risultato è proprio l’altitudine lo permettono, in quelli che il motore ne ricerche, attraverso la funzione Hakia fa due cose: da un lato co-
chiama Factz : frasi dichiarative Factz, il motore è in grado di estrar- struisce un indice del Web utiliz-

PASSO PER PASSO

Entrare nel Web semantico con Foaf


P er contribuire alla crescita del Web semantico potete pubblicare sul
Web il vostro profilo e la vostra rete sociale in formato Foaf (Friend of a
Friend). Vediamo come farlo utilizzando uno strumento chiamato FoafGen
.com/foaf/foaf-a-matic), in italiano, oppure Foaf Builder (http://
foafbuilder.qdos.com), in inglese ma con un’interfaccia più elegante. La pri-
ma cosa da fare è esportare i propri contatti in formato Vcf dal programma
in questo caso scegliete il Formato vCard. Completata l’esportazione porta-
tevi alla pagina http://toxi.co.uk/foafgen e scorretela fino a quando non tro-
vate l’elenco dei campi da compilare. Nel riquadro Contacts fate clic su Sfo-
profilo Foaf, fate clic su Select All. Potete eventualmente modificare il rap-
porto che avete con ognuno di essi agendo sul menu Relationship oppure
aggiungere per ognuno di loro dei dettagli aggiunti facendo clic sul link de-
(http://toxi.co.uk/foafgen). Abbiamo scelto questa applicazione Web perché in cui sono conservati. La procedura purtroppo è molto scomoda con Ou- glia e caricate il file in formato VCard salvato al passo precedente. Compila- tails. Al termine della modifica scorrete la pagina e, in fondo, accertatevi che
è l’unica, a quanto abbiamo potuto constatare, che permette di importare tlook, che non permette di esportarli in un unico file ma solo contatto per te poi gli altri campi, facilmente comprensibili anche da chi non mastica l’in- sia spuntata la voce encrypt all e-mail addresses per evitare di pubblicare gli
anche l’elenco dei conoscenti in formato Vcard (Vcf), creando così una rete contatto. Su Linkedin basta invece raggiungere, dopo avere eseguito il lo- glese. Se avete già un account su Delicious inseritelo nel campo del.icio.us indirizzi e-mail in formato pubblico, spuntate la voce output as Rdf/XML file
sociale a partire dai contatti di Linkedin, di Gmail o di qualunque altro servi- gin, la pagina www.linkedin.com/addressBookExport, scegliere dal campo user name e l’applicazione aggiungere come interessi i primi 10 tag del vo- per scaricare il file e fate clic su Submit: comparirà una nuova pagina con il
zio sia in grado di esportare in Vcf (Facebook purtroppo non lo permette). Export to la voce vCard e poi fare clic sul pulsante Export (figura 1). Per stro profilo (figura 2). Completata la compilazione fate clic su Continue. Se file Rdf e, dopo alcuni secondi, la finestra del browser che vi inviterà a sca-
Chi non fosse interessato ad aggiungere automaticamente al file Foaf anche esportarli da Gmail è sufficiente fare clic sul link Contatti a sinistra dell’inter- avete aggiunto un file in formato VCard, la pagina successiva sarà popolata ricarlo (figura 4). Il file andrà poi salvato nel proprio sito Web oppure invia-
i propri conoscenti può usare Foaf-a-matic (http://www.ldodds faccia e poi sul link Esporta presente a destra, sulla barra dei contatti; anche dall’elenco dei contatti in esso contenuti (figura 3). Per aggiungerli tutti al to ad un servizio che ospita profili Rdf come http://foaf.me.

1 2 3 4
110 111
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

Hakia Evri Searchmonkey Quintura

zando una tecnologia semantica – cordi che ha stretto con il Times di refox con cui eseguire ricerche di- Arricchimento ficiale non viene chiarito né quali tec- visualizzate in formato pieno ed inse-
chiamata dall’azienda OntoSem – Londra e con il Washington Post, rettamente dalle pagine che si sta di blog e siti Web nologie vengano utilizzate né in che rite nel post con un clic scegliendone
che provvede ad estrarre, con l’aiu- due giornali che nelle loro pagine navigando e un set di interfacce di modo siano analizzati i risultati. Nel- la dimensione. Il plug-in si affida per
to di tecnologie di analisi del lin- utilizzano i suoi dati per ampliare programmazione (Api) per integra- Esistono alcuni servizi che consentono l’uso ci è sembrato che Quintura uti- la selezione dei tag alla piattaforma
guaggio e di ontologie predefinite, le ricerche degli utenti. Il servizio, re la propria tecnologia in altri ser- di includere strumenti semantici al- lizzi un vocabolario di termini per l’e- semantica Calais, di cui abbiamo par-
concetti rilevanti dalle pagine Web che non si definisce un motore di vizi o applicazioni. l’interno del proprio sito Web o del strazione delle chiavi e uno di sinoni- lato nell’introduzione a questo artico-
analizzate. Dall’altro organizza i ri- ricerca, seleziona notizie basando- proprio blog. Sono servizi gratuiti che mi per l’espansione dei termini di ri- lo, e per funzionare ha bisogno di una
sultati attraverso un algoritmo si sulla correlazione tra concetti ri- Searchmonkey, infine, è un servizio aggiungono automaticamente tag o cerca: nessuna ontologia e nessuna chiave di attivazione che si riceve re-
(chiamato SemanticRank) che non levanti scelti dall’utente. Se si cer- che permette di aggiungere uno stra- link correlati a ciò che si sta scrivendo,analisi del linguaggio naturale. gistrandosi all’indirizzo http://openca-
si basa sul numero di keyword o sul ca, ad esempio, Apple, Evri mostra to semantico alle ricerche di Yahoo suggeriscono immagini da includere lais.com/user/register. Poiché Calais
numero dei link ma sulla pertinen- in un menu i termini iPhone, iPod, ampliando le informazioni che com- nel contenuto o forniscono al sito un Tagaroo (http://tagaroo.opencalais. costruisce la sua base dati su siti in in-
za tra i concetti espressi dalle chia- le categorie Software, Computer; le paiono nelle pagine dei risultati. I servizio di ricerca supplementare. com) è un servizio che suggerisce tag glese, Tagaroo è molto efficace per
vi di ricerca e quelli rilevati nelle attività releasing (‘rende pubbli- link che il motore restituisce quando Principalmente indirizzati a contenuti “intelligenti” e immagini al momento post scritti in questa lingua, molto me-
pagine scansionate. co’), adding (‘aggiunge’) e così via. si esegue una ricerca mostrano, di so- scritti in inglese, possono risultare uti- della scrittura di un post per un blog. no per quelli scritti italiano.
Maggiore importanza è data ai co- Se volessimo avere le informazioni lito, solamente il titolo della pagina, li anche per siti in altre lingue, com- Viene distribuito sotto forma di plug-
siddetti “siti credibili”, selezionati a più rilevanti sul rilascio del nuovo un suo breve estratto e il link corri- preso l’italiano. Disponibile anche in per la nota piattaforma di blogging Anche Zemanta (www.zemanta.com)
mano oppure in base al numero di sistema operativo per iPhone ba- spondente. Con Searchmonkey, inve- nella nostra lingua è, ad esempio, Wordpress e, dopo aver analizzato il si affida a strumenti semantici e di
citazioni ricevute da fonti accademi- sterebbe fare clic su releasing e poi ce, i risultati vengono arricchiti da Quintura (http://affiliates.quintura testo scritto, mostra in un piccolo box analisi del linguaggio naturale per
che e alle informazioni più recenti. su iPhone OS per veder comparire, informazioni più specifiche: i risultati .com), un motore di ricerca che estrae laterale una serie di tag compatibili suggerire tag, immagini e link a pagi-
Rispetto a Powerset, Hakia sembra con buona precisione, gli articoli, i dei profili di Facebook mostrano i le parole chiave più rilevanti trovate con il contenuto da creare. I tag pos- ne simili a quelle che si sta pubblican-
eseguire una maggiore analisi se- video e le foto più rilevanti riguar- link per aggiungere la persona ai all’interno del sito e le offre come sono essere aggiunti, eliminati da fu- do sul proprio blog. Questo servizio
mantica del linguaggio, ma anche in do al fatto che Apple che rilascia la propri amici o per inviargli diretta- chiavi di ricerca in una tag cloud di- turi suggerimenti oppure selezionati (disponibile come plug-in per i mag-
questo caso il grado di pertinenza terza versione dell’iPhone OS. Le mente un messaggio; i risultati di namica gestita da un widget in Flash per mostrare immagini a tema pre- giori servizi di blog, come estensione
dei risultati è molto variabile: eleva- informazioni provengono da quoti- Youtube il numero di visualizzazioni o Javascript. Le chiavi logicamente senti su Flickr. Le immagini, di cui per Firefox ed Explorer e come Book-
to in campi di conoscenze più strut- diani, blog e altri siti di notizie di un video e il numero dei commen- affini sono visualizzate vicine tra loro viene mostrata in una piccola antepri- marklet per Safari e Chrome) funzio-
turati, come le scienze mediche, mentre il Profilo, ossia il box infor- ti; i risultati di Amazon il prezzo del mentre quelle più rilevanti sono mo- ma anche la licenza, possono essere na anche con le e-mail di Gmail e di
molto modesto in altri. mativo che raccoglie i dati princi- libro e così via. Ciò si ottiene indican- strate con un carattere Yahoo ed è in grado di
pali dell’argomento cercato, è do a Yahoo, attraverso un’applicazio- di maggiori dimensioni. integrarsi con Face-
Tra le aziende impegnate nel setto- estratto da Wikipedia. Evri offre ne web gratuita disponibile sul sito Passando il mouse sulle book e Twitter per l’ag-
re della ricerca semantica E v r i gratuitamente un widget per inclu- http://developer.yahoo.com/search chiavi, vengono selezio- giunta di informazioni
(www.evri.com) occupa un posto dere la propria tecnologia in blog o monkey, i dati rilevanti delle pagine nati, sotto forma di clas- e link alle pagine del
speciale, non fosse altro per gli ac- altri siti Web, una Toolbar per Fi- che si desidera arricchire e specifi- sici link, i risultati più ri- proprio social network.
cando il layout che dovranno avere i levanti per la chiave se- È un servizio ben fatto,
link. Le applicazioni di questo tipo lezionata e mostrati tag che lavora molto bene
TIPS possono essere create e pubblicate da collegati per espandere con i blog supportati (lo
chiunque alla pagina http://gallery o migliorare la ricerca. abbiamo provato con
Un motore di ricerca per il Web semantico .search.yahoo.com. Per la creazione
dei metadati, ossia dei dati che iden-
L’effetto è certamente
piacevole, ma i risultati
Wordpress) ed è utile
anche per chi cerca

L a base di dati del search engine Sindice (http://sindice.com) è formata da siti Web che pub-
blicano dati in formato Rdf o utilizzando microformati. L’interfaccia offre tre diversi tipi di ri-
cerca: attraverso parole chiave o indirizzi Web, attraverso la ricerca della coppia proprietà/valore
tificano le informazioni specifiche di
ogni pagina Web, Searchmonkey uti-
lizza alcuni standard del Web seman-
non sempre pertinenti.
Inoltre non è chiaro di
quale natura sia il livel-
ispirazione o fonti per il
testo da scrivere in
quanto ogni link offerto
così come specificato nella tripletta Rdf, o attraverso query complesse. I risultati forniti sono sia tico tra cui Rdf, Rdfa, e altre tecnolo- lo semantico applicato a completamento del
link a pagine Web sia box strutturati in forma di dati. gie come i microformati. alle ricerche: sul sito uf- Tagaroo proprio articolo, estrat-

112 114
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

Hakia Evri Searchmonkey Quintura

zando una tecnologia semantica – cordi che ha stretto con il Times di refox con cui eseguire ricerche di- Arricchimento ficiale non viene chiarito né quali tec- visualizzate in formato pieno ed inse-
chiamata dall’azienda OntoSem – Londra e con il Washington Post, rettamente dalle pagine che si sta di blog e siti Web nologie vengano utilizzate né in che rite nel post con un clic scegliendone
che provvede ad estrarre, con l’aiu- due giornali che nelle loro pagine navigando e un set di interfacce di modo siano analizzati i risultati. Nel- la dimensione. Il plug-in si affida per
to di tecnologie di analisi del lin- utilizzano i suoi dati per ampliare programmazione (Api) per integra- Esistono alcuni servizi che consentono l’uso ci è sembrato che Quintura uti- la selezione dei tag alla piattaforma
guaggio e di ontologie predefinite, le ricerche degli utenti. Il servizio, re la propria tecnologia in altri ser- di includere strumenti semantici al- lizzi un vocabolario di termini per l’e- semantica Calais, di cui abbiamo par-
concetti rilevanti dalle pagine Web che non si definisce un motore di vizi o applicazioni. l’interno del proprio sito Web o del strazione delle chiavi e uno di sinoni- lato nell’introduzione a questo artico-
analizzate. Dall’altro organizza i ri- ricerca, seleziona notizie basando- proprio blog. Sono servizi gratuiti che mi per l’espansione dei termini di ri- lo, e per funzionare ha bisogno di una
sultati attraverso un algoritmo si sulla correlazione tra concetti ri- Searchmonkey, infine, è un servizio aggiungono automaticamente tag o cerca: nessuna ontologia e nessuna chiave di attivazione che si riceve re-
(chiamato SemanticRank) che non levanti scelti dall’utente. Se si cer- che permette di aggiungere uno stra- link correlati a ciò che si sta scrivendo,analisi del linguaggio naturale. gistrandosi all’indirizzo http://openca-
si basa sul numero di keyword o sul ca, ad esempio, Apple, Evri mostra to semantico alle ricerche di Yahoo suggeriscono immagini da includere lais.com/user/register. Poiché Calais
numero dei link ma sulla pertinen- in un menu i termini iPhone, iPod, ampliando le informazioni che com- nel contenuto o forniscono al sito un Tagaroo (http://tagaroo.opencalais. costruisce la sua base dati su siti in in-
za tra i concetti espressi dalle chia- le categorie Software, Computer; le paiono nelle pagine dei risultati. I servizio di ricerca supplementare. com) è un servizio che suggerisce tag glese, Tagaroo è molto efficace per
vi di ricerca e quelli rilevati nelle attività releasing (‘rende pubbli- link che il motore restituisce quando Principalmente indirizzati a contenuti “intelligenti” e immagini al momento post scritti in questa lingua, molto me-
pagine scansionate. co’), adding (‘aggiunge’) e così via. si esegue una ricerca mostrano, di so- scritti in inglese, possono risultare uti- della scrittura di un post per un blog. no per quelli scritti italiano.
Maggiore importanza è data ai co- Se volessimo avere le informazioni lito, solamente il titolo della pagina, li anche per siti in altre lingue, com- Viene distribuito sotto forma di plug-
siddetti “siti credibili”, selezionati a più rilevanti sul rilascio del nuovo un suo breve estratto e il link corri- preso l’italiano. Disponibile anche in per la nota piattaforma di blogging Anche Zemanta (www.zemanta.com)
mano oppure in base al numero di sistema operativo per iPhone ba- spondente. Con Searchmonkey, inve- nella nostra lingua è, ad esempio, Wordpress e, dopo aver analizzato il si affida a strumenti semantici e di
citazioni ricevute da fonti accademi- sterebbe fare clic su releasing e poi ce, i risultati vengono arricchiti da Quintura (http://affiliates.quintura testo scritto, mostra in un piccolo box analisi del linguaggio naturale per
che e alle informazioni più recenti. su iPhone OS per veder comparire, informazioni più specifiche: i risultati .com), un motore di ricerca che estrae laterale una serie di tag compatibili suggerire tag, immagini e link a pagi-
Rispetto a Powerset, Hakia sembra con buona precisione, gli articoli, i dei profili di Facebook mostrano i le parole chiave più rilevanti trovate con il contenuto da creare. I tag pos- ne simili a quelle che si sta pubblican-
eseguire una maggiore analisi se- video e le foto più rilevanti riguar- link per aggiungere la persona ai all’interno del sito e le offre come sono essere aggiunti, eliminati da fu- do sul proprio blog. Questo servizio
mantica del linguaggio, ma anche in do al fatto che Apple che rilascia la propri amici o per inviargli diretta- chiavi di ricerca in una tag cloud di- turi suggerimenti oppure selezionati (disponibile come plug-in per i mag-
questo caso il grado di pertinenza terza versione dell’iPhone OS. Le mente un messaggio; i risultati di namica gestita da un widget in Flash per mostrare immagini a tema pre- giori servizi di blog, come estensione
dei risultati è molto variabile: eleva- informazioni provengono da quoti- Youtube il numero di visualizzazioni o Javascript. Le chiavi logicamente senti su Flickr. Le immagini, di cui per Firefox ed Explorer e come Book-
to in campi di conoscenze più strut- diani, blog e altri siti di notizie di un video e il numero dei commen- affini sono visualizzate vicine tra loro viene mostrata in una piccola antepri- marklet per Safari e Chrome) funzio-
turati, come le scienze mediche, mentre il Profilo, ossia il box infor- ti; i risultati di Amazon il prezzo del mentre quelle più rilevanti sono mo- ma anche la licenza, possono essere na anche con le e-mail di Gmail e di
molto modesto in altri. mativo che raccoglie i dati princi- libro e così via. Ciò si ottiene indican- strate con un carattere Yahoo ed è in grado di
pali dell’argomento cercato, è do a Yahoo, attraverso un’applicazio- di maggiori dimensioni. integrarsi con Face-
Tra le aziende impegnate nel setto- estratto da Wikipedia. Evri offre ne web gratuita disponibile sul sito Passando il mouse sulle book e Twitter per l’ag-
re della ricerca semantica E v r i gratuitamente un widget per inclu- http://developer.yahoo.com/search chiavi, vengono selezio- giunta di informazioni
(www.evri.com) occupa un posto dere la propria tecnologia in blog o monkey, i dati rilevanti delle pagine nati, sotto forma di clas- e link alle pagine del
speciale, non fosse altro per gli ac- altri siti Web, una Toolbar per Fi- che si desidera arricchire e specifi- sici link, i risultati più ri- proprio social network.
cando il layout che dovranno avere i levanti per la chiave se- È un servizio ben fatto,
link. Le applicazioni di questo tipo lezionata e mostrati tag che lavora molto bene
TIPS possono essere create e pubblicate da collegati per espandere con i blog supportati (lo
chiunque alla pagina http://gallery o migliorare la ricerca. abbiamo provato con
Un motore di ricerca per il Web semantico .search.yahoo.com. Per la creazione
dei metadati, ossia dei dati che iden-
L’effetto è certamente
piacevole, ma i risultati
Wordpress) ed è utile
anche per chi cerca

L a base di dati del search engine Sindice (http://sindice.com) è formata da siti Web che pub-
blicano dati in formato Rdf o utilizzando microformati. L’interfaccia offre tre diversi tipi di ri-
cerca: attraverso parole chiave o indirizzi Web, attraverso la ricerca della coppia proprietà/valore
tificano le informazioni specifiche di
ogni pagina Web, Searchmonkey uti-
lizza alcuni standard del Web seman-
non sempre pertinenti.
Inoltre non è chiaro di
quale natura sia il livel-
ispirazione o fonti per il
testo da scrivere in
quanto ogni link offerto
così come specificato nella tripletta Rdf, o attraverso query complesse. I risultati forniti sono sia tico tra cui Rdf, Rdfa, e altre tecnolo- lo semantico applicato a completamento del
link a pagine Web sia box strutturati in forma di dati. gie come i microformati. alle ricerche: sul sito uf- Tagaroo proprio articolo, estrat-

112 114
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

Zemanta zLinks Gnosis Glue

to da un misto di fonti professionali e Estensioni semantiche mostra in evidenza sia nella pagina mo la pagina di un film su Amazon e maggiori informazioni basta eviden- (www.kaply.com/weblog/operator),
blog, può essere anche visitato e letto per Firefox sia nella sua barra laterale. Per ognu- un nostro amico legge l’articolo di ziare la porzione della pagina che ne che visualizza in una barra degli
in un’altra finestra. Come gli altri ser- na delle entità trovate è poi possibile Wikipesia dedicato allo stesso film, contiene in nome e trascinarlo verso strumenti di Firefox i microformati (o
vizi di questa rassegna, funziona me- Firefox e il suo efficace sistema di eseguire una ricerca specifica: dati fi- Glue è in grado di collegare le due destra o sinistra con il mouse; per anche i tag Rdfa) presenti in una pa-
glio se la lingua utilizzata è l’inglese. estensioni sono gli strumenti ideali nanziari per le aziende, profili su esperienze. È inoltre possibile, per aprire o chiudere la barra laterale di gina Web e consente di interagire
per mettere a disposizione di tutti i Linkedin o Facebook per le persone, ogni oggetto, aggiungere un com- Juice basta fare clic sull’icona a forma attraverso di essi tramite servizi of-
Se gli esempi visti sinora servono navigatori piccoli software che sfrut- mappe per i luoghi e così via. Pur- mento, identificarlo come uno dei pre- di bicchiere in alto a destra nel brow- ferti da altri siti.
ad integrare la semantica nei blog, tano, per gli usi più diversi, tecnolo- troppo, come più volte ripetuto, Ca- feriti, inviare si Twitter un messaggio ser. A fornire a Juice le capacità se- Quando si visitano siti che hanno già
l’ultimo che vi presentiamo consen- gie semantiche. La prima estensione lais funziona solo con pagine in ingle- che lo riguarda, salvare il relativo link mantiche c’è, secondo Linkool, l’a- contenuti identificati da tag semanti-
te di seguire il percorso contrario e che vi presentiamo si chiama Gnosis se o francese e per questo motivo su Delicious e compiere altre azioni zienda cinese che lo sviluppa, un ci, Operator mostra per ognuno di es-
di portare i contenuti di un blog al- (www.opencalais.com/Gnosis) e con- Gnosis rimane inattivo su pagine in che variano in base al tipo di oggetto “motore di esplorazione intelligente” si varie azioni che è possibile compie-
l’interno del Web semantico. Si sente di avere il motore di semantico altre lingue. che si sta visualizzando. basato su strumenti di analisi del lin- re: gli elementi identificati come indi-
chiama zLinks ( http://www.zitgist del progetto Calais, uno dei migliori guaggio naturale filtrati da un voca- rizzi o contatti possono essere espor-
.com/products/zlinks/) ed è un di tipo top down in circolazione, di- Due progetti più orientati alle naviga- Anche Juice (http://juiceapp.com) è bolario. Nonostante sia un’estensione tati in formato vCard o visualizzati su
plug-in per Wordpress che aggiun- rettamente all’interno del navigatore. zioni di tutti i giorni sono Glue e Juice. un’estensione per Firefox progettata usabile e utile per ricevere contenuti una mappa on-line, i tag possono es-
ge ai link inclusi nei post un livello Dopo l’installazione si presenta come Glue (www.getglue.com), un’esten- per riconoscere elementi rilevanti e a tema su una particolare chiave, gli sere usati per ricercare contenuti a te-
di significato secondo le specifiche una piccola barra laterale che va atti- sione sviluppata da Adaptive Blue, creare relazioni con altri elementi. strumenti di analisi del significato che ma su Youtube, Flickr e siti analoghi,
del Web semantico. Ogni link ag- vata scegliendo la voce ClearForest creatrice del del sistema di annotazio- Juice identifica libri, persone e film offre sono basilari: si tratta più di un gli eventi corredati di data possono
giunto al blog mostrerà infatti ac- Gnosis nel menu Visualizza / Barra ne automatica di link chiamato chia- presenti in una pagina Web e, in una selettore di parole-chiave filtrate che essere aggiunti con un clic ai calen-
canto al nome una piccola “z” blu laterale di Firefox. Facendo clic sul- mato SmartLinks, utilizza lo stesso ap- barra laterale, mostra un breve rias- di un motore semantico. dari di Google, Yahoo e così via. Le
che, sfiorata con il mouse, attiverà l’ultima icona in alto nella barra di proccio top down di Gnosis anche se sunto estratto da Wikipedia, un elen- funzionalità di Operator sono perso-
un box dinamico popolato di colle- Gnosis, si avvia l’analisi semantica in modo molto meno preciso e con fi- co di video presi da Youtube, gli arti- L’ultima estensione della nostra ras- nalizzabili tramite codice JavaScript;
gamenti correlati, recuperati dai della pagina visualizzata nel browser. nalità diverse: durante la navigazone coli più rilevanti da diverse fonti di segna sfrutta invece il già citato mo- sul sito Web dello sviluppatore
servizi che fanno parte del progetto Gnosis riconosce automaticamente riconosce libri, musica, film, vini, ri- informazioni, il prezzo (preso da Ama- dello bottom up: rileva infatti in una (www.kaply.com/weblog/ope
Linked Data. I link che permettono nomi di persona, nomi di aziende, storanti e altre entità nelle pagine zon) e così via. Per selezionare l’ele- pagina Web la struttura semantica rator-user-scripts) si possono trovare
a zLinks di mostrare un maggior luoghi, tecnologie, sistemi operativi e Web e mostra gli altri utenti di Glue mento su cui si vogliono ricevere che vi è inclusa. Si tratta di Operator numerosi esempi. •
numero di collegamenti utili sono decine di altre entità concettuali, e li che le hanno visualizzate, commenta-
quelli costruiti secondo i linguaggi te o aggiunge ai propri siti preferiti.
promossi dal W3C: un link ad un fi- Dventa così possibile vedere gli argo-
le Rdf costruito secondo l’ontologia
TIPS menti che interessano agli amici, con-
Foaf, ad esempio, riempirà il box dividere con loro pensieri ed opinioni
con l’elenco delle attività e della re- Microformati su specifici argomenti ed estendere il
te sociale della persona. Ma non è
tutto: zLinks consente anche all’au-
per Internet Explorer proprio network sociale a persone che
hanno visitato le stesse cose. La tec-
tore del post di annotare con note Per permettere ad Internet Explorer di leg- nologia alla base di Glue, che può
personali i link presenti nei propri gere ed analizzare i microformati presenti in identificare oggetti su cui costruire le
messaggi. Le note aggiunte saran- una pagina Web esiste un’estensione chia- relazioni in circa 200 siti, sfrutta in
no esse stesse salvate sotto forma di mata Oomph (http://www.ieaddons.com/it/ parte strumenti di riconoscimento e in
file Rdf e inviate automaticamente Details.aspx?Id=1110). Sebbene non sia parte le interfacce di programmazione
ad un servizio (pingtheseman- sempre efficace nel rilevare la presenza di messe a disposizioni da siti come
ticweb.com) che le includerà all’in- microformati, quando ci riesce li visualizza Amazon o Last.fm. L’utilizzo di una
terno dello spazio dei Linked Data, in un elegante box e ne consente l’integra- tecnologia di riconoscimento permet-
in modo da renderle disponibili sotto zione nei post dei blog creati con il Win- te di identificare gli oggetti su siti di-
forma di annotazioni semantiche. dows Live Writer plugin. versi: di conseguenza, se visualizzia- Juice Operator

116 117
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009
COME FARE COME FARE
WEB SEMANTICO WEB SEMANTICO

Zemanta zLinks Gnosis Glue

to da un misto di fonti professionali e Estensioni semantiche mostra in evidenza sia nella pagina mo la pagina di un film su Amazon e maggiori informazioni basta eviden- (www.kaply.com/weblog/operator),
blog, può essere anche visitato e letto per Firefox sia nella sua barra laterale. Per ognu- un nostro amico legge l’articolo di ziare la porzione della pagina che ne che visualizza in una barra degli
in un’altra finestra. Come gli altri ser- na delle entità trovate è poi possibile Wikipesia dedicato allo stesso film, contiene in nome e trascinarlo verso strumenti di Firefox i microformati (o
vizi di questa rassegna, funziona me- Firefox e il suo efficace sistema di eseguire una ricerca specifica: dati fi- Glue è in grado di collegare le due destra o sinistra con il mouse; per anche i tag Rdfa) presenti in una pa-
glio se la lingua utilizzata è l’inglese. estensioni sono gli strumenti ideali nanziari per le aziende, profili su esperienze. È inoltre possibile, per aprire o chiudere la barra laterale di gina Web e consente di interagire
per mettere a disposizione di tutti i Linkedin o Facebook per le persone, ogni oggetto, aggiungere un com- Juice basta fare clic sull’icona a forma attraverso di essi tramite servizi of-
Se gli esempi visti sinora servono navigatori piccoli software che sfrut- mappe per i luoghi e così via. Pur- mento, identificarlo come uno dei pre- di bicchiere in alto a destra nel brow- ferti da altri siti.
ad integrare la semantica nei blog, tano, per gli usi più diversi, tecnolo- troppo, come più volte ripetuto, Ca- feriti, inviare si Twitter un messaggio ser. A fornire a Juice le capacità se- Quando si visitano siti che hanno già
l’ultimo che vi presentiamo consen- gie semantiche. La prima estensione lais funziona solo con pagine in ingle- che lo riguarda, salvare il relativo link mantiche c’è, secondo Linkool, l’a- contenuti identificati da tag semanti-
te di seguire il percorso contrario e che vi presentiamo si chiama Gnosis se o francese e per questo motivo su Delicious e compiere altre azioni zienda cinese che lo sviluppa, un ci, Operator mostra per ognuno di es-
di portare i contenuti di un blog al- (www.opencalais.com/Gnosis) e con- Gnosis rimane inattivo su pagine in che variano in base al tipo di oggetto “motore di esplorazione intelligente” si varie azioni che è possibile compie-
l’interno del Web semantico. Si sente di avere il motore di semantico altre lingue. che si sta visualizzando. basato su strumenti di analisi del lin- re: gli elementi identificati come indi-
chiama zLinks ( http://www.zitgist del progetto Calais, uno dei migliori guaggio naturale filtrati da un voca- rizzi o contatti possono essere espor-
.com/products/zlinks/) ed è un di tipo top down in circolazione, di- Due progetti più orientati alle naviga- Anche Juice (http://juiceapp.com) è bolario. Nonostante sia un’estensione tati in formato vCard o visualizzati su
plug-in per Wordpress che aggiun- rettamente all’interno del navigatore. zioni di tutti i giorni sono Glue e Juice. un’estensione per Firefox progettata usabile e utile per ricevere contenuti una mappa on-line, i tag possono es-
ge ai link inclusi nei post un livello Dopo l’installazione si presenta come Glue (www.getglue.com), un’esten- per riconoscere elementi rilevanti e a tema su una particolare chiave, gli sere usati per ricercare contenuti a te-
di significato secondo le specifiche una piccola barra laterale che va atti- sione sviluppata da Adaptive Blue, creare relazioni con altri elementi. strumenti di analisi del significato che ma su Youtube, Flickr e siti analoghi,
del Web semantico. Ogni link ag- vata scegliendo la voce ClearForest creatrice del del sistema di annotazio- Juice identifica libri, persone e film offre sono basilari: si tratta più di un gli eventi corredati di data possono
giunto al blog mostrerà infatti ac- Gnosis nel menu Visualizza / Barra ne automatica di link chiamato chia- presenti in una pagina Web e, in una selettore di parole-chiave filtrate che essere aggiunti con un clic ai calen-
canto al nome una piccola “z” blu laterale di Firefox. Facendo clic sul- mato SmartLinks, utilizza lo stesso ap- barra laterale, mostra un breve rias- di un motore semantico. dari di Google, Yahoo e così via. Le
che, sfiorata con il mouse, attiverà l’ultima icona in alto nella barra di proccio top down di Gnosis anche se sunto estratto da Wikipedia, un elen- funzionalità di Operator sono perso-
un box dinamico popolato di colle- Gnosis, si avvia l’analisi semantica in modo molto meno preciso e con fi- co di video presi da Youtube, gli arti- L’ultima estensione della nostra ras- nalizzabili tramite codice JavaScript;
gamenti correlati, recuperati dai della pagina visualizzata nel browser. nalità diverse: durante la navigazone coli più rilevanti da diverse fonti di segna sfrutta invece il già citato mo- sul sito Web dello sviluppatore
servizi che fanno parte del progetto Gnosis riconosce automaticamente riconosce libri, musica, film, vini, ri- informazioni, il prezzo (preso da Ama- dello bottom up: rileva infatti in una (www.kaply.com/weblog/ope
Linked Data. I link che permettono nomi di persona, nomi di aziende, storanti e altre entità nelle pagine zon) e così via. Per selezionare l’ele- pagina Web la struttura semantica rator-user-scripts) si possono trovare
a zLinks di mostrare un maggior luoghi, tecnologie, sistemi operativi e Web e mostra gli altri utenti di Glue mento su cui si vogliono ricevere che vi è inclusa. Si tratta di Operator numerosi esempi. •
numero di collegamenti utili sono decine di altre entità concettuali, e li che le hanno visualizzate, commenta-
quelli costruiti secondo i linguaggi te o aggiunge ai propri siti preferiti.
promossi dal W3C: un link ad un fi- Dventa così possibile vedere gli argo-
le Rdf costruito secondo l’ontologia
TIPS menti che interessano agli amici, con-
Foaf, ad esempio, riempirà il box dividere con loro pensieri ed opinioni
con l’elenco delle attività e della re- Microformati su specifici argomenti ed estendere il
te sociale della persona. Ma non è
tutto: zLinks consente anche all’au-
per Internet Explorer proprio network sociale a persone che
hanno visitato le stesse cose. La tec-
tore del post di annotare con note Per permettere ad Internet Explorer di leg- nologia alla base di Glue, che può
personali i link presenti nei propri gere ed analizzare i microformati presenti in identificare oggetti su cui costruire le
messaggi. Le note aggiunte saran- una pagina Web esiste un’estensione chia- relazioni in circa 200 siti, sfrutta in
no esse stesse salvate sotto forma di mata Oomph (http://www.ieaddons.com/it/ parte strumenti di riconoscimento e in
file Rdf e inviate automaticamente Details.aspx?Id=1110). Sebbene non sia parte le interfacce di programmazione
ad un servizio (pingtheseman- sempre efficace nel rilevare la presenza di messe a disposizioni da siti come
ticweb.com) che le includerà all’in- microformati, quando ci riesce li visualizza Amazon o Last.fm. L’utilizzo di una
terno dello spazio dei Linked Data, in un elegante box e ne consente l’integra- tecnologia di riconoscimento permet-
in modo da renderle disponibili sotto zione nei post dei blog creati con il Win- te di identificare gli oggetti su siti di-
forma di annotazioni semantiche. dows Live Writer plugin. versi: di conseguenza, se visualizzia- Juice Operator

116 117
PC Professionale - Maggio 2009 PC Professionale - Maggio 2009

Anda mungkin juga menyukai