Semantic web , sau web - ul semantic , este o extensie a Web standardizate de către World Wide Web Consortium (W3C). Aceste standarde încurajează utilizarea formatelor de date standardizate și a protocoalelor de schimb pe Web, pe baza modelului Resource Description Framework (RDF).
Webul semantic este denumit de unii Web 3.0.
Potrivit W3C, "Semantic Web oferă un model care permite partajarea și reutilizarea datelor între mai multe aplicații, companii și grupuri de utilizatori . " Fraza a fost inventată de Tim Berners-Lee (inventator al Web-ului și director al W3C), care supraveghează dezvoltarea tehnologiilor comune Semantic Web. El îl definește ca „o rețea de date care poate fi procesată direct și indirect de mașini pentru a-și ajuta utilizatorii să creeze noi cunoștințe” . Pentru a realiza acest lucru, web-ul semantic implementează rețeaua de date care constă în legarea și structurarea informațiilor de pe internet pentru a accesa pur și simplu cunoștințele pe care le conține deja.
În timp ce detractorii săi au pus la îndoială fezabilitatea sa, promotorii săi susțin că aplicațiile făcute de cercetătorii din industrie , biologie și științe umaniste au dovedit deja validitatea acestui nou concept. Articolul original al lui Tim Berners-Lee din 2001 din Scientific American descria o evoluție așteptată de la rețeaua existentă la o rețea semantică, dar asta nu a avut loc încă. În 2006, Tim Berners-Lee și colegii săi au spus: „Această idee simplă ... rămâne în mare parte neexploatată. "
Conceptul de „ rețea semantică model ” a fost inventat în anii 1960 de către omul de știință cognitiv Allan Collins , lingvistul Ross Quillian (în) și psihologul Elizabeth Loftus și expus în diferite publicații ca o modalitate de reprezentare a cunoașterii structurate. Aplicat în contextul internetului, acest model extinde rețeaua de hyperlink - uri a paginilor web lizibile de către om prin inserarea de metadate lizibile automat pe pagini. Aceste metadate sunt legate între ele, permițând agenților să acceseze webul mai inteligent și să efectueze sarcini în numele utilizatorilor. Web-ul semantic este văzut ca o poartă de acces la date între diferite aplicații și sisteme. Aplicațiile sale sunt numeroase în publicare, bloguri și în alte câteva domenii.
Tim Berners-Lee a exprimat inițial punctul de vedere al Semantic Web astfel:
Am un vis pentru Web [în care computerele] devin capabile să analizeze toate datele de pe Web - conținutul, link-urile și tranzacțiile dintre oameni și computere. Un „web semantic”, care ar trebui să facă acest lucru posibil, nu a apărut încă, dar atunci când se va întâmpla, mecanismele cotidiene ale comerțului, birocrației și vieții noastre de zi cu zi vor fi gestionate de mașini care vorbesc cu mașini. „Agenții inteligenți” pe care oamenii îi susțin de veacuri se vor materializa în cele din urmă.
„Visez la un web [în care computerele] să poată analiza toate datele de pe web: conținut, linkuri și tranzacții între oameni și computere. Un „Web semantic”, care ar trebui să facă acest lucru posibil, nu a apărut încă, dar atunci când se va întâmpla, funcționarea cotidiană a comerțului, a administrației și a vieții noastre de zi cu zi va fi procesată de mașini care dialogează cu alte mașini. „Agenții inteligenți” care au fost promovați de mult timp s-ar materializa în cele din urmă. "
Majoritatea tehnologiilor oferite de W3C existau deja înainte. Acestea sunt utilizate în contexte diferite, în special în ceea ce privește informațiile care cuprind un domeniu limitat și definit și unde schimbul de date este o necesitate comună, cum ar fi cercetarea științifică sau schimbul de date între organizații. În plus, au apărut și alte tehnologii cu scopuri similare, cum ar fi microformatele .
Scopul principal al web-ului semantic este de a ghida evoluția web-ului pentru a permite utilizatorilor fără intermediari să găsească, să partajeze și să combine informații mai ușor. Ființele umane pot folosi internetul pentru a îndeplini sarcini precum găsirea cuvântului Paris pentru a rezerva o carte în bibliotecă, pentru a găsi o hartă și pentru a rezerva un bilet de transport. Cu toate acestea, mașinile nu pot îndeplini toate aceste sarcini fără îndrumare umană, deoarece paginile web sunt concepute pentru a fi citite în primul rând de oameni. Web-ul semantic își propune să facă paginile accesibile cu crawlere atât de oameni, cât și de mașini. Acest lucru ar permite ca activitatea obositoare și repetitivă de recuperare a informațiilor să fie efectuată într-un mod automat, îmbunătățind și consolidând informațiile de pe web pentru utilizatorii săi.
Web-ul semantic, așa cum a fost intenționat inițial, este un sistem care permite mașinilor să „înțeleagă” și să răspundă solicitărilor umane complexe în funcție de semnificația lor. O astfel de „înțelegere” necesită ca sursele de informații relevante să fi fost structurate semantic în prealabil. Această structură accesibilă pentru mașini permite o capacitate de descoperire mult mai mare decât ceea ce este posibil pur și simplu prin intermediul web-ului de documente. Folosirea RDF pentru a structura aceste date face posibilă exploatarea performanței mașinii; capacitatea lor de a prelucra date face posibilă studierea informațiilor obținute din aceste date pentru a trage noi concluzii din cunoștințele existente. Cu ajutorul RDF, documentele produse în HTML devin date care, prin munca comună a mașinilor și utilizatorilor, produc noi cunoștințe.
Adesea, expresiile „ semantică ”, „ metadate ”, „ ontologii ” și „web semantic” sunt utilizate inconsecvent. În special, acestea sunt utilizate în fiecare zi de către cercetători și practicieni a căror terminologie acoperă un peisaj larg de tehnologii, concepte și domenii de aplicare. În plus, există confuzie între tehnologiile luate în considerare pentru implementarea acesteia și mișcarea site-ului web semantic. Într-o lucrare prezentată de Gerber, Barnard și Van der Merwe, este desenat peisajul webului semantic și este prezentat un scurt rezumat al termenilor înrudiți și al tehnologiilor abilitante. Modelul arhitectural propus de Tim Berners-Lee este folosit ca bază pentru a reprezenta starea tehnologiilor actuale și emergente.
În exemplul următor, textul „Paul Schuster s-a născut la Dresda” de pe o pagină web va fi adnotat prin legarea persoanei la locul de naștere. Bucata de cod HTML afișată mai jos arată cum să descrieți un mini-grafic folosind sintaxa RDFa cu vocabularul Schema.org și un identificator Wikidata :
<div vocab="http://schema.org/" typeof="Person"> <span property="name">Paul Schuster</span> est né à <span property="birthPlace" typeof="Place" href="http://www.wikidata.org/entity/Q1731"> <span property="name">Dresde</span>. </span> </div>Acest exemplu definește următoarele cinci tripluri ( în ), afișate în format Turtle . Fiecare triplet reprezintă o margine a graficului generat: primul său element (subiectul) este numele nodului de la care începe marginea, al doilea element (predicatul) indică tipul muchiei și ultimul (obiectul) este fie numele nodului țintă, fie o valoare literală (text, număr etc.).
_:a <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://schema.org/Person> . _:a <http://schema.org/name> "Paul Schuster" . _:a <http://schema.org/birthPlace> <http://www.wikidata.org/entity/Q1731> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/itemtype> <http://schema.org/Place> . <http://www.wikidata.org/entity/Q1731> <http://schema.org/name> "Dresde" .Multe fișiere de pe computer pot fi clasificate mai mult sau mai puțin în două categorii: documente care pot fi citite de om și date care pot fi citite de mașină. Documentele precum e-mailurile , rapoartele sau broșurile pot fi citite de oameni. Pe de altă parte, datele conținute în calendare, agende, liste de lectură sau foi de calcul sunt lizibile cu condiția să utilizați o aplicație care le permite să fie citite, căutate și transformate în moduri diferite.
În prezent, World Wide Web se bazează în principal pe documente scrise în Hypertext Markup Language (HTML) , adică o convenție de marcare care este utilizată pentru codificarea textului intercalat cu obiecte multimedia precum imagini și formulare interactive. Etichetele de metadate oferă o metodă prin care computerele pot clasifica conținutul paginilor web; de exemplu :
<meta name="keywords" content="computing, computer studies, computer" /> <meta name="description" content="Cheap widgets for sale" /> <meta name="author" content="John Doe" />Cu HTML și un instrument de afișare (care ar putea fi un browser web sau alt „agent de utilizator” ), puteți crea și prezenta o pagină care afișează articole de vânzare. HTML pentru o pagină de catalog poate fi realizat simplu, documentul care conține afirmații precum „titlul acestui document este„ Gadgets Supermarket ””, dar codul HTML nu poate afirma fără echivoc că, de exemplu, numărul articolului X586172 este un tabel cu un preț de 199 USD și nici nu este un produs de larg consum. HTML poate spune doar că intervalul de text „X586172” este ceva care ar trebui să fie poziționat lângă „Mobilă” și „199 € ” etc. Nu există nicio modalitate de a spune că „aceasta este o pagină de catalog”, sau chiar de a spune că „Mobila” este un fel de titlu, sau chiar de a ști că „199 € ” este un preț. Nu există nicio modalitate de a exprima faptul că aceste informații sunt legate între ele pentru a descrie un articol discret , distinct de alte elemente care pot fi listate pe aceeași pagină.
Semantic HTML se referă la utilizarea etichetelor HTML pentru a insera informații suplimentare în document. De exemplu, folosind elementul HTML pentru deldesemnarea conținutului șters, mai degrabă decât strikeafișarea textului tăiat și specificarea formatării acestuia. Semantic HTML lasă aspectul în browser adăugând foi de stil în cascadă . Dar această practică își atinge limitele atunci când vine vorba de specificarea semanticii obiectelor, cum ar fi articolele de vânzare.
De Microformatele sunt , de asemenea , încercări neoficiale pentru a extinde HTML sintaxa pentru o mașină poate citi markup semantic despre obiecte dintr - un document , cum ar fi articole de vânzare sau de contact ( de exemplu , cu hCard ).
Webul semantic oferă limbaje special concepute pentru date: RDF ( Resource Description Framework ), OWL ( Ontology Web Language ) și XML ( eXtensible Markup Language ). HTML descrie documentele și legăturile dintre ele. RDF, OWL și XML, pe de altă parte, pot descrie și lucruri, cum ar fi persoane, întâlniri sau piese de avion. Potrivit lui Tim Berners-Lee, „RDF înseamnă date, ceea ce înseamnă HTML pentru documente. RDF vă permite să conectați datele la o categorie. "
Aceste tehnologii sunt combinate pentru a oferi descrieri care completează sau înlocuiesc conținutul documentelor web. Astfel, conținutul poate apărea sub formă de date descriptive stocate în baze de date accesibile pe Web sau prin etichete în documente (prin HTML sau varianta sa XHTML - XML HTML -). Aceste date pot fi apoi intercalate cu XML sau, uneori, publicate numai ca XML, cu aspectul și datele stocate separat. Descrierile citite de mașini permit managerilor de conținut să adauge sens conținutului lor, adică să descrie structura cunoașterii în cadrul conținutului. În acest fel, o mașină poate:
Iată un exemplu de etichetă care ar fi utilizată într-o pagină web non-semantică:
<item>cat</item>Codificarea informațiilor similare într-o pagină web semantică ar putea arăta astfel:
<item rdf:about="http://dbpedia.org/resource/Cat">Cat</item>Tim Berners-Lee împinge apariția unei rețele de date conexe ( date legate , în engleză ) sau date web (în franceză ) pentru Giant Global Graph , spre deosebire de Web, este o pagină HTML bazată pe web la nivel mondial. Tim Berners-Lee presupune că, dacă în trecut am împărtășit documente, atunci în viitor vom împărtăși date. Răspunsul său la întrebarea „cum?” Se bazează pe trei piloni. Una, o adresă URL trebuie să indice datele. În al doilea rând, oricine accesează adresa URL ar trebui să poată prelua date. În al treilea rând, relațiile din date trebuie să indice alte adrese URL cu datele.
Tim Berners-Lee a descris Web-ul semantic ca o componentă a Web 3.0:
Oamenii continuă să întrebe ce este Web 3.0. Cred că poate, atunci când veți avea o suprapunere de grafică vectorială scalabilă - tot ce se îndoaie și se pliază și pare negos - pe Web 2.0 și acces la un web semantic integrat într-un spațiu imens de date, veți avea acces la o resursă de date incredibilă .
„Oamenii întreabă tot timpul ce este Web 3.0. Cred că atunci când aveți o suprapunere de desene vectoriale - totul în valuri și pliuri neclare - care descrie Web 2.0 și accesul la un web semantic încorporat într-un spațiu de date imens, veți avea acces la o resursă incredibilă de date. "
„Semantic Web” este uneori folosit ca sinonim pentru „Web 3.0”, deși definiția fiecărui termen variază. La fel ca „Web 2.0”, „Web 3.0” este un neologism și un cuvânt cheie . În cazul Web 2.0, utilizarea termenului este dezbătută între cei care cred că este un termen de marketing fără schimbări reale și cei care cred că a existat o evoluție reală.
Unele dintre provocările rețelei semantice sunt vastitatea, vagitatea, incertitudinea, inconsecvența și înșelăciunea. Sistemele de raționament automatizate vor trebui să răspundă la toate aceste întrebări, pentru a respecta promisiunea webului semantic.
Această listă de provocări este mai ilustrativă decât exhaustivă, deoarece se concentrează pe provocările „logicii unificării” și a stratului „dovadă” pentru implementarea Web-ului semantic. Majoritatea tehnicilor menționate aici vor trebui să extindă limbajul OWL ( Web Ontology Language ), de exemplu, pentru a adnota probabilitatea condiționată a unei informații. Acesta este un domeniu activ de cercetare.
Standardizarea web-ului semantic este supravegheată de W3C .
Expresia „web semantic” este adesea utilizată mai specific pentru a desemna formate și tehnologii care îi vor permite să existe. Colectarea, structurarea și recuperarea datelor conexe vor funcționa folosind tehnologii care vor oferi o descriere formală a conceptelor, termenilor și relațiilor într-un anumit domeniu de cunoștințe . Aceste tehnologii sunt standardizate de W3C și includ în special:
Semantic Web stivă este o ilustrație pentru a reprezenta arhitectura web - ului semantic. Funcțiile și relațiile componentelor pot fi rezumate după cum urmează:
Standardele încă necesare pentru a pune în aplicare Semantic Web du - te prin recomandarea procesul de W3C ( World Wide Web Consortium ) grupuri de lucru. Aceasta înseamnă că fiecare nouă recomandare a fost supusă revizuirii publice. Apoi, recomandările W3C, care vor fi adoptate pe scară largă, vor deveni în mod natural standardele „Semantic Web”.
Iată lista standardelor și recomandărilor principale pe care se bazează Web-ul semantic:
Iată recomandările active actuale:
Pe de altă parte, mulți pași pentru implementarea unui „web semantic” sunt încă de imaginat, clarificat și specificat. Tim Berners-Lee , prin intermediul Semantic Web Stack , rezumă acești pași prin următoarele straturi:
În așteptarea implementării tuturor acestor straturi, tehnologiile deja disponibile, cum ar fi SPARQL , permit deja oferirea interoperabilității cu o granularitate mai bună a datelor decât cea oferită de serviciile web (W3C a retras în plus standardizarea serviciilor web ale prioritățile sale ).
Setul de surse de date care își partajează datele cu standardele web semantice a fost denumit Web de date (sau în limba engleză „ Linked Open Data ”) pentru a facilita adoptarea de către public. Web-ul de date se bazează pe tehnologii de date conectate care se suprapun peste tehnologiile web semantice care au fost deja adoptate pe scară largă. Datele legate sunt una dintre principalele tehnologii utilizate în mișcarea „ date deschise ” din Anglia, care își propune să împărtășească masiv date publice pentru a accelera cercetarea și comerțul. Apariția Web-ului semantic este considerat de unii ca fiind următoarea descoperire tehnologică și, prin urmare, economică pe care ei o numesc deja Web 3.0 .
Astfel, obiectivul va fi, în viitor, de a îmbunătăți accesul și utilitatea Web-ului și a resurselor interconectate prin intermediul acestuia, cum ar fi:
Principalele critici se referă la fezabilitatea completă sau chiar parțială a Web-ului semantic. Cory Doctorow vorbește despre „ metacrap ” (un portmanteau a format cuvinte metadate și porcării , putem încerca să aducem puterii franceze prin „métamerde”), o critică care se bazează pe observarea sarcastică a comportamentului uman. De exemplu, oamenii pot include microdate parazite în paginile web pentru a înșela motoarele web semantice care vor avea „naivitate” încredere în veridicitatea tuturor datelor. Este bine cunoscut acest fenomen pentru a înșela: motoarele de indexare, precum Google , caută să detecteze acest tip de manipulare. Peter Gärdenfors și Timo Honkela (ro) au observat că logica tehnologiilor web semantice acoperă doar o fracțiune din fenomenele care vor avea impact asupra semanticii web.
În 2001, Cory Doctorow a făcut o listă cu cele șapte obstacole presupuse de netrecut pentru obținerea metadatelor suficient de fiabile pentru a rula un posibil semantic web. Conform lui :
De asemenea, include și alte motive legate de perimarea metadatelor:
Cory Doctorow deduce că cercetarea unui astfel de sistem ar putea returna doar date care sunt învechite și parțial sau total incorecte.
Arhitectura, instrumentele și foarte concepte ale web - ului semantic au fost adesea criticate, invocând faptul că tehnologiile sau procesele pentru a menține calitatea datelor, inserat de ființe umane și , prin urmare , failibil, nu poate încă funcționa la scară. Web . Aceste limite sunt toate problemele noi pe care cercetarea încearcă să le rezolve în prezent prin provocările Webului semantic . Știință web (în) este numele pe care îl dau la „disciplina“ , care își propune să rezolve noi probleme științifice care scoate în evidență Web. Cu toate acestea, tehnologiile web semantice au fost adoptate în cadrul comunităților specializate în implementarea sistemelor informaționale, dar în principal în sisteme închise (exemplu: intranet ), cum ar fi în companii sau biblioteci.
Entuziasmul pentru web-ul semantic ar putea fi temperat de considerații precum refuzul cenzurii și dorința de a proteja viața privată . De exemplu, în prezent se poate înșela cu ușurință analizatorii de text să folosească alte cuvinte, metafore sau să folosească imagini în loc de cuvinte. Guvernelor le este mult mai ușor să vizualizeze și, prin urmare, să controleze, crearea de informații online dacă folosește o structură semantică, deoarece informațiile sunt mult mai ușor de interpretat și, eventual, de blocat prin intermediul unui sistem automat. În plus, problema a fost ridicată și de utilizarea meta-datelor, cum ar fi FOAF sau Geolocation API (as) , care pune sub semnul întrebării anonimatul World Wide Web . Aceste preocupări fac din securitatea datelor cu caracter personal un subiect activ de cercetare, ca în proiectul „ Politica conștientă Web ”.
Un alt recenzor vorbește despre o creștere a timpului necesar pentru crearea și publicarea conținutului datorită necesității de a produce două versiuni ale acestuia: una pentru vizualizarea umană și alta pentru mașini. Cu toate acestea, multe aplicații web se confruntă deja cu această problemă prin crearea unui format lizibil pentru un browser web sau la cererea unui cititor RSS, cum ar fi un blog . Dezvoltarea microformatelor a fost o reacție la acest tip de critică. În apărarea sa, Web-ul semantic va reduce probabil efortul asociat sarcinilor de recuperare a informațiilor și astfel va compensa costul suplimentar al furnizării unui format compatibil pentru mașini.
Una dintre primele soluții a fost utilizarea limbajului GRDDL , un mecanism care folosește doar conținutul deja prezent într-o pagină HTML (cu potențial microformate) pentru a extrage RDF din aceasta. Cu toate acestea, multiplicitatea și instabilitatea microformatelor, precum și dificultatea creării convertorului XSLT pentru GRDDL au condus la specificarea RDFa pentru a integra RDF în mod simplu și explicit în paginile HTML . Metoda RDFa va fi, de asemenea, integrată direct în standardul HTML5 prin microdate , ceea ce va simplifica și mai mult inserarea datelor RDF într-un document.
Această secțiune enumeră câteva dintre numeroasele proiecte și instrumente care există în cadrul mișcării Semantic Web.
Progresul webului semantic în întreaga lume este monitorizat de W3C ca parte a proiectului de implementare avansată a semanticului web ( SWAD ). Proiectul SWAD -Europe a avut loc dinMai 2002 la octombrie 2004.
Organizația europeană care găzduiește proiecte W3C și care monitorizează progresul web-ului semantic este ERCIM ( Consorțiul european de cercetare pentru informatică și matematică ).
Biblioteca Națională a Franței se intră în Semantic Web prin intermediul său data.bnf.fr proiect . Acest proiect integrează date produse în diverse formate, inclusiv Intermarc, XML-EAD și Dublin Core , pentru biblioteca digitală. Datele sunt modelate și grupate în funcție de prelucrare automată și publicate în diverse RDF standarde : RDF-XML, RDF-N3 și RDF-NT. Există, de asemenea, o publicație de date în JSON . Proiectul utilizează platforma de dezvoltare semantică CubicWeb .
Biblioteca Națională a Franței prevede astfel:
În 2013, proiectul a împărțit cu Gallica Premiul Stanford pentru inovație în bibliotecile de cercetare (SPIRL).
Din 2017, modelul de date data.bnf.fr se bazează pe modelul de referință conceptuală IFLA LRM , permițându-i să navigheze în relațiile dintre entități.
DBpedia este primul efort istoric de a publica date structurate extrase din Wikipedia : datele sunt extrase din pagini și în special din casetele de informații Wikipedia publicate în RDF și puse la dispoziție pe web a datelor prin HTTP și SPARQL sub licența GFDL . .
SemanticPedia este o platformă pentru publicarea datelor din diferite proiecte Wikimedia în limba franceză, susținută de Ministerul Culturii și Comunicațiilor , Inria și Wikimedia France . O versiune franceză a DBpedia a fost dezvoltată de echipa Wimmics sub responsabilitatea lui Fabien Gandon la centrul de cercetare Inria Sophia Antipolis. Acest capitol francofon se numește DBpedia.fr și contribuie pentru franceză la internaționalizarea inițiativei DBpedia extragând și publicând date din diferitele capitole lingvistice ale Wikipedia . Acest capitol francez din DBpedia acceptă multe aplicații. Ministrul Culturii din Franța, Aurélie Filippetti , a anunțat19 noiembrie 2012 că următorul proiect se referă la Wikționar și la cele două milioane de termeni ai săi.
Wikidata este unul dintre proiectele Fundației Wikimedia. Obiectivul său este de a pune toate datele structurate ale tuturor proiectelor fundației la dispoziția contribuabililor, fără niciun intermediar.
Wikipedia este unul dintre proiectele conectate la Wikidata. Fiecare articol Wikipedia are acum un identificator unic sub forma unui IRI și este o entitate din comunitatea Wikidata. Fiecare entitate este alcătuită din mai multe proprietăți cu una sau mai multe valori (triple). Aceste entități și proprietăți sunt marcate cu un identificator unic (de exemplu: Q90 este identificatorul unic al Parisului), ceea ce face baza de date independentă de limba utilizată. Valoarea acestor proprietăți poate fi o altă entitate, dar și un șir, un număr, o dată etc. Datele structurate în acest mod pot fi reutilizate în diferite formate (XML, JSON, Turtle etc.) și pot fi utilizate în cele din urmă pentru a alimenta infoboxurile Wikipedia, evitând astfel să fie necesare modificarea manuală a acestora în toate limbile, de fiecare dată când se modifică Wikidata. ., toate infoboxurile sunt modificate în același timp.
Datele Wikidata sunt licențiate sub CC0 . Prin urmare, toate datele partajate sunt gratuite și deschise pentru toate tipurile de utilizare.
Pentru Web-ul semantic, Wikidata este unul dintre puținele puncte finale SPARQL conectate în timp real la producătorii de date. Aceasta înseamnă că modificările din Wikidata au un impact imediat asupra bazei de date RDF și, astfel, permit reutilizarea acestor date în alte aplicații prin SPARQL. În ceea ce privește ontologia sa, structura este construită în timp într-o manieră consensuală între contribuabili. Prin urmare, structura acestei ontologii se poate schimba oricând în funcție de nevoile contribuitorilor.
AKSW ( Agile Knowledge Engineering și Semantic Web ) este un grup de cercetare care este găzduit de catedra Betriebliche Informationssysteme ( BIS ) a Institutului pentru Informatică ( IFI ) al Universității din Leipzig, precum și de Institutul de Calcul Aplicat ( InfAI ) . Grupul de cercetare AKSW a lansat o serie de proiecte precum DBpedia.
Datalift este o platformă originală destinată exploatării datelor care integrează într-o singură soluție open source toate funcțiile utile pentru interconectarea datelor, de la captarea lor până la publicarea lor finală. În Datalift, datele de intrare sunt date brute provenind din formate eterogene (baze de date, CSV, XML, RDF, RDFa, GML, Shapefile ...). Datele produse sunt date legate. Platforma Datalift participă activ la transformarea de la Web la Web de date .
FOAF ( Prietenul unui prieten ) este un vocabular care folosește RDF pentru a descrie relațiile pe care oamenii le au cu alte persoane și „lucrurile” din jurul lor. FOAF este un exemplu al încercării Web-ului semantic de a utiliza relațiile într-un context social.
Comunități online interconectate semantic (SIOC)SiOC este un vocabular pentru a descrie obiecte utilizate în mod obișnuit pe site - urile comunității și relațiile lor.
Webul de date oferă dezvoltarea de noi utilizări care concretizează noțiunea de inteligență colectivă precum: