DBpedia

Vikipēdijas raksts
Pārlēkt uz: navigācija, meklēt
DBpedia
DBpedia logo
Izstrādātājs Leipcigas Universitāte, Berlīnes Brīvā Universitāte, OpenLink Software
Sākotnējā versija 23 January 2007
Stabilā versija DBpedia 3.5 / 2010. gada 12. aprīlis[1]
Progr. valoda Scala, Java, VSP
Operētājsistēma Virtuoso Universal Server
Veids Semantiskais tīmeklis, Linked Data
Licence GNU Vispārējā publiskā licence
Tīmekļa vietne dbpedia.org

DBPedia ir projekts, kura mērķis ir iegūt strukturētu informāciju no Vikipēdijas. Iegūtā strukturētā informācija ir pieejama globālajā tīmeklī.[2] No DBpedia lietotāji var iegūt informāciju par Vikipēdijas resursu īpašībām, to savstarpējo saistību, kā arī saites uz citām saistītām datu kopām.[3] Tims Bērnerss-Lī DBpedia projektu min kā vienu no pazīstamākajām Linked Data projekta daļām. [4]

DBpedia projektu uzsāka Berlīnes Brīvā Universitāte un Leipcigas universitāte sadarbībā ar OpenLink Software kompāniju[5], pirmā datu kopa tika publicēta 2007. gadā. Pateicoties brīvai licencei, datu kopu jebkurš var izmantot tālāk dažādos veidos.

Lielākā daļa Vikipēdijas satura ir rakstīta brīvā tekstā, tomēr Vikipēdijas rakstos atrodama arī strukturēta informācija: "infokastes", rakstu kategorijas, attēli, ģeogrāfiskas koordinātas, saites uz ārējiem resursiem. Šī informācija tiek apstrādāta un ievieta datu kopā, pret kuru var izpildīt vaicājumus.

Datu kopa[izmainīt šo sadaļu | labot pirmkodu]

2010. gada aprīlis DBpedia datu kopa saturēja vairāk kā 3,4 miljonus lietu, tai skaitā vismaz 312 000 personu, 413 000 vietu (tai skaitā 311 000 apdzīvotu vietu), 94 000 mūzikas albumu, 49 000 filmas, 15 000 datorspēles, 140 000 organizācijas (tai skaitā 31 000 firmas un 31 000 mācību iestāžu), 146 000 sugu un 4600 slimību. Datu kopā ir šo lietu nosaukumi un īsi apraksti 92 dažādā valodā, 1 461 000000 saites uz attēliem, 5,5 miljoni saišu uz tīmekļa lapām, 4,8 miljoni saišu uz ārējām RDF datu kopām, 565 000 Vikipēdijas kategoriju un 75 000 YAGO kategoriju. Izmantojot šo datu kopu, iespējams kombinēt informāciju no vairākiem Vikipēdijas šķirkļiem vienlaicīgi. Piemēram, sagatavojot informāciju par rakstnieka darbiem, dati var tikt iegūti gan no autora šķirkļa, gan no atsevišķu rakstu darbu šķirkļiem.

DBpedia projekta sagatavotajām datu kopām tiek lietots RDF datu formāts. 2010. gada aprīlis datu kopa satur 1 miljardu informācijas vienību (RDF trijniekus). No tiem 257 miljoni trijnieku iegūti no angļu, un 766 miljoni no citu valodu Vikipēdijām.[6]

Piemērs[izmainīt šo sadaļu | labot pirmkodu]

Pret DBpedia savākto faktuālo informāciju iespējams izpildīt vaicājumus, kuru atbilžu sagatavošanai būtu nepieciešama informācija no daudz dažādiem Vikipēdijas šķirkļiem. Vaicājumus formulē SPARQL valodā, tā ir RDF datiem paredzēta valoda, līdzīga SQL. Piemēram, iedomāsimies, ka interesējamies par japāņu mangas seriālu Tokyo Mew Mew un vēlamies atrast šī seriāla ilustratora citus darbus un to žanrus.

Tā kā DBpedia informāciju no Vikipēdijas šķirkļiem apkopo vienā datu kopā, ar šo vaicājumu varam iegūt interesējošo informāciju, pat precīzi nezinot, kurā Vikipēdijas šķirklī atrodas katrs informācijas fragments:

 PREFIX dbprop: <http://dbpedia.org/property/>
 PREFIX db: <http://dbpedia.org/resource/>
 SELECT ?who ?WORK ?genre WHERE { 
  db:Tokyo_Mew_Mew dbprop:illustrator ?who .
  ?WORK  dbpprop:author ?who .
  OPTIONAL { ?WORK dbpprop:genre ?genre } .
 }

Lietojumi[izmainīt šo sadaļu | labot pirmkodu]

DBpedia datu kopa ir RDF līmenī saistīta ar citām tīmeklī brīvi pieejamām datu kopām. Programmas var DBpedia datus izmantot un papildināt ar informāciju no šīm saistītajām datu kopām. 2010. gada aprīlis eksistē vairāk kā 4,8 miljoni saišu starp DBpedia un ārējām datu kopām, tai skaitā: Freebase, OpenCyc, UMBEL, GeoNames, MusicBrainz, CIA World Fact Book, DBLP, Project Gutenberg, DBtune, Jamendo, Eurostat, Uniprot, Bio2RDF, ASV cilvēku skaitīšanas dati. [7][8] Saites uz DBpedia satur Thomson Reuters OpenCalais, avīzes New York Times Linked Open Data projekti un Zemanta pakalpojums.[9][10][11] BBC izmanto DBpedia savu datu sakārtošanai.[12][13] Faviki ļauj veidot semantiskas birkas (tags), izmanto DBpedia.[14]

Amazon piedāvā DBpedia datu kopu ērtā formā izmantošanai Amazon Web Services platformā.[15]

Skatīt arī[izmainīt šo sadaļu | labot pirmkodu]

Ārējās saites[izmainīt šo sadaļu | labot pirmkodu]

Atsauces[izmainīt šo sadaļu | labot pirmkodu]

  1. DBpedia 3.5 released
  2. Christian Bizer, Jens Lehmann, Georgi Kobilarov, Soren Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann, DBpedia - A crystallization point for the Web of Data. Web Semantics: Science, Services and Agents on the World Wide Web, Volume 7, Issue 3, The Web of Data, September 2009, Pages 154-165, ISSN 1570-8268
  3. Komplett verlinkt - Linked Data (German). 3sat (2009-06-19). Atjaunināts: 2009-11-10.
  4. Sers Tims Bērnerss-Lī sarunā ar Talis par Semantisko tīmekli. Intervijas atšifrējums angliski, ierakstīts 2008. gada 7. februārī.
  5. , http://wiki.dbpedia.org/Team. Atjaunināts: 2009-11-23
  6. DBpedia dataset. DBpedia. Atjaunināts: 2008-09-26.
  7. , http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/LinkStatistics. Atjaunināts: 2009-11-24
  8. , http://esw.w3.org/topic/TaskForces/CommunityProjects/LinkingOpenData/DataSets/Statistics. Atjaunināts: 2009-11-24
  9. First 5,000 Tags Released to the Linked Data Cloud. open.blogs.nytimes.com. Atjaunināts: 2009-11-10.
  10. Life in the Linked Data Cloud. www.opencalais.com. Atjaunināts: 2009-11-10. "Wikipedia has a Linked Data twin called DBpedia. DBpedia has the same structured information as Wikipedia – but translated into a machine-readable format."
  11. Zemanta talks Linked Data with SDK and commercial API. blogs.zdnet.com. Atjaunināts: 2009-11-10. "Zemanta fully supports the Linking Open Data initiative. It is the first API that returns disambiguated entities linked to dbPedia, Freebase, MusicBrainz, and Semantic Crunchbase."
  12. European Semantic Web Conference 2009 - Georgi Kobilarov, Tom Scott, Yves Raimond, Silver Oliver, Chris Sizemore, Michael Smethurst, Christian Bizer and Robert Lee. Media meets Semantic Web - How the BBC uses DBpedia and Linked Data to make Connections. www.eswc2009.org. Atjaunināts: 2009-11-10.
  13. BBC Learning - Open Lab - Reference. bbc.co.uk. Atjaunināts: 2009-11-10. "Dbpedia is a database version of Wikipedia. It's used in a lot of projects for a wide range of different reasons. At the BBC we are using it for tagging content."
  14. Semantic Tagging with Faviki. www.readwriteweb.com.
  15. Amazon Web Services Developer Community : DBPedia. developer.amazonwebservices.com. Atjaunināts: 2009-11-10.