flickr galerie | Twitter @Padáček | Facebook profil | Foursquare profil | LinkedIn profil

Zápisky.info


01.12. 2008

Nekompletní podpora SPARQL OPTIONAL v PHP frameworcích

Během práce na komunitní stránce Knowledge Engineering Group, která je kompletně implementována nad RDF úložištěm, jsem narazil na jeden problém s nekompatibilitou se standardem SPARQL. Používali jsme framework RDF API for PHP, což je téměř zažitý standard pro PHP aplikace pracující s RDF. Nyní popíšu náš případ užití. Měli jsme v úložišti několik instancí typu foaf:Group; některé měly jeden atribut foaf:name, jehož hodnotou bylo jméno v anglickém jazyce a jiné měly dva atributy foaf:name, jeden v angličtině a druhý v češtině. Jedním dotazem jsme chtěli zvolit obě jména a zobrazit je v XHTML editoru. SPARQL dotaz vypadal následovně:

Pokračování »

20.11. 2007

Týdenní návštěva Koblenze

Zatímco někteří strojvůdci německý drah stávků, ten v ICE 125, kterým se snažím dostat na vlak z Frankfurtu do Prahy, řídí jak má a tak se vlak 300vkou řítí po dráze :) byl jsem tento týden na univerzitě v Koblenzi „oficiálně“ navštívit Simona Schenka a pomoci mu s implementací některých výzkumných projektů. Byla to příjemná týdenní práce plná Javy, Continuous Integration a sémantického Webu. Proto si dovolím představit, s čím jsme pracovali a co tvořili.

Pokračování »

07.10. 2007

Exporty DOAP metadat projektů, připomínky

KEGweb již poskytuje první RDF metadata pomocí exportů. Aktuálně lze získat popis softwarových projektů a také popis jednotlivých projektů, viz. stránky jednotlivých projektů. Exportovaná metadata používají schéma DOAP. Ukázkové RDF jsem uvedl v minulém příspěvku.

Neb export byl poměrně chudý (pouze titul, krátký popis a domovská stránka projektu), napsal jsem do mailing–listu doap-interest, které vlastnosti by bylo dobré přidat. Odpověď byla stručná, ale hodnotná. Opět jsem se ale podivil nad jednou věcí. Vlastnost rdfs:seeAlso je sice definována obecně, co se formátu cílového zdroje týká:

rdfs:seeAlso is an instance of rdf:Property that is used to indicate a resource that might provide additional information about the subject resource.

A triple of the form: S rdfs:seeAlso O

states that the resource O may provide additional information about S. It may be possible to retrieve representations of O from the Web, but this is not required. When such representations may be retrieved, no constraints are placed on the format of those representations.

The rdfs:domain of rdfs:seeAlso is rdfs:Resource. The rdfs:range of rdfs:seeAlso is rdfs:Resource.

Tak proti této specifikaci většina vývojářů přijímá předpoklad, že cílovým formátem je vždy RDF. Proto jsem musel dle toho upravit hodnoty rdfs:seeAlso v databázi KEGwebu.

Zaujal mě i odkaz na stránky Apache Foundation, kde dokumentují jedno rošíření schématu DOAP o zápis implementovaných standardů. Tím můžete uvést, že „projekt X implementuje specifikaci Y“, kterou můžete celkem detailně popsat, třeba:

@prefix asfext: <http://projects.apache.org/ns/asfext#> .

<:rdfschema>
  asfext:title "RDF Vocabulary Description Language 1.0: RDF Schema" ;
  asfext:body "W3C" ;
  asfext:id "RDF Schema" ;
  asfext:url <http://www.w3.org/TR/rdf-schema/> ;
  a asfext:Standard .

To by následně poskytlo možnost prohledávat projekty podle použitých technologií.

30.09. 2007

Linked Data pro projekty katedry

Již delší dobu pracuji na stránce a projektu KEGweb, která prezentuje osoby a aktivity, ve kterých jsou zapojení, z Katedry informačního a znalostního inženýrství VŠE Praha. Stránka skupiny KEG je zvláštní v tom, že v pozadí celé zdánlivě statické stránky je RDF úložiště a data jsou ukládány jako RDF tvrzení o jednotlivých zdrojích.

O tomto prodlouženém víkendu jsem zapracoval na podpoře tzv. Linked Data – znovupoužitelná RDF metadata využívající ustálené schémata / ontologie a zpřístupněná pro využití v dalších datech. Důležité bylo rozlišit informativní a neinformativní zdroje – např. osoba je neinformativní zdroj z pohledu RDF, stránka o této osobě je informativní zdroj. URIref neinformativních zdrojů jsou také „klikatelné“ – po přístupu přes HTTP je vrácena hlavička 303 See Other a také Location s adresou informativního zdroje.

Využil jsem schématu DOAP (prohlédněte si diagram tříd a vlastností), jmenovitě vlastností doap:name, doap:shortdesc a doap:homepage pro popis softwarových projektů katedry. Data jsou uložena v následující podobě (v syntaxi N3):

@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix doap: <http://usefulinc.com/ns/doap#> .

<http://keg.vse.cz/resource/swproject/kegweb>
  rdfs:seeAlso <http://keg.vse.cz/swproject/kegweb> ;
  doap:name "KEGweb" ;
  a doap:Project .

Vidíte, že http://keg.vse.cz/resource/swproject/kegweb je URIref identifikující projekt a http://keg.vse.cz/swproject/kegweb stránka s informacemi o něm. Brzy přibude RDF export, takže bude kdokoliv moci je využít a doplnit o svá tvrzení, agregovat, …

17.05. 2007

SCRUM master potěšil

V úterý časně ráno vystupuju z tramvaje na Maninách a míjí mě zamyšlený SCRUM master mého týmu. Myslel jsem, že jde pro noviny, ale mýlil jsem se! Plnil jen svou práci. Kolegové den před tím na ranním meeting zahlásili jako překážku v práci nedostatek banánů. A náš master se ještě k tomu o něco později dočetl v knize o XP, že základní podmínkou pro dobrou pracovní výkonnost je dostatek jídla na pracovišti a tak nám vyrostl uprostřed kanceláře banánovník …

Vložil Padacek v 23:32 | Projekty, workshopy, práce | Komentář: 1 [18.05.07 08:01]

17.04. 2007

On the air! … CZpodcast#8

A máme tady CZpodcast Vol. 8, který má být navázáním na skvělou Filemonovu prezentaci metodik vývoje a SCRUMu. Ale nebyli jsme tak striktní a vznikl z toho volný potlach nad zásadami extrémního programování a SCRUMu. A co tam dělám já? No já jsem ten malý černovlasý uchichtávající se hároš–developer vzadu … ne, sranda. Snad jsem přispěl také něčím hodnotným. A pro zájemce odkaz na zmiňovanou sémantickou aplikaci mé domovské katedry.

05.04. 2007

Večer CZJUG, ráno SCWCD

Už měsíc stránka leží ladem. Ale neflákám se, to ne! Asi před 3 týdny jsem byl na 6 dní služebně do Německa a také něco procestoval. Reportáž z cest možná připravím, ale nic neslibuju. Hlavní náplní celého měsíce bylo studium na zkoušku, kterou jsem spáchal dnes. Teď již s klidným srdcem se dívám na vysvědčení z Sun Certified Web Component Developer for the Java 2 Platform, Enterprise Edition 1.4 a kochám se na strohé » Pass « v rámečku uprostřed stránky.

Pokud by to někoho zajímalo, na zkoušce se probírají servlety, JSP, JSTL, programování vlastních tagů, zabezpečení, enterprise návrhové vzory. Asi nejlepší studijni materiál je kniha Head First Servlets & JSP, která obsahuje i vzorové kontrolní testy. No a také specifikace!

Večer před zkouškou jsem se šel rozptýlit. Filemon dorazil z Evropy (nebo kde se teď pracovně nachází) a v klidu vystřihl na CZJUGu dvouhodinou prezentaci o metodikách vývoje a nejen jeho preferovaném SCRUMu. Pozornější jistě poznali na slidech, že Filovo srdce v rytmu rapu bije! – na slidech jsem objevil min. jednu citaci Headdyho a něco i z Ali G In Da House. A asi nejvtipnější poznámka? „… no já SCRUM použil i na stěhování, ale některé lidi jsem tím naštval …

Filemon během přednášky na CZJUGu

02.03. 2007

Cvičil jsem programování aplikací sémantického Webu

Dnes, tj. 2.3. 2007, jsem byl v rámci svého působení na Katedře informačního a znalostního inženýrství VŠE Praha k výuce předmětu 4IZ440 Reprezentace a zpracování znalostí na WWW. Na dnešním cvičení jsem přednesl hrubý úvod do programování aplikací nad RDF daty, použití API a jejich různé způsoby přístupu k datém – v praktických ukázkách s využitím knihovny Jena se cvičila práce s „triple–based modelem“ a dotazování pomocí jazyka SPARQL. Ke stažení nabízím prezentaci, ukázková data (jde o data pro připravovanou katedrální komunitní stránku) a také zdrojové kódy příkladů. Pro jejich spuštění jsou nutné knihovny JUnit 3.8.1 a Jena 2.5.2.

Ke stažení: prezentace, ukázková data, zdrojové kódy příkladů.

Jen bych rád ještě poznamenal, že SPARQL jsem se naučil až včera při psaní ukázek a prezentace. Pro studium byla výborná SPARQL reference guide a pro ladění dotazů on–line editor.

06.02. 2007

NOVÝ K-Space Newsletter Issue 2

Byl nasázen během konce prosince / začátku ledna a ve svém obsahu přináší informace o tom, co je nového v K–Space, poznámky k zajímavým akcím a hlavně, co za nové toolíky partneři v projektu zapojení vyvinuli. Doporučuji přečíst.

02.01. 2007

What is K–Space about?

V následujícím článku chci všem zvědavým prozradit, co je obsahem projektu K–Space a jaké jsou mé aktuální povinnosti v něm.

What is K–Space about?

By Craig Stewart (Queen Mary, University of London)

K–Space is a network of leading research teams from academia and industry conducting integrative research and dissemination activities in semantic inference for automatic and semi–automatic annotation and retrieval of multimedia content. K–Space exploits the complementary expertise of project partners, enables resource optimization and fosters innovative research in the field.

The aim of K–Space research is to narrow the gap between low–level content descriptions that can be computed automatically by a machine and the richness and subjectivity of semantics in high–level human interpretations of audiovisual media: The Semantic Gap.

Specifically, the K–Space integrative research focuses on three core areas:

  1. Content–based multimedia analysis: using tools and methodologies for low–level signal processing, object segmentation, audio/speech processing, text analysis and audiovisual content structuring and description
  2. Knowledge extraction: through building a multimedia ontology infrastructure, knowledge acquisition from multimedia content, knowledge–assisted multimedia analysis, context based multimedia mining and intelligent exploitation of user relevance feedback
  3. Semantic multimedia: using knowledge representation for multimedia, distributed semantic management of multimedia data, semantics–based interaction with multimedia and multimodal media analysis

An additional objective of the Network is to implement an open and expandable framework for collaborative research based on a common reference system.

The specific dissemination objectives of K-Space include:

  • To disseminate the technical developments of the network across the broad research community
  • To boost technology transfer to industry and contribute to related standardization activities.

Další informace poskytne oficiální projektová stránka kspace-noe.net a také volně distribuované informační materiály.

A co s tím mám společného já?

V jádru toho všeho je sémantický Web a o ten jsem se zajímal již na gymnáziu. Někteří si možná vzpomínají, že minulý rok jsem na semináři KEG přednášel o FOAFu. Na Katedře informačního a znalostního inženýrství se vyskytuji stále. Působím jak ve zmíněné skupině, tak na projektu K–Space. Na starosti mám různé maličkosti — dával jsem dohromady třeba zmiňovaný newsletter (grafiku jsem dostal hotovou) a tedy využil znalost práce s Adobe InDesign. V současné době se snažím pomalu proniknout do API Sesame2. Budou se v něm implementovat některé nástroje a využije se hlavně integrované RDF repository.

Součástí mého působení byla účast na dvou pravidelných meetincích – v září v Grazu a v prosinici v Aténách. Úkolem bylo diskutovat průběh ve svěřených pracovních skupinách, redakční práce na newsletteru a pár dalších maličkostí. Fakt, že jsem student VŠE a druhého ročníku bakalářského studia oboru aplikovaná informatika nemá na mé práci pro katedru a na projektu vliv.

Vložil Padacek v 01:34 | Projekty, workshopy, práce | Komentáře: 2 [06.01.07 21:09]

Navigace

Vyhledávání

 Vyhledávání 

Povolené operátory: AND, OR a NOT

Kategorie

Nejčtenější

Poslední komentáře

  • koles: dobry!...
  • Josef Petrák: [1] Hned, jak ho celé přebagruju ;-) korektury byly kruté....
  • HoNem: eště že ten newsletter sázíš, jinak bys ten článek snad musel smolit sám :D Možná sis všimnul, že tenhle text...
  • Jan Renner: [3] Potvrzuju, že v Opeře OK :) Pěkné je to....
  • Lucien144: [1] Melo by to byt opraveno. Testoval jsem jeste:IE 6,7 @ WinXPFF1.5 @ WinXPSafari 2 @ MacOSOpera 8.x, 9.x @...

Odkazy

Statistiky návštěvnosti [TOPlist]
PageRank Checking Icon
Valid XHTML 1.0 Strict

Obsah © 2004 – 2006 Josef Petrák

Grafika © 2004 Dlouhý Webdesign

Redakční systém BLOG:CMS