24.07. 2010
Zveřejníme akademické projekty, samozřejmě sémanticky
Sémantický web, RDF a další příbuzné technologie nemusí být jen hračkou pro akademiky a nástrojem pro pokročilé analyzování informací. Vyvíjím webovou prezentaci pro Knowledge Engineering Group, uskupení výzkumníků při VŠE Praha, kteří se zajímají o znalostí inženýrství. Vsadil jsem na PHP jako framework, na RDF jako datový model a vidím v tom výhody. Aktuálně dokončuji seznam akademických projektů, na kterých se tato skupina podílí a proto následujícím tutoriálem předvedu, jak lehce lze s RDF pracovat využít jej jako interní datový model ve webové aplikaci. Chcete–li před čtením toto článku absolvovat lehký úvod do sémantických webových technologií, přečtěte si Parsování FOAF s PHP, překlad tutoriálu pro jeden z RDF frameworků, které je možné využít ve skriptovacím jazyce PHP. Pro náš aktuální příklad ale budeme pracovat s jiným — ARC2.
21.06. 2010
Tam, kde skončil posterous
Posterous je hodně zajímavá služba. Až tolik, že jsem uvažoval tento skomírající blog odstřelit a pokračovat v psaní na nové adrese zapisky.jspetrak.name publikované právě přes tuto službu. A může za to opět Aristo, že jsem si to rozmyslel. Prý jsou Zápisky.info jeho nejoblíbenější český blog o sémantickém webu. No, možná zároveň je i jediným, kde se o sem. webu psalo, že? Nechtěl jsem míchat své hrátky coby šéfredaktor elektronického magazínu o drahách s IT, ale asi se to snese. Takže tam, kde skončil posterous, Zápisky.info pokračují. A dva články, které jsem na posteru publikoval, překopíruju sem. Jedeme dál!
04.05. 2010
V zajetí kočkovitých šelem a sociálních sítí
Opět nám změnili Facebook. Stejně jako kdykoliv předtím se novinky objevily bez varování a byly postupně uvolněny mezi jednotlivé uživatele. Tentokrát padla za oběť profilová stránka uživatelů – metodou navýsost brutální se pokusili FB–inženýři namapovat jednotlivá klíčová slova v profilech lidí namapovat na existující fandovské stránky. Pokud chyběla, vznikla prázdná. „Obsah budete moct přidat, až to dovolíme,“ zní jednoduché instrukce. Kromě toho všem promazali stávající data a přenastavili nastavení soukromí (viz NY Times). Kupodivu tentokrát nevznikaly nesmyslné skupiny odporu. Že by konečně změna? Spíš rezignace při pohledu na promazaný profil. Jediné, co se mi na tom celém líbí, je, že odteď může mít fanoušky cokoliv a kdokoliv – třeba pozice šéfredaktora magazínu ŽelPage.
A já žil v bludu. Měl jsem za to, že pro používání Foursquare potřebuju telefon s GPS. Chyba, díky m.foursquare.com a ručnímu hledání lokací lze dělat „check–in“ třeba pomocí jakéhokoliv mobilu s prohlížečem a nebo na počítači. Nechal jsem se tedy zlákat, založil si účet a teď zjišťuju, k čemu to reálné může být. Sunfreedom mi ale včera vyjmenoval hned dva důvody, proč dát od Foursquare ruce pryč: 90 % lidí nevypisuje žádné doporučení/doplňující informace a hlavně – co na to stalkeři?
03.05. 2010
Tenká hranice objektivního článku a PR
Arthur Dent a Miloslav Lešetický (Plaváček) mi dnes znovu připomněli existenci systému Placla. Ten poskytuje možnost zadat poptávku po placených článcích s tím, že zájemci si podle svého zaměření vybírají a na své stránky příslušné texty po zpracování vystaví. Původně jsem slovo „své“ přehlédl a měl za to, že se jedná o tržiště copywriterů a pracovních nabídek.
Nedávno autoři Placly oslovili i náš internetový magazín ŽelPage. Odmítli jsme na základě faktu, že se snažíme být nezávislí, objektivní, nehledě na to, že celý náš projekt je postaven na dobrovolnosti přispěvatelů a nekomerční bázi. Nebudu operovat s termínem novinářská etika, přestože publikujeme pod oficiálně přiděleným ISSN. Většina našich čtenářů totiž redaktory magazínu za novináře nepovažuje a obdobně se tváří i Syndikát novinářů ČR. Nicméně se snažíme tyto principy ctít. Naopak, naši činnost zaštiťuje občanské sdružení. To má navíc otevřený bankovní účet, do kterého může každý nahlédnout. I přesto, že na něm žádná sponzorská platba zatím nepřistála, někteří nás z úplatků podezřívají po vydání každého článku na mediálně propírané téma. Zejména v posledním týdnu.27.03. 2010
Ontologie AIISO Roles pro pozice lidí
Na KEGwebu máme seznam lidí, kteří ve skupině aktuálně působí. Chtěl jsem je roztřídit podle pracovního zařazení a – stejně jako vždy předtím – použít již hotovou a používanou ontologii namísto vytváření nové. Na posledním konferenčním hovoru jsme se shodli, že použijeme AIISO Roles, ale nepůjde to ukamžitě. Nemohl jsem včera uvěřit, že nejsou schopní za 2 roky opravit překlep v názvech vlastnosti z RDF Schema a ani nedoplní popisky s názvy rolí. Tak, místo, abych ji jen načetl do databáze a napsal UI k přiřazování rolí k lidem, sháním tvůrce, aby ji opravili… Zaujal mě ale samotný vocab.org, který je freewarovým úložištěm pro ontologie a provozuje jej Ian Davis.
16.02. 2010
Ontologie pro relace mezi lidmi aktualizována
V současnoti existují 3 různé ontologie pro popis osob, resp. kontaktů – FOAF, RDF/vCard a W3C kontakty. Všechny tři jsem stručně představil před pár dny, když byla aktualizována ontologie pro vCard. Nejvíce jsou používané právě první dvě jmenované, kdy někteří autoři jejich doménu – osoby vs. kontakty – volně zaměňují a jiní naoapak striktně odlišují. Pro spojení osoby/organizace s její vizitkou jsem navrhl přidat do FOAFu vlastnost foaf:businessCard, ale její design je zatím ve stádiu diskusí na projektové wiki a netuším, zdali a kdy se do specifikace dostane.
Dnes prodělala změnu ontologie, která dlouhou dobu rozšiřuje možnosti vyjádření vztahu mezi osobami. Zatímco FOAF nabízí pouze oboustranný vztah „někdo zná někoho“, ontologie Relationship nabízí nejen obdobnou obecnou vlastnost, která ale nabízí jednostranný vztah, ale i další přesnější typy vztahu. „Přítel někoho“, „zaměstnán někým“, ale třeba i „chtěl by ho poznat“, to vše se nachází v jejím pojmovém aparátu. Podle diskusí se ale ukázalo, že zatímco lidský popis vlastností byl správný, vlastní návrh ontologie obsahoval chyby.
Vlastnost rel:knowsOf byla původně vlastností odvozenou od foaf:know. Nyní je tomu naopak. Už jen proto, že foaf:knows implikoval oboustranný vztah. Dále některé vlastnosti definují vztah osob, kdy se fakticky znát nemusí, např. „chtěl by znát“, ale přitom tyto vlastnosti byly odvozené od vlastnosti, která vynucovala fakt, že se osoby již znají. Nyní je tedy design ontologie očištěn a můžeme jen doufat v její širší použití. Ian Davis udělal dobrou práci!
Alternativa ze světa mikroformátů
Kromě FOAF lze ale kombinovat nejen s ontologií Relationship, ale i s další, nazvanou XFN, která má svůj původ v mikroformátech. Na blogu jsem ji používal již před několika lety a dokonce jsem přeložil generátor takových metadat do češtiny. Nyní se dočkal i tento mikroformát své ontologie. Všechny z vlastností jsou odvozené od foaf:knows. Protože jsou však v XFN jako relace používány hypertextové odkazy mezi stránkami, slouží tyto stránky jako „proxy“ identifikující jednotlivé osoby. V tom je tato technologie trochu krkolomná a uvidíme, jestli najde nějaké širší uplatnění.
10.02. 2010
Sjednocení zápisu vCard v RDF
Formát vCard je asi většině známý. Slouží pro zápis osobních vizitek a výměnu kontaktů. Čte ho vše od Microsoft Outlook po AddressBook.app na Mac OS X. Chcete–li mít svou vizitku čitelnou pro aplikace sémantického webu, musíte mít k dispozici ontologii pro popis takových dat. Mapování vCard do RDF bylo definováno už před devíti roky. Poznánka W3C Representing vCard Objects in RDF/XML načrtla první koncept, jak by se daly tyto data transformovat do RDF trojic. Pět let na to, s využitím doporučení pro správnou tvorbu schémat a ontologií, byla navržena podmnožina z vCardu, která se snáze používá. Členský návrh W3C An Ontology for vCards shrnuje dostupné a doporučené elementy, stejně jako na ukázkách demonstruje, jak zapsat jednotlivé dílčí informace. Děvět let bez dvou dnů po zveřejnění prvně zmíněné poznámky vychází aktualizovaná verze, kdy Representing vCard Objects in RDF zohledňuje doporučení, které se vývoj a praxí se sémantickým vCard získaly. Součástí dokumentu je také ještě více příkladů a stručný souhrn obsahu ontologie.
vCard ale není jedinou ontologií pro popis osob, která existuje. Přímou alternativou pro popis kontaktů je také W3C ontologie pro kontakty vyvinutá v rámci projektu SWAP. Ta popisuje osoby také jako kontakty s e–maily, telefonními čísly, atd. Třetí a nejméně důležitou je ontologie FOAF. Ta je z těchto tří asi nejvíce populární na sémantickém Webu. Popisuje osoby, základní informace o nich a také vztahy mezi nimi. I když poskytuje pouze jediný vztah foaf:knows, stala se díky tomu populární, ba přímo must–have pro sociální aplikace na sémantickém Webu.
Chtete–li propojit vCard a FOAF, řešení existuje. Na projektu OpenVocab byla vytvořena vlastnost ov:businessCard, která dovoluje připojit k objektu vizitku – ať už k osobě, skupině nebo organizaci. Její definice je ale označná jako nestabilní. Nabízí se tedy možnost, aby se taková vlastnost zařadila přímo do FOAFu. Téma mixování vCardu a FOAFu jsem také trochu (nechtěně) nakousl na mailing–listu foaf-dev, kde se nakonec konsensus nenašel. Podle všeho ale foaf:Person (osoba) a vc:VCard (vizitka) nemůžou být to samé.
V současné době také vzniká přehled, co mají ontologie vCard, PIM a FOAF společného a jak je mapovat na sebe.
04.02. 2010
Skriptování webových aplikací s RDF a SPARQL
Znalosti 2010 — 9. ročník série česko–slovenské konference o získávání, zpracování, zpřístupňování a správy znalostí se letos koná v Jindřichově Hradci. Zatímco v roce 2008 v Bratislavě jsem prezentoval tehdejší práci na distribuovaném dotazování více databází pomocí Sesame 2, letos nabízím téma bližší programování dynamických webových stránek. Základem je velmi stručně představit, že lze programovat webové stránky pomocí RDF frameworku a dotazovacího jazyka SPARQL, který dotazuje informace v databázi. Pro prezentaci informací pak volím XHTML+RDFa. Přesně tak programuju KEGweb — komunitní stránky výzkumné skupiny na Katedře informačního a znalostního inženýrství VŠE Praha. Jádrem všeho je databáze a knihovna ARC2, se kterou se pracuje velmi dobře. Myslím, že bude stát za to představit, jak se s RDF/SPARQL dá programovat a jak s tímto „stackem“ psát webovou aplikaci. Prozatím přikládám mnou publikované materiály — konferenční poster Case Study on Linked Data and SPARQL Usage for Web Application Development ve spoluautorství s Aristem a Vojtou Svátkem ze skupiny KEG.
Ke stažení: text článku (PDF), plakát (PDF)
Vzkazy z konference najdete na Twitteru pod tagem #znalosti2010.
18.12. 2009
FOAF a jeho aktualizace 0.96 – první zásadní změny
Schéma FOAF a jeho specifikace byla po dva roky téměř beze změny. Téměř jedinou úpravnou bylo přidání vlastnosti foaf:openid pro přiřazení OpenID identifikátoru k agentovi (zejména osobě). 15. 12. 2009 byla zveřejněna aktualizace 0.96 Amsterdam Edition, která vyjma editorských úprav obsahuje také zásadnějí revize některých pojmů ve schématu. Některé z vlastností, které jsou málo používané nebo špatně specifikované, jsou označeny za archaické. U třech bylo z důvodu nedodržení jmenné konvence navrženo nové znění a současné taktéž označeno za zavržené. Navíc, jak uvedla Libby Miller v oznámení, další větší aktualizace bude brzy následovat.
28.08. 2009
Jak získat SQL dotaz z View v Oracle
Dnes přidám jen jeden tip pro ty, co hledají stejně dlouho v dokumentaci Oracle databáze jako já, jak pracovat s pohledy. Máte–li „view“ (pohled) nad tabulkami v databázi a chcete, zjistit, jaký SQL dotaz se vykonává, dá se jednoduše získat dotazem:
SELECT text
FROM all_views
WHERE view_name = '%VIEW_NAME%';