Konečně se mi dnes povedlo udělat jednu novou stránku o tom, co všechno na VŠE učím, nebo jsem učil. Zatím toho moc neobsahuje, ale to přijde, věřím tomu. Takže, tady je „výuka na VŠE„, resp. hlavně „dobývání znalostí z webu, alias webmining“
hurráá.
Listopad 13th, 2008
Je to už nějaký pátek, co se obejvil nástroj OpenCalais pro extrakci událostí, pojmenovaných entit a dalších informací, které se v nestrukturovaném textu vyskytují. Funguje to tak, že na libovolný anglický text získáte seznam pojmů, které s v tom textu vyskytují. Malá ukázka:
OpenCalais
Co se dá s takovými informacemi dělat je poměrně jednoduché. Lze je připojit např. na stránku ve wikipedii, můžeme shlukovat dokumenty podle podobnosti a různé jiné – dosud nelehké – úkoly.
Na tomto nástroji je postaven poměrně zajímavý rozšiřující modul pro redakční systém WordPress, který umožňuje během psaní článku tuto extrakci informací a na základě informací navhruje, které fotky by se mohli do článku hodit, zajímavé, že? Mimo to ještě navrhuje, jakými klíčovými slovy by se dal daný článek označit (viz ukázka)
Tagaroo Wordpres plugin
Listopad 13th, 2008