Nepomuk

From KDE Wiki Sandbox
Revision as of 17:38, 8 February 2012 by Abella (talk | contribs)

Nepomuk

L'objectiu d'aquesta pàgina no és explicar plenament la tecnologia Nepomuk i cada detall, però ens donarà una breu visió general, alguns exemples, comparteix el que hi ha al darrere i enllaça a informació pertinent al web.

Una breu explicació

Tal com esmenta el Glossari, Nepomuk tracta la classificació, organització i presentació de les dades. No és una aplicació, sinó un component que poden utilitzar els desenvolupadors dins de les aplicacions.

Proveu en el Dolphin

Per exemple, el gestor de fitxers Dolphin fa ús de Nepomuk. Per al següent Nepomuk i Strigi han d'estar activats a Arranjament del sistema -> Cerca a l'escriptori. La barra d'informació de Dolphin (Visualitza -> Plafons -> Informació, o premeu F11) presenta informació extreta de Strigi sobre el fitxer seleccionat, i us permetrà assignar etiquetes, valoracions i comentaris als fitxers. Aquesta informació s'emmagatzema en Nepomuk i catalogada per Strigi. A continuació, podeu cercar metadades utilitzant la barra de navegació de Dolphin. Escolliu Edita -> Cerca... o premeu Ctrl+F i cerqueu per noms de fitxer o contingut del fitxer.


Funcionalitats

Nepomuk ofereix diverses «capes» de funcionalitat per a les aplicacions. La primera i més simple d'elles és l'etiquetatge manual, valoracions i comentaris, com s'usen en Dolphin. Això us ajudarà a trobar els fitxers més ràpidament, però també suposa molt treball.

Per a facilitar la cerca de fitxers que continguin un cert text, Nepomuk ofereix una segona funcionalitat: indexar el text dels fitxers. Per a fer-ho utilitza una tecnologia anomenada Strigi. Podeu cercar fitxers introduint algunes paraules que sabeu que hi són, o simplement el seu títol (o una part d'aquest).

La tercera capa és molt més complexa, i el motiu és que Nepomuk ha estat concebut com un projecte d'investigació de diverses companyies i universitats de la Unió Europea. Aquí trobareu paraules difícils com «escriptori semàntic» i «ontologies». Bàsicament, es tracta de contextos i relacions.

Indexació de fitxers

Strigi no indexa tots els fitxers que hi ha al disc dur. La seva configuració per omissió en la majoria de les distribucions de Linux exclou alguns patrons comuns per als fitxers de còpia de seguretat i directoris de configuració, i només els indexa certs directoris a la vostra carpeta d'inici. Ho podeu canviar a Arranjament del sistema -> Cerca a l'escriptori -> Carpetes d'índex de l'escriptori -> Personalització de les carpetes d'índex... -> Carpetes d'indexació de l'Strigi.

Tingueu en compte que Strigi del KDE 4.7 no segueix els enllaços simbòlics (bug #208602), fins i tot encara que seleccioneu les carpetes sota l'enllaç simbòlic per a la indexació (bug #287593). (Un enllaç simbòlic és un fitxer que «apunta» a un altre fitxer o directori; el Dolphin mostra els enllaços simbòlics en cursiva). Haureu de trobar la ruta cap al directori actual (en Dolphin, seleccioneu el fitxer, escolliu Propietats -> General -> Apunta a) i indiqueu-li a Strigi per a que l'indexi.

En Arranjament del sistema també podeu controlar si els Strigi indexarà els fitxers als en suports extraïbles com ara unitats USB i CD-ROM.

Exemples

Permetin-me mirar d'explicar què ofereix Nepomuk usant dos exemples.

Relacions

Diguem que heu rebut una fotografia d'un amic, fa dues setmanes, i l'heu desada en algun lloc al vostre ordinador. Com trobareu ara aquest fitxer? Tret que sapigueu la ubicació, no té bona pinta.

Nepomuk té com a objectiu ajudar-vos. Sabeu que aquest fitxer us el va enviar aquest amic, però el vostre ordinador no. Nepomuk, no obstant, pot recordar aquesta relació. De manera que en cercar el nom de l'amic aparegui la fotografia!

Una altra possible relació és entre una pàgina web de la qual heu copiat text i el document en el qual l'heu enganxat, o dues imatges mostrant el mateix cotxe. Aquestes relacions de vegades poden ser extretes dels propis fitxers (podeu analitzar fotografies i veure qui o què hi apareix) o proporcionades per les aplicacions involucrades (com en l'anterior exemple sobre correu electrònic). Aquesta part de Nepomuk està encara sota un fort desenvolupament, i necessita integració amb les aplicacions, per la qual cosa pot trigar uns quants anys fins que de debò brilli.

En conjunt, aquesta part de Nepomuk tracta de fer cerques intel·ligents. Pensa sobre com Google intenta ser intel·ligent amb les teves cerques: quan cerqueu un hotel i el nom d'una ciutat, mostra sobre els resultats d'un lloc web un mapa que mostra hotels a la ciutat esmentada. Fins i tot pot suggerir-vos un nom millor en el cas que hageu comès un error ortogràfic. Google també mira de posar la informació més apropiada al començament de la llista de resultats, utilitzant complexos càlculs sobre relacions (enllaços) entre pàgines web. Nepomuk serà capaç d'oferir aquest tipus de resultats intel·ligents i ordenar-los segons la seva adequació utilitzant la informació sobre relacions.

Contextos

Aquestes relacions no solament poden ajudar-vos a cercar fitxers, sinó que també tenen influència en les aplicacions i en la informació que presenten. Tingueu en compte que aquesta forma d'usar Nepomuk és més una visió que una realitat! Molts dels components estan en el seu lloc, però no han estat integrats en les aplicacions ni en l'escriptori en el seu conjunt.

Vet aquí un exemple de com el portar la informació contextual al vostre escriptori pot ajudar-vos a treballar de forma més eficient.

Diguem que esteu treballant per acabar algunes notes agafades en una reunió. Sona el telèfon i algú us demana si podeu cercar el full de càlcul amb preus i adaptar-lo a un client. Després d'algunes interrupcions més descobriu que el vostre escriptori està ple de fitxers i finestres...

Estaria bé poder-ho organitzar tot una mica millor, oi?

Entren en joc les «activitats». Aquestes han estat introduïdes en Plasma, i actualment ofereixen diferents «escriptoris». Són similars als escriptoris virtuals, però on el que canvia és l'escriptori en si, no les aplicacions. Conté diferents estris, fons de pantalla i coses així. Per descomptat, des de KDE 4.3, cada escriptori virtual pot tenir la seva pròpia activitat, amb els dos en sincronia.

Si les aplicacions i l'escriptori estiguessin al tant de les activitats, podríeu crear una activitat per a cadascuna de les tasques en les quals treballeu regularment. Per tant, si normalment canvieu a un full de càlcul amb preus, podeu crear una activitat per a això: posant un estri de Vista de carpeta (o varis) en l'escriptori, afegint una calculadora i un estri de tasques pendents per a seguir la pista del que encara s'ha de canviar. Potser fins i tot un estri de carpetes de correu electrònic mostrant els correus amb preguntes relacionades amb aquest full de càlcul!

Tan aviat com algú faci una pregunta sobre preus, canvieu a aquesta activitat, i ja podeu treballar amb la vostra aplicació de fulls de càlcul. És conscient de la vostra activitat pel que us mostra fulls de càlcul de preus recents, no la recent llista de l'inventari en la qual esteu treballant en una altra activitat! Kopete, l'aplicació de xat, ens mostra als companys que ho saben tot sobre els preus, ja que són les persones amb les quals parleu sempre que treballeu en aquesta activitat.

Quan acabeu, torneu a l'altra activitat i una vegada més totes les aplicacions ajustaran el seu comportament al que estigueu fent.

Els beneficis d'aquesta forma de treball basada en activitats van més enllà del que pugueu esperar al principi. No solament us ajuda a trobar els vostres fitxers i contactes, també a commutar tasques per si mateix. El cervell humà no és molt bo amb tasques múltiples -a la majoria de la gent li porta uns minuts agafar velocitat després de canviar de tasca-. El canvi d'«entorn» ho agilitza, fins i tot si només esteu a la pantalla. Compareu-ho amb l'alegria de fer les maletes per anar-vos-en de vacances!

Per descomptat, l'anterior sobretot serà apropiat per a la gent que treballa amb el seu ordinador en una oficina o a casa. Un jugador o un usuari informal probablement no utilitzaran aquestes activitats.

Tingueu en compte que l'escenari descrit anteriorment encara és molt lluny de la realitat. Gran part de la infraestructura bàsica per a això en KDE està en el seu lloc, però encara queda molt.

Preguntes més freqüents

El següent s'ha agafat d'un missatge dels fòrums del KDE. Si us plau, sou lliure d'afegir/treure/modificar els detalls, si teniu temps!

P. Què és l'escriptori semàntic del Nepomuk, i l'indexador de fitxers de l'escriptori Strigi?

R. L'escriptori semàntic Nepomuk és el fonament de tots els altres mòduls de la infraestructura del Nepomuk. Proporciona una forma d'organitzar, anotar i construir les relacions entre les dades (no només el nom de fitxer i el contingut, sinó per exemple les aplicacions que utilitzen un determinat fitxer, o com és etiquetat aquest fitxer). Una sèrie d'aplicacions i espais de treball del KDE utilitzen aquesta infraestructura bàsica per oferir característiques com ara l'etiquetatge del correu electrònic (KMail) o l'activitat d'arranjament (Plasma).

D'altra banda, l'indexador de fitxers de l'escriptori Strigi és un sistema per indexar fitxers de manera que puguin afegir-se al repositori principal del Nepomuk, una forma convenient per utilitzar-ho dins del Nepomuk sense afegir cap fitxer manualment. A més, les aplicacions, com ara Dolphin poden cercar fitxers basant-se en el contingut, el nom, o altres meta-dades (per exemple, etiquetes) associades als fitxers indexats. Com un indexador també pot indexar fitxers sense text, com fitxers PDF, accedint a les meta-dades contingudes en aquests fitxers (autor, informació sobre publicació, etc.) Alguns components del KDE aporten «analitzadors» addicionals per a més tipus de fitxer. Nepomuk pot funcionar correctament sense utilitzar l'indexador de fitxers, doncs és un component addicional (i opcional).

P. Com puc saber si Strigi ha indexat un fitxer?

R. En Dolphin, seleccioneu el fitxer. Si el plafó d'informació mostra «Created at» i «Has hash» el fitxer serà indexat per Strigi.

P. Com puc deshabilitar l'escriptori semàntic?

R. La majoria de les vegades, la forma més senzilla és deshabilitar la indexació de fitxers, el qual sol ser, entre els components del Nepomuk, el més pesat en la utilització de recursos (encara que s'han inclòs moltes optimitzacions en la versió 4.7 que redueixen aquesta càrrega). Això es fa desmarcant l'opció Habilita l'indexador de fitxers d'escriptori Strigi en la secció Cerca a l'escriptori de l'Arranjament del sistema. En cas que vulgueu deshabilitar totes les característiques semàntiques, desmarqueu l'opció Habilita l'escriptori semàntic del Nepomuk. Tingueu en compte que això també desactivarà la cerca en el gestor de fiters Dolphin.

Tingueu en compte que amb l'última opció alguns programes que utilitzen Nepomuk per al meta-dades oferiran una funcionalitat reduïda: Per exemple, el KMail no serà capaç d'etiquetar el correu o les activitats de Plasma no oferiran característiques addicionals com les icones, o informació de dades als programes.

P. Per què tinc processos nepomukservicestub tot i que he deshabilitat el Nepomuk?

R. Podria ser un error. Si us plau, presenteu un informe d'error amb una descripció completa del vostre problema i els passos per a reproduir-lo.

P. La indexació de fitxers PDF i alguns altres tipus de fitxer no funciona.

R. La indexació de fitxers PDF és un problema conegut i que s'està rastrejant en aquest bug #231936. Si teniu problemes amb altres fitxers, obriu un error, preferiblement afegint un fitxer d'exemple que mostri el problema.

P. El programa nepomukservicestub es bloqueja a l'inici.

R. Un gran nombre de solucions per als bloqueigs han estat solucionades per a la versió 4.7.2 de les àrees de treball i aplicacions del KDE. Si en trobeu més, si us plau, envieu informes d'error amb instruccions detallades sobre com reproduir el problema, ja que de vegades els desenvolupadors no són capaços de provocar-los en les seves configuracions de prova.

P. El procés virtuoso-t es bloqueja en un 100% de la CPU.

R. Virtuoso-t és un component clau de la infraestructura del Nepomuk i en algunes ocasions les ordres enviades pels altres components acaben prenent massa temps (per tant, mostra l'efecte amb la CPU al 100%). En Sebastian Trüg (el desenvolupador principal del Nepomuk) ha solucionat la majoria d'aquests problemes en la versió 4.7.1 o posteriors.

P. De vegades el Nepomuk consumeix massa memòria RAM.

R. Molts d'aquests problemes s'han solucionat, en altres casos, però, els desenvolupadors no són capaços de reproduir els problemes correctament. En aquest cas, el proveir-los d'exemples i casos de prova als informes d'error augmenta les possibilitats d'obtenir una solució.

P. El Nepomuk torna a indexar els fitxers durant l'inici.

R. Aquest error s'ha corregit en la versió 4.7.0. Ara, el Nepomuk «escaneja» per als canvis, sense indexar res més.

P. El Nepomuk accedeix massa al disc durant l'inici.

R. En les versions 4.7 i posteriors aquest problema s'ha reduït gràcies a un mecanisme de limitació implementat en l'indexador de fitxers.

P. La meva base de dades de Nepomuk s'ha corromput. Com la netejo?

R. En el cas extrem que la vostra base de dades estigui molt corrupta i tots els altres intents hagin fracassat, podeu eliminar el directori $KDEHOME/share/apps/nepomuk (on $KDEHOME sol ser .kde o .kde4) mentre no s'està executant el Nepomuk. La base de dades s'esborrarà, però també es perdrà la informació existent, com les etiquetes, les puntuacions i els comentaris.

Solució de problemes avançada

Si Nepomuk té problemes per indexar un fitxer, en una terminal proveu d'executar

nepomukindexer /ruta/al/fitxer

i veure si hi ha algun resultat útil. Podeu comparar la sortida amb la d'un fitxer similar que s'hagi indexat amb èxit.

xmlindexer /ruta/al/fitxer > /tmp/test.xml

genera una representació XML d'algunes de les dades extretes d'un fitxer. La podeu veure en un visor de XML, com ara el vostre navegador, i de nou compareu la sortida amb un fitxer similar. (xmlindexer pot estar en un paquet diferent i opcional en la distribució de Linux, per exemple en Ubuntu és al paquet strigi-utils).

Aquesta entrada de blog explica com activar la sortida de depuració del servei Nepomuk. També mostra com depurar l'ús de la CPU per part de Nepomuk, i del seu dorsal d'emmagatzematge.

Aquest missatge del blog explica com extreure informació útil per informar d'errors quant a l'ús del dorsal Virtuoso.

Compartir i privacitat

Solament vull afegir una cosa més abans d'indicar altres fonts d'informació: intercanvi de les dades de Nepomuk. Seria genial si les vostres marques, puntuacions i comentaris poguessin ser compartits amb els altres quan els envieu els fitxers. No obstant, si heu marcat un contacte amb alguna marca una mica compromesa («avorrit en el llit») i li envieu aquesta informació de contacte personal a un amic en comú és probable que no vulgueu enviar-li també aquesta marca...

Aquest problema s'està considerant i és un tema important d'investigació per part dels investigadors de Nepomuk. De moment, aquestes preocupacions sobre la privadesa, combinades amb reptes tècnics, són el motiu que la informació de Nepomuk sigui privada. Tingueu la seguretat que l'equip de Nepomuk fa tot el possible per respectar la vostra privadesa.

Enllaços externs