Nepomuk/da: Difference between revisions

From KDE Wiki Sandbox
(Created page with '==Funktionaliteter==')
No edit summary
 
(225 intermediate revisions by 2 users not shown)
Line 1: Line 1:
{{Template:I18n/Language Navigation Bar|Nepomuk}}
<languages />  
<languages />  


=Semantisk søgning=


=Nepomuk=
Formålet med denne side er ikke at forklare KDE's teknologi til semantisk søgning i alle detaljer, men at give et kort overblik, nogle eksempler, visionerne bag og links til relevant information på nettet.


Formålet med denne side er ikke at forklare Nepomun teknologien i alle detaljer, men at give et kort overblik, nogle eksempler, visionerne bag og links til relevant information på nettet.
== Baloo er næste generation af semantisk søgning ==
 
Fra KDE Applications 4.13 erstattes Nepomuk af '[https://community.kde.org/Baloo Baloo]' filindekserings- og filsøgningsfundament. Semantisk søgning  bruger ikke længer en enkelt stor database men forskellige specialiserede databaser for hver type data. De nye søgedatabaser kan findes i <tt>$HOME/.local/share/baloo</tt>. Hvis du har opdateret til KDE Applications 4.12 fra en tidligere KDE-udgivelse, så kan du slette <tt>$KDEHOME/share/apps/nepomuk</tt>.


==Kort forklaring==
==Kort forklaring==


Som nævnt i [[Glossary_(da)#Nepomuk|Ordlisten]] har Nepomuk at gøre med klassifikation, organisering og præsentation af data. Det er ikke en applikation men en komponent, som kan bruges af udviklere i deres applikationer.
Som nævnt i [[Special:myLanguage/Glossary#Nepomuk|Ordlisten]] har semantisk søgning at gøre med klassifikation, organisering og præsentation af data. Det er ikke et program men en komponent, som kan bruges af udviklere i deres programmer.
 
=== Prøv den i Dolphin ===
For eksempel bruger filmanageren [[Special:myLanguage/Dolphin|Dolphin]] søgning. I KDE Applications versioner før 4.13 skulle semantisk søgning være aktiverede i <menuchoice>Systemindstillinger -> Skrivebordssøgning</menuchoice>. Dolphin's sidepanel '''Information''' (<menuchoice>Kontrol -> Paneler -> Information</menuchoice> eller tast <keycap>F11</keycap>) viser information, som søgningen henter frem om den valgte fil og lader dig også knytte mærker, vurderinger og kommentarer til filer. Denne information lagres og indekseres af søgningen. Du kan søge på metadata i Dolphin's navigationslinje. Klik på <menuchoice>Find</menuchoice> i værktøjslinjen eller tast <keycap>Ctrl + F</keycap>, og søg efter et filnavn eller filindhold.
 
<!-- info about nepomuksearch:/ deleted per its developer: "Actually nepomuksearch:/ is an internal thing and should not be entered by the user." its developer -->


=== Prøv den ===
[[Dolphin_(da)|Dolphin]] bruger for eksempel Nepomuk. For at kunne prøve det følgende, så skal Nepomuk og Strigi være aktiverede i ''Systemindstillinger > Skrivebordssøgning''. Dolphin's sidepanel ''Information'' lader dig knytte tags, vurderinger og kommentarer til filer. Denne information lagres i Nepomuk og indekseres af Strigi. Du kan søge på metadata i Dolphin's navigationslinje - skriv "nepomuksearch:/" efterfulgt af søgeordet.


==Funktionaliteter==
==Funktionaliteter==


Nepomuk offers several 'layers' of functionality to applications. The first and most simple of those is manual tagging, rating and commenting, as used in Dolphin. This helps you to find your files faster, but is also a lot of work.
Kde's semantiske søgning tilbyder flere 'lag' af funktionalitet til programmer. Det første og enkleste involverer manuel tagging, bedømmelse og kommentering som i Dolphin. Det hjælper dig med at finde filer hurtigere, men kræver meget arbejde.
 
For at gøre det nemmere at finde tekstfiler tilbyder søgning er anden funktionalitet: indeksering af filernes tekster. Du kan finde filer ved at søge på nogle ord, som du ved, at de indeholder, eller blot på (en del af) deres titel.
 
Det tredje lag er meget komplekst og grunden til, at det underliggende lag, Nepomuk, blev skabt af adskillige firmaer og universiteter i EU som et forskningsprojekt. Det er her, du finder vanskelige begreber som 'semantisk skrivebord' og 'ontologier'. Det handler i bund og grund om sammenhænge og beslægtethed.
 
=== Indeksering af filer ===
 
Søgning indekserer ikke alle filerne på harddisken. Dens standardkonfiguration i de fleste Linux-distributioner udelukker nogle almindelige mønstre for backupfiler og mapper til indstillingsfiler. Du kan ændre på dette i <menuchoice>Systemindstillinger -> Skrivebordssøgning</menuchoice>. Tilføj mapper, som skal ekskluderes. Hvis du ønsker at slå indeksering helt fra, så føj blot din hjemmemepper til her.
 
I '''Systemindstillinger''' kan du også kontrollere om søgning skal indeksere filer på mobile enheder så som USB-drev og CD-ROM'er. I KDE Applications 4.13 er dette ikke muligt, mobile enheder bliver ikke indekserede. Der er planer om at genintroducere denne funktion i fremtidige versioner.
 
==Eksempler==
 
Lad mig prøve at forklare, hvad semantisk søgning kan ved to eksempler. Disse funktioner er endnu ikke fuldt tilgængelige - grundlaget er til stede, men programmernes udviklere skal integrere dem i deres programmer.
 
===Beslægtethed===
 
Lad os sige, at du modtog et foto fra en ven for 2 uger siden. Du gemte det et eller andet sted på din computer. Hvordan finder du nu filen? Hvis du ikke kan huske, hvor du gemte den, så har du et problem.
 
Her prøver den semantiske søgning at hjælpe dig. Du ved, at filen kom fra den der ven &ndash; det ved computeren ikke; men søgningen kan huske 'slægtskabet'. Søger du på din vens navn, så findes fotoet frem!
 
Andre muligte slægtskaber er mellem en internetside, som du kopierede tekst fra og det dokument, som du satte teksten ind i eller mellem to billeder af den samme bil. Sådanne slægtskaber kan undertiden trækkes ud af filerne selv (du kunne se på fotos hvem eller hvad, der er på dem) eller gives af de involverede programmer (som i email-eksemplet ovenfor). Den del af søgningen er stadig under intens udvikling og mangler endnu at blive integreret i programmer, så du må regne med, at der kommer til at gå et par år, før det hele fungerer.
 
Denne del af semantisk søgning handler om smart søgning. Tænk på, hvordan Google prøver at håndtere dine søgninger på en smart måde: når du søger efter et hotel og et bynavn, så får du et bykort, som viser hoteller i den nævnte by oven over de fundne websteder! Hvis du staver forkert, så får du måske et forslag til en bedre stavemåde. Google prøver også at placere de mest relevante informationer først i listen af resultater ved hjælp af komplekse beregninger af slægtskaber (links) mellem websteder. Semantisk søgning vil også blive i stand til at give smarte søgeresultater ordnet efter relevans ved at  bruge information om beslægtethed.
 
===Sammenhænge===
 
Disse slægtskaber kan ikke bare være til hjælp ved søgning efter filer, de kan også have indflydelse på programmer og på hvilken information de fremviser. Bemærk, at denne måde at bruge søgning på stadig er mere vision end realitet! Mange af komponenterne er klar, men de er endnu ikke integrerede i programmerne og skrivebordet som helhed.
 
Her er et eksempel på, hvordan bevidsthed om sammenhænge kan hjælpe dit skrivebord med at fungere mere effektivt.
 
Lad os sige, at du er i gang med at færdiggøre nogle noter, som du tog under et møde. Så ringer telefonen, og du bliver bedt om at finde regnearket med priser og tilpasse det til en kunde. Efter endnu et par afbrydelser er dit skrivebord fuldt af filer og vinduer...
 
Det ville være rart at kunne organisere alt dette lidt bedre, ikke?
 
Her kommer [[Special:myLanguage/Glossary#Aktiviteter (Activities)|aktiviteter]] ind i billedet. De blev introduceret i [[Special:myLanguage/Plasma|Plasma]] og giver indtil videre mulighed for forskellige skriveborde. De minder lidt om virtuelle skriveborde, men her er det skrivebordet selv, som ændres og ikke de programmer som kører på det. Der kan være forskellige widgets, baggrunde og lignende. Fra Plasma 4.3 er der dog sammenhæng mellem de to begreber, da de virtuelle skriveborde kan have hver sin aktivitet.
 
Hvis programmerne og skrivebordet var bevidste om aktiviteter, så kunne du lave en aktivitet for hver af de opgaver, som du regelmæssigt arbejder med. Hvis du for eksempel ofte skal ændre et regneark med priser, så kan du lave en aktivitet til det: læg en Mappevisning (eller flere) på skrivebordet, tilføj en regnemaskine og et gøremålsliste-widget for at holde styr på de ting, som du stadig mangler at ændre. Du vil måske også tilføje et emailmappe-widget, som indeholder mails med spørgsmål om disse regneark med priser!
 
Når en eller anden spørger dig om en pris, så skifter du til denne aktivitet. Start regnearket - det er bevidst om din aktivitet, så det viser de seneste regneark med priser og ikke den seneste liste over inventar, som du arbejdede på i en anden aktivitet! Chat-programmet [[Special:myLanguage/Kopete| Kopete]] viser dig den kolleger, som ved noget om priser, da du tit chatter med hende, når du arbejder i denne aktivitet.
 
Når du er færdig, går du tilbage til en anden aktivitet, og igen tilpasser programmerne deres opførsel til, hvad du arbejder med.
 
Fordelene ved en sådan aktivitets-baseret arbejdsgang går videre end du måske umidelbart forventer. Det hjælper dig ikke bare med at finde filer og kontakte personer, det hjælper også med selve skiftet mellem opgaver. Den menneskelige hjerne er ikke særlig god til at multitaske - de fleste skal bruge adskillige minutter på at komme op i omdrejninger efter at have skiftet til en ny opgave. For at komme hurtigere i gang er det en stor hjælp at skifte omgivelser, også selv om det kun er på skærmen. Sammenlign det med, hvordan du kommer i feriestemning, når du pakker din kuffert!
 
Dette er selvfølgelig mest relevant for en, der arbejder ved computeren på kontoret eller derhjemme. Hvis du mest spiller computerspil eller blot bruger computeren en gang imellem, så vil du nok ikke få meget brug for aktiviteter.
 
Scenariet, som blev beskrevet ovenfor er allerede delvist implementeret i aktiviteter, med der er stadig meget at gøre.
 
== Ofte stillede spørgsmål ==
 
Følgende kommer fra et indlæg på [http://forum.kde.org/viewtopic.php?f=154&t=97098&p=204592 KDE's forummer]. Hvis du har tid, så må du meget gerne tilføje, fjerne eller ændre detaljer!
 
;Hvad er Nepomuk Semantic Desktop og Strigi Desktop File Indexer?
 
:Nepomuk og Strigi er teknologierne bag KDE's semantiske søgning. Ingen af dem bruges direkte i den nyeste udgave af KDE's semantiske søgning ([http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search se detaljer]),  men deres efterfølgere viderefører en stor del af deres kode og begreber. Semantisk søgning giver dig en måde at organisere, annotere og opbygge sammenhænge imellem data (ikke blot filnavne og indhold, men for eksempel også hvilke programmer, som har brugt en given fil eller hvordan den er mærket). Mange af KDE's programmer og arbejdsflader bruger denne grundlæggende infrastruktur til at frembyde funktioner så som mærkning af e-mails ([[Special:myLanguage/KMail|KMail]]) eller opsætning af aktiviteter (Plasma).
 
:Filindekseringen lader programmer som [[Special:myLanguage/Dolphin|Dolphin]] søge efter filer baseret på deres indhold, navn eller andre metadata (fx mærker) knyttet til de indekserede filer. Sådan en indekser kan også indeksere filer som ikke består af ren tekst så som PDF'er ved at tilgå metadata indeholdt i disse filer (forfatter, udgivelsesinformation osv.). Nogle KDE-komponenter leverer yderligere "analysatorer" for flere filtyper.
 
; Hvorfor har vi både brug for Akonadi og semantisk søgning? Laver de ikke det samme?
 
:Kort sagt giver Akonadi et lager til PIM-data som kalenderaftaler, kontakter og e-mail, som bruges af programmer som '''KMail''' og '''KOrganizer''' men også af Plasmas indbyggede kalender. Semantisk søgning bruger Akonadi til sine søgefunktioner. Hvordan Baloo udbyder søgning er faktisk op til programmet. I tilfældet KDE PIM bruges Xapian til at foretage indeksering og søgning.
 
;Hvordan kan jeg slå det semantiske skrivebord fra?
 
:Filindeksering kan deaktiveres ved at føje brugerens hjemmemappe til <menuchoice>Systemindstillinger -> Skrivebordssøgning -> Søg ikke på disse placeringer</menuchoice>. De øvrige funktioner er dele af de programmer, som bruger dem og kan ikke slås fra uden at forringe disse programmer. Hvis du for eksempel ikke vil have søgning i '''KMail''', så må du simpelthen fjerne '''KMail'''...
 
I versioner før KDE Applications 4.13 ville semantisk søgning have komponenter kørende uafhængigt af programmer. Disse funktioner kunne slås fra ved at deaktivere <menuchoice>Aktivér Nepomuk filindeksering</menuchoice> i afsnittet [[Special:myLanguage/System_Settings/Search_Desktop|Skrivebordssøgning]] i [[Special:myLanguage/System Settings|Systemindstillinger]]. Hvis du vil slå alle semantiske funktioner fra, så deaktiver<menuchoice>Aktivér Nepomuk filindeksering</menuchoice>. Bemærk, at du så også deaktiverer søgning i [[Special:myLanguage/Dolphin|Dolphin]].
 
:Bemærk, at med det sidste fravalg vil nogle programmer, som bruger semantisk søgning til metadata få reduceret deres funktionalitet: for eksempel vil [[Special:myLanguage/KMail|KMail]] ikke kunne mærke mails og Plasma-aktiviteter vil ikke give dig ekstra funktioner så som ikoner eller information om programdata.  


To make finding files containing text easier, Nepomuk offers a second functionality: indexing the text of files. It uses a technology called [[Glossary#Strigi|Strigi]] for this. You can now also find files by entering some words which you know are in there, or just (part of) their title.
;Baloo/semantisk søgning bruger 100% CPU! Hvad skal jeg gøre?


The third layer is a very complex one, and the reason why Nepomuk was conceived as a research project of several companies and universities in the European union. This is where you will find difficult words like 'semantic desktop' and 'ontologies'. Basically, it is about context and relationships.
:Du skal bare vente. Nogle filer er meget vanskelige eller helt umulige at indeksere. I øjeblikket omfatter det filer på over 50 megabyte. Når søgningen finder disse prøver den i et fast tidsrum. Når det er gået vil den prøve at finde ud af, hvilken fil den ikke kunne indeksere og deaktivere indeksering af den i fremtiden. Da den indekserer i blokke på 40 filer ad gangen skal den indeksere blokken i mindre dele for at finde problemfilen: første/anden halvdel indekseres, derefter indekseres den problematiske halvdel i mindre bidder indtil problemfilen findes. Dette kan tage op til 30 minutter med intens brug af CPU. Desværre fortsætter Baloo med at analysere en problematisk blok, selv når maskinen kører på batteri; dog starter den ikke på en ny blok når maskinen kører på batteri. Denne adfærd er blevet rettet i KDE 4.13.1 (hvor indekseringen afbrydes, så snart elkablet tages ud) og den tid det kan tage at søge efter hver fil er reduceret til 10 minutter. Teamet bag den semantiske søgning arbejder på at forbedre indekseringsværktøjet til at håndtere flere vanskelige filer.


==Examples==
;Hvorfor kører der nepomukservicestub-processer, selv om jeg har deaktiveret Nepomuk?


Let me try to explain what Nepomuk offers using two examples.
:Det kan være en fejl. Indsend en [http://bugs.kde.org fejlrapport] med en fuldstændig beskrivelse af dit problem og hvordan du fik det til at dukke op.


===Relationship===
;Filindeksering af PDF eller en anden filtype virker ikke.


Say you received a photo from a friend of yours, 2 weeks ago. You saved it somewhere on your computer. Now how to you find that file? If you don't remember the location, you're out of luck.
:PDF-indeksering er et kendt problem, som kan følges i {{bug|231936}}. Hvis du har problemer med andre filer, så start en fejlrapport og vedhæft helst en eksempelfil, som viser problemet.


Now Nepomuk aims to help you. You know this file came from that friend of yours, your computer does not. Nepomuk, however, can remember this relationship. Searching on the name of your friend will therefor pop up the photo!
;Programmet nepomukservicestub går ned når maskinen startes op.


Another potential relationship is between a web page you copied text from and the document you pasted it into, or two images showing the same car. Such relations can sometimes be extracted from the files themselves (you could analyze photos and see who or what is on there) or supplied by the applications involved (as in the above email example). This part of Nepomuk is still under heavy development, and needs integration in applications, so you can expect it to take a few more years to really shine.
:Et stort antal problemer med nedbrud er blevet løst i 4.7.2-udgaven af KDE's arbejdsflader og programmer. Hvis du støder på flere, så rapportér fejlen med detaljerede instruktioner om, hvordan problemet kan reproduceres, da udviklerne undertiden ikke kan udløse fejlene i deres egne test-udgaver.


All in all, this part of Nepomuk is about making search smart. Think about how Google tries to be smart with your searches: when you search for a hotel and a city name, it shows above the website results a google map showing hotels in the city you mentioned! It might even suggest a better name in case you made a spelling mistake. Google also tries to put the most relevant information on top of the list of results, using complex calculations on relationships (links) between websites. Nepomuk will be able to offer such smart results and order them on relevancy using relationship information.
;Processen virtuoso-t hænger med 100% CPU.


===Context===
:Virtuoso-t er en central komponent i den gamle semantiske søgnings infrastruktur, og under nogle omstændigheder kommer kommandoer sendt af andre komponenter til at optage for meget tid (med den effekt, at vise 100% CPU-forbrug).


These relationships can not only help you while searching for files, but also have an influence on applications and what information they present. Note that this way of using Nepomuk is still more a vision than reality! Many of the components are in place, but it is not yet integrated in applications and the desktop as a whole.
Fra 4.13-udgaven af Applications bruges Virtuoso ikke længere af den semantiske søgning.


So here an example of bringing context awareness to your desktop could help you work more efficiently.
;Q. Undertiden bruger Nepomuk for meget RAM.


Say you are working on finishing some notes you took in a meeting. The phone rings, and somebody asks you to find that spreadsheet with prices, adjust it for a customer. After a few more interruptions you find your desktop full of files and windows...
:Mange af disse problemer er blevet rettet; i andre tilfælde har udviklerne dog ikke kunnet reproducere problemerne korrekt. I disse tilfælde forøger du chancen for at få fejlene rettet, hvis du føjer eksempler og testcases til [http://bugs.kde.org/ fejlrapporterne].


It'd be nice to be able to organize all that a bit better, right?
;Søgning bruger harddisken for meget ved opstart:


Enter '[[Glossary#Activities|activities]]'. These have been introduced in [[Plasma]], and currently offer different 'desktops'. They are a bit like virtual desktops, except that the desktop itself changes, not the set of applications. Different widgets, background, things like that. Of course, since KDE 4.3, each virtual desktop can have it's own activity, bringing the two in sync.
:En reguleringsmekanisme er blevet implementeret i filindekseringen, så versioner efter KDE SC 4.8 skulle ikke længere have dette problem.


If applications and desktop were aware of activities, you could create an activity for each of the tasks you regularly work on. So if you often have to change a spreadsheet with prices, you create an activity for that: put a Folder View (or several) widget on the desktop, add a calculator and a todo-widget to keep track of what you still have to change. Maybe even an email folder widget showing the mails with questions regarding these prices spreadsheets!
;Min søge-database er blevet ødelagt. Hvordan kan jeg rense den?


As soon as somebody asks a question about prices, you switch to this activity. Fire up your spreadsheet application. It is aware of your activity so it shows recent price spreadsheets, not the recent list of inventory you were working on in another activity! [[Kopete]], the chat application shows your colleague who knows all about prices, as she is the person you always chat with when working on this activity.
:I det ekstreme tilfælde, at din database er helt ødelagt og alle andre muligheder er slået fejl kan du slette mappen <tt>$KDEHOME/share/apps/nepomuk</tt> (hvor <tt>$KDEHOME</tt> som regel er <tt>.kde</tt> eller <tt>.kde4</tt> i din hjemmemappe) imens Nepomuk ikke kører. Databasen vil så blive renset, men du vil også miste eksisterende information som mærker, vurderinger og kommentarer.


When you are finished, you go back to another activity, and once again all applications adjust their behavior to fit what you are doing.
== Avanceret fejlsøgning ==


The benefits of such an activity-based work flow go further than you might at first expect. It not only helps you find files and contact persons, but also helps in switching tasks itself. The human brain isn't very good at multi-tasking - it takes most people several minutes to get up to speed after switching tasks. Changing the 'environment' helps a lot in speeding this up, even if it's just on the screen. Compare it with getting in the mood for your holiday by packing your bag!
==Deling og privatliv==


Of course, the above is mostly relevant to people working behind their computer in the office or at home. A gamer or a casual user would probably not use these activities much.
Der er en ting, som jeg må gå ind på, før jeg linker til kilder til yderligere information: deling af Nepomuk data. Det ville være smart, hvis  dine tags, bedømmelser og kommentarer blev delt med andre, når du sender dem filer; men hvis du tagger en kontaktperson med en pinlig kommentar ('kedelig i sengen') og sender denne persons kontaktinformation til en fælles ven, så vil du nok ikke ønske, at taggen følger med...


Note that the scenario described above is still years away from reality. Much of the basic infrastructure for this in KDE is in place but much is still left.
Dette spørgsmål bliver selvfølgelig overvejet og er et vigtigt forskningsområde for Nepomuk-forskerne. Indtil videre er Nepomuk-sammenhænge private på grund af ovenstående problem og fordi der er store tekniske udfordringer. Du kan være sikker på, at Nepomuk-teamet gør alt, hvad det kan for at sikre, at dit privatliv bliver respekteret.


==Sharing and privacy==  
== Eksterne links ==


There is one thing I need to touch on before pointing to other sources of information: sharing Nepomuk data. It'd be great if your tags, ratings and comments would be shared with others when you send them files. However, if you tagged a contact with a slightly embarrassing tag ('boring in bed') and send that persons contact information to a mutual friend you probably don't want that tag to be send as well... This issue is of course being considered and an important subject of research by the Nepomuk researchers. For the time being, these privacy concerns, combined with technical challenges, are the reason Nepomuk context is private. Rest assured the Nepomuk team does all it can to make sure your privacy is respected.
Den nye søgeteknologi (fra KDE Applications 4.13):
* [http://dot.kde.org/2014/02/24/kdes-next-generation-semantic-search artikel med brugerinformation på dot'tet]
* [http://community.kde.org/Baloo Information til udviklere på community.kde.org]
* [http://en.wikipedia.org/wiki/Semantic_desktop Wikipedia - Semantic Desktop]


:''More info'':
Den gamle søgeteknologi:
::[http://en.wikipedia.org/wiki/Semantic_desktop Wikipedia - Semantic Desktop]  
* [http://techbase.kde.org/Projects/Nepomuk Nepomuk-sider for udviklere på KDE TechBase]
::[http://en.wikipedia.org/wiki/NEPOMUK_(framework)  Wikipedia - NEPOMUK Framework]  
* [http://nepomuk.kde.org/discover/user NEPOMUK KDE's websted]
::[http://nepomuk.semanticdesktop.org/xwiki/bin/view/Main1/ NEPOMUK website]
* [http://en.wikipedia.org/wiki/NEPOMUK_(framework)  Wikipedia - NEPOMUK Framework]  
::[http://nepomuk.kde.org/discover/user NEPOMUK KDE site]
* [http://nepomuk.semanticdesktop.org/nepomuk/ NEPOMUK websted]
::[http://dot.kde.org/2009/12/10/exploring-new-nepomuk-features-mandriva-linux-2010 article explaining Nepomuk on the DOT]
* [http://dot.kde.org/2009/12/10/exploring-new-nepomuk-features-mandriva-linux-2010 artikel som forklarer Nepomuk DOT'tet]
* [http://kdenepomukmanual.wordpress.com Brugervejledning til at komme i gang]


[[Category:System]]
[[Category:System/da]]

Latest revision as of 12:48, 13 July 2019

Semantisk søgning

Formålet med denne side er ikke at forklare KDE's teknologi til semantisk søgning i alle detaljer, men at give et kort overblik, nogle eksempler, visionerne bag og links til relevant information på nettet.

Baloo er næste generation af semantisk søgning

Fra KDE Applications 4.13 erstattes Nepomuk af 'Baloo' filindekserings- og filsøgningsfundament. Semantisk søgning bruger ikke længer en enkelt stor database men forskellige specialiserede databaser for hver type data. De nye søgedatabaser kan findes i $HOME/.local/share/baloo. Hvis du har opdateret til KDE Applications 4.12 fra en tidligere KDE-udgivelse, så kan du slette $KDEHOME/share/apps/nepomuk.

Kort forklaring

Som nævnt i Ordlisten har semantisk søgning at gøre med klassifikation, organisering og præsentation af data. Det er ikke et program men en komponent, som kan bruges af udviklere i deres programmer.

Prøv den i Dolphin

For eksempel bruger filmanageren Dolphin søgning. I KDE Applications versioner før 4.13 skulle semantisk søgning være aktiverede i Systemindstillinger -> Skrivebordssøgning. Dolphin's sidepanel Information (Kontrol -> Paneler -> Information eller tast F11) viser information, som søgningen henter frem om den valgte fil og lader dig også knytte mærker, vurderinger og kommentarer til filer. Denne information lagres og indekseres af søgningen. Du kan søge på metadata i Dolphin's navigationslinje. Klik på Find i værktøjslinjen eller tast Ctrl + F, og søg efter et filnavn eller filindhold.


Funktionaliteter

Kde's semantiske søgning tilbyder flere 'lag' af funktionalitet til programmer. Det første og enkleste involverer manuel tagging, bedømmelse og kommentering som i Dolphin. Det hjælper dig med at finde filer hurtigere, men kræver meget arbejde.

For at gøre det nemmere at finde tekstfiler tilbyder søgning er anden funktionalitet: indeksering af filernes tekster. Du kan finde filer ved at søge på nogle ord, som du ved, at de indeholder, eller blot på (en del af) deres titel.

Det tredje lag er meget komplekst og grunden til, at det underliggende lag, Nepomuk, blev skabt af adskillige firmaer og universiteter i EU som et forskningsprojekt. Det er her, du finder vanskelige begreber som 'semantisk skrivebord' og 'ontologier'. Det handler i bund og grund om sammenhænge og beslægtethed.

Indeksering af filer

Søgning indekserer ikke alle filerne på harddisken. Dens standardkonfiguration i de fleste Linux-distributioner udelukker nogle almindelige mønstre for backupfiler og mapper til indstillingsfiler. Du kan ændre på dette i Systemindstillinger -> Skrivebordssøgning. Tilføj mapper, som skal ekskluderes. Hvis du ønsker at slå indeksering helt fra, så føj blot din hjemmemepper til her.

I Systemindstillinger kan du også kontrollere om søgning skal indeksere filer på mobile enheder så som USB-drev og CD-ROM'er. I KDE Applications 4.13 er dette ikke muligt, mobile enheder bliver ikke indekserede. Der er planer om at genintroducere denne funktion i fremtidige versioner.

Eksempler

Lad mig prøve at forklare, hvad semantisk søgning kan ved to eksempler. Disse funktioner er endnu ikke fuldt tilgængelige - grundlaget er til stede, men programmernes udviklere skal integrere dem i deres programmer.

Beslægtethed

Lad os sige, at du modtog et foto fra en ven for 2 uger siden. Du gemte det et eller andet sted på din computer. Hvordan finder du nu filen? Hvis du ikke kan huske, hvor du gemte den, så har du et problem.

Her prøver den semantiske søgning at hjælpe dig. Du ved, at filen kom fra den der ven – det ved computeren ikke; men søgningen kan huske 'slægtskabet'. Søger du på din vens navn, så findes fotoet frem!

Andre muligte slægtskaber er mellem en internetside, som du kopierede tekst fra og det dokument, som du satte teksten ind i eller mellem to billeder af den samme bil. Sådanne slægtskaber kan undertiden trækkes ud af filerne selv (du kunne se på fotos hvem eller hvad, der er på dem) eller gives af de involverede programmer (som i email-eksemplet ovenfor). Den del af søgningen er stadig under intens udvikling og mangler endnu at blive integreret i programmer, så du må regne med, at der kommer til at gå et par år, før det hele fungerer.

Denne del af semantisk søgning handler om smart søgning. Tænk på, hvordan Google prøver at håndtere dine søgninger på en smart måde: når du søger efter et hotel og et bynavn, så får du et bykort, som viser hoteller i den nævnte by oven over de fundne websteder! Hvis du staver forkert, så får du måske et forslag til en bedre stavemåde. Google prøver også at placere de mest relevante informationer først i listen af resultater ved hjælp af komplekse beregninger af slægtskaber (links) mellem websteder. Semantisk søgning vil også blive i stand til at give smarte søgeresultater ordnet efter relevans ved at bruge information om beslægtethed.

Sammenhænge

Disse slægtskaber kan ikke bare være til hjælp ved søgning efter filer, de kan også have indflydelse på programmer og på hvilken information de fremviser. Bemærk, at denne måde at bruge søgning på stadig er mere vision end realitet! Mange af komponenterne er klar, men de er endnu ikke integrerede i programmerne og skrivebordet som helhed.

Her er et eksempel på, hvordan bevidsthed om sammenhænge kan hjælpe dit skrivebord med at fungere mere effektivt.

Lad os sige, at du er i gang med at færdiggøre nogle noter, som du tog under et møde. Så ringer telefonen, og du bliver bedt om at finde regnearket med priser og tilpasse det til en kunde. Efter endnu et par afbrydelser er dit skrivebord fuldt af filer og vinduer...

Det ville være rart at kunne organisere alt dette lidt bedre, ikke?

Her kommer aktiviteter ind i billedet. De blev introduceret i Plasma og giver indtil videre mulighed for forskellige skriveborde. De minder lidt om virtuelle skriveborde, men her er det skrivebordet selv, som ændres og ikke de programmer som kører på det. Der kan være forskellige widgets, baggrunde og lignende. Fra Plasma 4.3 er der dog sammenhæng mellem de to begreber, da de virtuelle skriveborde kan have hver sin aktivitet.

Hvis programmerne og skrivebordet var bevidste om aktiviteter, så kunne du lave en aktivitet for hver af de opgaver, som du regelmæssigt arbejder med. Hvis du for eksempel ofte skal ændre et regneark med priser, så kan du lave en aktivitet til det: læg en Mappevisning (eller flere) på skrivebordet, tilføj en regnemaskine og et gøremålsliste-widget for at holde styr på de ting, som du stadig mangler at ændre. Du vil måske også tilføje et emailmappe-widget, som indeholder mails med spørgsmål om disse regneark med priser!

Når en eller anden spørger dig om en pris, så skifter du til denne aktivitet. Start regnearket - det er bevidst om din aktivitet, så det viser de seneste regneark med priser og ikke den seneste liste over inventar, som du arbejdede på i en anden aktivitet! Chat-programmet Kopete viser dig den kolleger, som ved noget om priser, da du tit chatter med hende, når du arbejder i denne aktivitet.

Når du er færdig, går du tilbage til en anden aktivitet, og igen tilpasser programmerne deres opførsel til, hvad du arbejder med.

Fordelene ved en sådan aktivitets-baseret arbejdsgang går videre end du måske umidelbart forventer. Det hjælper dig ikke bare med at finde filer og kontakte personer, det hjælper også med selve skiftet mellem opgaver. Den menneskelige hjerne er ikke særlig god til at multitaske - de fleste skal bruge adskillige minutter på at komme op i omdrejninger efter at have skiftet til en ny opgave. For at komme hurtigere i gang er det en stor hjælp at skifte omgivelser, også selv om det kun er på skærmen. Sammenlign det med, hvordan du kommer i feriestemning, når du pakker din kuffert!

Dette er selvfølgelig mest relevant for en, der arbejder ved computeren på kontoret eller derhjemme. Hvis du mest spiller computerspil eller blot bruger computeren en gang imellem, så vil du nok ikke få meget brug for aktiviteter.

Scenariet, som blev beskrevet ovenfor er allerede delvist implementeret i aktiviteter, med der er stadig meget at gøre.

Ofte stillede spørgsmål

Følgende kommer fra et indlæg på KDE's forummer. Hvis du har tid, så må du meget gerne tilføje, fjerne eller ændre detaljer!

Hvad er Nepomuk Semantic Desktop og Strigi Desktop File Indexer?
Nepomuk og Strigi er teknologierne bag KDE's semantiske søgning. Ingen af dem bruges direkte i den nyeste udgave af KDE's semantiske søgning (se detaljer), men deres efterfølgere viderefører en stor del af deres kode og begreber. Semantisk søgning giver dig en måde at organisere, annotere og opbygge sammenhænge imellem data (ikke blot filnavne og indhold, men for eksempel også hvilke programmer, som har brugt en given fil eller hvordan den er mærket). Mange af KDE's programmer og arbejdsflader bruger denne grundlæggende infrastruktur til at frembyde funktioner så som mærkning af e-mails (KMail) eller opsætning af aktiviteter (Plasma).
Filindekseringen lader programmer som Dolphin søge efter filer baseret på deres indhold, navn eller andre metadata (fx mærker) knyttet til de indekserede filer. Sådan en indekser kan også indeksere filer som ikke består af ren tekst så som PDF'er ved at tilgå metadata indeholdt i disse filer (forfatter, udgivelsesinformation osv.). Nogle KDE-komponenter leverer yderligere "analysatorer" for flere filtyper.
Hvorfor har vi både brug for Akonadi og semantisk søgning? Laver de ikke det samme?
Kort sagt giver Akonadi et lager til PIM-data som kalenderaftaler, kontakter og e-mail, som bruges af programmer som KMail og KOrganizer men også af Plasmas indbyggede kalender. Semantisk søgning bruger Akonadi til sine søgefunktioner. Hvordan Baloo udbyder søgning er faktisk op til programmet. I tilfældet KDE PIM bruges Xapian til at foretage indeksering og søgning.
Hvordan kan jeg slå det semantiske skrivebord fra?
Filindeksering kan deaktiveres ved at føje brugerens hjemmemappe til Systemindstillinger -> Skrivebordssøgning -> Søg ikke på disse placeringer. De øvrige funktioner er dele af de programmer, som bruger dem og kan ikke slås fra uden at forringe disse programmer. Hvis du for eksempel ikke vil have søgning i KMail, så må du simpelthen fjerne KMail...

I versioner før KDE Applications 4.13 ville semantisk søgning have komponenter kørende uafhængigt af programmer. Disse funktioner kunne slås fra ved at deaktivere Aktivér Nepomuk filindeksering i afsnittet Skrivebordssøgning i Systemindstillinger. Hvis du vil slå alle semantiske funktioner fra, så deaktiverAktivér Nepomuk filindeksering. Bemærk, at du så også deaktiverer søgning i Dolphin.

Bemærk, at med det sidste fravalg vil nogle programmer, som bruger semantisk søgning til metadata få reduceret deres funktionalitet: for eksempel vil KMail ikke kunne mærke mails og Plasma-aktiviteter vil ikke give dig ekstra funktioner så som ikoner eller information om programdata.
Baloo/semantisk søgning bruger 100% CPU! Hvad skal jeg gøre?
Du skal bare vente. Nogle filer er meget vanskelige eller helt umulige at indeksere. I øjeblikket omfatter det filer på over 50 megabyte. Når søgningen finder disse prøver den i et fast tidsrum. Når det er gået vil den prøve at finde ud af, hvilken fil den ikke kunne indeksere og deaktivere indeksering af den i fremtiden. Da den indekserer i blokke på 40 filer ad gangen skal den indeksere blokken i mindre dele for at finde problemfilen: første/anden halvdel indekseres, derefter indekseres den problematiske halvdel i mindre bidder indtil problemfilen findes. Dette kan tage op til 30 minutter med intens brug af CPU. Desværre fortsætter Baloo med at analysere en problematisk blok, selv når maskinen kører på batteri; dog starter den ikke på en ny blok når maskinen kører på batteri. Denne adfærd er blevet rettet i KDE 4.13.1 (hvor indekseringen afbrydes, så snart elkablet tages ud) og den tid det kan tage at søge efter hver fil er reduceret til 10 minutter. Teamet bag den semantiske søgning arbejder på at forbedre indekseringsværktøjet til at håndtere flere vanskelige filer.
Hvorfor kører der nepomukservicestub-processer, selv om jeg har deaktiveret Nepomuk?
Det kan være en fejl. Indsend en fejlrapport med en fuldstændig beskrivelse af dit problem og hvordan du fik det til at dukke op.
Filindeksering af PDF eller en anden filtype virker ikke.
PDF-indeksering er et kendt problem, som kan følges i bug #231936. Hvis du har problemer med andre filer, så start en fejlrapport og vedhæft helst en eksempelfil, som viser problemet.
Programmet nepomukservicestub går ned når maskinen startes op.
Et stort antal problemer med nedbrud er blevet løst i 4.7.2-udgaven af KDE's arbejdsflader og programmer. Hvis du støder på flere, så rapportér fejlen med detaljerede instruktioner om, hvordan problemet kan reproduceres, da udviklerne undertiden ikke kan udløse fejlene i deres egne test-udgaver.
Processen virtuoso-t hænger med 100% CPU.
Virtuoso-t er en central komponent i den gamle semantiske søgnings infrastruktur, og under nogle omstændigheder kommer kommandoer sendt af andre komponenter til at optage for meget tid (med den effekt, at vise 100% CPU-forbrug).

Fra 4.13-udgaven af Applications bruges Virtuoso ikke længere af den semantiske søgning.

Q. Undertiden bruger Nepomuk for meget RAM.
Mange af disse problemer er blevet rettet; i andre tilfælde har udviklerne dog ikke kunnet reproducere problemerne korrekt. I disse tilfælde forøger du chancen for at få fejlene rettet, hvis du føjer eksempler og testcases til fejlrapporterne.
Søgning bruger harddisken for meget ved opstart
En reguleringsmekanisme er blevet implementeret i filindekseringen, så versioner efter KDE SC 4.8 skulle ikke længere have dette problem.
Min søge-database er blevet ødelagt. Hvordan kan jeg rense den?
I det ekstreme tilfælde, at din database er helt ødelagt og alle andre muligheder er slået fejl kan du slette mappen $KDEHOME/share/apps/nepomuk (hvor $KDEHOME som regel er .kde eller .kde4 i din hjemmemappe) imens Nepomuk ikke kører. Databasen vil så blive renset, men du vil også miste eksisterende information som mærker, vurderinger og kommentarer.

Avanceret fejlsøgning

Deling og privatliv

Der er en ting, som jeg må gå ind på, før jeg linker til kilder til yderligere information: deling af Nepomuk data. Det ville være smart, hvis dine tags, bedømmelser og kommentarer blev delt med andre, når du sender dem filer; men hvis du tagger en kontaktperson med en pinlig kommentar ('kedelig i sengen') og sender denne persons kontaktinformation til en fælles ven, så vil du nok ikke ønske, at taggen følger med...

Dette spørgsmål bliver selvfølgelig overvejet og er et vigtigt forskningsområde for Nepomuk-forskerne. Indtil videre er Nepomuk-sammenhænge private på grund af ovenstående problem og fordi der er store tekniske udfordringer. Du kan være sikker på, at Nepomuk-teamet gør alt, hvad det kan for at sikre, at dit privatliv bliver respekteret.

Eksterne links

Den nye søgeteknologi (fra KDE Applications 4.13):

Den gamle søgeteknologi: