Οι σχέσεις δε βοηθούν μόνο στην αναζήτηση αρχείων, αλλά επιδρούν επίσης και στις εφαρμογές καθώς και στις πληροφορίες που παρουσιάζουν. Σημειώστε ότι ο συγκεκριμένος τρόπος χρήσης του Nepomuk είναι περισσότερο όραμα παρά πραγματικότητα! Πολλά από τα συστατικά του υπάρχουν αλλά δεν έχουν ενσωματωθεί στις εφαρμογές και στην επιφάνεια εργασίας συνολικά.
Ώρα για ένα παράδειγμα του πώς η μεταφορά της γνώσης του περικειμένου στην
επιφάνεια εργασίας μπορεί να σας βοηθήσει να δουλέψετε αποδοτικότερα.

Ο στόχος αυτής της σελίδας δεν είναι να εξηγήσει στο σύνολό της την τεχνολογία του Nepomuk με κάθε λεπτομέρεια, αλλά να παρουσιάσει μια συνοπτική περίληψη, να δώσει μερικά παραδείγματα, να μοιραστεί το όραμα πίσω από το Nepomuk και να παρέχει συνδέσμους με σχετικές πληροφορίες στο διαδίκτυο.

Συνοπτική επεξήγηση

Όπως αναφέρεται και στο Γλωσσάρι, το Nepomuk ασχολείται με τη δεικτοδότηση/ευρετηρίαση, την οργάνωση και την παρουσίαση των δεδομένων. Δεν είναι εφαρμογή, αλλά ένα συστατικό που μπορεί να χρησιμοποιηθεί από τους προγραμματιστές μέσα στις εφαρμογές.

Δοκιμάστε το στον Dolphin

Για παράδειγμα, ο διαχειριστής αρχείων Dolphin χρησιμοποιεί το Nepomuk. Για να ισχύουν τα παρακάτω, το Nepomuk και το Strigi πρέπει να είναι ενεργοποιημένα από τις Ρυθμίσεις συστήματος-> Αναζήτηση επιφάνειας εργασίας. Η πλευρική μπάρα πληροφοριών του Dolphin (Έλεγχος -> Πίνακες -> Πληροφορίες , ή το πάτημα του πλήκτρου F11) παρουσιάζει πληροφορίες που εξήγαγε το Strigi σχετικά με το συγκεκριμένο αρχείο, και σας επιτρέπει να αναθέτετε ετικέτες, βαθμολογίες και σχόλια στα αρχεία. Οι πληροφορίες αυτές αποθηκεύονται τότε στο Nepomuk και ευρετηριοποιούνται από το Strigi. Έτσι μπορείτε να αναζητήσετε μετα-δεδομένα από την γραμμή πλοήγησης στον Dolphin. Κάντε κλικ στο Αναζήτηση, ή πατήστε Ctrl+Fκαι ψάξτε για ονόματα αρχείων ή τα περιεχόμενα των αρχείων.


Το Nepomuk προσφέρει διάφορα επίπεδα λειτουργικότητας στις εφαρμογές. Οι πρώτες και απλούστερες είναι η προσθήκη ετικετών με το χέρι, η αξιολόγηση και ο σχολιασμός, όπως ακριβώς στον Dolphin. Αυτό σας βοηθά να βρίσκετε τα αρχεία σας γρηγορότερα, αλλά είναι και αρκετή δουλειά.

Για να κάνει ευκολότερη την εύρεση αρχείων κειμένου με βάση το περιεχόμενό τους, το Nepomuk παρέχει μια δεύτερη λειτουργικότητα: τη δεικτοδότηση (ευρετηρίαση) του κειμένου των αρχείων. Η τεχνολογία που χρησιμοποιεί για αυτό είναι το Strigi. Μπορείτε να βρείτε αρχεία εισάγοντας μερικές λέξεις που γνωρίζετε από πριν ότι περιέχονται, ή απλά τον τίτλο ή ένα τμήμα του.

Το τρίτο επίπεδο είναι πολύπλοκο σε μεγάλο βαθμό και αποτελεί και τον λόγο που το Nepomuk συστήθηκε σαν ερευνητικό έργο διαφόρων εταιριών και πανεπιστημίων στη Ευρωπαϊκή Ένωση. Εκεί θα συναντήσετε δύσκολες λέξεις όπως η 'σημασιολογική επιφάνεια εργασίας' και οι 'οντολογίες'. Βασικά, έχει να κάνει με το περικείμενο (context) και τις σχέσεις.

Δεικτοδότηση αρχείων

Το Stigi δεν ευρετηριοποιεί όλα τα αρχεία του σκληρού δίσκου. Η προκαθορισμένη του διαμόρφωση στις περισσότερες διανομές του Linux εξαιρεί τους συνήθεις τύπους αρχείων αντιγράφων ασφαλείας και τους καταλόγους διαμόρφωσης και δεικτοδοτεί μόνο τα αρχεία στον προσωπικό φάκελο. Αυτό μπορείτε να το αλλάξετε στις Ρυθμίσεις συστήματος -> Αναζήτηση επιφάνειας εργασίας -> Αναζήτηση στην Επιφάνεια εργασίας -> Προσαρμογή φακέλων ευρετηρίου...->Φάκελοι για προσθήκη στο ευρετήριο.

Σημειώστε ότι το Strigi από την έκδοση 4.7 του KDE κι ύστερα, δεν ακολουθεί τους συμβολικούς συνδέσμους (σφάλμα #208602). Μέχρι και την KDE 4.9, ακόμα κι αν ο χρήστης επιλέξει τους φακέλους που βρίσκονται κάτω από τον συμβολικό σύνδεσμο (bug #287593), το περιεχόμενο δε δεικτοδοτείται. Το συγκεκριμένο σφάλμα έχει διορθωθεί. Έτσι, ο χρήστης μπορεί να βλέπει τους φακέλους, αλλά δεν μπορεί να επιλέξει κάποιον από αυτούς για ευρετηρίαση. (Συμβολικός σύνδεσμος είναι ένα αρχείο που "δείχνει" προς ένα άλλο αρχείο ή φάκελο· ο Dolphin εμφανίζει τους συμβολικούς δεσμούς με πλάγια.) Πρέπει λοιπόν να βρείτε τη διαδρομή προς τον πραγματικό κατάλογο (στον Dolphin, επιλέξτε το αρχείο, επιλέξτε Ιδιότητες-> Γενικά-> Δείχνει στο) και πείτε στο Strigi να το δεικτοδοτήσει.

Στις Ρυθμίσεις συστήματος μπορείτε επίσης να ελέγξετε αν το Strigi δεικτοδοτεί αρχεία σε αφαιρούμενα μέσα αποθήκευσης όπως USB ή CD-ROM.


Ας προσπαθήσουμε να εξηγήσουμε τι προσφέρει το Nepomuk χρησιμοποιώντας δυο παραδείγματα.


Ας πούμε ότι λάβατε μια φωτογραφία από έναν φίλο σας πριν από δυο εβδομάδες. Την αποθηκεύσατε κάπου στον υπολογιστή σας. Πώς βρίσκετε τώρα το αρχείο; Αν δε θυμάστε την τοποθεσία, ατυχήσατε.

Τώρα το Nepomuk έρχεται να σας βοηθήσει. Εσείς γνωρίζετε ότι το αρχείο το λάβατε από έναν φίλο σας, ο υπολογιστής σας όμως όχι. Το Nepomuk, παρόλα αυτά, μπορεί να θυμηθεί αυτή τη σχέση. Κάντε αναζήτηση με το όνομα του φίλου σας και η φωτογραφία θα ξεπροβάλλει!

Μια άλλη πιθανή σχέση είναι αυτή μεταξύ της ιστοσελίδας από την οποία αντιγράψατε ένα κείμενο και το έγγραφο στο οποίο το επικολλήσατε, ή δυο εικόνες που δείχνουν το ίδιο αυτοκίνητο. Τέτοιες σχέσεις μπορεί μερικές φορές να εξαχθούν από τα ίδια τα αρχεία (θα μπορούσατε να αναλύσετε φωτογραφίες και να δείτε ποιος ή τι είναι εκεί) ή να παρέχονται από τις εμπλεκόμενες εφαρμογές (όπως στο παράδειγμα με το email παραπάνω). Αυτό το κομμάτι του Nepomuk είναι υπό ανάπτυξη και απαιτεί ενσωμάτωση στις εφαρμογές, έτσι αναμένεται να πάρει μερικά χρόνια ακόμα για να λάμψει πραγματικά.

Στην ουσία, το συγκεκριμένο τμήμα του Nepomuk αφορά στο να κάνει την αναζήτηση έξυπνη. Σκεφτείτε πώς η Google προσπαθεί να είναι έξυπνη στις αναζητήσεις σας: όταν ψάχνετε ένα ξενοδοχείο και το όνομα μιας πόλης, δείχνει πάνω από τα αποτελέσματα έναν χάρτη που δείχνει ξενοδοχεία στην πόλη που αναφέρατε! Μπορεί ακόμα και να σας συστήσει ένα καταλληλότερο όνομα σε περίπτωση ορθογραφικού λάθους. Η Google επίσης προσπαθεί να σπρώξει τις πιο σχετικές πληροφορίες στην κορυφή της λίστας των αποτελεσμάτων, κάνοντας πολύπλοκους υπολογισμούς ως προς τις σχέσεις (συνδέσμους) μεταξύ των ιστοσελίδων. Το Nepomuk θα μπορέσει να σας προσφέρει τέτοια έξυπνα αποτελέσματα και να τα ταξινομήσει ως προς τη σχετικότητά τους χρησιμοποιώντας πληροφορίες σχέσεων.


Οι σχέσεις δε βοηθούν μόνο στην αναζήτηση αρχείων, αλλά επιδρούν επίσης και στις εφαρμογές καθώς και στις πληροφορίες που παρουσιάζουν. Σημειώστε ότι ο συγκεκριμένος τρόπος χρήσης του Nepomuk είναι περισσότερο όραμα παρά πραγματικότητα! Πολλά από τα συστατικά του υπάρχουν αλλά δεν έχουν ενσωματωθεί στις εφαρμογές και στην επιφάνεια εργασίας συνολικά.

Ώρα για ένα παράδειγμα του πώς η μεταφορά της γνώσης του περικειμένου στην επιφάνεια εργασίας μπορεί να σας βοηθήσει να δουλέψετε αποδοτικότερα.

It'd be nice to be able to organize all that a bit better, right?

Enter 'activities'. These have been introduced in Plasma, and currently offer different 'desktops'. They are a bit like virtual desktops, except that the desktop itself changes, not the set of applications. Different widgets, background, things like that. Of course, since KDE 4.3, each virtual desktop can have it's own activity, bringing the two in sync.

If applications and desktop were aware of activities, you could create an activity for each of the tasks you regularly work on. So if you often have to change a spreadsheet with prices, you create an activity for that: put a Folder View (or several) widget on the desktop, add a calculator and a todo-widget to keep track of what you still have to change. Maybe even an email folder widget showing the mails with questions regarding these prices spreadsheets!

As soon as somebody asks a question about prices, you switch to this activity. Fire up your spreadsheet application. It is aware of your activity so it shows recent price spreadsheets, not the recent list of inventory you were working on in another activity! Kopete, the chat application shows your colleague who knows all about prices, as she is the person you always chat with when working on this activity.

When you are finished, you go back to another activity, and once again all applications adjust their behavior to fit what you are doing.

The benefits of such an activity-based work flow go further than you might at first expect. It not only helps you find files and contact persons, but also helps in switching tasks itself. The human brain isn't very good at multi-tasking - it takes most people several minutes to get up to speed after switching tasks. Changing the 'environment' helps a lot in speeding this up, even if it's just on the screen. Compare it with getting in the mood for your holiday by packing your bag!

Of course, the above is mostly relevant to people working behind their computer in the office or at home. A gamer or a casual user would probably not use these activities much.

Note that the scenario described above is still years away from reality. Much of the basic infrastructure for this in KDE is in place but much is still left.

Frequently Asked Questions

The following is taken from a KDE forums post. Please feel free to add/remove/modify details if you have the time!

Q. What is the Nepomuk Semantic Desktop, and the Strigi Desktop File Indexer?

A. The Nepomuk Semantic Desktop is the foundation of the all the other modules of the Nepomuk infrastructure. It provides a way to organize, annotate and build relationships among the data (not only file name and content, but for example which applications used a certain file, or how it is tagged). A number of KDE applications and workspaces use this basic infrastructure to deliver features such as email tagging (KMail) or activity setup (Plasma).

On the other hand, the Strigi Desktop File Indexer is a system to index files so that they can be added to the main Nepomuk repository, a convenient way to use them within Nepomuk without adding any file manually. Also, applications such as Dolphin can then search for files basing on content, name, or other meta-data (e.g. tags) associated to indexed files. Such an indexer can also index non-text files, such as PDFs, by accessing the meta-data contained in these files (author, publication information, etc.). Some KDE components ship additional "analyzers" for more file types. Nepomuk can be fully functional without the use of the File Indexer, which is an additional (and optional) component.

Q. How can I tell if Strigi has indexed a file?

A. In Dolphin, select the file. If the Information panel displays "Created at" and "Has hash", then the file was indexed by Strigi.

Q. How can I disable the semantic desktop?

A. Most of the times, the easiest way is to disable file indexing, which is usually, among the Nepomuk components, the heavier in resource usage (although many optimizations were included in the 4.7 release which has reduced resource usage). This is done by unchecking Enable Nepomuk File Indexer in the Desktop Search section of System Settings. In case you want to turn off all semantic features, uncheck Enable Nepomuk Semantic Desktop. Notice that this will turn off search in Dolphin as well.

Notice that with the latter option some programs who use Nepomuk for meta-data will offer reduced functionality: for example KMail will not be able to tag mail, or Plasma activities will not offer additional features such as icons, or program data information.

Q. Why do I have nepomukservicestub processes even though I've disabled Nepomuk?

A. It may be a bug. Please file a bug report with a complete description of your problem and the steps to trigger it.

Q. File indexing of PDF/some other file types doesn't work.

A. PDF indexing is a known issue and it's being tracked in bug #231936. If you have issues with other files, open a bug, preferably adding a sample file that shows the problem.

Q. The program nepomukservicestub crashes at startup.

A. A large number of fixes for crashes has been fixed for the 4.7.2 release of the KDE Workspaces and Applications. If you encounter more, please file bugs report with detailed instructions on how to reproduce the problem, as sometimes the developers are unable to trigger them in their test setups.

Q. The virtuoso-t process hangs at 100% CPU.

A. Virtuoso-t is a key component of the Nepomuk infrastructure and in some occasions the commands sent by the other components end up taking too much time (hence showing the effect of 100% CPU). Sebastian Trüg (the lead developer of Nepomuk) has fixed most of these problems in 4.7.1 or newer.

Q. Sometimes Nepomuk consumes too much RAM.

A. Many of these problems have been fixed, in other cases however the developers are unable to reproduce the issues correctly. In this case, providing examples and test cases to bug reports increase the chances to get these bugs fixed.

Q. Nepomuk re-indexes files at startup.

A. This bug has been fixed in 4.7.0 versions. Now Nepomuk just "scans" for changes, without indexing anything.

Q. Nepomuk accesses the disk too much on startup.

A. In 4.7 and newer this problem has been lessened thanks to a throttling mechanism implemented in the file indexer.

Q. My Nepomuk database has been corrupted. How do I clean it?

A. In the extreme case your database is really corrupted and all other attempts have failed, you can delete the $KDEHOME/share/apps/nepomuk directory (where $KDEHOME is usually .kde or .kde4) while Nepomuk is not running. The database will be cleared, but you will also lose existing information such as tags, ratings and comments.

Advanced troubleshooting

If Nepomuk has trouble indexing a file, in a terminal try running

nepomukindexer /path/to/file

and see if there's any useful output. You can compare the output to a similar file that is successfully indexed.

xmlindexer /path/to/file > /tmp/test.xml

generates an XML representation of some of the information extracted from a file. You can view this in an XML viewer, such as your browser, and again compare it to the output for a similar file. (xmlindexer may be in a different and optional package in your Linux distribution; for example in Ubuntu it is in the strigi-utils package.)

This blog post explains how to turn on debugging output from the Nepomuk service. It also shows how to debug the CPU usage of Nepomuk and its storage backend.

This blog post explains how to extract useful information for bug reports about the CPU usage of the Virtuoso backend.

Sharing and privacy

There is one thing I need to touch on before pointing to other sources of information: sharing Nepomuk data. It'd be great if your tags, ratings and comments would be shared with others when you send them files. However, if you tagged a contact with a slightly embarrassing tag ('boring in bed') and send that persons contact information to a mutual friend you probably don't want that tag to be send as well...

This issue is of course being considered and an important subject of research by the Nepomuk researchers. For the time being, these privacy concerns, combined with technical challenges, are the reason Nepomuk context is private. Rest assured the Nepomuk team does all it can to make sure your privacy is respected.

External links