Nepomuk

Метою створення цієї сторінки не є розгорнутий опис технології Nepomuk з усіма можливими подробицями. На цій сторінці ви знайдете лише короткий огляд, декілька прикладів та загальний опис призначення технології, а також посилання на пов’язані з нею ресурси у мережі.

Короткий опис

Як ми вже зазначали у глосарії, Nepomuk призначено для класифікування, впорядкування та показу даних. Nepomuk не є якоюсь окремою програмою, але компонентом, яким можуть скористатися розробники програмного забезпечення.

Як спробувати Nepomuk у Dolphin

Nepomuk використано у Dolphin. Щоб познайомитися з можливостями, вам слід увімкнути Nepomuk і Strigi у Системних параметрах -> Додатково -> Стільничний пошук. За допомогою бічної панелі Dolphin (Керування -> Панелі -> Інформація або натисніть F11) буде показано дані, видобуті Strigi щодо вибраного файла, а також можете призначати мітки, оцінки та коментарі. Ці дані буде збережено у Nepomuk та проіндексовано Strigi. Після завершення індексування ви зможете шукати файли за метаданими за допомогою панелі навігації Dolphin. Достатньо скористатися натиснути кнопку Пошук... або натиснути комбінацію клавіш Ctrl+F і виконати пошук за назвою або вмістом файла.

Функціональні можливості

Nepomuk надає програмам декілька «шарів» функціональних можливостей. Першим і найпростішим з них є визначення міток, оцінок і коментарів файлів вручну, як це можна зробити у Dolphin. Визначені метадані допоможуть вам пришвидшити пошук файлів, але для їх створення потрібні значні зусилля.

Щоб спростити пошук файлів з відповідним текстом, у Nepomuk передбачено іншу функціональну можливість: індексування текстового вмісту файлів. Для цього використано технологію, яка має назву Strigi. У разі її використання знайти файл можна буде на основі декількох слів, які, як ви пам’ятаєте, містяться у ньому, або просто частиною його назви.

Третій шар є дуже складним, саме через нього Nepomuk вважається дослідницьким проектом декількох компаній та університетів Європейської Союзу. Цей шар пов’язано з такими складними поняттями, як «семантична стільниця» та «онтології». Його використання передбачає встановлення контекстів і зв’язків між даними.

Індексування файлів

Strigi не виконує індексування геть усіх файлів на жорсткому диску. За типових налаштувань у більшості дистрибутивів Linux буде виключено типові файли резервних копій та каталоги налаштувань, буде проіндексовано лише файли у вашій домашній теці. Змінити поведінку системи можна за допомогою пункту Системні параметри -> Стільничний пошук -> Теки індексування -> Налаштувати теки індексування… -> Теки для індексування.

Зауважте, що у KDE 4.7 Strigi не здатний обробляти символічні посилання (вада №208602). До KDE 4.9, навіть якщо ви вкажете, що слід індексувати теки за символічним посиланням (вада №287593) дані не буде проіндексовано. Цю ваду було виправлено. Таким чином, користувач зможе бачити символічні посилання, але не зможе позначити їх для індексування. Символічне посилання — це файл, який «вказує» на інший файл або каталог; у Dolphin назви символічних посилань буде показано курсивом. Вам слід визначити справжню адресу каталогу (у Dolphin позначте пункт файла, а потім скористайтеся пунктом меню Властивості -> Загальне -> Вказує до) і наказати Strigi проіндексувати дані у каталозі.

За допомогою Системних параметрів можна також визначити, чи буде Strigi індексувати файли на портативних носіях даних, зокрема дисках USB та компакт-дисках.

Приклади

Давайте спробуємо розібратися з можливостями Nepomuk на двох прикладах.

Зв’язки

Припустімо, ви два тижні тому отримали фотографію, зроблену вашим другом чи подругою. Ви зберегли дані зображення десь на вашому комп’ютері. Як же знайти файл, якщо ви на пам’ятаєте, куди його було збережено?

Nepomuk допоможе вам у пошуку. Ви, звичайно ж, знаєте ім’я того, хто надіслав файл, але комп’ютер про це нічого не знає. Nepomuk допоможе комп’ютерові відновити зв’язок між, скажімо, ім’ям та адресою файла. Достатньо буде вказати ім’я вашого друга чи подруги і у результатах пошуку за метаданими буде показано потрібну вам фотографію!

Іншим потенційним зв’язком є зв’язок між веб-сторінкою, з якої ви скопіювали фрагмент тексту, і документом, куди ви вставили цей текст, або між двома знімками одного автомобіля. Дані про такі зв’язки іноді можна видобути з самих файлів (ви можете проаналізувати фотографії і встановити, що саме на них зображено) або даних програм, за допомогою яких було виконано обробку файлів (див. приклад з зображенням, надісланим електронною поштою). Розробка відповідної частини Nepomuk все ще триває. Потрібна інтеграція до програм, отже повної реалізації доведеться чекати декілька років.

Щоб там ми не говорили, цю частину Nepomuk призначено для інтелектуалізації пошуку. Вона чимось подібна до тої системи, яку Google використовує у власному пошуковому рушії: якщо ви шукаєте назву готелю або міста, рушій покаже над списком результатів пошуку карту google з готелями, які ви шукали! Система навіть може запропонувати точнішу назву, якщо ви припустилися помилки під час введення. Крім того, Google намагається подати найточніші відповідники на початку списку результатів на основі складних обчислень та взаємозв’язків (посилань) між сайтами. Nepomuk зможе подавати подібні кмітливі результати і впорядковувати їх за відповідністю на основі даних про взаємзв’язок.

Контекст

Дані щодо зв’язків не лише допоможуть вам у пошуку файлів, але і зможуть вплинути на роботу програм та показані ними дані. Зауважте, що, таким чином, використання Nepomuk надасть вам більше даних, ніж ви навіть могли припустити! Багато компонентів системи вже реалізовано, але ще не інтегровано з програмами та стільницею.

Наведемо приклад прив’язки стільниці до контексту. Така прив’язка допоможе вам працювати ефективніше.

Припустімо, ви працюєте над якимись нотатками для робочої зустрічі. Дзвонить телефон, хтось просить вас знайти електронну таблицю з цінами на продукцію і створити з неї цінник для покупця. Після декількох подібних прохань, які перериватимуть вашу роботу, на стільниці буде відкрито цілу купу файлів та вікон...

Хотілось би впорядкувати все це кращим чином, чи не так?

Ви можете скористатися 'просторами дій'. Ці простори було введено до Плазми на заміну «стільницям». Простори дій чимось подібні до віртуальних стільниць, але зі зміною наборів програм. Інші віджети, тло стільниці тощо. Починаючи з KDE 4.3, кожну віртуальну стільницю може бути пов’язано з простором дій, отже можлива синхронізація цих двох компонентів середовища.

Оскільки програми і стільниці пов’язано з просторами дій, ви можете створити простір дій для кожного завдань, які вам доводиться регулярно виконувати. Отже, якщо вам часто доводиться працювати з електронною таблицею цін, ви можете створити простір дій для цієї роботи: відкрийте на стільниці віджет перегляду тек (або декілька таких віджетів), додайте віджет калькулятора та віджет стеження за завданнями, щоб стежити за ще не виконаною роботою. Можливо, вам захочеться відкрити віджет електронної пошти зі списком повідомлень, що стосуються електронних таблиць цін!

Якщо хтось надішле запит щодо цін, ви перемкнетеся на відповідний простір дій і відкриєте програму для роботи з електронними таблицями. Програму буде пов’язано з простором дій, отже у ній ви побачите електронні таблиці з останніми даними щодо цін, а не складськими фактурами, над якими ви працюєте у іншому просторі дій! У Kopete буде відкрито вікно балачки з вашим колегою, який володіє інформацією щодо цін, саме відповідний обліковий запис буде пов’язано з цим простором дій.

Коли ви завершите роботу, можна повернутися до іншого простору дій. Всі програми змінять свої параметри відповідно до відкритого простору дій з певною функціональною прив’язкою.

Переваги такої заснованої на просторах дій роботи не обмежуються наведеним вище прикладом. Подібне впорядкування роботи допоможе вам не лише у пошуку файлів та записів контактів, але і у перемиканні між самими завданнями. Мозку людини важко впоратися з виконанням декількох завдань одночасно, — більшості людей потрібно декілька хвилин на адаптацію до нового завдання. Зміна «середовища» значно пришвидшує цей процес, навіть якщо всі зміни обмежуються екраном комп’ютера. Це можна порівняти з покращенням настрою під час пакування речей перед відпусткою!

Звичайно ж, наведені вище приклади здебільшого стосуються людей, які працюють за комп’ютером у офісі або вдома. Комп’ютерним гравцям або звичайним користувачам простори дій не дадуть майже ніяких переваг.

Зауважте, що описаний вище сценарій не відповідає поточній дійсності. Для його реалізації може знадобитися декілька років. Багато з ідей вже реалізовано у KDE, але багато ще чекає на свою реалізацію.

Поширені питання та відповіді на них

Наведені нижче дані взято з допису на форумі KDE. Будь ласка, додавайте ваші пункти до списку, вилучайте застарілі пункти та вносьте зміни, якщо маєте на те бажання!

Яка відмінність між семантичною стільницею Nepomuk та інструментом індексування файлів Nepomuk (Strigi)?

Відповідь. Семантична стільниця Nepomuk є основою всіх інших модулів інфраструктури Nepomuk. За її допомогою можна впорядковувати, анотувати та створювати зв’язки між даними (не лише назвою файла і його вмістом, але, наприклад, тим, у яких програмах використано певний файл, або мітками цього файла). Програми і робочі простори KDE використовують цю базову інфраструктуру для реалізації своїх можливостей, зокрема додавання міток до повідомлень електронної пошти (KMail) або налаштування просторів дій (Plasma).

З іншого боку, засіб індексування файлів Strigi — система для індексування файлів, за допомогою якої дані додаються до основного сховища даних Nepomuk, зручний спосіб уможливлення використання цих даних у Nepomuk без додавання кожного з файлів вручну. Крім того, після обробки цим засобом програми, зокрема Dolphin, можуть виконувати пошук за вмістом, назвою або іншими метаданими (наприклад мітками), пов’язаними з індексованими файлами. Такий засіб індексування може виконувати обробку не лише текстових файлів, але і файлів PDF, отримуючи доступ до метаданих, що зберігаються у цих файлах (даних щодо автора, публікації тощо). У деяких компонентах KDE передбачено додаткові «аналізатори» для інших типів файлів. Nepomuk може працювати без використання індексатора файлів, який є додатковим (а не обов’язковим) компонентом.

Why do we need both Akonadi and Nepomuk? Aren't they doing the same thing?

There is often a good deal of confusion aboujt Akonadi and Nepomuk. Why data from Akonadi is indexed in Nepomuk explains exactly why we have both, and what their roles are. Don't miss the additional information from Will Stephenson in the Comments section.

Питання. Як вимкнути семантичну стільницю?

Відповідь. Здебільшого, найпростішим способом вимкнути індексування файлів, яке навантажує систему найбільше серед компонентів Nepomuk (хоча у випуску 4.7 було виконано значну оптимізацію, яка зменшила навантаження на систему). Щоб зробити це, зніміть позначку з пункту Увімкнути засіб індексування файлів стільниці Nepomuk у розділі Стільничний пошук програми Системні параметри. Якщо ви бажаєте вимкнути всі семантичні можливості, зніміть позначку з пункту Увімкнути семантичну стільницю Nepomuk. Зауважте, що таким чином буде вимкнено можливість пошуку у Dolphin.

Слід зауважити, що у разі вибору останнього варіанта, деякі з програм, які використовують Nepomuk для зберігання метаданих, матимуть звужені можливості: у KMail не можна буде визначати мітки для повідомлень електронної пошти, а у просторах дій Плазми не можна буде скористатися додатковими можливостями, зокрема піктограмами та даними щодо програм.

Питання. Чому я бачу у списку процесів nepomukservicestub навіть після вимикання Nepomuk?

Відповідь. Можливо, причиною є певна вада. Будь ласка, повідомте про неї, надавши повний опис вашої проблеми та кроки з її відтворення.

Питання. Індексування файлів PDF або інших типів не працює.

Відповідь. Проблема з індексуванням PDF є відомою, за її виправленням можна стежити на сторінці вада №231936. Якщо у вас виникають проблеми з файлами інших типів, створіть повідомлення про ваду. Буде добре, якщо ви додасте зразок файла, за допомогою якого можна буде відтворити проблему.

Питання. Програма nepomukservicestub завершує роботу у аварійному режимі після запуску системи.

Відповідь. Багато вад, пов’язаних з аварійним завершенням роботи, було виправлено у випуску 4.7.2 KDE. Якщо вашу проблему не було виправлено, будь ласка, створіть звіт щодо вади з докладними настановами щодо відтворення проблеми, оскільки іноді розробникам не вдається відтворити проблему у призначених для цього тестових системах.

Питання. Процес virtuoso-t споживає 100% процесорного часу.

Відповідь. Virtuoso-t є ключовим компонентом інфраструктури Nepomuk. За певних обставин команди, надіслані іншими компонентами, призводять до значних затримок з обробкою (у цей час система споживає 100% потужностей процесора). Sebastian Trüg (провідний розробник Nepomuk) виправив більшість цих проблем у 4.7.1 та новіших версіях.

Питання. Іноді Nepomuk споживає занадто багато оперативної пам’яті.

Відповідь. Значну частину цих проблем було усунуто, але деякі проблеми розробникам не вдалося відтворити. Надання прикладів та настанов щодо відтворення у звітах щодо вад збільшує ймовірність виправлення цих вад.

Питання. Чому Nepomuk повторно індексує файли після запуску системи?

Відповідь. Цю ваду було виправлено у версії 4.7.0. Тепер Nepomuk лише «шукає» зміни без повторного індексування всіх даних.

Питання. Чому Nepomuk під час запуску блокує своїми запитами доступ до диска?

Відповідь. У 4.7 на новіших версіях навантаження на диск було зменшено завдяки реалізації у інструменті індексування файлів механізму гальмування.

Питання. Мою базу даних Nepomuk було пошкоджено. Як спорожнити базу даних?

Відповідь. Якщо вашу базу даних серйозно пошкоджено, нічого вже не може врятувати дані, ви можете вилучити каталог $KDEHOME/share/apps/nepomuk (де $KDEHOME зазвичай ~/.kde або ~/.kde4), коли Nepomuk буде вимкнено. Базу даних буде спорожнено, але ви також втратите всі дані, що було зібрано, зокрема мітки, оцінки і коментарі.

Додаткові можливості з усування вад

Якщо виникають труднощі з індексуванням файла за допомогою Nepomuk, віддайте за допомогою термінала команду

nepomukindexer /шлях/до/файла

і ознайомтеся з виведеними даними. Можете порівняти виведені дані з даними для подібного файла, вміст якого було успішно проіндексовано.

xmlindexer /path/to/file > /tmp/test.xml

створює представлення у форматі XML частини інформації, видобутої з файла. Ви можете переглянути файл у програмі для перегляду XML, зокрема програмі для перегляду сторінок інтернету, і знову ж таки порівняти з даними для подібного файла. Файл xmlindexer може зберігатися у іншому, додатковому пакунку вашого дистрибутива Linux; наприклад, в Ubuntu цим пакунком є strigi-utils.

У цьому дописі у блозі наведено пояснення щодо вмикання діагностичного виведення даних для служби Nepomuk. Там також наведено дані щодо діагностики причин надмірного використання процесора Nepomuk та помилок, пов’язаних зі сховищем даних.

У цьому дописі у блозі пояснено спосіб отримання корисних даних для звітів про ваду щодо надмірного використання процесорного часу сервером Virtuoso.

Оприлюднення даних і конфіденційність

І ще одна річ, якої хотілось би торкнутися перед наведенням інших джерел інформації: оприлюднення даних Nepomuk. Іноді буває корисним, якщо ваші мітки, оцінки та коментарі буде надіслано іншим користувачам разом з файлами. Але якщо ви раптом зробили мітку, яка може образити того, кому ви надсилаєте файл (наприклад, мітка «колода у ліжку» для фотографії), ви навряд чи захочете, щоб її було надіслано разом зі знімком того, кому ви надіслали файл...

Звичайно ж, цю проблему було ретельно розглянуто творцями Nepomuk. У поточній версії з міркувань збереження конфіденційності та уникнення зайвих технічних проблем контексти Nepomuk є особистими даними. Таким чином, розробники Nepomuk роблять все можливе для забезпечення конфіденційності ваших даних.

Інші джерела даних