welcome: please sign in

The following 427 words could not be found in the dictionary of 0 words and are highlighted below:
antiword   bindings   build   buildnewindex   cache   catdoc   catppt   comment   config   Config   Contents   core   data   descriptions   dir   doc   Document   Excel   False   ffffcc   filter   Find   Format   Get   heading   Help   history   http   index   Info   jpg   mode   moin   net   None   odp   ods   odt   Of   Office   Open   org   Page   pdf   pdftotext   plugins   poppler   Powerpoint   ppt   projects   Python   pywin32   rebuild   rowbgcolor   search   Search   section   show   sourceforge   Star   stemming   strings   sx   System   Table   tablewidth   Text   timings   True   txt   url   usenewindex   utils   Wiki   wiki   Windows   Word   www   Xapian   xapian   xls   xls2csv   xpdf   автоматически   алгоритм   аналогичен   аналогичный   библиотеки   библиотеку   Бинарные   биндинги   большого   большое   большой   будет   будут   бы   была   версии   версий   версия   версиям   версиях   виде   вики   включена   включение   включено   включить   включённых   во   возможно   возможностей   возможность   времени   время   все   всех   вспомогательные   встроенного   встроенный   встроенным   вхождения   выдача   вызывает   выполнения   выполнить   выполняется   генерации   генерация   данная   Данная   данного   данной   данные   Данный   данный   даёт   движком   диалог   директорию   дискового   дистрибутив   дистрибутиве   длительное   Для   для   добавлен   дополнения   дополнительной   дополнительных   достаточно   доступен   доступная   доступно   доступность   доступные   доступный   других   его   если   Если   её   желания   за   зависимостей   Зависимости   Зависимость   занимает   занять   записи   запрос   запроса   запросе   запросов   запустить   значение   Значение   значения   значительно   из   Извлекаются   изменении   изменения   Изображение   или   имеется   иметь   индекс   индекса   индексирования   индексироваться   индексируются   инкрементальной   информации   информация   Искать   искать   исключением   использовавшийся   Использование   использованием   использовании   использованию   использования   использовать   использует   используется   использующийся   истории   исходном   Как   как   каталоге   каталогу   кодировки   коих   количество   Командам   команде   командной   команды   комментариях   конфигурации   конфигурацию   Конфигурация   которые   Кроме   ли   механизма   много   может   можно   Мойн   момент   морфологический   на   называемым   найдены   найти   наличие   наличием   наличии   напрямую   нарушать   Настраивать   начальной   не   невозможность   недоступных   необходима   необходимо   необходимости   нестандартную   нет   неудачны   Ниже   ниже   нижней   но   новые   новый   новых   нормализованном   нормализованы   обработке   обработки   обычно   обязательна   одна   одного   означает   оказались   оказаться   операция   Описание   опция   остановить   отвечающих   отключает   отключено   отсутствует   очередном   пакеты   параметр   Параметр   параметра   параметров   перевод   переключения   перестроения   перестроить   Перестройка   По   по   Повторная   повторно   повторной   поддерживаемых   Подробнее   позволяет   поиск   Поиск   поиска   поиске   поисковая   поисковой   поисковом   поисковым   поисковых   поиском   показывать   пользователям   Помощь   попытки   После   после   поставляемую   построить   потребовать   представлен   предыдущие   преимуществ   при   При   придётся   прикреплённые   прикреплённых   Примечания   проверить   Проверить   проверки   производиться   пространства   путь   путём   пытается   работоспособность   работы   рабочий   равно   развитых   размер   разрешен   расширенный   реализованному   ревизии   результаты   рекомендуется   ряд   сайта   сайте   связи   сгенерировать   серверов   синтаксиса   системе   системная   системных   скорость   слов   слова   случае   см   сначала   снова   собственно   содержать   создать   соответствующая   сохранения   список   ссылающиеся   стало   старым   старых   страниц   странице   страницы   строки   существенной   сущностей   таблицы   так   также   Текстовые   тестер   Тестирование   тестовый   тестом   тесты   Тип   того   только   увеличить   узреть   указать   умолчанию   установить   установке   установки   установленными   утилите   утилиту   файла   файлов   файлы   Файлы   Фильтр   фильтров   фильтры   Формат   формате   функции   функциональных   хотя   хранения   хранится   части   чего   что   чтобы   чёрный   элементов   Это   этом   языка  

Clear message
location: ПомощьПоXapian

Поиск с использованием Xapian

Использование библиотеки Xapian позволяет значительно увеличить скорость работы поиска и даёт ряд дополнительных функциональных преимуществ, недоступных при использовании встроенного механизма поиска.

Зависимости

Для работы поиска необходимо иметь установленными в системе собственно библиотеку Xapian и биндинги для языка Python (пакеты xapian-core и xapian-bindings), доступные на сайте http://www.xapian.org/, версии не ниже 1.0.6. Кроме того, пользователям Windows также придётся установить pywin32, доступный на сайте http://sourceforge.net/projects/pywin32/.

Для обработки прикреплённых файлов МойнМойн использует дополнения-фильтры (filter plugins). Ниже представлен список включённых в дистрибутив МойнМойн фильтров:

Тип файла

Зависимость

Примечания

Текстовые файлы (.txt)

Фильтр пытается использовать кодировки UTF-8 и ISO-8859-1 (или ASCII в случае, если предыдущие попытки оказались неудачны)

Изображение JPEG (.jpg)

Извлекаются данные EXIF

Файлы OpenOffice.org 1.x (.sx?)

Формат файлов, использовавшийся в старых версиях OpenOffice.org/StarOffice

Файлы в формате Open Document Format (.odt, .ods, .odp, ...)

Формат файлов, использующийся в новых версиях OpenOffice.org/StarOffice

Бинарные файлы

При обработке используется алгоритм, аналогичный реализованному в утилите strings и чёрный список для сущностей, которые нет желания искать.

Файлы MS Word (.doc)

antiword

Фильтр вызывает antiword

Файлы MS Excel (.xls)

catdoc

Фильтр вызывает xls2csv

Файлы MS Powerpoint (.ppt)

catdoc

Фильтр вызывает catppt

Файлы PDF (.pdf)

xpdf-utils или poppler-utils

Фильтр вызывает pdftotext

После установки дополнительных фильтров (или зависимостей) необходимо (повторно) создать индекс. Xapian будет использовать новые фильтры или вспомогательные библиотеки автоматически. При очередном поисковом запросе поисковая выдача может содержать результаты, ссылающиеся напрямую на прикреплённые файлы.

Конфигурация

В конфигурации вики имеется ряд параметров, отвечающих за конфигурацию Xapianкомментариях доступен перевод данной таблицы):

Параметр

Значение по умолчанию

Описание

xapian_search

Falseотключено

При установке значения данного параметра в Trueвключено») поиск с использованием Xapian будет разрешен на вики.
(!) МойнМойн автоматически отключает xapian_search (и использует встроенный поиск) если не может найти рабочий индекс. Проверить, используется ли Xapian, можно на странице SystemInfoсистемная информация»)

xapian_index_history

Falseотключено

Если данная значение данного параметра равно Trueвключено»), индексируются все ревизии всех страниц (за исключением системных, коих доступная только одна версия). Это позволяет пользователям при необходимости искать по старым версиям страниц (если соответствующая опция в FindPage была включена).
/!\ Перестройка индекса необходима при изменении данного параметра. Кроме того, рекомендуется проверить размер индекса после повторной его генерации, так как включение данной функции может потребовать большое количество дискового пространства для хранения индекса большой вики. Перестройка может занять длительное время в случае индексирования истории версий страниц.

xapian_index_dir

Noneотсутствует

Данный параметр позволяет указать нестандартную директорию для сохранения индекса. По умолчанию индекс хранится в каталоге data_dir/cache/xapian.
/!\ После изменения данного параметра необходимо повторно сгенерировать индекс.

xapian_stemming

Falseотключено

При установке значения данного параметра в Trueвключено») будет производиться морфологический поиск: слова будут индексироваться в исходном и нормализованном виде и слова запроса будут нормализованы при поиске. Это означает, что при поиске слова «тесты» также будут найдены вхождения слов «тестовый», «тестом», «тестер» и т. д.
/!\ После изменения значения данного параметра необходимо перестроить индекс.

(Повторная) генерация индекса

Для начальной, повторной и инкрементальной генерации индекса можно использовать поставляемую в дистрибутиве утилиту командной строки moin.

Для (повторной) генерации индекса достаточно выполнить

moin --config-dir=/путь/к/каталогу/конфигурации/вики --wiki-url=url-вики/ index build --mode=rebuild

Подробнее о команде moin index см. на странице ПомощьПоКомандамМойн.

При наличии большого сайта невозможность использования поиска во время перестроения индекса может оказаться существенной. В этом случае можно сначала построить новый индекс путём использования команды moin index build --mode=buildnewindex. Данная операция занимает много времени, но позволяет не нарушать работоспособность поиска на вики. После чего достаточно остановить вики, запустить moin index build --mode=usenewindex для переключения на новый индекс и запустить её снова.

/!\ Перестройка индекса обязательна в случае изменения значения хотя бы одного из параметров xapian_index_history, xapian_index_dir или xapian_stemming конфигурации.

Тестирование

Проверить возможность использования Xapian и доступность индекса можно на странице SystemInfo. Для проверки, выполняется ли поиск с использованием Xapian, достаточно включить параметр show_timingsпоказывать время выполнения») в конфигурации вики, выполнить поисковой запрос и проверить наличие записи _xapianSearch в нижней части страницы.

Использование

Поиск с использованием Xapian аналогичен использованию других поисковых серверов. В связи с наличием развитых поисковых возможностей у Xapian, добавлен ряд новых элементов синтаксиса поисковых запросов, на данный момент не поддерживаемых встроенным поисковым движком (обычно называемым «moin search» — поиском Мойн). Для дополнительной информации см. КакИскать и/или новый расширенный диалог поиска, доступный на странице FindPage, чтобы узреть, что стало доступно и возможно.