МАЙДАН - За вільну людину у вільній країні


Архіви Форумів Майдану

УВАГА: оголошується конкурс

01/25/2004 | Franko
Зараз активно створюється оффлайн-варіант сайту Майдан (бібліотека, статті, новини, розробки) для розповсюдження на компакт-дисках. (Це потрібна справа, бо компакти можна буде розповсюджувати для поширення знань, притому вітатимуться добровільні оплати цих дисків поза межами собівартості, що дозволить виручити трохи грошей на акції.) Зусилля по "локалізації" та каталогізації даних задіяні в проекті майданівці докладають самотужки.

Тепер умови конкурсу: потрібен пошуковий двигун, який дозволяв би індексувати великий масив HTML-даних і міг би швидко проводити пошук, інтегруючись в саму бібліотеку (як Java applet, наприклад). Для того, щоб людина вставила CD, потопталася мишкою по екрану і мала змогу шукати оффлайновий Майдан за ключовими словами. Абсолютно необхідна умова - це коректна робота з кирилицею. Ми змушені були відкинути вже п"ять чи шість наявних в інеті безкоштовних і не дуже пошукових двигунів через те, що пошук по кирилиці проводився некоректно: не знаходилися файли, або знаходилися зайві файли, або - це було найкраще наближення - українські букви "і" та "є" сприймалися як розділові знаки, не індексувалися і в індексі розбивали слово надвоє. Через такі "дрібниці" доводиться відсівати дуже класні продукти.

В принципі, можна написати своє. Але дуже потрібна якнайглибша інтеграція в голий HTML, мінімальна (в ідеалі нульова) кількість додаткового софта на стороні клієнта, стабільність софтверу і - його НАЯВНІСТЬ, що дозволить сконцентруватися на специфічних проблемах замість написання пошуковика. CD має бути річчю в собі і все має містити на собі.

Конкурс виграють усі, хто вкаже на якесь робоче рішення. Перевірку на його робочість бере на себе ініціативна група. Головний приз - чудове відчуття власної потрібності і корисності ;-) Додатковий приз - за домовленістю :-)

Відповіді

  • 2004.01.25 | Летчик

    Re: УВАГА: оголошується конкурс

    Franko пише:
    > В принципі, можна написати своє. Але дуже потрібна якнайглибша інтеграція в голий HTML, мінімальна (в ідеалі нульова) кількість додаткового софта на стороні клієнта, стабільність софтверу і - його НАЯВНІСТЬ, що дозволить сконцентруватися на специфічних проблемах замість написання пошуковика. CD має бути річчю в собі і все має містити на собі.

    Я можу написати С++ СOM движок і індексатор. Проблема для мене саме в інтегруванні у HTML і представленні результатів пошуку. Пошук буде вестись в заданній формі слова, але, якщо знайти словарі форм слів, то можливо зробити і більш гарний движок.

    Якщо э готові движки з ісходним кодом на C++, то можу спробувати розібратись і вдосконалити для нормальної роботи з українськими символами.
    згорнути/розгорнути гілку відповідей
    • 2004.01.25 | Franko

      Хотів би я мати вихідні коди тих движків...

      Летчик пише:
      > Я можу написати С++ СOM движок і індексатор.

      Я теж думав про COM, точніше ActiveX, який встроюється (тег OBJECT або EMBED) в лівий фрейм звичайної вебсторінки. Якщо писатиму, то саме так.

      > Проблема для мене саме в інтегруванні у HTML і представленні результатів пошуку.

      [ATL] ActiveX control, який ембедиться в HTML. Представлення результатів пошуку - імхо це не проблема. Можна, наприклад, записувати результат у темп-файл, а потім його грузити в правий фрейм. Так "некрасиво", але на мій погляд ефективно, поступав один з комерційних движків, які я напорпав в інеті.

      > Пошук буде вестись в заданній формі слова, але, якщо знайти словарі форм слів, то можливо зробити і більш гарний движок.

      Це вже проблема класом вище.

      > Якщо э готові движки з ісходним кодом на C++, то можу спробувати розібратись і вдосконалити для нормальної роботи з українськими символами.

      Сабж. Це було би найпростіше.

      Якщо Ви справді маєте серйозне бажання долучитися, то давайте в мило: wakeup at lvivonline dot com. Спробуємо продумати це все і роздерибанити роботу.
      згорнути/розгорнути гілку відповідей
      • 2004.01.25 | Летчик

        Відправив. Перевірте почту. (-)

  • 2004.01.26 | YZ

    Є багато прогрмерських та веб-форумів, треба тути запитати (-)



Copyleft (C) maidan.org.ua - 2000-2024. Цей сайт підтримує Громадська організація Інформаційний центр "Майдан Моніторинг".