Фахівці в галузі пошукової оптимізації досить давно використовують автоматичні й напівавтоматичні програмні системи для полегшення своєї роботи і тимчасових витрат на реєстрацію просувного сайту в різних інформаційних службах та тематичних каталогах. Якщо згадувати найбільш відомі програмні комплекси, то це Allsubmitter и Smile SEO Tools. Сутність таких програм полягає в автоматичному заповненні форм реєстрації, які перед відправкою перевіряються на правильність заповнення безпосередньо самою людиною (під час роботи в напівавтоматичному режимі). Напівавтоматичний режим вважається найкращим засобом для якісної зареєстрації сайту у великій кількості каталогів.
Ключовим моментом при автоматичному заповненні форми є вибір найбільш відповідної за тематикою категорії із заздалегідь віизначеного переліку. Цю процедуру, таку просту для ручного виконання самою людиною, автоматично досить складно реалізувати, оскільки перелік можливих категорій апріорі невідомий фахівцеві, який реєструє сайт у каталогах.
Варто зауважити, що переліки категорій здебільшрго бувають представлені у псевдоієрархічному вигляді через використання різних роздільників слів («>», «::», «-», «|»). При цьому, фізично перелік категорій на веб-сторінці має пласку структуру.
У широко вживаній програмі Allsubmiter автоматизація вибору категорії грунтується на заданому переліку ключових слів. Слова задаються в порядку зменшення їх пріоритету, наприклад:
туризм відпочинок тур послуги агентства інше різне тощо
Перш за все програма аналізує по черзі категорії у переліку на наявність першого ключового слова, потіоту, якщо відповідності не виявлено, розпочинається пошук на наявність другого ключового слова, і ця процедура продовжується, допоки не знайдеться категорія, назву якої містить ключове слово. Однак не завжди в результаті застосування цього способу автоматичного вибору категорії можна отримати потрібний результат. Наприклад, описаний спосіб безсилий для такого списку:
Туризм > Готелі
Туризм > Пансіонати
Туризм > Агентства
...
В такому випадку програма виконає невірний вибір категорії «Туризм > Готелі». У зв'язку з цим, описаний вище метод не є ефективним при автоматичному виборі категорії (за статистикою категорія вибирається правильно у 50-75% випадків) і вимагає доопрацювання, ускладнення аналізу списку.
Автором поточної статті була розроблена нова методика автоматичного вибору категорії із заданого списку, яка дає на 85-95% вірний результат за умови, що відповідна за тематикою категорія дійсно існує в аналізованому переліці і перелік ключових слів складений правильно.
Сутність методики також полягає у попередньому укладанні переліку ключових слів, розміщенні їх у порядку зменшення пріоритету і подальшому аналізові наявного переліку категорій. маючи заданий перелік Li, (i=1..n) із n ключових слів, уведемо поняття ваги ключового слова:
Далі, послідовно аналізуючи категорії переліку Kj, (j=1..m), отримуєпо показники суммарної ваги для кожної категорії (сума ваги усіх ключовых слів, що містяться у назві категорії):
Категория, яка нарешті виявить найбільшу сумарну вагу Wсумм j і буде вважатися найбільш відповідною для заданого з самого початку переліку ключових слів. Таким чином, завдяки введенню ваги ключових слів, описана методика дозволяє давати тосить влучні результати навіть під час аналізу переліків зі схожими назвами категорій.
09/24/06.
Поточний проект: Solidarité Charente Ukraine Association Solidarité Charente Ukraine