Текстова търсачка на XEROX намира игла в копа сено
Учени от Xerox Corporation разработиха нов софтуер за търсене на документи
FactSpotter, който дава възможност да се открие буквално „игла в копа сено”. Продуктът, създаден в изследователския център Xerox Research Centre Europe (HRCE) в Гренобъл, Франция, комбинира мощна лингвистична търсачка с лесен интерфейс, така че всеки да може да задава въпроси към системата на обикновен език, използван в ежедневието. За разлика от традиционните инструменти за търсене FactSpotter търси не само по ключовите думи, съдържащи се в зададения въпрос, но и в контекста на документите, в който те са използвани. Например ако се нуждаем от документи, в които се споменава Анджелина Джоли, системата ще ни даде и резултати, в който името й е заместено с местоимението „тя”.
“Умната” търсачка може да прерови почти всеки документ независимо от езика, разположението, формата, големината или типа; възползва се от начина, по който хората мислят, говорят и задават въпроси и различава резултатите, като подчертава само полезните и релевантни отговори.
„Нашата търсачка е от следващо поколение, надскача обикновеното търсене чрез ключови думи, както и днешните програми за търсене в бази данни, които обикновено дават като резултат само 40 процента от всички релевантни документи, защото ключовите думи са твърде ограничаващи – споделя Фредерик Сегонд, мениджър на морфологичните и семантични проучвания в XRCE - Инструментът на Xerox е по-ефективен, защото анализира смисъла и връзките между документите. FactSpotter „разбира” смисловия контекст на търсенето, връща правилната информация на потребителя и дори подчертава точното положение на отговорите в документа.”
Софтуерът допълва разрастващото се портфолио на Xerox от иновации, свързани с аутсорсинга на услуги, и е част от съвременните интелигентни технологии на компанията за управление на документи. Той помага на потребителите да управляват по-добре огромни бази данни и документните процеси в сферите на банкерството, финансите, правото и др.
„Съвременните хора всеки ден търсят множество специфична информация, за да могат да вършат работата си – споделя Мике Мациарка, директор на InfoTrends Dynamic Content Software and Image Scanning Trends Consulting Services - Всички ние имаме нужда от инструменти, които улесняват намирането на „иглата” сред копите „сено”. FactSpotter удовлетворява тази нужда, защото прави търсенето лесно, по-ефективно и по-обширно. Това безспорно подобрява ефективността на резултатите и позволява на потребителите да бъдат по-продуктивни.”
Новият софтуер е средство, чрез което потребителите могат да задават въпросите си естествено, без да ги адаптират към логиката на компютрите. FactSpotter намира точно тази част от текста, която е свързана с въпроса. Това го отличава от традиционните машини за търсене, които дават като резултат цели документи и поради тази причина на потребителя се налага да намери нужната информация сам. Той взема предвид контекста на целия документ, вместо на отделни групи думи, и въвежда концепцията „връзка”, като търси вътре в изреченията и параграфите. FactSpotter разпознава абстрактни категории като „хора” или „сгради” и извлича всички думи, които се вписват в тях.
Като анализира значението едновременно на въпросите и търсените документи, FactSpotter ще улесни и подобри скоростта на работата с бази данни. Например по време на решаване на правни казуси той ще позволи определени факти да бъдат открити бързо и лесно сред хиляди, а често и милиони различни документи. Като предоставя пълни и релевантни отговори лесно и бързо, новият софтуер може да направи революция в операциите с динамични данни в сферата на бизнеса като риск мениджмънт, фармацевтични проучвания, анализ на пазара и конкуренцията, безопасност и борба с престъпността.

