Joker Len
Slice: | web_production |
Index: | 297 |
Name: | JokerLen |
Group: | CombinedSequences |
Description: |
We consider text features, believing that the page title is attributed to each of its proposal, i.e. The distance between the word from Title and any other word 1 sentence. Len is the maximum attitude of words from the request of the text met in some sentence (with attributed Title) in relation to the length of the request. Example [Harms Circus Vertunov] for ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2FWWWWIKILIVRES.info%2FWIKI%2F%25D0%25A6%25D %25b8%25D1%2580%25D0%25D0%25A %25BC%25D1%2581%of this document))
Original Description: Считаем текстовые фичи, считая что тайтл страницы приписан к каждому ее предложению, т.е. расстояние между словом из тайтла и любым другим словом 1 предложение. Len- максимальное отношение слов из запроса встретившихся в каком-то предложении текста (с приписанным тайтлом) в отношении к длине запроса. Пример [Хармс цирк Вертунов] для ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fwww.wikilivres.info%2Fwiki%2F%25D0%25A6%25D0%25B8%25D1%2580%25D0%25BA_%25D0%25A8%25D0%25B0%25D1%2580%25D0%25B4%25D0%25B0%25D0%25BC_%28%25D0%25A5%25D0%25B0%25D1%2580%25D0%25BC%25D1%2581%29 этого документа)) |
Tags: | TG_DOC TG_DOC_TEXT TG_DYNAMIC TG_DEPRECATED |
Authors: | styskin |
Responsibles: | styskin |