Начало » Речници » SEO Речник » BM25 (Best Match 25)

BM25 (Best Match 25)

BM25 е популярен и високоефективен алгоритъм за класиране (ranking function), който се използва от много информационни системи за извличане, включително търсачките. Основната му задача е да сортира наборите от документи (уебстраници) по тяхната релевантност спрямо конкретна заявка за търсене (query), подадена от потребителя.

Алгоритъмът BM25 е базиран на вероятностен модел и изчислява степента на съвпадение между заявката и всеки документ, като отчита няколко ключови фактора. Те включват честотата на срещане на думите от заявката в документа (Term Frequency – TF) и обратната честота на документа (Inverse Document Frequency – IDF), която оценява колко рядка е дадена дума в цялата колекция от документи.

Важно е да се отбележи, че при стандартната си реализация, функцията BM25 не отчита относителната позиция на думите от заявката в рамките на документа, нито тяхната близост. Тоест, независимо дали думите са разпръснати из целия текст или са групирани заедно (като фраза), BM25 ги третира като отделни термини при оценката на релевантността. Това прави алгоритъма бърз и ефективен, макар и по-малко чувствителен към фразови съвпадения в сравнение с някои по-сложни модели.

Let's discuss your goals!

Schedule a free consultation call. We'll talk about your specific needs and create a plan that fits you perfectly.