You never can tell with bees (dil) wrote in ru_python,
You never can tell with bees
dil
ru_python

Нестрогий поиск подстроки

Задача: определить наличие в строке некоего слова посредством нестрогого сравнения. То есть, foobar может там быть написан как foo bar, f0obar, fobar, foobar5 или ещё как-нибудь похоже.

В общих чертах эту задачу решает fuzzywuzzy посредством fuzz.partial_ratio, но к сожалению, оно работает только на коротких строках, примерно до 200 символов. На 300 уже не видит даже полностью совпадающего слова foobar.

Есть идеи, как решить эту задачу?
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 19 comments