Используя конец слов Mark с Unicode в регулярных выражениях в Python
-
27-09-2019 - |
Вопрос
Следующие совпадения в холостом ходу, но не совпадают при запуске в методе в файле модуля:
import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)
В то время как следующие совпадения в обоих случаях:
import re
re.search('שלום','שלום עולם',re.UNICODE)
(Обратите внимание, что StackoverFlow ошибочно переключает первое и второе элементы в строке выше, так как это право на левый язык)
Как я могу сделать первый код в файле PY?
Обновление: то, что я должен был написать для первого сегмента, это то, что он совпадает с простым, но не совпадает при запуске в консоли Eclipse с Pydev.
Решение
Кажется, работает для меня, когда я использую строки Unicode:
# -*- coding: utf-8 -*-
import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)
Увидеть это в действии: http://codepad.org/xwz5czj5.
Не связан с StackOverflow