Используя конец слов Mark с Unicode в регулярных выражениях в Python

StackOverflow https://stackoverflow.com/questions/3046528

Вопрос

Следующие совпадения в холостом ходу, но не совпадают при запуске в методе в файле модуля:

import re
re.search('\\bשלום\\b','שלום עולם',re.UNICODE)

В то время как следующие совпадения в обоих случаях:

import re
re.search('שלום','שלום עולם',re.UNICODE)

(Обратите внимание, что StackoverFlow ошибочно переключает первое и второе элементы в строке выше, так как это право на левый язык)

Как я могу сделать первый код в файле PY?

Обновление: то, что я должен был написать для первого сегмента, это то, что он совпадает с простым, но не совпадает при запуске в консоли Eclipse с Pydev.

Это было полезно?

Решение

Кажется, работает для меня, когда я использую строки Unicode:

# -*- coding: utf-8 -*-

import re
match = re.search(u'\\bשלום\\b', u'שלום עולם', re.U)

Увидеть это в действии: http://codepad.org/xwz5czj5.

Лицензировано под: CC-BY-SA с атрибуция
Не связан с StackOverflow
scroll top