使用带有“\ s”的正则表达式并执行简单的string.split()将删除其他空格 - 如换行符,回车符,制表符。 除非需要这样做,否则只提供多个空格,我将介绍这些例子。
编辑:我不会这样做,我睡了这个,除了纠正最后结果的错误(v3.3.3 @ 64位,而不是32位),显然打击了我:测试字符串相当琐碎。
所以,我得到了... 11段,1000字,6665字节的Lorem Ipsum,以获得更真实的时间测试。 然后我添加了随机长度的额外空格:
original_string = ''.join(word + (' ' * random.randint(1, 10)) for word in lorem_ipsum.split(' '))
我还纠正了“适当的while”; 如果一个人关心,单行将基本上做任何前导/尾随空格的条带,这个修正版本保留一个前导/尾随空格(但只有一个;-)。 (我发现这是因为随机分布的join在末端有额外的空间,因此while失败了。)
# setup = '''
import re
def while_replace(string):
while ' ' in string:
string = string.replace(' ', ' ')
return string
def re_replace(string):
return re.sub(r' {2,}' , ' ', string)
def proper_join(string):
split_string = string.split(' ')
# To account for leading/trailing spaces that would simply be removed
beg = ' ' if not split_string[ 0] else ''
end = ' ' if not split_string[-1] else ''
# versus simply ' '.join(item for item in string.split(' ') if item)
return