Bạn có thể sử dụng defaultdict để kiểm đếm từng chuỗi con bắt đầu bằng mỗi vị trí trong chuỗi đầu vào. Phương thức getubs là một phương thức trình tạo tạo ra một chuỗi con nhỏ hơn mỗi khi nó được gọi.
Ví dụ
from collections import defaultdict def getsubs(loc, s): substr = s[loc:] i = -1 while(substr): yield substr substr = s[loc:i] i -= 1 def longestRepetitiveSubstring(r): occ = defaultdict(int) # tally all occurrences of all substrings for i in range(len(r)): for sub in getsubs(i,r): occ[sub] += 1 # filter out all sub strings with fewer than 2 occurrences filtered = [k for k,v in occ.items() if v >= 2] if filtered: maxkey = max(filtered, key=len) # Find longest string return maxkey else: raise ValueError("no repetitions of any substring of '%s' with 2 or more occurrences" % (r)) longestRepetitiveSubstring("hellopeople18654randomtexthellopeoplefromallaroundthe world")
Đầu ra
Điều này sẽ cho kết quả:
'hellopeople'