急急急,小白弱弱请教一个关于字符串的大问题

2021-03-20 09:54:39 +08:00
 hellogitooxx
有一个字符数组(可自增),如:AAAABAAABBABBBABBBBCABDBABCABBAAAAACAAAACBCAAAAAABBBCCACBABBABAAABAE....,将它切成 6 行(暂定)输出,切法如下:
A, A, B, B, A, A, A, C, A, A, A, A
A, A, B, C, B, A, A, A, B, C, B, E
A, B, A, A, C, A, A, A, B, B, A, .
A, B, B, B, A, A, A, A, B, A, A, .
B, A, B, D, B, A, C, A, C, B, A, .
A, B, B, B, B, C, B, A, C, B, B, .
即每 6 个元素为一组,向竖输出,请给出互相行之间不断比较,有三个以上(暂定)相同的元素开始计算,一直计算出每行之间都不存在(四个,五个。。。)相同的元素为止,注意提示第几行和第几行有相同并统计出现次数。


刚开始我看着也有点迷糊,按题目的意思是,先把字符串格式输出先,然后再取每行前面三个元素相互比较,然后再统计,后面要是还有相同的元素,不断比较和统计。

我的代码如下:

def get_str(str1):
# 字符串转换成列表,方便观看
list_ = list(str1)
# print(list_)

# 生成 6 个空列表
b1, b2, b3, b4, b5, b6 = ([] for i in range(6))
# 等待间隔数,利用方差
c1 = 6
# 统计相同次数
num = 0
# 相同行次统计
sum_tong = 0

for index, value in enumerate(list_):
index = index + 1

if index % c1 == 1:
b1.append(value)
# print(b1)
if index % c1 == 2:
b2.append(value)

if index % c1 == 3:
b3.append(value)

if index % c1 == 4:
b4.append(value)

if index % c1 == 5:
b5.append(value)

if index % c1 == 0:
b6.append(value)

if index <= 18 and len(b1) == 3:

if b1 == b2 and (index % c1 == 2):
sum_tong = sum_tong + 1
print("第一行和第二行相同----次数::" + str(sum_tong))
elif b1 == b3 and (index % c1 == 3):
sum_tong = sum_tong + 1
print("第一行和第三行相同----次数::" + str(sum_tong))

elif b1 == b4 and (index % c1 == 4):

sum_tong = sum_tong + 1
print("第一行和第四行相同----次数::" + str(sum_tong))
elif b1 == b5 and (index % c1 == 5):

sum_tong = sum_tong + 1
print("第一行和第五行相同----次数::" + str(sum_tong))
elif b1 == b6 and (index % c1 == 0):

sum_tong = sum_tong + 1
print("第一行和第六行相同----次数::" + str(sum_tong))

elif b2 == b3 and (index % c1 == 3):

sum_tong = sum_tong + 1
print("第二行和第三行相同----次数::" + str(sum_tong))
elif b2 == b4 and (index % c1 == 4):

sum_tong = sum_tong + 1
print("第二行和第四行相同----次数::" + str(sum_tong))
elif b2 == b5 and (index % c1 == 5):

sum_tong = sum_tong + 1
print("第二行和第五行相同----次数::" + str(sum_tong))
elif b2 == b6 and index % c1 == 0:

sum_tong = sum_tong + 1
print("第二行和第六行相同----次数::" + str(sum_tong))

elif b3 == b4 and (index % c1 == 4):

sum_tong = sum_tong + 1
print("第三行和第四行相同----次数::" + str(sum_tong))
elif b3 == b5 and (index % c1 == 5):

sum_tong = sum_tong + 1
print("第三行和第五行相同----次数::" + str(sum_tong))
elif b3 == b6 and index % c1 == 0:

sum_tong = sum_tong + 1
print("第三行和第六行相同----次数::" + str(sum_tong))

elif b4 == b5 and (index % c1 == 5):

sum_tong = sum_tong + 1
print("第四行和第五行相同----次数::" + str(sum_tong))
elif b4 == b6 and index % c1 == 0:

sum_tong = sum_tong + 1
print("第四行和第六行相同----次数::" + str(sum_tong))

elif b5 == b6 and index % c1 == 0:
sum_tong = sum_tong + 1
print("第五行和第六行相同----次数::" + str(sum_tong))

elif index > 18 and sum_tong >= 2:

if b1 == b2 and (index % c1 == 2):
num = num + 1
print("第一行和第二行有对应相同的----次数:" + str(num))
elif b1 == b3 and (index % c1 == 3):
num = num + 1
print("第一行和第三行有对应相同的----次数:" + str(num))

elif b1 == b4 and (index % c1 == 4):

num = num + 1
print("第一行和第四行有对应相同的----次数:" + str(num))
elif b1 == b5 and (index % c1 == 5):

num = num + 1
print("第一行和第五行有对应相同的----次数:" + str(num))
elif b1 == b6 and (index % c1 == 0):

num = num + 1
print("第一行和第六行有对应相同的----次数:" + str(num))

elif b2 == b3 and (index % c1 == 3):

num = num + 1
print("第二行和第三行有对应相同的----次数:" + str(num))
elif b2 == b4 and (index % c1 == 4):

num = num + 1
print("第二行和第四行有对应相同的----次数:" + str(num))
elif b2 == b5 and (index % c1 == 5):

num = num + 1
print("第二行和第五行有对应相同的----次数:" + str(num))
elif b2 == b6 and index % c1 == 0:

num = num + 1
print("第二行和第六行有对应相同的----次数:" + str(num))

elif b3 == b4 and (index % c1 == 4):

num = num + 1
print("第三行和第四行有对应相同的----次数:" + str(num))
elif b3 == b5 and (index % c1 == 5):

num = num + 1
print("第三行和第五行有对应相同的----次数:" + str(num))
elif b3 == b6 and index % c1 == 0:

num = num + 1
print("第三行和第六行有对应相同的----次数:" + str(num))

elif b4 == b5 and (index % c1 == 5):

num = num + 1
print("第四行和第五行有对应相同的----次数:" + str(num))
elif b4 == b6 and index % c1 == 0:

num = num + 1
print("第四行和第六行有对应相同的----次数:" + str(num))

elif b5 == b6 and index % c1 == 0:
num = num + 1
print("第五行和第六行有对应相同的----次数:" + str(num))

print("相同总行数" + str(sum_tong))
# 打印
print(b1)
print(b2)
print(b3)
print(b4)
print(b5)
print(b6)
print("--------------------------------------------------------------------")
# print("总共出现相同次数" + str(num))


data1=get_str("AAACDAAAACDABAABBAAABBAABAABBAACCBAA....")


我卡住了,思路有了,解题方法有点问题,求高手赐教
2240 次点击
所在节点    Python
22 条回复
Enying
2021-03-20 10:16:46 +08:00
说实话,看不下去…
Pagliacii
2021-03-20 10:58:05 +08:00
没看懂想比较啥,但是竖向输出可以简单写成这样: https://i.loli.net/2021/03/20/BRiEovm5lsdFjV9.png
Pagliacii
2021-03-20 11:01:07 +08:00
@Pagliacii #2 后面的循环应该是 `for row in rows.values()` 才对,写少了
hellogitooxx
2021-03-20 15:03:14 +08:00
hellogitooxx
2021-03-20 15:04:54 +08:00
首先感谢 @Pagliacii 的回答,按他的代码,已经完成了编排,
前面是我表达不清,不好意思,如下
A,A,B,B,A,A,A,C,A,A,A,A
A,A,B,C,B,A,A,A,B,C,B,E
A,B,A,A,C,A,A,A,B,B,A
A,B,B,B,A,A,A,A,B,A,A
B,A,B,D,B,A,C,A,C,B,A
A,B,B,B,B,C,B,A,C,B,B
需求:
元素已经编排好了,然后选择第一行前面的 3 个元素,和后面 5 行前面三个元素对比,有相同的+1,如第一行和第二行有相同的,则+1,行与行之间相互不断比较,到第 4 行和第 6 行也有相同的,也+1,不过这个+1 不是在第一行和第二行的前提上+1,因为它们的内部元素不相等的,然后继续循环,又回到第一行,取前面 4 个元素,相互比较,第 4 行和第 6 行也有相同的相同元素出现+1,循环,后面取前面 5 个元素,又一次循环,发现没有相同元素,程序结束。

想得到的信息:
第一和第二行,有相同的,出现一次
第四和第六行,有相同的,出现二次

恳请赐教。
Pagliacii
2021-03-20 18:37:09 +08:00
@hellogitooxx #5 有三个问题。

1. 相同元素是指字符相同即可,还是要位置相符?
2. 是每行都和其他行比较一次,还是相邻的两行作比较?
3. 取前面的元素作比较,元素的个数是从 3 到 5 即可,还是要到行尾?
drinkeroftea
2021-03-20 19:38:07 +08:00
result = dict()
for i in range(len(str_list)):
for j in range(i+1, len(str_list)):
count = 0
for p in range(3, len(str_list[i])):
if str_list[i][:p] == str_list[j][:p]:
count += 1
else:
break
result[str(i)+'_'+str(j)] = count

也不知道有没有读懂你的题干
hellogitooxx
2021-03-20 20:20:28 +08:00
@Pagliacii 感谢你的回复,
1.就是相同的元素字符即可,比如第一行 AAB,第二行也是 AAB,第四行 A,B,B 和第 6 行 A,B,B,
2.是每行都和其他行比较一次,存在相同就+1,
3.取前面的元素作比较(从第 3 个元素开始),每循环一次就增加一个元素进行相互比较,直到不存在相同的两行为止。

暂时还发不了图片网址,见谅。


@drinkeroftea
感谢你的热心回复,你可以看看 5 楼我的回复。
hellogitooxx
2021-03-20 20:22:11 +08:00
@drinkeroftea 你可以贴张图你的代码运行后的结果么,我再详细描述一下
Pagliacii
2021-03-20 20:35:18 +08:00
@hellogitooxx #8 也就是说是每行相同位置的字符要相同才计算是吧?

“从第 3 个元素开始” 是指前两个元素不用管吗?
hellogitooxx
2021-03-20 23:59:49 +08:00
@Pagliacii 是的,每行相同位置的字符要相同。
“从第 3 个元素开始” 是指前两个元素不用管。
Pagliacii
2021-03-21 00:04:43 +08:00
@hellogitooxx 如果我没理解错的话,大概就是这样的:

https://i.loli.net/2021/03/21/DGe4xAXUSzBr7oZ.png
Pagliacii
2021-03-21 00:06:53 +08:00
@Pagliacii #12 贴错图了,应该是这张: https://i.loli.net/2021/03/21/XxYQLNKiWzylmTa.png
hellogitooxx
2021-03-21 09:45:57 +08:00
@Pagliacii 感谢你在百忙之中回复,
然后选择第一行前面的 3 个元素,去后面 5 行查找是否存在前面三个元素相同的,有相同的+1,如第一行和第二行有相同的,则+1 (绿色条),程序向下循环查找,AAB 已经后面行已经没有,然后,(第二行,前面的 3 个元素,去后面 4 行查找是否存在前面三个元素相同的,有则+1,第三行同样,以此类推,比较存在就+1,)
到第 4 行和第 6 行也有相同的,也+1,不过这个+1 不是在第一行和第二行的前提上+1,因为它们的内部元素不相等的,然后继续循环,又回到第一行,开始取前面 4 个元素(因为之前是 3 个元素,现在元素内部也自增+1,循环一次,蓝色箭头),相互比较(查找),第 4 行和第 6 行也有相同的相同元素出现+1 (黄色条),面取前面 5 个元素,又一次循环,发现没有相同元素,程序结束。

思维是,先将字符串转换成 6 行,向竖输出,然后,第一次,先取第一行前面 3 个元素,去查找后面行前面 3 个元素是否有相同的,存在则+1,循环一次过后,再取第二行前面 3 个元素,去后面 4 行查找是否存在前面三个元素相同的,有则+1,第三行同样,以此类推,像比较存在就+1 )

截图我也发你邮箱了,再次感谢你。
Pagliacii
2021-03-21 10:02:52 +08:00
@hellogitooxx #14 那就是我原来的理解才是对的,是从取 3 个元素开始各行之间作比较。但是你在 #11 又说“从第 3 个元素开始” 是指前两个元素不用管,我就改了代码不比较前两个元素了。

https://i.loli.net/2021/03/21/FZNhU1kb56RivY9.png

其实你只要改动比较字符的长度范围即可,即将 [i:i + 1] 改成 [:i + 1]
hellogitooxx
2021-03-21 12:00:11 +08:00
@Pagliacii 太感谢你了。刚学编程不久,能够遇到你这样热心回答,向你学习。
Pagliacii
2021-03-21 12:09:30 +08:00
@hellogitooxx #16 不客气。其实你只要把问题拆解成一个个小问题,然后把小问题一个个解决就能够解决大问题了。另外清晰地表达出问题也有助于思考
hellogitooxx
2021-03-21 19:33:51 +08:00
@Pagliacii

def detect_paired(rows):
paired_rows = list(combinations(rows.keys(), 2))
# 你把 paired 这个变量换成一个字典来存储比较结果就好了。
# 比如以行数组成的元组作为 key,而 value 则是相同的次数。
# 这样只要每次发现相同的两行,就把 value 加一,就可以得到你想要的结果了。
paired = {}
value =1
i = 2
longest_column = max(rows.values(), key=lambda row: len(row))
while paired_rows and i < len(longest_column):
for pair in paired_rows[:]:
# print(pair)
if rows[pair[0]][:i + 1] == rows[pair[1]][:i + 1]:
# 以行数组成元组:pair
#print(paired.keys())
# 你应该先判断这两行是否已经记录过了,即是否存在于
# paired 这个字典里。如果字典里已有记录,那么就更新这个记录。
# 如果没有,那么就新增一个记录到字典里去。
if pair in paired.keys():
#if pair==paired[pair]:
value += 1
paired[pair]=value # 更新

elif pair not in paired.keys():
paired.update({pair: value})

print(f"L{pair[0]}==L{pair[1]}:{rows[pair[0]][:i + 1]}")

else:
paired_rows.remove(pair)
i += 1

return paired


添加了判断行数组是否存在,
我另外换了一串字符串,如下:
AAAAAABBBBBBABAABAABBBBABAAAAABABBAABBABABAAABBABAABAABDEFABBF

为什么达不到我想要的效果的,请问问题还出在哪里呢

按理说( 1,4 ),( 2,3 )不会有这么多呢?

我遇到的问题是怎么更新对应的字典里的键的值。

恳请你指点一下
Pagliacii
2021-03-21 19:54:33 +08:00
@hellogitooxx #18 判断一个 key 是否已存在字典里和更新字典项其实可以写成一行,如下:

paired[pair] = paired.get(pair, 0) + 1

上面这一行的代码是使用了字典的 get 方法。它的作用是如果字典里存在对应的 key,则返回它的 value 给调用方;如果不存在则返回第二个参数。

至于如何更新字典项,就是用赋值符号把值赋给对应项,如上面的 paired[pair] = ...
hellogitooxx
2021-03-21 21:42:40 +08:00
@Pagliacii 感谢你。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/763392

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX