急急急,小白弱弱请教一个关于字符串的大问题
    2021-03-20 09:54:39 +08:00
  hellogitooxx
有一个字符数组(可自增),如:AAAABAAABBABBBABBBBCABDBABCABBAAAAACAAAACBCAAAAAABBBCCACBABBABAAABAE....,将它切成 6 行(暂定)输出,切法如下:
A, A, B, B, A, A, A, C, A, A, A, A
A, A, B, C, B, A, A, A, B, C, B, E
A, B, A, A, C, A, A, A, B, B, A, .
A, B, B, B, A, A, A, A, B, A, A, .
B, A, B, D, B, A, C, A, C, B, A, .
A, B, B, B, B, C, B, A, C, B, B, .
即每 6 个元素为一组,向竖输出,请给出互相行之间不断比较,有三个以上(暂定)相同的元素开始计算,一直计算出每行之间都不存在(四个,五个。。。)相同的元素为止,注意提示第几行和第几行有相同并统计出现次数。
刚开始我看着也有点迷糊,按题目的意思是,先把字符串格式输出先,然后再取每行前面三个元素相互比较,然后再统计,后面要是还有相同的元素,不断比较和统计。
我的代码如下:
def get_str(str1):
    # 字符串转换成列表,方便观看
    list_ = list(str1)
    # print(list_)
    # 生成 6 个空列表
    b1, b2, b3, b4, b5, b6 = ([] for i in range(6))
    # 等待间隔数,利用方差
    c1 = 6
    # 统计相同次数
    num = 0
    # 相同行次统计
    sum_tong = 0
    for index, value in enumerate(list_):
        index = index + 1
        if index % c1 == 1:
            b1.append(value)
            # print(b1)
        if index % c1 == 2:
            b2.append(value)
        if index % c1 == 3:
            b3.append(value)
        if index % c1 == 4:
            b4.append(value)
        if index % c1 == 5:
            b5.append(value)
        if index % c1 == 0:
            b6.append(value)
        if index <= 18 and len(b1) == 3:
                if b1 == b2 and (index % c1 == 2):
                    sum_tong = sum_tong + 1
                    print("第一行和第二行相同----次数::" + str(sum_tong))
                elif b1 == b3 and (index % c1 == 3):
                    sum_tong = sum_tong + 1
                    print("第一行和第三行相同----次数::" + str(sum_tong))
                elif b1 == b4 and (index % c1 == 4):
                    sum_tong = sum_tong + 1
                    print("第一行和第四行相同----次数::" + str(sum_tong))
                elif b1 == b5 and (index % c1 == 5):
                    sum_tong = sum_tong + 1
                    print("第一行和第五行相同----次数::" + str(sum_tong))
                elif b1 == b6 and (index % c1 == 0):
                    sum_tong = sum_tong + 1
                    print("第一行和第六行相同----次数::" + str(sum_tong))
                elif b2 == b3 and (index % c1 == 3):
                    sum_tong = sum_tong + 1
                    print("第二行和第三行相同----次数::" + str(sum_tong))
                elif b2 == b4 and (index % c1 == 4):
                    sum_tong = sum_tong + 1
                    print("第二行和第四行相同----次数::" + str(sum_tong))
                elif b2 == b5 and (index % c1 == 5):
                    sum_tong = sum_tong + 1
                    print("第二行和第五行相同----次数::" + str(sum_tong))
                elif b2 == b6 and index % c1 == 0:
                    sum_tong = sum_tong + 1
                    print("第二行和第六行相同----次数::" + str(sum_tong))
                elif b3 == b4 and (index % c1 == 4):
                    sum_tong = sum_tong + 1
                    print("第三行和第四行相同----次数::" + str(sum_tong))
                elif b3 == b5 and (index % c1 == 5):
                    sum_tong = sum_tong + 1
                    print("第三行和第五行相同----次数::" + str(sum_tong))
                elif b3 == b6 and index % c1 == 0:
                    sum_tong = sum_tong + 1
                    print("第三行和第六行相同----次数::" + str(sum_tong))
                elif b4 == b5 and (index % c1 == 5):
                    sum_tong = sum_tong + 1
                    print("第四行和第五行相同----次数::" + str(sum_tong))
                elif b4 == b6 and index % c1 == 0:
                    sum_tong = sum_tong + 1
                    print("第四行和第六行相同----次数::" + str(sum_tong))
                elif b5 == b6 and index % c1 == 0:
                    sum_tong = sum_tong + 1
                    print("第五行和第六行相同----次数::" + str(sum_tong))
        elif index > 18 and sum_tong >= 2:
            if b1 == b2 and (index % c1 == 2):
                num = num + 1
                print("第一行和第二行有对应相同的----次数:" + str(num))
            elif b1 == b3 and (index % c1 == 3):
                num = num + 1
                print("第一行和第三行有对应相同的----次数:" + str(num))
            elif b1 == b4 and (index % c1 == 4):
                num = num + 1
                print("第一行和第四行有对应相同的----次数:" + str(num))
            elif b1 == b5 and (index % c1 == 5):
                num = num + 1
                print("第一行和第五行有对应相同的----次数:" + str(num))
            elif b1 == b6 and (index % c1 == 0):
                num = num + 1
                print("第一行和第六行有对应相同的----次数:" + str(num))
            elif b2 == b3 and (index % c1 == 3):
                num = num + 1
                print("第二行和第三行有对应相同的----次数:" + str(num))
            elif b2 == b4 and (index % c1 == 4):
                num = num + 1
                print("第二行和第四行有对应相同的----次数:" + str(num))
            elif b2 == b5 and (index % c1 == 5):
                num = num + 1
                print("第二行和第五行有对应相同的----次数:" + str(num))
            elif b2 == b6 and index % c1 == 0:
                num = num + 1
                print("第二行和第六行有对应相同的----次数:" + str(num))
            elif b3 == b4 and (index % c1 == 4):
                num = num + 1
                print("第三行和第四行有对应相同的----次数:" + str(num))
            elif b3 == b5 and (index % c1 == 5):
                num = num + 1
                print("第三行和第五行有对应相同的----次数:" + str(num))
            elif b3 == b6 and index % c1 == 0:
                num = num + 1
                print("第三行和第六行有对应相同的----次数:" + str(num))
            elif b4 == b5 and (index % c1 == 5):
                num = num + 1
                print("第四行和第五行有对应相同的----次数:" + str(num))
            elif b4 == b6 and index % c1 == 0:
                num = num + 1
                print("第四行和第六行有对应相同的----次数:" + str(num))
            elif b5 == b6 and index % c1 == 0:
                num = num + 1
                print("第五行和第六行有对应相同的----次数:" + str(num))
        print("相同总行数" + str(sum_tong))
        # 打印
        print(b1)
        print(b2)
        print(b3)
        print(b4)
        print(b5)
        print(b6)
        print("--------------------------------------------------------------------")
        # print("总共出现相同次数" + str(num))
data1=get_str("AAACDAAAACDABAABBAAABBAABAABBAACCBAA....")
我卡住了,思路有了,解题方法有点问题,求高手赐教
    
    
    
    22 条回复
    
    
    
      
      Enying
2021-03-20 10:16:46 +08:00
说实话,看不下去…
 
    
    
      
      Pagliacii
2021-03-20 10:58:05 +08:00
 
    
    
      
      Pagliacii
2021-03-20 11:01:07 +08:00
@
Pagliacii #2 后面的循环应该是 `for row in rows.values()` 才对,写少了
 
    
    
      
      hellogitooxx
2021-03-20 15:03:14 +08:00
 
    
    
      
      hellogitooxx
2021-03-20 15:04:54 +08:00
首先感谢 @
Pagliacii 的回答,按他的代码,已经完成了编排,
前面是我表达不清,不好意思,如下
A,A,B,B,A,A,A,C,A,A,A,A
A,A,B,C,B,A,A,A,B,C,B,E
A,B,A,A,C,A,A,A,B,B,A
A,B,B,B,A,A,A,A,B,A,A
B,A,B,D,B,A,C,A,C,B,A
A,B,B,B,B,C,B,A,C,B,B
需求:
元素已经编排好了,然后选择第一行前面的 3 个元素,和后面 5 行前面三个元素对比,有相同的+1,如第一行和第二行有相同的,则+1,行与行之间相互不断比较,到第 4 行和第 6 行也有相同的,也+1,不过这个+1 不是在第一行和第二行的前提上+1,因为它们的内部元素不相等的,然后继续循环,又回到第一行,取前面 4 个元素,相互比较,第 4 行和第 6 行也有相同的相同元素出现+1,循环,后面取前面 5 个元素,又一次循环,发现没有相同元素,程序结束。
想得到的信息:
第一和第二行,有相同的,出现一次
第四和第六行,有相同的,出现二次
恳请赐教。
 
    
    
      
      Pagliacii
2021-03-20 18:37:09 +08:00
@
hellogitooxx #5 有三个问题。
1. 相同元素是指字符相同即可,还是要位置相符?
2. 是每行都和其他行比较一次,还是相邻的两行作比较?
3. 取前面的元素作比较,元素的个数是从 3 到 5 即可,还是要到行尾?
 
    
    
      
      drinkeroftea
2021-03-20 19:38:07 +08:00
result = dict()
for i in  range(len(str_list)):
     for j in range(i+1, len(str_list)):
         count = 0
         for p in range(3, len(str_list[i])):
             if str_list[i][:p] == str_list[j][:p]:
                 count += 1
             else:
                 break
         result[str(i)+'_'+str(j)] = count
也不知道有没有读懂你的题干
 
    
    
      
      hellogitooxx
2021-03-20 20:20:28 +08:00
@
Pagliacii 感谢你的回复,
1.就是相同的元素字符即可,比如第一行 AAB,第二行也是 AAB,第四行 A,B,B 和第 6 行 A,B,B,
2.是每行都和其他行比较一次,存在相同就+1,
3.取前面的元素作比较(从第 3 个元素开始),每循环一次就增加一个元素进行相互比较,直到不存在相同的两行为止。
暂时还发不了图片网址,见谅。
@
drinkeroftea 感谢你的热心回复,你可以看看 5 楼我的回复。
 
    
    
      
      hellogitooxx
2021-03-20 20:22:11 +08:00
@
drinkeroftea 你可以贴张图你的代码运行后的结果么,我再详细描述一下
 
    
    
      
      Pagliacii
2021-03-20 20:35:18 +08:00
@
hellogitooxx #8 也就是说是每行相同位置的字符要相同才计算是吧?
“从第 3 个元素开始” 是指前两个元素不用管吗?
 
    
    
      
      hellogitooxx
2021-03-20 23:59:49 +08:00
@
Pagliacii  是的,每行相同位置的字符要相同。
“从第 3 个元素开始” 是指前两个元素不用管。
 
    
    
      
      Pagliacii
2021-03-21 00:04:43 +08:00
 
    
    
      
      Pagliacii
2021-03-21 00:06:53 +08:00
 
    
    
      
      hellogitooxx
2021-03-21 09:45:57 +08:00
@
Pagliacii 感谢你在百忙之中回复,
然后选择第一行前面的 3 个元素,去后面 5 行查找是否存在前面三个元素相同的,有相同的+1,如第一行和第二行有相同的,则+1 (绿色条),程序向下循环查找,AAB 已经后面行已经没有,然后,(第二行,前面的 3 个元素,去后面 4 行查找是否存在前面三个元素相同的,有则+1,第三行同样,以此类推,比较存在就+1,)
到第 4 行和第 6 行也有相同的,也+1,不过这个+1 不是在第一行和第二行的前提上+1,因为它们的内部元素不相等的,然后继续循环,又回到第一行,开始取前面 4 个元素(因为之前是 3 个元素,现在元素内部也自增+1,循环一次,蓝色箭头),相互比较(查找),第 4 行和第 6 行也有相同的相同元素出现+1 (黄色条),面取前面 5 个元素,又一次循环,发现没有相同元素,程序结束。
思维是,先将字符串转换成 6 行,向竖输出,然后,第一次,先取第一行前面 3 个元素,去查找后面行前面 3 个元素是否有相同的,存在则+1,循环一次过后,再取第二行前面 3 个元素,去后面 4 行查找是否存在前面三个元素相同的,有则+1,第三行同样,以此类推,像比较存在就+1 )
截图我也发你邮箱了,再次感谢你。
 
    
    
    
    
      
      hellogitooxx
2021-03-21 12:00:11 +08:00
@
Pagliacii 太感谢你了。刚学编程不久,能够遇到你这样热心回答,向你学习。
 
    
    
      
      Pagliacii
2021-03-21 12:09:30 +08:00
@
hellogitooxx #16 不客气。其实你只要把问题拆解成一个个小问题,然后把小问题一个个解决就能够解决大问题了。另外清晰地表达出问题也有助于思考
 
    
    
      
      hellogitooxx
2021-03-21 19:33:51 +08:00
@
Pagliacii def detect_paired(rows):
    paired_rows = list(combinations(rows.keys(), 2))
    # 你把 paired 这个变量换成一个字典来存储比较结果就好了。
    # 比如以行数组成的元组作为 key,而 value 则是相同的次数。
    # 这样只要每次发现相同的两行,就把 value 加一,就可以得到你想要的结果了。
    paired = {}
    value =1
    i = 2
    longest_column = max(rows.values(), key=lambda row: len(row))
    while paired_rows and i < len(longest_column):
        for pair in paired_rows[:]:
            # print(pair)
            if rows[pair[0]][:i + 1] == rows[pair[1]][:i + 1]:
                # 以行数组成元组:pair
                #print(paired.keys())
                # 你应该先判断这两行是否已经记录过了,即是否存在于
                # paired 这个字典里。如果字典里已有记录,那么就更新这个记录。
                # 如果没有,那么就新增一个记录到字典里去。
                if pair in paired.keys():
                    #if pair==paired[pair]:
                    value += 1
                    paired[pair]=value  # 更新
                elif pair not in paired.keys():
                    paired.update({pair: value})
                print(f"L{pair[0]}==L{pair[1]}:{rows[pair[0]][:i + 1]}")
            else:
                paired_rows.remove(pair)
        i += 1
    return paired
添加了判断行数组是否存在,
我另外换了一串字符串,如下:
AAAAAABBBBBBABAABAABBBBABAAAAABABBAABBABABAAABBABAABAABDEFABBF
为什么达不到我想要的效果的,请问问题还出在哪里呢
按理说( 1,4 ),( 2,3 )不会有这么多呢?
我遇到的问题是怎么更新对应的字典里的键的值。
恳请你指点一下
 
    
    
      
      Pagliacii
2021-03-21 19:54:33 +08:00
@
hellogitooxx #18 判断一个 key 是否已存在字典里和更新字典项其实可以写成一行,如下:
paired[pair] = paired.get(pair, 0) + 1
上面这一行的代码是使用了字典的 get 方法。它的作用是如果字典里存在对应的 key,则返回它的 value 给调用方;如果不存在则返回第二个参数。
至于如何更新字典项,就是用赋值符号把值赋给对应项,如上面的 paired[pair] = ...
 
    
    
      
      hellogitooxx
2021-03-21 21:42:40 +08:00
 
    
    
    这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
     https://www.v2ex.com/t/763392
      V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
      V2EX is a community of developers, designers and creative people.