首页   注册   登录
 SakuraSa 最近的时间轴更新
ONLINE

SakuraSa

V2EX 第 41395 号会员,加入于 2013-06-29 14:26:24 +08:00
今日活跃度排名 756
[小白问题] Java 中路径 String 的字典序排序
问与答  •  SakuraSa  •  271 天前  •  最后回复来自 SakuraSa
11
仿 10086 的钓鱼网站
Chamber  •  SakuraSa  •  2015-07-23 01:28:38 AM  •  最后回复来自 SakuraSa
3
这种访问记录是攻击么?
问与答  •  SakuraSa  •  2015-05-18 21:33:30 PM  •  最后回复来自 ihacku
6
python 模拟登陆 Github
  •  1   
    问与答  •  SakuraSa  •  2014-09-24 13:14:05 PM  •  最后回复来自 SakuraSa
    25
    关于麻将的算法问题
    问与答  •  SakuraSa  •  2014-08-15 21:04:01 PM  •  最后回复来自 SakuraSa
    28
    如何 pythonic 地实现函数只计算一次?
  •  1   
    问与答  •  SakuraSa  •  2014-07-02 10:58:48 AM  •  最后回复来自 SakuraSa
    14
    SakuraSa 最近回复了
    家里的树莓派 2 比较旧了,我也准备升级树莓派 3b 提高吃灰效率
    184 天前
    回复了 GavinHua 创建的主题 分享发现 地震了??
    http://news.ceic.ac.cn/index.html?time=1518437889
    4.3 2018-02-12 18:31:36 39.37 116.67 20 河北廊坊市永清县
    228 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    @DannyVim #15
    30k line 对于现在的电脑来说不算大文件吧
    我觉得直接用上面的代码 10s 都用不了
    228 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    228 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    上面的那个 gist 被我不小心删掉了,换一个
    228 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    虽然出来的数据格式不太对,但是应该很好转换过去了
    234 天前
    回复了 linkbg 创建的主题 Python Python 如何实现字符串比较并输出不同点
    @linkbg

    更直观的形式(py3):

    import difflib
    a = '00abc'
    b = 'axxc123'
    opcodes = difflib.SequenceMatcher(None, a, b).get_opcodes()
    print('change "%s" to "%s":' % (a, b))
    print(*(
    '%6s "%s"->"%s"' % (op, a[af:at], b[bf:bt])
    for op, af, at, bf, bt in opcodes
    if op != 'equal'), sep='\n')

    >>>output:
    change "00abc" to "axxc123":
    delete "00"->""
    replace "b"->"xx"
    insert ""->"123"
    234 天前
    回复了 linkbg 创建的主题 Python Python 如何实现字符串比较并输出不同点
    @linkbg
    编辑距离并不不会受到位置的影响,例如:

    import difflib
    a = 'abc'
    b = 'axxc123'
    print(difflib.SequenceMatcher(None, a, b).get_opcodes())

    >>> [('equal', 0, 1, 0, 1), ('replace', 1, 2, 1, 3), ('equal', 2, 3, 3, 4), ('insert', 3, 3, 4, 7)]
    234 天前
    回复了 linkbg 创建的主题 Python Python 如何实现字符串比较并输出不同点
    这个问题的重点还是怎么定义“不同点”
    不过对于序列的不同,有一个比较通用的定义方式:编辑距离
    编辑距离,就是通过
    1. 插入一个元素
    2. 删除一个元素
    3. 修改一个元素
    将一个序列变成另一个序列的最短步数
    我觉得这个最短步数的操作序列可以作为“不同点”的定义

    在 python2.7+中有个 difflib 实现了序列编辑距离的计算

    import difflib
    a = '123sdasiioi'
    b = '123sdasiioi12'
    print(difflib.SequenceMatcher(None, a, b).get_opcodes())

    >>> [('equal', 0, 11, 0, 11), ('insert', 11, 11, 11, 13)]

    把 equal 去掉,大概就是你说的不同了
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   鸣谢   ·   实用小工具   ·   700 人在线   最高记录 3762   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 13ms · UTC 22:30 · PVG 06:30 · LAX 15:30 · JFK 18:30
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1