首页   注册   登录
 SakuraSa 最近的时间轴更新
SakuraSa's repos on GitHub
JavaScript · 3 人关注
TenhouDB
Statistics for Tenhou MJGames
Python · 2 人关注
Leetcode_CodeDownloader
Get all your submissions on Leetcode
Python · 2 人关注
SimpleTenhou
用于组织天凤比赛的网站系统
Python · 1 人关注
TenhouLoggerX
New TenhouLogger with better UI
Python · 0 人关注
ChatProcess
Process with timelimit
Python · 0 人关注
ChocoBlog
Simple blog system powered by tornado
Python · 0 人关注
ChocoBlog2
Another blog for myself.
Java · 0 人关注
config
A type-safe configuration library for JVM languages
JavaScript · 0 人关注
cornfield
Python · 0 人关注
LruCache.py
Implements LRU(Last-recently-used) cache algorithm, Support the thread safe, With Python
Python · 0 人关注
Mahjong
Game libs for JP Mahjong
0 人关注
MajoNoInori
脑洞大开的结果,估计是个填补上的坑。
Python · 0 人关注
MyLeetcodeSubmissions
My Leetcode OJ submissions
0 人关注
onlineGal
onlineGal
CSS · 0 人关注
TenhouDB_game
群赛用网站
Python · 0 人关注
TenhouLogger
Log down games on Tenhou.com
Python · 0 人关注
WebGame
传说中的雀(坑)娘 MJ Collection?
ONLINE

SakuraSa

V2EX 第 41395 号会员,加入于 2013-06-29 14:26:24 +08:00
今日活跃度排名 1522
[小白问题] Java 中路径 String 的字典序排序
问与答  •  SakuraSa  •  217 天前  •  最后回复来自 SakuraSa
11
仿 10086 的钓鱼网站
Chamber  •  SakuraSa  •  2015-07-23 01:28:38 AM  •  最后回复来自 SakuraSa
3
这种访问记录是攻击么?
问与答  •  SakuraSa  •  2015-05-18 21:33:30 PM  •  最后回复来自 ihacku
6
python 模拟登陆 Github
  •  1   
    问与答  •  SakuraSa  •  2014-09-24 13:14:05 PM  •  最后回复来自 SakuraSa
    25
    关于麻将的算法问题
    问与答  •  SakuraSa  •  2014-08-15 21:04:01 PM  •  最后回复来自 SakuraSa
    28
    如何 pythonic 地实现函数只计算一次?
  •  1   
    问与答  •  SakuraSa  •  2014-07-02 10:58:48 AM  •  最后回复来自 SakuraSa
    14
    SakuraSa 最近回复了
    家里的树莓派 2 比较旧了,我也准备升级树莓派 3b 提高吃灰效率
    129 天前
    回复了 GavinHua 创建的主题 分享发现 地震了??
    http://news.ceic.ac.cn/index.html?time=1518437889
    4.3 2018-02-12 18:31:36 39.37 116.67 20 河北廊坊市永清县
    173 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    @DannyVim #15
    30k line 对于现在的电脑来说不算大文件吧
    我觉得直接用上面的代码 10s 都用不了
    173 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    173 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    上面的那个 gist 被我不小心删掉了,换一个
    173 天前
    回复了 DannyVim 创建的主题 问与答 Python 清洗、提取 txt 内数据的问题
    虽然出来的数据格式不太对,但是应该很好转换过去了
    179 天前
    回复了 linkbg 创建的主题 Python Python 如何实现字符串比较并输出不同点
    @linkbg

    更直观的形式(py3):

    import difflib
    a = '00abc'
    b = 'axxc123'
    opcodes = difflib.SequenceMatcher(None, a, b).get_opcodes()
    print('change "%s" to "%s":' % (a, b))
    print(*(
    '%6s "%s"->"%s"' % (op, a[af:at], b[bf:bt])
    for op, af, at, bf, bt in opcodes
    if op != 'equal'), sep='\n')

    >>>output:
    change "00abc" to "axxc123":
    delete "00"->""
    replace "b"->"xx"
    insert ""->"123"
    179 天前
    回复了 linkbg 创建的主题 Python Python 如何实现字符串比较并输出不同点
    @linkbg
    编辑距离并不不会受到位置的影响,例如:

    import difflib
    a = 'abc'
    b = 'axxc123'
    print(difflib.SequenceMatcher(None, a, b).get_opcodes())

    >>> [('equal', 0, 1, 0, 1), ('replace', 1, 2, 1, 3), ('equal', 2, 3, 3, 4), ('insert', 3, 3, 4, 7)]
    180 天前
    回复了 linkbg 创建的主题 Python Python 如何实现字符串比较并输出不同点
    这个问题的重点还是怎么定义“不同点”
    不过对于序列的不同,有一个比较通用的定义方式:编辑距离
    编辑距离,就是通过
    1. 插入一个元素
    2. 删除一个元素
    3. 修改一个元素
    将一个序列变成另一个序列的最短步数
    我觉得这个最短步数的操作序列可以作为“不同点”的定义

    在 python2.7+中有个 difflib 实现了序列编辑距离的计算

    import difflib
    a = '123sdasiioi'
    b = '123sdasiioi12'
    print(difflib.SequenceMatcher(None, a, b).get_opcodes())

    >>> [('equal', 0, 11, 0, 11), ('insert', 11, 11, 11, 13)]

    把 equal 去掉,大概就是你说的不同了
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   鸣谢   ·   2528 人在线   最高记录 3541   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 13ms · UTC 05:27 · PVG 13:27 · LAX 22:27 · JFK 01:27
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1