V2EX 首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python 学习手册
Python Cookbook
Python 基础教程
Python Sites
PyPI - Python Package Index
http://www.simple-is-better.com/
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
V2EX  ›  Python

Python 读取文本文件,怎么才能读取一段内容呢?

  •  
  •   warcraft1236 · 124 天前 · 1975 次点击
    这是一个创建于 124 天前的主题,其中的信息可能已经有所发展或是发生改变。

    Python 新手

    有个文本文件,格式大概是这样的

    一些内容....
    ###START RECORD
    一些内容....
    ###END
    一些内容...
    

    我想读取从 ###START RECORD 开始到 ###END 这段的文本

    请问有什么比较好的方法吗?

    13 回复  |  直到 2017-07-18 13:37:36 +08:00
        1
    ysc3839   124 天前 via Android
    用 find 找到两个 pattern 然后 string[find1+len (pattern1):find2]
        2
    misaka19000   124 天前 via Android
    应该不能,操作系统读取文件的系统调用不能根据文件内容来判断吧,只能读到内存中再做处理了
        3
    ryd994   124 天前 via Android
    一行行读了判断呗………
        4
    zeraba   124 天前 via Android
    呐 把每一行先读出来 就像 3 楼说的 存到列表 然后开始找开始行和结束行的第一个索引 找到之后把内容存到另一个列表 并删除旧列表里面响应内容 然后继续循环
        5
    dawnven   124 天前
    正则表达式
        6
    dangyuluo   124 天前
    感觉效率比较高的方法是一行一行读,然后根据格式判断。
    正则表达式就有点杀鸡用牛刀的感觉了。
        7
    warcraft1236   124 天前
    @dangyuluo 正则表达式效率会比较低吗?
        8
    wzha2008   124 天前
    按行读入内存,读到 start 后每行加入列表,再读到 end 就 break
        9
    yylucifer   124 天前
    @warcraft1236 用正则文本多了会很低。。
    要讲效率,应该一行一行处理是比较高的
        10
    ToughGuy   124 天前   ♥ 1
    def read_part(filename, start='###START RECORD', end='###END'):
    ----content = []
    ----recording = False

    ----with open(filename) as f:
    --------for line in f:
    ------------line = line.strip()

    ------------if line == end:
    ----------------break

    ------------if recording:
    ----------------content.append(line)

    ------------if line == start:
    ----------------recording = True
    ----return '\n'.join(content)
        11
    scriptB0y   124 天前
    查一下是第几行然后 seed
        12
    warcraft1236   124 天前
    @ToughGuy 多谢,我明白了
        13
    VYSE   124 天前 via Android
    mmap
    DigitalOcean
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   鸣谢   ·   1791 人在线   最高记录 3541   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.0 · 54ms · UTC 12:16 · PVG 20:16 · LAX 04:16 · JFK 07:16
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1