V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
v2htm
V2EX  ›  问与答

用 sed 替换时怎样排除 html 标签<>里的内容?

  •  
  •   v2htm · Nov 25, 2015 · 3106 views
    This topic created in 3809 days ago, the information mentioned may be changed or developed.

    刚刚接触 sed ,批量替换 html 页面内关键字,需要排除标签里的文字,比如:
    <font color=red> </font>

    我用 sed -r -i '/(<[^>]*>)/b; 's/AAA/BBB/g' test.html
    这样的方法,结果是有尖括号的行整行都被跳过了,没有完成后边的替换操作,应该怎么写?

    1 replies    2015-11-25 09:58:13 +08:00
    comicfans44
        1
    comicfans44  
       Nov 25, 2015
    对于 html 最合适的处理语言是 xslt...通过很多技巧 sed 也许也能完成工作,但有点像锤子拧螺丝
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1218 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 23:26 · PVG 07:26 · LAX 16:26 · JFK 19:26
    ♥ Do have faith in what you're doing.