V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐关注
Meteor
JSLint - a JavaScript code quality tool
jsFiddle
D3.js
WebStorm
推荐书目
JavaScript 权威指南第 5 版
Closure: The Definitive Guide
manyfreebug
V2EX  ›  JavaScript

如何分辨页面上的一段 HTML 是富文本编辑器生成的还是直接用 html 的语法书写的?

  •  
  •   manyfreebug · 24 天前 · 1280 次点击

    富文本编辑器能将一段普通文本形成对应的 HTML 标签,有什么特征可以分辨出这段 html 是富文本编辑器生成还是直接用 html 的语法书写的?

    例如这张页面框中的这部分,是如何形成的呢: https://developer.mozilla.org/zh-CN/docs/Learn

    10 条回复    2021-09-26 13:55:55 +08:00
    wzzzx
        1
    wzzzx   24 天前   ❤️ 1
    为什么要分辨这个?
    xiaoming1992
        2
    xiaoming1992   24 天前   ❤️ 1
    富文本编辑器生成的 `<p>hello</p>` 和 直接用 html 语法书写的 `<p>hello</p>` 有什么区别吗?
    shapl
        3
    shapl   24 天前   ❤️ 1
    看 class 算不?富文本一般没这个。
    DoveAz
        4
    DoveAz   24 天前 via Android   ❤️ 1
    几乎无法分辨
    Pastsong
        5
    Pastsong   24 天前   ❤️ 1
    你点一下最下面的 Edit on GitHub 那就知道是怎么生成的了
    manyfreebug
        6
    manyfreebug   24 天前
    @shapl 有的可以靠 class="markdown_body" class="richtext_body"识别出来,但大部分 html 好像没法分辨
    manyfreebug
        7
    manyfreebug   24 天前
    @Pastsong 这个方法可能可以针对 mdn 的页面,但有没有什么通用的方法可以用在别的网站上呢
    Pipecraft
        8
    Pipecraft   24 天前   ❤️ 1
    富文本编辑器生成的网页代码一般会包含 inline style 代码。有的设置字体大小,颜色的会用到 <font size=` ,<font color=` 这种标签。直接用 html 的语法书写的一般会用 class 设置字体和颜色。
    2i2Re2PLMaDnghL
        9
    2i2Re2PLMaDnghL   23 天前   ❤️ 1
    你只能通过一些启发式的方法去判断,比如你 #6 说的 class,或者 #8 说的 font,或者 span style (毕竟 html5 好像移除了 font )
    至于通用的方法,应当是无解。
    rodrick
        10
    rodrick   23 天前
    先说说看为啥要分辨 感觉这个需求很特别
    关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1205 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 17ms · UTC 18:26 · PVG 02:26 · LAX 11:26 · JFK 14:26
    ♥ Do have faith in what you're doing.