遇到个好笑的事

2022-08-01 21:58:15 +08:00
 kukala
小项目一般用富文本编辑器把内容存入数据库不是带有着 html 标签的嘛!

需求是提取出来的内容不带 html 标签的!



请问大家会选择如下哪个操作:

1 、建立 2 个字段,一个存带 html 标签的内容,一个存不带 html 的内容

2 、取出数据然后替换掉 html 标签
6221 次点击
所在节点    程序员
45 条回复
kingjpa
2022-08-01 22:05:16 +08:00
这时候 php 的好处就出来了 直接一个 strip_tags 函数搞定。
wzzzx
2022-08-01 22:08:57 +08:00
我肯定是选 2 ,这个就是一个业务上的需求吧。今儿不要标签,明儿要标签,后天想把标签加粗展示,大后天想把标签变为红色,总不能一次整多一个字段吧
eason1874
2022-08-01 22:12:32 +08:00
大部分富文本编辑器都有两个保存 API ,一个存 HTML 格式的,一个存文本格式的,并且两者可以互转

文本格式也只是类似 markdown 去掉部分 HTML 标签,不能全部去掉。比如允许编辑字体颜色,保存时如果把 HTML 标签全部去了,那你就转不回来了
oneisall8955
2022-08-01 22:12:36 +08:00
2 ,jsoup 解析整一下
BugCry
2022-08-01 22:12:59 +08:00
这要从何笑起呢
kukala
2022-08-01 22:18:27 +08:00
@BugCry 你会选哪个
kkeep
2022-08-01 22:19:22 +08:00
2
kukala
2022-08-01 22:20:08 +08:00
@eason1874 你再仔细看下题
kukala
2022-08-01 22:21:01 +08:00
@oneisall8955 是的
kukala
2022-08-01 22:21:14 +08:00
@kingjpa 的确
eason1874
2022-08-01 22:38:15 +08:00
@kukala 哦,你的意思是,在有 HTML 版本的同时要不要另外存一个文字版本是吧,那我选 2
Danswerme
2022-08-01 22:52:12 +08:00
选 1 ,我懒
kukala
2022-08-01 23:00:36 +08:00
@eason1874 对头,是这样的
kukala
2022-08-01 23:00:56 +08:00
@Danswerme 这是懒的问题吗?
DeutschXP
2022-08-02 02:33:38 +08:00
@kukala 那你有没有想过,在某些应用情景下,单独存一个不带 html 标签的纯文本,会更方便搜索呢?
netnr
2022-08-02 08:46:26 +08:00
选 1 直接存储 更通用
murmur
2022-08-02 09:02:31 +08:00
@DeutschXP 全文搜索用 solar 这些,也不需要你在数据库里存,要存分词的结果
imicksoft
2022-08-02 09:02:38 +08:00
选 1 ,这事我干过。
我之前采集过 aardio 论坛的帖子,aardio 的数据类型有一个是 table 类型,那存 html 不方便搜索 aardio 代码,所以就用了两个字段,一个存 html 源码,一个存纯文本。
yuewenjie
2022-08-02 09:04:43 +08:00
嘿嘿
kukala
2022-08-02 09:15:56 +08:00
@DeutschXP 这个应用场景下,你有实践过没

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/870060

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX